Комментарии / Публикации Sawaru / iXBT Live

Автор не входит в состав редакции iXBT.com (подробнее »)

В новости упущено половина новости. Там китайцы и над инфраструктурой озаботились.

>>«Основанный на технологии MTLink1.0, разработанной компанией Moore Thread, MTT S4000 может поддерживать соединение нескольких карт и ускорять распределенные вычисления сотен миллиардов крупных моделей.»
>>«Что особенно важно, так это то, что с помощью инструмента разработки MUSIFY, разработанного компанией Moore Thread, вычислительная карта MTT S4000 может в полной мере использовать существующую экосистему программного обеспечения CUDA и реализовать бесплатную миграцию кода CUDA на платформу MUSA.»

>>«Решение интеллектуального вычислительного центра Moore Thread KUAE основано на полнофункциональном графическом процессоре и представляет собой полнофункциональное решение, интегрирующее программное и аппаратное обеспечение, включая инфраструктуру с вычислительным кластером KUAE в качестве ядра, платформой управления кластером KUAE Platform и моделью KUAE ModelStudio. Решайте проблемы управления строительством и эксплуатацией крупномасштабных вычислительных мощностей графических процессоров комплексным способом. Это решение можно использовать «из коробки», что значительно сокращает временные затраты на создание традиционных вычислительных мощностей, разработку приложений, создание платформ эксплуатации и обслуживания, а также обеспечивает быстрый вывод на рынок для коммерческих операций.»
https://www.mthreads.com/uploaded/news/content/2023/12/19/mtlpnzduiyk.png

«начали распаивать 32 Гига.»
Xiaoxin Pro 16 R7-7840HS 32G
ну как начали...
Тут скорей начали ставить шуструю память Lpddr5x-7467

Дроби не дроби, но когда сфера деятельности состоит из кучки высококвалифицированных людей, где для разработок сложных интегральных схем без опыта не обойтись, так ещё которых не особо-то и хватает в целом на рынке, то деваться и не куда особо. Т.е. что бы раздобыть нужного сотрудника, тебе придётся его откуда-то переманивать, предлагая больше конкурента, так ещё и у тебя этих сотрудников будут регулярно переманивать. Проблем бы не было, если это были бы не нвидиа, а кто поменьше выпускающий схемы попроще.
Т.е. это вам не уборщица и даже не программист, которым можно найти замену. Вот и приходится холить и лелеять то, что есть. Тем более, что сложность разработки растёт и вот как-то бы надо расширять штат сотрудников, просто чтобы те грызли гранит науки и двигали прогресс хотя бы с той же скоростью.

Выход я отсюда конечно вижу. Интенсивное развитие, т.е. переложить часть функций на машину, уменьшив порог вхождения, повысив специализацию и квалификацию людей. А кто квалификацию не повысит останется не удел. Т.е. закрыть этих опытных спецов новыми обученными кадрами + обученными нейросетями. Но эт дело не быстрое и то с растущим спросом на нейросети темпы расширения компании могут превосходить темпы перехода к интенсивному развитию. Т.е. закрыть потребность в кадрах и иметь рынок безработных может не получиться.

В целом и общем так же можно сказать что идея крупного бизнеса это на оборот укрупнение производства, ради достижения эффекта масштаба. Ну и так, у нас почему-то везде складывается иерархия власти. Где как-то вот не особо часто и не особо меняются высшие эшелоны этой власти. И бизнес (в массе своей) что-то как то не хочет делегировать свою власть и полномочия вниз. И да это не противоречит вашим словам. Просто компания это так же разные интересы, разных людей, а эти интересы не однородны и могут иметь разные векторы. Как следствие одних дробим, других не дробим.

После того, как в Россию ввезут из Китая!

«и тензорных ядер нет»
Тензорные ядра, это не RT Блок, это про работу с матрицами т.е. ИИ. И да он у АМД тоже есть, называется matrix core/accelerator и да он интегрирован в CU.
https://cdn.mos.cms.futurecdn.net/aAsJCjzcbThZZNWwMV24Nc-970-80.jpg.webp
И да RA тоже самое, что и RT блок, и да он так же интегрирован в CU или TMU.
Просто у АМД иной подход к организации вычислительных ресурсов. Но спец блоки таковыми и остаются.
Вся разница с нвидиа, то что у зелёных блоки выделенные.

«но 200 баксов это край цена»
Боюсь там 200 баксов только себестоимость будет. И это с нехилой такой маржей в 50%. Типичная средняя маржа это в районе 30% для рынка технологий. Так к тому же имеем дело с массовой 4060, где маржа точно ниже средней. А в топах типа 4080, маржа выше средней.

И да если что за период разработки ловлейсов, было потрачено на НИОКР в 3-4 раза больше, чем за аналогичный период разработки паскалей. (Брал 2 года до релиза)
https://www.macrotrends.net/stocks/charts/NVDA/nvidia/research-development-expenses
(ниже графика табличка)
И да стоимость разработки это прям большая часть себеса будет.

А так изготовить чип стоит в районе 53 баксов (голый чип), память 27 баксов. Докиньте плату, охлад, подложку, монтаж + отчисления по стандартам (типа HDMI, если они платятся) + закиньте 5% в резерв (для гарантии). Плюс прочие не производственные траты, типа рекламы, работы уборщицы и прочего. Будьте уверены там только железная часть за 100$ улетает, повторюсь без разработки данного чуда, без всей программной части и без маржи нвидиа.

А раз так, то ладно.
Не ну смех смехом, а у нас тоже эффективные менеджеры, просто коньюнктура разная, как следствие разные пути/средства, но своей цели они явно достигают ибо кто ж их держать будет.
А издевательство то оно и понятно, тоже самое и с либералами, последствие девяностых с перестройкой.
Но и в принципе показывают некоторое положение вещей, ведь эффективные манагеры, они чьи то манагеры. И не то что бы интересы работяг совпадают с интересами владельцев.

Не раздаёт, нвидиа не благотворительная организация, это сотрудники эти миллионы зарабатывают.
«Стесняется»?
это вообще не про бизнес. Увольнение ключевых сотрудников это самоубийство. И очевидно цель компании заставить, их всеми доступными средствами, работать эффективно. Тем более что такие люди в среднем в дефиците. Т.к. сама отрасль состоит из высококвалифицированных спецов, так эти ещё и с нехилым опытом.
Поверьте, не эффективную уборщицу уволят достаточно быстро. А ценными кадрами разбрасывается только дурак. Хуанг очевидно не дурак.

С чего вы взяли что он жадный? Потому что он как и все стремится получить прибыль и увеличить капитал? Вот куда пойдут прибыли? Правильно на расширенное воспроизводство. Не будет прибыли не будет и благ, в данном случае карт нвидиа. Т.к. а Зачем? Вот вы вложите 1 млн руб, что бы получить с этого ничего или что бы потерять 100тыс. руб?
Так же если нвидиа не будет получать прибыль, то у компании не будет больше ресурсов, для создания новых карт, а т.к. новые карты сложнее предыдущих, то прогресс сильно замедлится относительно того, что сейчас имеем. (а ведь темпы роста производительности и так упали за исчерпанием эффекта низкой базы)
Тем более, если какая-нибудь АМД будет получать прибыль и увеличивать капитал, а Нвидиа нет, то АМД просто победит в конкурентной борьбе и станет монополистом.

И причём тут вообще жадность? Если сама система по другому вообще не функционирует.

" У них попросту довольно резко появилось много денег и, как следствие, пропала мотивация работать активно."
Ну а вы что хотели? Вот так работает мир, когда мотивируешь работать людей за деньги. Так сам человек будет мало заинтересован в результате собственного труда. Творчеством сыт не будешь.

«Если кто-то работает неэффективно, компания попытается найти для этого человека новую команду и новое место внутри компании, вместо того, чтобы увольнять. В неспокойные времена Nvidia сокращает заработную плату руководителей, чтобы рядовые сотрудники не испытывали трудностей.»
Понятное дело, это ведь экономически целесообразно.
Проблема вообще в чём, сторожил увольнять сложно, т.к. это опытные и ценные спецы. Их ещё попробуй найди. Так ещё зачастую их опыт и перенимают новички.
А если увольнять молодняк, то откуда взяться опытным спецам? А молодняк работает не эффективно, относительно опытных спецов.
И сокращение бонусов манагеров так и вообще милое дело, т.к. не особо вредит производству, в отличии от работяг.

Возможный выход это замена кожаных мешков на нейрожестянку.

Да, относится к ПО. Так и разрабатывают микросхемы, их сперва описывают на специальных языках.
https://en.wikipedia.org/wiki/Hardware_description_language
Ну и так, понятное дело у нас литографическое оборудование работает не в ручном режиме, а работает по программе.

«Если амд разработала CCX на 16 ядер, „
Смотрим первое схематичное изображение. И видим 8 ядер на CCX. По этой инфе нет 16 ядерный CCX АМД не разработала.

Речь о больших ядрах конечно. Т.к. кол-во ядер на CCX определяется по сути общим же кешем. Zen Xc ядра как раз демонстрируют, что к тому же кешу ты можешь подцепить и в двое больше ядер.
И вот что бы сделать 16 ядерный CCX с Zen5 нам на кристалле нужно уместить 64МБ кеша! При том, тут нужно решить важную проблему, скорость доступа к этому самому кешу.
Т.е. проблемы примерно как с кольцевой шиной интела. Т.к. кеш L3 не монолитен, а разделён на части.
https://www.hardwareluxx.ru/images/cdn01/C497754B12FE4FE19542FB7D35AFB8F4/img/268F6CA01B3947279543A4A68AB0DBC7/CPU_Complex_268F6CA01B3947279543A4A68AB0DBC7.jpg

Вот по этому прицепить больше ядер к тому же объёму кеша можно (условно малых ядер).
Мы даже можем уместить этот объём кеша на кристалле, что позволяют делать тех. процессы.
Но что бы сделать 16 ядерный CCX придётся решить проблемы с задержками и доступом к кешу.
Если что главная задача кеша, это оперативный доступ к информации, т.е. сокрытие задержек от нашей ОЗУ.

" каких-то библиотек (не шарю что это)."
Библиотеки с нашими ячейками транзисторов. Вам дальше по тексту и поясняют:
«high-density and mid-range performance-density libraries»
Так к примеру для GPU, нам нужны транзисторы с более плотной компоновкой, а огромные мощности (с частотами) не очень то и нужны.

«А по моей ссылке на Dave2D оба ноута были на 75 ватт-час. Вот где собака зарыта.»
Вот так и нужно. Смотрите в чём прикол, сами тесты скорее всего на 100% верные иначе интел могут и в суде притянуть за клевету. Антимонопольщики к примеру.
Но у таких тестов, будут проблемы с методологией тестирования, где выборка может быть не релевантна. По этому нужно ж сперва смотреть, что говорит сама Интел или АМД, а после выискивая подобные нюансы нужно критиковать методологию тестирования.

«Вполне могут,»
Не вполне. Апех 720п ведьмак и кп2077(даже с фср не тянет), год оф вор (с фср) не тянет, елден ринг, я бы сказал тоже нет (т.к. ср фпс менее 30, с просадками меньше 20).
Не вполне, но окей что-то тянет, ваша правда, тут я не прав.

«Я ничего не подменял.» Именно подменили.
Хуже того вырвали из контекста «Как то вот хватает (ключевой фактор).» << это как то взяли и забыли.

«производительность от него вполне зависит.»
А теперь скажите на милость, как производительность встройки к примеру зависит от кеша проца? Никак. А ведь это тоже производительность нашего APU.
Так же можно найти ряд задач, где важные некоторые другие параметры, нежели размер кеша. Вот самый простой пример, это некоторый алгоритмы майнинга. Которые скалируются зачастую от ПСП и кол-ва потоков процессора. Есть вообще процессы аля САПР где важно иметь много ОЗУ, дабы в ней крутились расчёты.
Зато «Если плевать на производительность, то зачем вообще апгрейдиться ;)?»
отличное избиение соломенного чучела.

«Нет, вы попользовались картой»
Не в полной мере из за того, что брали с избытком. Или даже не пользовались особо. Т.е. вы уже в моменте покупки переплатили, за то чем не будете пользоваться. Я про избыток мощности. О чём изначально и условился.
" вы могли купить её б/у" или не могли. И всё равно переплатите.

«Потому что можно поставить выше разрешение или использовать DLDSR»
И на кой ляд оно мне надо?
«Цена за улучшение качества не так уж велика.»
Ну как не велика… она на оборот бесконечно велика. Ибо возьмём к примеру нойту, нафиг мне это ваше разрешение повыше?
Вы извините 1 не понимаете о чём говорите. 2 С какого-то ляда определяете что мне надо.

«это не отличить от общей погрешности измерений.»
Вывод потребление браузера не копейки. Т.к. выше величины погрешности.

«соответствия словам Интел не видно.»
Так вы в своих же материалах, практически не где вообще не соответствовали словам интел.
«не нужно мне за неё предъявлять.»
Так как это не нужно, если нужно. Вы мне сейчас сказали что вот там 2Вт, мол в простое. При том, что нам не показано даже что это в простое, это вообще какое-то минимальное значение зафиксированное ПО, в не пойми каких условиях. Т.е. мы уже практически не можем это соотнести со словами интела. А уж делая из этого какую-то экстраполяцию… << что не верно, но тут да есть часть вины интел, о чём ниже.
Учитывая, что ПО это так же нагрузка, вы можете сказать, что это тот простой который имел ввиду интел?

«Хотелось бы более внятные тесты потребления в простое от обзорщиков»
Опять же не верная аргументация, как по мне. Хотелось бы внятных тестов от самой Интел, где будет нормально расписана методология тестирования. Она конечно местами есть, но вот касательно простоя, что вот они имели ввиду под IDLE хз. Догадывайтесь. Как и то как они её собственно измерили. Что бы мы могли повторить тест или соотнести эти данные с данными из других источников.

Если что там и тесты жизни от батарейки были. Но результаты не очень внушительные, что и как сравнили я не вчитывался. Честно лень опять лезть на сайт интел через ВПН и копаться там.
https://youtu.be/yu2ughlWWD4?si=SFsnioYgOUBD2Fm2&t=106
Ссылка в правом нижнем углу.

«Браузеры жрут копейки. Вайфай тоже. „
“копейки» а может овердофига? Вот опять же к разговору о категориях, относительно чего копейки? Относительно 3д рендера? Или относительно простоя? Вот это копейки это в ватах сколько?

«Нет, фантастика это. Там и 79% меньше чем у 7840u в режиме простоя.»
«Наилучшее что смог найти по Интелу в простое это 2W»
Залез я короче на сайт интела за уточнением.
>Use up to 36% lower power while in «busy-idle» mode with an Intel® Core™ Ultra 7 165H processor, compared to an AMD Ryzen 7 7840U processor
>«Use up to 79% lower power while in „idle“ mode with an Intel® Core™ Ultra 7 165H processor, compared to an AMD Ryzen 7 7840U processor»
(As measured by system-on-chip (SoC) package power while in «idle» mode. )
>>А теперь укажите со 100% точностью что в вашем случае намеряли?

Кстати, сразу можно сказать, что тесты производительности интел
не релевантные. По крайней мере касательно IGPU в играх.
Т.к.
интел LPDDR5-7467
АМД LPDDR5-6400
Я конечно понимаю, что ноутов с АМД и Lpddr5x-7500 не встречаются (я не знаю таких), но могли уж свою систему с аналогичной памятью протестировать.

Неа. Т.к. у вас есть предыдущий кадр. Хуже того у вас есть информация, что и куда движется в кадре. Отсюда будет гостинг, неверное расположение объектов в кадре, а то и что похуже. Так например некоторые объекты могут не отрисовать, а некоторые перекрытые объекты могут на оборот отрисовать << но это уж слишком.

«ютуб можно отнести в категорию web browsing.»
Частично. Браузер то работает, сам браузер ресурсы жрёт, сеть ресурсы жрёт (пусть и не SoC).
Так что это 100% не просмотр локального видео.
«Нетфликс»
А вот тут сложности, это уже не веб браузер вроде есть конкретное приложение, которое вполне себе может кушать меньше ресурсов чем целый браузер.
Так ещё важны алгоритмы нетфликса, как минимум как поток закодирован. Я к тому, что может быть
А) Оптимизация под нетфликс
Б)Декодер интела лучше работает с кодировкой нетфликса

«В том и дело, что время жизни от батареи вообще не выросло. „
Опять 25. Я уже матерится хочу. Ещё раз из того, что вы привели вам этого и не обещали.
Ещё раз Интел говорит. на 44% меньше потребления SoC относительно 7840u.
В просмотре видео локально.
Причём тут рапторы и причём тут ютуб? И причём тут вообще время жизни от батареи.

Таймкод по Интелу кидал.
Я про то, что это можно сделать прям ссылкой.
https://youtu.be/yu2ughlWWD4?si=SFsnioYgOUBD2Fm2&t=106
https://youtu.be/Jw-apgUOpHk?si=A7oFqdGgFp6vp4wQ&t=261