Для работы проектов iXBT.com нужны файлы cookie и сервисы аналитики.
Продолжая посещать сайты проектов вы соглашаетесь с нашей
Политикой в отношении файлов cookie
Транзисторы там те же самые, потому что техпроцесс один и тот же (ещё бы, в пределах одного чипа). Более плотно реализованы функциональные блоки ядра (использованы «более плотные библиотеки»). Где-то приобрели — где-то потеряли, так вот потеряли в частоте.
.
Вообще, есть такой термин в процессоростроении — PPA, расшифровывается как Performance, Power, Area. Производительность, потребление, площадь. Относится к оптимизации дизайна, между ними приходится выбирать чего тебе больше нужно. Увеличиваешь производительность (тут имеется в виду частота) — теряешь в потреблении и/или площади, и тп. Вот у 4c оптимизация выкручена в площадь за счёт частоты. Не уверен насчёт потребления, наверное и оно меньше — иначе bergamo не уложился бы в тот же TDP, что genoa. А может оно меньше просто потому что частота меньше. Учитывая, что зависимость потребления от частоты нелинейна, может площадь дополнительно и за счёт потребления выкрутили, и всё равно общее потребление вышло такое же.
.
PPA зависит и от техпроцесса (что фабрика-боженька пошлёт), и от собственно библиотек в рамках этого техпроцесса (какие вариации в рамках этого техпроцесса придумали).
«Выгорающий кислород» — может это как-то связано с влажностью воздуха?..
Могу сказать, что с дешёвым масляным обогревателем лет 20-25 назад дышать через какое-то время становилось менее приятно. Почему — хз.
AMD свою генерацию фреймов рекомендует использовать, когда частота кадров уже от 60. От 30 — можно, но не стоит. Ниже 30 — ни в коем случае.
Вот я лично думаю, если уже есть 60, нахрена мне было бы нужно ещё 60 нарисованных? Учитывая что они добавляют своих проблем?
Я недавно с удивлением узнал, что некоторые робопылесосы умеют объезжать носки, или, простите, собачье дерьмо — и соответственно не наматывать его на вал или не размазывать по квартире) Вы что-то такое тестируете?
.
У меня Xiaomi Robot Vacuum-Mop 2 Pro, и он меня бесит тем, что изо дня в день штурмует минут по пять одни и те же неприступные для него бастионы (например, переехать через ножку сушилки для белья — железную трубку диаметром сантиметра полтора — ему практически не по силам). Причём эти бастионы иногда не получается внести как запрещённую зону в приложение — там минимальный размер зоны довольно велик.
А на днях коты сбросили с плиты кастрюлю с приготовленным рисом, а он с крахмалом, и пылесос не только его размазал по квартире (и крахмал классно присох к полу), он ещё и сам им забился по самое не могу. Замучался его чистить.
.
В общем, мне кажется, было бы здорово исследовать состояние таких «бытовых» проблем у роботов-пылесосов.
Я под NVLink имел в виду не протокол, а порт на видеокарте. Нашёл, что у MI300 есть «8 Infinity Fabric Links», но не смог найти что именно можно с их помощью сделать. У нВидии понятно написано — NVLink-ом можно соединить 256 видеокарт, дальше добавляешь NVSwitch и подключаешь дальше. Свитч ещё и как-то сам оптимизирует маршруты между видеокартами. Сравнить эти возможности с АМД не смог, не нашёл аналогичной информации.
Понятно только, что NVLink даёт 900GB/s пропускной способности на видеокарту, у АМД по идее 8*128GB/s = 1024. Но опять же не факт, что можно это так в лоб умножать, что они все одновременно могут работать на полной скорости. Но если да, то по сырым возможностям железа опять же АМД впереди.
Есть-то оно есть, а цельные продукты на основе этого есть? Есть ли аналог того же NVLink? Я уверен, что собрать готовую продуктовую линейку из готовых кирпичиков это не быстрое дело. У nVidia большая фора практически во всём.
Я б поспорил на бутылку, что mi300x будет продаваться дешевле h200 :)
Вопрос только как это определить или кто будет арбитром. MSRP тут мало что значит.
А кроме софта, у нвидии не только видеокарты и не только cuda — у них ещё и свой интерконнект, и свои сетевые карты, и свои готовые сервера dgx — то есть куча готовой инфраструктуры для того, чтобы не просто на одной видяшке инференс гонять, а чтобы строить облака видях для обучения самых крупных из сетей.
Себестоимость выше, конечно, чем у H100 или будущего H200, но продаваться будет наверняка дешевле.
Им ещё пару лет по поддержке софта нвидию догонять. Пока что они несмотря на всё это железо только на 20-40% быстрее, чем H100, и не везде. Но начало хорошее. С учётом того, какие цены может себе позволить нвидия (имея при этом очередь заказов на год!!! вперёд), и что в ИИ приличная централизация — одни майкрософт и мета только в этом году покупают 150к H100 каждая — есть много заинтересованных в том, чтобы оптимизировать существующий софт под амд.
Проверил — Медиатек в дименсити использует стандартные армовские ядра и стандартное армовское видео
Это за счёт чего они тогда так разогнались и начали всерьёз конкурировать с Квалком, если все компоненты у них «с полки» ?
уменьшение техпроцесса почти всегда позволяет повысить частоту. часто ещё и понизить потребление при этом; при равной частоте — так вообще оно точно становится ниже.
.
Вообще, есть такой термин в процессоростроении — PPA, расшифровывается как Performance, Power, Area. Производительность, потребление, площадь. Относится к оптимизации дизайна, между ними приходится выбирать чего тебе больше нужно. Увеличиваешь производительность (тут имеется в виду частота) — теряешь в потреблении и/или площади, и тп. Вот у 4c оптимизация выкручена в площадь за счёт частоты. Не уверен насчёт потребления, наверное и оно меньше — иначе bergamo не уложился бы в тот же TDP, что genoa. А может оно меньше просто потому что частота меньше. Учитывая, что зависимость потребления от частоты нелинейна, может площадь дополнительно и за счёт потребления выкрутили, и всё равно общее потребление вышло такое же.
.
PPA зависит и от техпроцесса (что фабрика-боженька пошлёт), и от собственно библиотек в рамках этого техпроцесса (какие вариации в рамках этого техпроцесса придумали).
Могу сказать, что с дешёвым масляным обогревателем лет 20-25 назад дышать через какое-то время становилось менее приятно. Почему — хз.
Вот я лично думаю, если уже есть 60, нахрена мне было бы нужно ещё 60 нарисованных? Учитывая что они добавляют своих проблем?
.
У меня Xiaomi Robot Vacuum-Mop 2 Pro, и он меня бесит тем, что изо дня в день штурмует минут по пять одни и те же неприступные для него бастионы (например, переехать через ножку сушилки для белья — железную трубку диаметром сантиметра полтора — ему практически не по силам). Причём эти бастионы иногда не получается внести как запрещённую зону в приложение — там минимальный размер зоны довольно велик.
А на днях коты сбросили с плиты кастрюлю с приготовленным рисом, а он с крахмалом, и пылесос не только его размазал по квартире (и крахмал классно присох к полу), он ещё и сам им забился по самое не могу. Замучался его чистить.
.
В общем, мне кажется, было бы здорово исследовать состояние таких «бытовых» проблем у роботов-пылесосов.
Понятно только, что NVLink даёт 900GB/s пропускной способности на видеокарту, у АМД по идее 8*128GB/s = 1024. Но опять же не факт, что можно это так в лоб умножать, что они все одновременно могут работать на полной скорости. Но если да, то по сырым возможностям железа опять же АМД впереди.
Вопрос только как это определить или кто будет арбитром. MSRP тут мало что значит.
Им ещё пару лет по поддержке софта нвидию догонять. Пока что они несмотря на всё это железо только на 20-40% быстрее, чем H100, и не везде. Но начало хорошее. С учётом того, какие цены может себе позволить нвидия (имея при этом очередь заказов на год!!! вперёд), и что в ИИ приличная централизация — одни майкрософт и мета только в этом году покупают 150к H100 каждая — есть много заинтересованных в том, чтобы оптимизировать существующий софт под амд.
Это за счёт чего они тогда так разогнались и начали всерьёз конкурировать с Квалком, если все компоненты у них «с полки» ?