Комментарии / Публикации skaurus / iXBT Live

Для работы проектов iXBT.com нужны файлы cookie и сервисы аналитики. Продолжая посещать сайты проектов вы соглашаетесь с нашей Политикой в отношении файлов cookie

Комментатор

Skaurus

Рейтинг

+50.30

Автор не входит в состав редакции iXBT.com (подробнее »)

можешь сам в моем профиле посмотреть список моих комментариев и убедиться

@Jin, у вас тут баг, похоже

эээ. я этого не писал, и даже в истории комментариев этого коммента нет)

Транзисторы там те же самые, потому что техпроцесс один и тот же (ещё бы, в пределах одного чипа). Более плотно реализованы функциональные блоки ядра (использованы «более плотные библиотеки»). Где-то приобрели — где-то потеряли, так вот потеряли в частоте.
.
Вообще, есть такой термин в процессоростроении — PPA, расшифровывается как Performance, Power, Area. Производительность, потребление, площадь. Относится к оптимизации дизайна, между ними приходится выбирать чего тебе больше нужно. Увеличиваешь производительность (тут имеется в виду частота) — теряешь в потреблении и/или площади, и тп. Вот у 4c оптимизация выкручена в площадь за счёт частоты. Не уверен насчёт потребления, наверное и оно меньше — иначе bergamo не уложился бы в тот же TDP, что genoa. А может оно меньше просто потому что частота меньше. Учитывая, что зависимость потребления от частоты нелинейна, может площадь дополнительно и за счёт потребления выкрутили, и всё равно общее потребление вышло такое же.
.
PPA зависит и от техпроцесса (что фабрика-боженька пошлёт), и от собственно библиотек в рамках этого техпроцесса (какие вариации в рамках этого техпроцесса придумали).

нет, совершенно одинаковый

«Выгорающий кислород» — может это как-то связано с влажностью воздуха?..
Могу сказать, что с дешёвым масляным обогревателем лет 20-25 назад дышать через какое-то время становилось менее приятно. Почему — хз.

Nio небось раньше разорится, чем этот автомобиль выйдет на рынок.

AMD свою генерацию фреймов рекомендует использовать, когда частота кадров уже от 60. От 30 — можно, но не стоит. Ниже 30 — ни в коем случае.
Вот я лично думаю, если уже есть 60, нахрена мне было бы нужно ещё 60 нарисованных? Учитывая что они добавляют своих проблем?

Я недавно с удивлением узнал, что некоторые робопылесосы умеют объезжать носки, или, простите, собачье дерьмо — и соответственно не наматывать его на вал или не размазывать по квартире) Вы что-то такое тестируете?
.
У меня Xiaomi Robot Vacuum-Mop 2 Pro, и он меня бесит тем, что изо дня в день штурмует минут по пять одни и те же неприступные для него бастионы (например, переехать через ножку сушилки для белья — железную трубку диаметром сантиметра полтора — ему практически не по силам). Причём эти бастионы иногда не получается внести как запрещённую зону в приложение — там минимальный размер зоны довольно велик.
А на днях коты сбросили с плиты кастрюлю с приготовленным рисом, а он с крахмалом, и пылесос не только его размазал по квартире (и крахмал классно присох к полу), он ещё и сам им забился по самое не могу. Замучался его чистить.
.
В общем, мне кажется, было бы здорово исследовать состояние таких «бытовых» проблем у роботов-пылесосов.

Я под NVLink имел в виду не протокол, а порт на видеокарте. Нашёл, что у MI300 есть «8 Infinity Fabric Links», но не смог найти что именно можно с их помощью сделать. У нВидии понятно написано — NVLink-ом можно соединить 256 видеокарт, дальше добавляешь NVSwitch и подключаешь дальше. Свитч ещё и как-то сам оптимизирует маршруты между видеокартами. Сравнить эти возможности с АМД не смог, не нашёл аналогичной информации.
Понятно только, что NVLink даёт 900GB/s пропускной способности на видеокарту, у АМД по идее 8*128GB/s = 1024. Но опять же не факт, что можно это так в лоб умножать, что они все одновременно могут работать на полной скорости. Но если да, то по сырым возможностям железа опять же АМД впереди.

О, ты ж ниже и привёл цитату Лизы Су, что придётся продавать дешевле.

Есть-то оно есть, а цельные продукты на основе этого есть? Есть ли аналог того же NVLink? Я уверен, что собрать готовую продуктовую линейку из готовых кирпичиков это не быстрое дело. У nVidia большая фора практически во всём.

AFAIK, ChatGPT 3.5 натренирован при помощи PyTorch.

так что, спорить будем?))

Я б поспорил на бутылку, что mi300x будет продаваться дешевле h200 :)
Вопрос только как это определить или кто будет арбитром. MSRP тут мало что значит.

А кроме софта, у нвидии не только видеокарты и не только cuda — у них ещё и свой интерконнект, и свои сетевые карты, и свои готовые сервера dgx — то есть куча готовой инфраструктуры для того, чтобы не просто на одной видяшке инференс гонять, а чтобы строить облака видях для обучения самых крупных из сетей.

Себестоимость выше, конечно, чем у H100 или будущего H200, но продаваться будет наверняка дешевле.
Им ещё пару лет по поддержке софта нвидию догонять. Пока что они несмотря на всё это железо только на 20-40% быстрее, чем H100, и не везде. Но начало хорошее. С учётом того, какие цены может себе позволить нвидия (имея при этом очередь заказов на год!!! вперёд), и что в ИИ приличная централизация — одни майкрософт и мета только в этом году покупают 150к H100 каждая — есть много заинтересованных в том, чтобы оптимизировать существующий софт под амд.

Проверил — Медиатек в дименсити использует стандартные армовские ядра и стандартное армовское видео
Это за счёт чего они тогда так разогнались и начали всерьёз конкурировать с Квалком, если все компоненты у них «с полки» ?

уменьшение техпроцесса почти всегда позволяет повысить частоту. часто ещё и понизить потребление при этом; при равной частоте — так вообще оно точно становится ниже.

Нет, в любом случае ответственность руководителя. Маск тот, кто в итоге это всё организовал — его и заслуга в первую очередь