Комментарии / Публикации Sawaru / iXBT Live

Для работы проектов iXBT.com нужны файлы cookie и сервисы аналитики. Продолжая посещать сайты проектов вы соглашаетесь с нашей Политикой в отношении файлов cookie

Комментатор

Sawaru

Рейтинг

+1610.00

Автор не входит в состав редакции iXBT.com (подробнее »)

Вопрос когда.
А вообще могут не дороже чем в сабже.
Прикол в том, что это apple. Тут уже
А) Играет значимую роль эффект масштаба
Б)Значительно выше серийность. (которая делает переговорные позиции apple, с подрядчиками сильнее)
В)У эпл значительно больше ресурсов, а значит возможностей для организации производств.
Вопрос лишь в фабриках. Samsung и TSMC строят. Intel работает над возможностью контрактного производства.

Т.е. не проблема сделать смартфон apple в США. Но потребуются значительные инвестиции. Капиталоотдача и сроки окупаемости у которых будут не лучше чем есть сейчас.
Проще говоря, Apple больше заработает с использования труда наёмных рабочих на Тайване, в Китае, Корее, Индии ну и т.д.
И зачем тогда эти вот инвестиции.

Если забыть о себестоимости. То Apple как и любая другая компания, может зарядить конский прайс, вне зависимости от себестоимости изготовления.

Глобально всё проще. Нвидиа просто увеличила кеш. Из за чего сократился трафик на шине. Как следствие её и порезали. Вот примерно то, что АМД сделали поколение назад.
Данная схема куда более эффективна.

Сделать проект такого уровня хорошо, в современных реалиях, ну скажем так, не можете не беритесь.
А то автолевелинг, прегенрация мира и т.п.
Это очень плохо сочетается со старыми играми, где много ручного дизайна.

Кек а причём тут гос? Просто монопольная лапа. Или олигопольная лапа. Или даже просто буржуйская лапа. Хрен редьки не слаще.
И да это уже вполне видимая и осязаемая рука рынка.
Государство то это не субъект. Это объект. И есть такая штука рынок власти. Вот кто больше заплатит, то и пользуется государственной машиной.

А может и вовсе посягательство на частную собственность!

А да это похоже я дурак.
https://github.com/RadeonOpenCompute/ROCm/issues/2065
https://www.reddit.com/r/Amd/comments/12z0tme/rocm_docs_560_alpha_on_windows/
Дело в том, что АМД 2 месяца назад сделали гайд по ROCm на винде.
+ новости о поддержке винды в ROCm 5.6.0 Alpha.
.
И вот сам прикол, ROCm 5.6.0 вышел. Уже 13 часов назад. 8 Часов назад, когда я писал я даже Release Notes прочитать не мог. Ссылка вела на версию 5.5.1, версии 5.6.0 ещё не было. Видимо страницу сделали доступной позже.
https://rocm.docs.amd.com/en/docs-5.6.0/release.html
Т.к. залили его ещё 24 числа.
.
Видимо да я поспешил каюсь.
.
С ИИ пока какой-то нормальной конкретики не было. Но вот что накопал.
https://3dnews.ru/1088404/ryzen-7040hs-launch
Похоже пока под всякие ИИ фишки винды. + «Ryzen AI поддерживает ИИ-модели ONNX и TensorFlow, однако к четвёртому кварталу этого года AMD надеется на появление поддержки PyTorch.»

Всё ж просто. Запросы у людей разные.
Ну потому, как например в игре может и не быть лучей, а поиграть в неё хочется.
Или потому например как в киберпанке, играть в 30 фпс не хочется и DLSS включать тоже.
Это же чисто визуальная фича, при том очевидно играет роль субъективный фактор.
Если б лучи были столь значимы, так много людей, так долго бы не сидели на той же 1060 и т.п.

Итого не ударяясь в крайности вывод прост, каждому своё. и каждый для себя найдёт причины почему играть или не играть с лучами.

«На все непрофессиональные карты АМД поддержка ROCm не распространяется.»
Похоже я/мы тут немножечко отстали от жизни.
https://wccftech.com/amd-ceo-teases-rocm-support-coming-to-radeon-consumer-gpus-soon/?dark=1
Но не всё радужно, смотрим картинку.
https://www.techpowerup.com/img/QRvBTldiReypdM0z.jpg
Т.е. всё таки хоть и ограниченная поддержка не проф карт, но она есть. В частности с ROCm 5.6 (в источнике будет ссылка на апрельскую новость) поддерживается NAVI 2, но только HIP. Это самый свежий ROCm на сей день.
Хоть и перечислены всего пара карт, но учитывая, что одно поколение, проблем быть особых не должно, т.к. наборы инструкций идентичные.
С огромной долей вероятности завезут и NAVI 3.
.
Понимаете какое дело. Отсутствие библиотек к примеру да это проблема. Т.к. кто-то же должен их будет написать. И очевидно никто особо делать этого не хочет, покуда у них есть готовые проекты уже работающие на той же CUDA. Просто потому, что это время. Плюс попытка перехода на ROCm для некоторых оказалась тем ещё головняком. И жалобы характера, то не сделано, это сделано но неудобно/криво, то не поддерживается/не реализовано.
Кстати видел жалобы на баги, в смысле их очень долго не фиксят, при том баги порой критичные, баг естественно зарепортили. < Опять же может быть уже не актуально, ROCm всё ещё развивается.
.
И вот разница в скорости работы как раз, ну не такая и большая проблема на самом-то деле. Важнее то как раз сколько усилий и времени займёт использование ROCm. Иначе быстрый медленный, не особо важно, его не будут использовать. Хотя многие бы явно хотели погонять свои задачи на радеонах.
.
Ну на самом деле. Я примерно понял куда нынче метят АМД. Вот если так посмотреть они же явно не просто так пихнули AI Блок в райзены 7040. Есть явный тренд на нейросети. Плюс новости о поддержке винды и нави 3.
Вывод напрашивается сам собой, они дадут какую-никакую поддержку ROCm для обычных смертных. Что бы без танцев с бубном под виндой запускать всякие stable diffusion, GPT модели и т.п.

В целом, ну пойдёт. Жрёт немного, всё в принципе тянет в FHD. С лучами конечно только киберпанк в 35FPS не радует. Ну плюс DLSS 3. Ценой за 300у.е.

Для того же FHD 7600 в нативе чуть хуже, в среднем разница в 2 FPS, т.е. плевать.
Зато цену берут как 250 у.е. приятно.
Из минусов конечно всё ещё фиг пойми где FSR 3 для тех кому надо. чуть выше потребление. А ещё значительные 21% хуже в RT.
Если смотреть по FPS для FHD
(Всё что около и больше 40 FPS считаем играбельным)
Киберпанк 22FPS не играбельно вообще никак.
Хогвартс 31.7FPS играть вроде как можно, но уже не комфортно, я бы не очень хотел играть с таки FPS.
Некоторые игры на грани играбельности см скобки.
Т.е. для игр с лучами, карта не имеет запаса вообще никакого. Киберпанк показателен, завтрашний день очевидно за трассировкой пути.

Вывод. Всё зависит от требований пользователя. Если для вас приемлем апскейл в виде DLSS и аналогов, + зелёным.
Если вам нужны лучи, ценой до 300у.е. сегодня + зелёным.
Хотите играть преимущественно в нативе и без лучей + красным.

ИМХО АМД как-то бы ещё уронить цену. И тогда получим народный топ. Ибо если карта будет стоить в районе 200у.е. ей вообще все минусы простят так ещё попросят добавки, но помечтали и будет. А хуанг, фиг его знает, цену ронять он явно не захочет.

А можно картинки ещё хуже? А то же не дай бог, что-то можно разглядеть.

«С уменьшением техпроцесса становится намного сложнее наращивать производительность?»
Отвечу максимально просто. Чем дальше, тем сложней. Всегда. Сложность прогресса то растёт. Эффект низкой базы знаком? Ситуация обратная. Дальше можно не читать, смысл понятен.

Ну начнём с того что 980 и 1080 это не топы. Топы были 980Ti и 1080 Ti + например титаны.
И если так посмотреть 1080ti примерно равно 2070S. А 980Ti близка с 1070.
.
Далее можно посмотреть на RT 3080 ti и RTX 4080. И тут как получается. 4080 использует более дорогой тех процесс. Использует больше более быстрой памяти GDDR6X. Стоимость разработки архитектуры выше. Но РРЦ та же.
У той же 4090 относительно предшественника чип и архитектура дороже. Но РРЦ даже ниже.
(данные по ценам с techpowerup)
.
По подробнее про тех. процесс вдумайтесь хуанг на нём не с экономил! Он взял лучшее из того, что есть на рынке. А он подобное проворачивал например в 900, 2000 и 3000 серии. Т.е. уже здесь виден предел.
Кстати с памятью тоже пока тихо, где новая GDDR7?
.
От сюда же растут корни и DLSS. Это наипростейший способ увеличить производительность. Он же наиболее выгодный. И не просто так его подхватили что АМД, что Интел со своими FSR и XeSS.
Это как раз нвидиа заморочились и нашли таки выход. И уже можно сказать, что игроделы то реализуют данные технологии. При том неизвестно сколько по времени данная хитрость позволить сохранять текущие темпы.
.
Возможности нарастить производительность конечно есть. От разгона до увеличения конвейеров и подсистемы памяти. Но некоторые вариации бы явно привели у удорожанию или очередному выпуску печек. А люди и так не довольны ценами. Но и прогрессом конечно тоже не были шибко довольны.

«от проприетарных ROCm»
Эм что?
https://github.com/RadeonOpenCompute/ROCm
ROCm™ is an open-source stack for GPU computation.
Дополнительно обратимся к вики
https://en.wikipedia.org/wiki/ROCm
ROCm is free, libre and open-source software (except the GPU firmware blobs[3])...
Т.е. ROCm бесплатный и с открытым исходным кодом, кроме блобов с прошивкой GPU.

Ну и так
«HSA was aimed at producing a middle-level, hardware-agnostic intermediate representation, that could be JIT-compiled to the eventual hardware (GPU, FPGA...) using the appropriate finalizer.»
Т.е. некоторая кроссплатформенность есть, т.к. использовать можно не только для GPU, вероятно АМД будут или уже используют ROCm для своих FPGA. Но конечно, с поддержкой сторонних производителей, явно не всё радужно, если что-то подобное вообще есть.

А в чём собственно по вашему заключается то проприетарность ROCm? И какое отличие в бесплатности и открытости меж SYCL и ROCm?

«А покупателей карт дешевле 2000$ АМД за людей не считает.»
Не ну как бы мы знаем, что он открытый и бесплатный, пользуйся. Там же на вики мы знаем какие карты поддерживают ROCm веги и нави 2/3. Правда похоже с виндой оно не дружит (минус к кросплатформе). Тут другая проблема, а нафиг же оно нужно? Если брать ML за счёт тензорных ядер RTXы явно лучше. Если даже не ML, то у CUDA один фиг более распространена, тем более с учётом уже написанных библиотек/софта. Переносить/портировать свои проекты на ROCm многие явно не захотят. Ну и так где-то тут есть OpenCL.

А теперь о птичках. По каким критериям ROCm не слишком уступает? И где я могу посмотреть это сравнение.

Т.е. по мне вероятно такой же сырой стек. Если сравнить с CUDA. По критериям распространённость, кол-во библиотек, функционал/удобство. Возможно скорость в каких-то задачах.
По крайней мере это те жалобы/опыт которые мне встречались (неоднократно) в этих ваших ынтернетах. Если есть иной материал делитесь с удовольствие изучу.

Попытаемся добавить в сравнение АМД. В новости идёт речь о LLM. В частности мы имеем вычисления FP8/16 и BF16.
Посмотрим что может АМД в лице mi250x
fp16, bf16 383TFlops. Естественно в матричном режиме. Не шибко быстро.
Так же играет роль псп и объём VRAM.
Тут у АМД уже лучше 3.2ТБ/сек и 128ГБ
Смотрим пункт. 2

См п. 3 для сравнения с А100. НО есть важный нюанс, там не написана производительность с разряженными матрицами, где А100 удвоит свою производительность (в тех же fp/bf 16).

Теперь же переходим к актуальному поколению. См картинку 4. АМД говорят о х8 производительности в ИИ (х5 на ватт) для mi300 относительно mi 250x.
383*8 = ~3064Tflops вот это уже прилично.
Можно уже сравнивать с H100 см. п. 1. И тут АМД даже побыстрее будет.
Хотя вероятно в FP8 и INT8 быстрее будет Нвидиа.

Самое интересное это будущая mi300x. См п. 5
192ГБ HBM3 с 5.3TБ/сек. + Быстрый IL. Что позволяет использовать LLM с ещё большим количеством параметров.

Итого железно интел слегка в отстающих получается (мб не во всех задачах). Хотя свою нишу занять может.
Но есть маааленькая проблема у той же АМД, железо на бумаге то конфетка.
Но я обязан упомянуть 2 момента. H100 и A100 уже на рынке, когда новое поколение АМД ещё нет.
Второе конечно же софт. И тут позиции Нвидиа сильней. Хоть АМД и развивает свой ROCm, но вроде всё ещё не паритет. А что простите у Интел? Они вообще обычно софт тоже развивают, но о каких-то аналогах cuda и ROCm не слышал, но я и не интересовался.

Материалы.
1)https://www.hpcwire.com/wp-content/uploads/2022/03/Nvidia-Hopper-Ampere-comparison-chart_GTC22_HPCwire.png
2)https://www.servethehome.com/wp-content/uploads/2022/08/AMD-MI250X-MVM-at-HC34-Performance.jpg
3)https://i2hard.ru/upload/sprint.editor/c74/ukg1o3n4qp7whasm3ph3o3x5tvvuu3r7.jpg
4)https://images.anandtech.com/doci/17445/2022-06-09%2014_16_37.jpg
5)https://images.anandtech.com/doci/18915/AMD%20DC%20AI%20Technology%20Premiere%20Keynote%20Deck%20for%20Press%20and%20Analysts%2063.jpeg
5.1)https://www.anandtech.com/show/18915/amd-expands-mi300-family-with-mi300x-gpu-only-192gb-memory

Кхм, вы оскорбляете чатгпт. Тут порой очепятки уже в заголовках. В этом плане уж лучше б чат гпт писал подобные новости. Вся новость это по сути перепечатка источника.

Так десятки задач, это без общих. Что уже не мало.
И вот допустим только одних монтажек сколько! Одна задача и уже несколько разных приложений. Т.е. объёмы тестирования очень не маленькие.
Ещё прикол в том, что для тестирования нужно использовать несколько прогонов.

Только так оно не работает. Бангладеш ничего не скажет, пока местная элитка, живёт на эти самые доллары. Точнее сказать то может, своему населению, но ничего менять не будут. Вот так оно работает. Власть доллара то на том и держится по сути. Что в каждой такой стране, найдутся заинтересованные в этом самом долларе.

А заинтересованы они в нём, потому что за него покупается примерно всё, что нужно этим самым элитам. Т.е. завтра и вдруг отказ от бакса тупо не возможен.
Тут нужна глубочайшая проблема, которую не возможно решить, которая приведёт к каскаду отказа от доллара во всём мире.

Вот тогда да, он нафиг никому не будет нужен. если ты не сможешь на него ничего толком купить, ни яхт тебе, ни дорогих авто, даже макбука и брендовых шмоток. Ну или что там ещё хотят элиты, по мимо золотых унитазов.

Причём не важно кто эти элиты, от местного диктатора и его родни. До вполне себе местных капиталюг с лобби в правительстве.

А уж если в какой то стране 3 мира вдруг, придут к власти люди, нацеленные на более прогрессивную народную политику. Которая будет нести ущерб, бизнесу допустим Американскому. В лучшем Случае санкции и изоляция. В худшем, доблестные вояки погрозят пальчиком, за одно могут вернуть старых, удобных диктаторов или посадить новых.

Им достаточно просто гору бабла налить 20-30 спецам из чиповой индустрии, дать время, дать денег.
Гору? Ну если буквально размером с эверест. А времени, ну так может лет 10-20.
И да открою тайну. Всё тоже самое нужно проделать не только с чиповой индустрией.
Литографы, это квинтесенция многих отраслей. Без них же, произвести ничего не получится.
И куда же тут без кучи административного то ресурса?

А в США, нафига им шить кросовки? Слишком дорогая рабочая сила. Хотя вероятно кто-то в незначительных количествах шьёт.
Проще за годик другой научить индийцев шить нужные им кросовки. Ну или даже не индийцев, куча отсталых стран, готовых шить всё что нужно за копейки.

Ну вообще достаточно ещё далёк.
Как пример их самая передовая фабрика SMIC, освоила таки 7нм. По крайней мере видел такой слух.
Но нюанс, они жили на импортном оборудовании. Более тонкие нормы без оборудования не освоить. Оборудование не поставляется.
И при всём при том, отставание от TSMC несколько лет. Ходили слухи, что Китай переманивает спецов с Тайваня. (слухи не означают, что так и было)
(Молчим про качество, ТХ и выход годных конечно)

Есть у Китая и производитель оборудования
http://www.smee.com.cn/eis.pub?service=homepageService&method=indexinfo&onclicknodeno=1_4_4_1
Обещали 28нм к году 2021. Но как понимаем ну пока не смогли.
Плюс можете пробежаться глазами тут
https://thechinaproject.com/2023/05/01/chinas-semiconductor-industry-cant-quit-german-optics/

Короче говоря проблема в оборудовании. А точнее в EUV. Это очень и очень сложно. Даже для Китая. ASML то угрохала на это не один десяток лет, и пользовалась ресурсами со всего мира фактически. Т.е. лучшие умы и компании в своих отраслях.

Так что кучки людей и денег Китаю явно не хватит. Тут проблема, что нужно кучу отраслей поднимать прямо на уровень мировых лидеров. И нужно было это ещё вчера.
Мало того, что бы догнать, Китаю то нужно вести свои разработки существенно быстрее. А то когда они там родят, то в мире может уже новое оборудование будет, с новыми тех. процессами.

Т.е. как раз не в обозримом будущем. Т.к. в краткосрочной перспективе 5/3нм они не освоят. Думаю даже в среднесрочной не осилят. Точнее уже не осилили, эту проблему они не сегодня решать начали. О чём то можно говорить лишь в долгосрочной перспективе.

«если бы Китай начал собственное производство»
Это тоже не показатель слабости.

Вот единственный вариант слабости который я могу придумать. Это квази/прокси или даже реальная война. Где инициатором выступит США.

Вот это будет отражать слабость США, по той причине, что данное действо будет означать, что других вариантов решить ситуацию уже не осталось. Т.е. экономические и политические инструменты не сработали. + сюда же запишем тайные операции.

И ведь нечто подобное было меж Англией и США, когда США сменил Англию на месте мирового Гегемона.

Есть маленькая проблемка. Производительность будет разница в разных задачах.
А задач тьма. И проблема как всё протестировать и привести к общему знаменателю так сказать.