Комментарии / Публикации Sawaru / iXBT Live

Для работы проектов iXBT.com нужны файлы cookie и сервисы аналитики. Продолжая посещать сайты проектов вы соглашаетесь с нашей Политикой в отношении файлов cookie

Комментатор

Sawaru

Рейтинг

+1602.50

Автор не входит в состав редакции iXBT.com (подробнее »)

Та пусть висит. Удаляются комменты ток модерацией по жалобе.
Редактировать коммент можно только до того как вам на него ответят.

Какая то картинка оч странная.
Типо зачем HBM стаки располагать НАД чиплетами gpu? Это ж усложнит отвод тепла от GPU так ещё и будем вжаривать стеки памяти. Обычно HBM память то монтируют рядом с кристаллом.

Не всё норм. Ибо нужен был максимально удачный старт. А после под шумок можно и поменять. Вообще ж сони таки в срочном порядке переделывали СО, в связи с тем, что Хбокс использовал более мощную платформу. Сони пришлось немного разогнать свои SoC и поменять охлад.
И это между прочим было перед релизом.
А щас что сменили радиатор, при том достаточно неплохо как по мне там весила медная пластина, теперь её нет, а так же самих рёбер стало меньше. НО сони вроде изменили немного сам вентилятор. Возможно даже увеличили обороты. Из за чего собственно и улучшился отвод тепла. И вот мы получаем пару градусов разницы.
А так же могли оптимизировать чуть чуть потоки воздуха.
И это кстати на фоне того, что сони больше не продают пс5 в убыток.

Как по мне сам тест AnTuTu просто кусок.
Хотя относительные тесты можно сделать, что бы оценить именно разницу в производительности. Т.е. как тут.

Очень даже работает. Смотря какой план. И смотря насколько выгодней в долгосрочной перспективе.
Тех работы, планируются. Как и обновление парка железа тоже планируется. Поставок один фиг придётся ждать.
И спрос на эпики как раз говорит о том, что работает бизнес, ещё как работает.

Чел фигню говоришь. 3D-Vcashe это кеш в 3д компоновке. HBM память это лять по сути озу, может быт распаивают как l4 кеш. И нужно оно как раз для ресурсоёмких вычислений, что бы не терять тучу производительности, из за низкой скорости той же dram памяти.
Но кеш всё ещё крайне быстрый, а что самое главное имеет оочень низкие задержек, это вообще не коим образом не аналог или плагиат HBM. У них даже тип ячеек разный, у hbm это до 8 стеков DRAM. Когда кеш это SRAM.
Да и о чём вы вообще?
АМД как раз и приложила руку к созданию HBM памяти, они же её одни из первых и использовали.
И что АМД «плагиатят» сами себя?

Так по моему там недавно были какие-то с подвижки, но так прям вот не помню, краем глаза вроде что-то читал. Но могу ошибаться.

проблема в том, что он сейчас недостаточно развит как система команд.
Хотя отверждение спорное. Но суть такая, а нафиг оно надо пока есть арм?
Он щас всех заинтересовал в связи с возможным переходом арм к НВ.
Ну может он не хуже, но не лучше.
В целом так стоит вопрос развития самой системы команд. Ибо вероятно будет как с линем. Один главный путь развития и несколько разных небольших ответвлений.
В долгосроке может зайти, но а щас на кой туда прям плотно залезать. Типо план какой пользуешься АРМ, инвестируешь в RISC-V. Когда АРМ будет не выгоден или ваш вариант RISC-V лучше, плавно слезаешь с АРМ.

Не в кеш точно нет. Чем больше кеш, тем он медленней, в случае райзенов, добавь задержку меж обращением в кеш соседних кристаллов. Единственный варик это распаивать сверхбыстрый озу на подложке, типо hbm. Как L4. Но и это не вариант по сути. Ибо DRAM память всё ещё более дешёвая и и один фиг одна планка ddr будет более ёмкой.
Так что боюсь до рудимента ой как далеко.
Что бы РАМ ушла в не бытье надо, что бы придумали новую ПЗУ, которая будет очень очень быстрой, иметь низкие задержки и при том не только в режиме линейного чтения.

вы не верно трактуете.

Ты дурак? Куда БИБЛИОТЕКИ мать вас. Просто открой глаза и научись читать.
Тензорные ядра, это не что-то уникальное. Это блок для матричных вычислений. У амд они есть в архитектуре CDNA. У интела тоже будет АМХ блок.

Ну типа, очевидно Майки и АМД совместно разработали библиотеки для ML. Не удивительно.
Нв для такого явно юзает свои библиотеки куда.
Но один фиг для данных целей лучше юзать спец блоки. И амд это тоже понимают.

Про архитектуру не известно. Но базовый принцип, чем выше частоты и ниже производительность, тем проще архитектура. И 1,8ГГц не то что б мало. А 8Тфлоп не то что б много.
Опять же GCN 3.0 1ГГц фури нано, при потреблении на 25Вт ниже, имела почти 8,2Тфлоп.
Тут же для того же результата надо аж 1.8ггц и то не дотянули.
Но самая жесть это младший вариант, который совсем фекальный 2тфлоп при 150Вт? Что-то явно не то с масштабируемостью видимо.
.
GPU сложная железка, но разрабатывают блоки для гпу не только амд и нв. Есть те кто продаёт разработанные блоки, та же мали например или imagination.
Adreno? тоже графика!
Так что тех кто умеет разрабатывать графику хватает. При том что разработка gpu это всё же не что то концептуально новое. Тоже логические вентили, тоже simd, тоже разводка в кремнии. И да компания создала десятки гпу. Но сколько создал каждый отдельный человек?
И да gpu как и cpu так или иначе в своей основе таки использует математику. Просто описывают функции или алгоритмы, через логические вентили. и тут нет концептуальной разницы меж тем же cpu. Кстати cpu то тоже используют simd расширения.
.
Так что дорога то уже прокатанная. И я даже с актуальным то не сравнивал. Но получить что-то уровня 1080ти или титанов, можно было. При том что китайцы то не тратят кучу ресурсов на продвижение технологий типо РТ или длсс.
.
А что до интел вон обещают выкатить карту уровня 3070. с матричными блоками и РТ блоками, со своим длсс. И это интел не смогла? Сомнительно. про DG1 даже не говорите, ибо это та же встройка по сути, просто в ином формате. Считайте отбраковка.

тк они и так платят за тот же dp и hdmi. Как пример.
Так же можно заметит что версия openGL тоже не последняя.
Но тем не менее лицензирование бы явно не стоило дорого, ибо отчисления идут с одной штуки. И менее дорого.
При том я не уверен, что производители железа вообще должны платить за вулкан. Ибо это вообще по сути реализовывается через драйвер. И является наследием опенгл.
Т.е. они и так платят, почему бы не использовать более свежие стандарты.

Пфф где этот мусор был бы не то что быстрее НВ а на уровне.
Оно архитектурно судя по всему ну такое себе. И выехали чисто за счёт частот и потребления.
просто берём gp102
псп 484ГБ/сек
ТДП 250Вт
частота 1582MHz
fp32 11.34Tflop
16нм
упс. И это 2016год
Возьмём амд 2015.
r9 nano максимально близкий конфиг с тем что в новости
псп 512ГБ/сек
ТДП 175Вт
частота 1000MHz
fp32 8.19Tflop
28нм.
Просто GCN 3.0, лол.
только вот фури как бы к fp16 имеет множитель 1:1 и fp64 1:16. Когда 1080ти 1:64 и 1:32 соответственно.
.
Китаец же фигачит на частоте в 1.8Ггц. Что выше любого названного варианта. Да и им доступны те же 16...12нм ТП серийно. Что это нам говорит, что вероятно конвейер то по проще будет, ибо производительность не высока, в отличии от тактовой частоты.
.
И да сделать gpu ХУЖЕ, чем модель 6 летней давности, действительно просто. Особенно с ресурсами китайцев, как человеческих так и денежных. Просто потому как тебе вообще не надо быть первопроходцем. ДОГОНЯЮЩИМ быть проще. Банально за это время стало БОЛЬШЕ опытных кадров. Фаундри продвинулись вперёд. Да даже наборов ГОТОВЫХ блоков для проектирования стало больше. Купи, поставь, пользуйся. СЕЙЧАС не обязательно всё делать с 0. И с чего ты взял, что инженеры, которые делали этот gpu, что-то разрабатывают в первой лол. Или что любой другой опыт не в счёт.
Лол я даже не брал в сравнение современные железки. Не брал в расчёт что в 2022 году (под конец) может уже выйти следующее поколение железа.
А оно даже до железок 2015-2016 года не дотянуло местами.
Лол ты так говоришь, как будто китайцы запилят что-то КОНЦЕПТУАЛЬНО новое, что до них НЕ делали. И вот оно оказалось похуже.
Но НЕТ. НАВЕРНЯКА используя КУЧУ РЕСУРСОВ, просто не смогли.

Оно конечно прикольно, что типо своё.
Но такой мусор.
Особенно конкурент 1050. Который JM9231. Жрёт в 2 раза больше, имеет чуть выше частоту, почти в 2.5раза больше псп, а производительность та же. Мда. При том что паскали то, далеко не новые.
А вот отсутствие того же вулкана не айс.
И типо 2 тфлоп? И 9 тфлоп? на сегодняшний день это не так и много. Хотя оно почти не о чём и не говорит.
И да как минимум были ещё 1080ти и титан Х.
Ну и конечно аппаратные декодеры и грустный dp 1.3, грустно, но допустим большего и не нужно под те условия где будут использовать данные карты.
.
Но всё же что им блин мешало поставить dp посвежее, vp9 av1 декодеры и вулкан? Хотя чё это я. Смысл ибо врят ли бы китайцы стали бы поддерживать игры на данных картах теми же драйверами. Ибо вероятно это более нишевое решение.
Но самая фигня в том, что они ещё не выпущены. И появятся серийно ток в след году. А это уже 6 лет отставания.
.
А за это время индустрия уже подсела на те же нейронки с матричными вычислениями.

Чел если ты тупой это твои проблемы.
Но по мне максимально очевидно, что ты тупо не можешь измерять задержки в отрыве от шины данных процессора. Ибо она тоже вносит свои задержки как и тот же КП. Да даже от маршрутизации в самой микроархитектуре. Ибо ты не можешь прокачать данные из озу, не используя шину лол.
Просто бери и проверяй эмпирически лол.
Сравни задержки на одинаковых модулях в 3х разных конфигах.
На интеле тот же 10900к
С тем же амд zen2 3800х
И о божечки что мы видим? На интеле задержка то оказывается ниже. Но тут разные шины и кп.
А теперь сравним задержки zen2 3800х и zen3 5800х при прочих равных.
И о боже 5800х имеет задержки почти на 10нс меньше
А ведь шина таже, да даже КП тот же. А вот иерархия L3 кеша изменилась. Сделав L3 единым для 8 ядер, что и приводит нас к тому, что шина стала менее нагруженной, ибо больше не нужно прокачиваться данные меж двумя CCX в CCD и бац задержка то стала по меньше.

Задержки конечно конские 90нс для 128бит или двухканала, для интела. Это прям слишком много.
А учитывая микроархитектуру, то задержки должны были бы остаться теми же или изменения были б минимальны.
Ибо по сути всё та же кольцевая шина, только вместо 2х больших ядер подключили два 4х ядерных кластера с малыми ядрами.
А ведь это даже ещё не самый худший варик ddr5 которым будет по факту уже ddr5 4800.
Ждёмс реальных тестов с снижением таймингов или разгоном памяти.

Выглядит немного позорно. Типо у амд хотя бы теплотрубки есть. А тут же просто алюминиевый радиатор, в лучшем случае с медным сердечником? тьфу покрасили и подстветочку.

А драйверу в принципе плевать игра не игра.