Комментарии / Публикации deadlock / iXBT Live

>> Вот только конкуренты, не увеличивая плотность транзисторов, но улучшая их структуру
Чушь какую-то несёте. Интел делает тоже самое что и TSMC.
Давайте цитату приведу:
«повышении плотности транзисторов на 15%»

Но это… и есть эксперимент :)

>> А чего не смочь-то
Всё у вас так просто :)
Назовите ещё какую-нибудь контору, которая бы успешно меняла архитектуру свои платформ.
Майкрософт не смог, вот.
Amiga переехала на PowerPC уже после своей смерти :)

Реалтайм? Что вы под этим подразумеваете?

>> Но если все прочие производители внезапно перейдут на арм — получится хаос.
Никакого хаоса не будет.
ARM работает в датацентрах Amazon, Google, Microsoft.

И что вы со своим HiSpot H2 прямо по улице ходите? :)

А как связан выход нового процессора любой архитектуры с заводами и дата-центрами? Они как работали, так и работают.
>> И даже не только сборки энтузиастов, но и серверы, например https://www.gigabyte.com/ru/ARM-Server.
Apple в первые несколько дней продаст на порядок больше компов, чем этих серверов было выпущено за всё время существования :)

Ну допустим 10900к неплох, но человек говорил про i7 :)

>> Про покупку компонентов от AMD даже не думаю и не читаю обзоры на их камни и мамки.
Засунули голову в песок?
Вы же так уверены в Интел, или чего-то боитесь? :)

Но почему, но почему, расстаться снова нам пришлось?
Ведь было всё у нас всерьёз второго сентября…

Такой был у меня в рабочем компе когда-то. И что?
Причём тут функционал планшета? Речь о производительности.

>> То, что в случае, если матрицы разрежены половина ее конвейеров формально простаивает
Он не простаивает. Он загружен на 100%, но за счёт нулевых элементов можно представить что условный темп удваивается. Маркетинг.
//www.ixbt.com/3dv/nvidia-ampere-a100-gpu-review.html
«графический процессор A100 поддерживает новые инструкции Sparse Tensor Core, пропускающие вычисления для записей с нулевыми значениями, что и приводит к удвоению производительности вычислений, использующих разреженность матриц.»

Увеличьте картинку и прочитайте примечание [1]

«Тут имеется 1472 IPU (целочисленных процессора), каждый из которых располагает собственной внутрипроцессорной памятью в размере 900 МБ при пропускной способности в 47,5 ТБ/с»
.
Не каждый. «IPU» это весь чип, а отдельные ядра — IPU-core.
900МБ и ПСП указаны суммарно для всего чипа, а не для тайла.

Тринадцать, не двенадцать. Впрочем через 2 месяца будет новый король IPC :)

Где вы увидели «на х86»? С утра уже бахнули, да? :D

PS: Сорри за обрывочный текст — автокоррект на iOS отрезал некоторые слова :)

>> А более современным уже проигрывает.
В Linpack? Это самый тупой тест, как раз для GPU.
Возьмите более современный HPCG — там ARM выступает ещё лучше
Fugaku/Summit
Rmax 2,80x
HPCG 4,56x

>> 84 ядрами в каждом.
“ 80 SM. 5120 CUDA Cores. “
В каждом SM — 64 “CUDA cores”. Именно то, что nvidia называет ядрами :)
Смысл в том, что процессоры Power9 слишком слабые, чтобы на них производить вычисления. Процессоры Интел тоже слишком слабые и жрущие.
Если вы не заметили, то заявлял предыдущий оратор сравнивал 202к ядер Power9 с 8 миллионами ядер ARM.
Преимущество A64FX в том, он спокойно бодается по энергоэффективности с GPU уже сейчас, оставаясь вполне обычным процессором.
>> О чем собственно фанатикам «суперэффективных АРМ» уже много лет пытаются объяснить — что как только из ARM пытаются выжать действительно хорошую производительность вся его эффективность сдувается
.
Ага, но объясняльщики обычно не рубят в матчасти и живут в своём выдуманном мирке, где Интел всё ещё лидер :)

На каких? Помню на SparcV7 была инструкция MULScc (multiply step), но вроде у остальных было нормальное умножение. Я работал с V8 только.
Да, в ARM1 не было, но он не был коммерческим.