Автор не входит в состав редакции iXBT.com (подробнее »)
avatar
С этим без проблем справится обычный процессор.
avatar
И где я должен критиковать apple, под новостью об Интел?) Покажи мне где я хвалил яблоко за ии модуль в цп. Потом можешь предъявлять за двойные стандарты, нефанат.
avatar
Все верно. Можно просто прикинуть в каком сценарии это понадобится, что не так уж и сложно. AVX-512 и AMX существенно повышают нагрузку на подсистему памяти, как и любые векторные инструкции при активном их использовании. Считать стали больше, а память-то та же. В дебри ходить не буду, приведу приблизительно на примере восьмиядерного Skylake.
.
Берём AVX2 + FMA3. Делаем fused multiply and add. a=(a*b+c)
3 операнда * 256 бит * 3 ГГц * 8 ядер * 2 инструкции в такт = 4.6 ТБ/с
Четырёхканальная DDR4 даст пропускную способность порядка 100 ГБ/с.
.
Разница 40 раз. Процессор в этом сценарии работает 2.5% времени, а 97.5% времени простаивает из-за малой ПСП памяти. Отсюда спрос на НВМ для числодробилок.
avatar
> Так что как ни старайся, наш продукт будет в разы и десятки раз дороже, потому что будет продаваться только местно и в некоторых дружественных странах.
> Делать всё равно надо
Прекрасные мысли, в них так и чувствуется желание громко и с пафосом бестолково потратить чужие деньги.
avatar
Или бесполезно, потому что это отожравший блоки общего назначения модуль ЦП на площадь которого будет подаваться сколько-то ватт даже в простое.
avatar
Так это ж и не претензия.
avatar
В 2080ti 18.6 млрд транзисторов. В 3090 28.3 млрд, меньше чем в 2 раза разница. Учитывая что 4090 таки не чипсет трекратный разнице взяться неоткуда.
.
Зайдём с другой стороны. В 3090 10496 CUDA-ядер. В 4090 по слухам 16384. Опять разница меньше двух крат, трём взяться неоткуда.
avatar
Так что использовать? Вот базовую арифметику использовали в очень многих задачах. Поэтому сделали ММХ. ММХ использовали в очень многих задачах. Поэтому сделали SSE. SSE использовали в очень многих задачах. Поэтому сделали AVX/AVX2. AVX/AVX2 использовали в очень многих задачах. Поэтому сделали AVX512.
.
Зачем VPU? Нейросети можно и на ГПУ/ЦПУ обучать. Для каких задач нужен VPU? Что ускорить? Какому проценту пользователей это нужно?
avatar
Даже у AVX-512 виднеется больше полезных прикладных применений (ускорение обучения нейросетей ими лишь одно из многих), чем у этих VPU, которые среднему покупателю непонятно зачем нужны. Очередное псевдодостижение ради победы в паре бенчмарков.
avatar
Нет, не значит что за ней будущее в серверах. Просто она лучше подходит для некоторых задач (за счёт большой псп). Но для убивцы ДДР этого мало.
avatar
Написали вы немало о степпингах да производстве, но не о микроархитектуре. С первым спорить в принципе и не собирался, по второму не вижу предмета изначального спора, так что добавить мне нечего.
avatar
Хотел поставить плюс, промахнулся и поставил минус. Ничего из добавлений не отрицаю.
avatar
«Тем не менее это тоже улучшение»
По сути единственное.
« по мелочи сделали ещё что-то»
Так что? Где достижения за год?
«отработали производство и повысили частоты»
Во-первых для того чтобы повысить частоты на том же техпроцессе и той же микроархитектуре много ума не надо. Во-вторых это никак не относится к изменениям в микроархитектуре.
.
Так что никаких микроархитектурных достижений кроме увеличения l2 кэша не видно. Насколько это увеличит cache hit — неясно. Хорошо если на 0.1%.
avatar
И что улучшили в микроархитектуре Raptor Lake кроме l2 кэша?
avatar
С такими керогазами будет припекать так что надуются не только щеки.
.
А вообще мне кажется что в данном случае дело не в конкуренции (разгоним вусмерть ради преимущества в 2% над конкурентом), а в борьбе за «достижение» само по себе. AMD в 2013 году горе-победу с первым 5 ГГц процессором одержало (с другими победами в тот период было туго), Интел в 2022 решил повторить горе-успех с 6 ГГц (в 13 поколении архитектура та же что у 12).
avatar
На Интеле достаточно давно 5 ГГц под бустом на К процессорах под водянкой.
Правда это многовато «но», так что по большей части посыл верный.
avatar
Так я про компьютеры/смартфоны и отвечал. В них ОЗУ и/или ПЗУ отдельные со всеми следствиями.
avatar
Конечно не тоже самое. Только это не означает само по себе, что там картина заметно отличается от попугаев в синтетике, поэтому этот пассаж неправоту оппонента никак не доказывает. Поэтому и написал, что это странная претензия. Где тут фанатизм — загадка. Можешь мне мои же цитаты из сообщений выше присылать, если где-то буду сильно ругать АМД за синтетику, не обижусь.
avatar
Тогда можно и сразу на исходный вопрос ответить. Выделяю капсом.
«А тесты ОБЯЗАТЕЛЬНО должны быть НЕСИНТЕТИЧЕСКИМИ или что?»
Просто если не должны — то странно на них указывать как на что-то плохое, тем более что это никак не доказывает неправоту Расула.
avatar
Тесты в реальных приложениях это тоже тесты. Тоже невероятно.