Intel решила брать размером? Топовый GPU Intel получился крупнее конкурирующих решений AMD и Nvidia

Пока о производительности новинок Intel ничего сказать нельзя

Представленные вчера видеокарты Intel Arc, как мы давно знаем, опираются на два GPU. Старший имеет 512 вычислительных блоков, и видеокарты на его основе якобы должны конкурировать с GeForce RTX 3070 и Radeon RX 6700 XT. 

Intel решила брать размером? Топовый GPU Intel получился крупнее конкурирующих решений AMD и Nvidia

Как сообщается, GPU ACM-G10, который ранее мы знали под именем DG2-512, имеет площадь 406 мм2 и содержит 21,7 млрд транзисторов. То есть он крупнее, чем Navi 22 и GA104, и имеет ощутимо больше транзисторов. Кроме того, плотность транзисторов у него также выше. 

Напомним, GPU Intel производятся на мощностях TSMC по техпроцессу 6 нм, то есть по этому параметру они современнее, чем конкурирующие решения AMD и Nvidia.  

Intel решила брать размером? Топовый GPU Intel получился крупнее конкурирующих решений AMD и Nvidia

Что касается GPU ACM-G11 (DG2-128), он имеет площадь 157 мм2 и содержит 7,2 млрд транзисторов. То есть он опережает Navi 24, а вот относительно GA107 говорить сложно, так как его площадь известна лишь приблизительно (200 мм2), а количество транзисторов Nvidia вообще не раскрывала. 

31 марта 2022 в 13:17

Автор:

| Источник: Videocardz

41 комментарий

D
<Здесь должна быть шутка про «самые большие микросхемы в мире»>
D
Вот когда микросхема не будет помещаться в чемодан, тогда и пошутим! )))
Sawaru
По логике вещей. GPU интел должны потреблять меньше! Ибо думаю, они использовали большее кол-во транзисторов, при лучшем тех процессе. И за счёт этого достигли аналогичной производительности при более низком потреблении. В теории оно так.
.
Но вот сроки конечно ужасные. Тут уж на носу следующее поколение. И фактически, решение интел будет уже не у дел.
И
Раджа сделает кипятильник как делал многие годы GCN, не переживайте
Sawaru
Ну слушайте тут очень сильно надо постараться. Тем более над картами работает не только Раджа.
И
Его команда много раз делала такие же вещи… Вспомните Pascal и Vega
-
Раджа наделал много шума в своём Twitter, потом все сроки вышли и когда карта вышла по более совершенному 14нм в сравнении с Pascal 16нм она ещё проиграла по потреблению, мало того, что сливала 1080 не говоря о 1080 Ti
L
Справедливости ради Pascal был на православном TSMC, а Vega на еретическом Samsung.
И
Vega была на GloFo 14нм. Он лучше TSMC 16нм и вышел несколько позже
-
GloFo 14нм — 30.59
TSMC 16нм — 28.88
Sawaru
Плотность транзисторов, не показатель энергоэффективности или производительности тех процесса. Совсем.
И
GloFo и Samsung были партнерами в создании 14nm и вроде как по открытым данным разницы между ними особо нет
-
Apple A9 на техпроцессе Samsung был эффективнее TSMC и при этом чип был меньше по размерам
-
https://www.tomshardware.com/news/iphone-6s-a9-samsung-vs-tsmc,30306.html
Sawaru
Так вега, это всё тот же GCN. И вообще это GPGPU ориентированная архитектура. И как бы разработку вела команда АМД не интела. Суть архитектуры-то в сложном конвейере, который кстати силён в FP64 вычислениях. По этому ты и получаешь высокое же потребление.
.
Я даже больше скажу, Vega по своей сути была спущена то серверного сегмента. За неимением хоть каких-то альтернатив.
.
И да по поводу ТП. 14нм у амд Это GF. Не TSMC. И тут говорить о совершенстве не приходиться. Дешёвый да. Лучше ли он TSMC сомнительно. Ибо при прочих равных, у тсмс ТП может оказаться энергоэффективней.
И
Ну а толку от этой GPGPU архитектуры в десктопе? У Хуанга есть вторая архитектура для числодробилок которая обычно не хуже GCN там где она нужна

Наверно была спущена с серверов, но кто её пиарил как игровой топ который уничтожит все существующие чипы Nvidia в своём Twitter? :)
-
Ну и Раджа уже 5 лет работает на ВК и встройками в Intel(они на одной архитектуре). Успехи так себе, ибо Iris XE хуже Vega 8-11, а тут уже RDNA2 встройка появилась, за это время AMD прошли путь от кипятильника Radeon VII до классной 6900 XT и сейчас будет 7900 XT в которую докинут блоков и все будет топ.
Sawaru
GPGPU архитектуры в десктопе. Вообще толк есть. Но вопросы к АМД. Которые захотели с 1 GCN в проф сегмент залезть.
.
И? 5 лет. Это едва ли 1-1.5 проекта. Цикл разработки ведётся 3-5 лет!!!
И что вы ожидали? Тем более, он как бы не один работает очевидно.
.
Не говоря, уже о том. И да та же RDNA 100% ещё начали разрабатывать при Кодури же. Ибо сроки минимум 3 года. При том это я пишу скорей для CPU. Для GPU может оказаться чуть дольше.
Выпускать, что-то ежегодно, выходит только за счёт рабы нескольких групп инженеров параллельно.
И
1. Ну конкретно от AMD толку мало, CUDA нет который распространён в потребительских программах, а узкоспециализированные скорее всего не будут крутить на потребительских карточках, да и памяти в них маловато, как и FP64, кроме Radeon VII
2. Ну Раджа же не с 0 делает карты, учитывая опыт intel во встройках и многие штуки Intel уже выпустил вроде встройки Iris Xe и дискретки DG1 и по ним видно, что ничего хорошего Intel в ближайшем будущем не выпустит, ибо продукты очень отстают от конкурентов во всем, кроме декодирования видео. Да и Раджа вовсе обещал карты в 2020 году :)
Sawaru
CUDA это лишь библиотеки. АМД всё ещё пытаются в ROCm.
Ещё что-то выкатывают в рамках GPU Open.
.
И по поводу FP64. Та же 64 вега 791.6 GFLOPS (1:16).
У GeForce серии обычно (1:32), у амперов (1:64). Т.е. боюсь у амдшных вег, больше всег терафлопс, в потребительской то линейке. При том, ничто тебе не запрещает, купить их не для игр. Для рабочей станции, пусть и домашней. Такое бывает.
S
Не должны. Техпроцесс работает не сам по себе, а в зависимости от того как инженеры спроектировали чип. Плюс архитектура. Плюс даже прекрасный техпроцесс и энергоэффективную архитектуру можно перечеркнуть жадностью по частотам.
.
А по какой логике это все должно быть и у Интела — загадка. Вы наверное не «по логике» хотели сказать, а «при прочих равных».
Sawaru
Ну я загуглил спеки. GPU ACM-G10 что в новости.
https://ark.intel.com/content/www/us/en/ark/products/228341/intel-arc-a770m-graphics.html
.
TGP 120-150w. При частоте 1650МГц. Флопсы видим в новости.
Отсюда и исходил. Хотя всё же сомневаюсь немного в таком потреблении.
S
Ещё есть догадка, что ощутимая часть транзисторного бюджета ушла на этот ИИ-модуль, который даёт результаты только в особых задачах. Если бы сравнивались площади чипов без него результат у Интел был бы несколько лучше.
Sawaru
Я бы не был так в этом уверен. Обычные матричные блоки. Вот тут как сравнение есть нвидиа. У которых блоки то есть. Но разница в 3.7 миллиарда транзисторов всё ещё существует.
Ну и как бы спец блоки, по идее должны занимать не очень много места.
.
Видимо руководство дало отмашку, на хороший такой транзисторный бюджет. Который и был потрачен, на всё в целом.
S
Спец блоки могут занимать немало места. АВХ 512 20% ядра занимали.
Sawaru
Ну AVX это не совсем прям спец блок. Это таки часть FPU и конвейера в целом. И на этих же блоках, насколько мне известно выполняются инструкции по типу SSE.
И
120-150W это ноутбучная версия, вряд ли будет меньше 200-250 в десктопе
Sawaru
И? в новости флопсы указаны. На сайте интела потребление. Сопоставьте.
И
Написал чушь, прошу прощения
gigachad
13,5 tflops при 120-150вт весьма неплохо
И
Ну терафлопсы фактически ничего не значат, та же 3090 почти на 50% обгоняет 6900 ХТ, но в играх без RT они +- идентичны
Sawaru
Тут вы правы и нет. Важным будет подчеркнуть. Что терафлопсы это просто операции с плавающей запятой. И в какой-нибудь математике они важны. Т.е. нужно уточнять, что так именно в играх.
.
А вот игры это отдельная задача, в которой важна производительность других блоков. TMU и ROP. По мимо шейдерной же производительности.
.
А по поводу RTX Ампер, скажу так. Флопсы у них бумажные. Ибо всё кроется в самой архитектуре. Тут нвидиа принесла в жертву INT 32 блоки. И теперь конвейер может считать и то и другое. Т.е. на бумаге у Амперов много терафлопсов, но в реальных задачах меньше. Ибо часть из них будет вести расчёты целочисленные.
Если я правильно понял изменения в конвейере.
.
При том в играх без РТ. У тебя опять же как минимум важны операции текстурированные, растрирования изображения и т.д. Т.е. всё то, что исполняется непосредственно на TMU и ROP.
O
Вообще-то уменьшение тех. процесса не означает уменьшение нагрева, ибо производители процессоров выбирают: сделать большее количество транзисторов на той же площади или разместить их плотнее, но сохранив количество и уменьшив размер чипа
Sawaru
Вот тут то вы ошибаетесь. Транзистор не магическим образом становиться меньше. Он уменьшается например из-за повышения разрешающей способности или типо того. Т.е. рисунок с маски, получается более точным. Отсюда улучшаются характеристики транзистора же.
.
При том, при уменьшении тех процесса, порой используются другие легирующие элементы. Что тоже отражается на свойствах.
.
Отсюда с каждым новым семейством тех. процессов. Мы получаем транзистор который требует меньше энергии.
.
Отсюда есть два ответвления. Понижение потребление. Или повышение частоты. Ибо при том же потреблении, транзистор сможет переключиться больше раз.
.
При том зависимость частоты от потребления показывает экспоненциальную зависимость! Т.е. каждые следующие МГц будут требовать всё больше энергии.
.
А тут разница в тех процессах, весомое. Ибо использует передовое оборудование. Т.е. рост качества на лицо.
.
А вот увеличения кол-ва транзисторов, приводит ближе к линейному росту потребления. Я бы даже сказал линейное, с учётом биннинга(отбраковки). Ибо те транзисторы, что не соответствуют ТТХ просто забракуют. Именно по этому старшие решения, основанные на полноценном чипе, имеют лучшие характеристики.
.
При том на самом деле транзистор, транзистору рознь. Разные исполнительные блоки, по мимо того, что могут работать на иной частоте. Так и иметь иное потребление. В виду загруженности данного блока. Т.е. очевидно, что КП или даже кеши потребляют меньше энергии нежели сам исполнительный конвейер. Ибо разная загруженность и плотность вычислений.
.
По этому ваша логика понятно, но уж слишком поверхностна. Хотя я свои знания считаю крайне скромными и поверхностными. Ибо я обычный обыватель.
.
По этому например, какая-нибудь эпл может взять дочерта транзисторов и склепать огромный чип, но который будет потреблять меньше конкурентов. Ибо банально будет работать на более низких частотах. Но естественно такое решение дороже в производстве.
И не вижу проблем, поступить Интелу подобным образом.
O
Нет. Ошибки отсутствуют. Я не говорю про уменьшение тех. процесса, а про то, что затраты энергии на запитывание транзистора становятся меньше. Однако при увеличении их количества будет потребляться такое же/большее количество энергиии
Sawaru
Ваша логика сама по себе ошибочна. Ибо не учитывает нюансов, которые крайне важны.
.
Простой пример. Берёшь много транзисторов. Снижаешь частоту.
Воуля, ты получаешь ту же производительность при меньшем потреблении.
.
Рост потребления, от количества транзисторов, практически линеен.
Рост потребления, от частоты экспоненциален.
.
При том опять же даже так, вы сильно ошибаетесь. Банально взяв больше транзисторов, уменьшение потребления транзисторов, может не только компенсировать линейно возросшее потребление, но и ещё и увеличить энергоэффективность. Например при качественном росте ТТХ транзистора. Т.е. снижение потребления больше, нежели рост от кол-ва.
.
И даже так. Всё равно то, что вы пишете не всегда истина. Допустим я пущу все транзисторы на кеш. А на другом кристале исключительно на вычислительные блоки. И при прочих равных, второй кристалл будет потреблять больше энергии. А первый меньше.
.
По это ваша простая логика, приводит к неверным выводам. Ибо не учитывает важных нюансов же.
.
Т.е. можно взять больше транзисторов, и уменьшить потребление.
.
Банальщина. M1PRO имеющий 33.7 миллиарда транзисторов, потребляет всего 34Вт.
М1MAX имеющий же 57миллиардов транзисторов, потребляет около 50Вт. В пике.
.
Для сравнения. 6900xt имеющая 26,8 миллиарда транзисторов, потребляет всего 300Вт.
.
Т.е. в 2,12 раза больше транзисторов, потребляют практически в 6 раз меньше энергии.
.
Ваша логика примерно такова, стоишь ты лицом к стене, шириной ну скажем метров 10 и высотой 20, и говоришь пофиг на прямую всего 10 метров. Но вот только вход за стену находиться в километре от вас. Формально то правы, а на практике нет. Ибо не учитываете, критичные вещи.
O
Я не читаю эти комменты. Зачем?
И
Потребление M1 Max 100-120W все же, так как 100W•h батарейку он разряжает всего за 63 минуты и последние проценты ноутбук троттлит
-
« При работе от батареи производительность не ограничивается как для процессорной части, так и для графики. С учетом потребления в ~115 Вт при максимальной нагрузке это удивительно, ведь батарея (99.9 Вт⋅ч) в таком случае проживет недолго. В наших тестах заряд иссяк уже через 63 минуты, при этом по достижении 5% заряда потребление чипа ограничилось до 13 Вт.»
-
https://www.notebookcheck-ru.com/Obzor-Apple-MacBook-Pro-16-2021-M1-Max-Maksimalnaja-proizvoditelnost-bez-trottlinga.581714.0.html
Sawaru
ну как бэ, в ноуте потребителем выступает не только SoC. Ещё как минимум ОЗУ и Монитор.
При том окей, я посмотрел не в ту графу. Так что под 100Вт в синтетике.
И
Монитор почти ничего не потребляет, у меня MBA M1 работает часов 7-8, а если смотреть фильмы так вообще часов 15, ибо основные потребители процессор и встройка
-
А потребление ОЗУ входит в TDP видеокарты, а GDDR6X потребляет немало
S
Ваша логика сама по себе ошибочна. Ибо не учитывает нюансов, которые крайне важны.
.
Простой пример. Берёшь много транзисторов. Снижаешь частоту.
Воуля, ты получаешь ту же производительность при большей плате за аренду мощностей TSMC.
Sawaru
Ну так про плату речи и не шло. Но да дороже. И ничего страшного в этом нет.
.
При том нет, аренда мощностей TSMC зависит от того вообще сколько продукции ты хочешь выпустить.
.
При том, что стоимость производства тех же эпловских SoC всего около 100$. Примерно, в пересчёте на 1 чип. А учитывая что это APU. При том, с широкой шиной к памяти. С IGPU на уровне дискреток и отличным CPU. Такой метод имеет право на жизнь.
.
При том будьте уверены, стоимость разработки, колоссальна, ввиду серьёзных умственных трудозатрат.
.
Ну или как пример вам АМД. Выпускать отдельный кристалл с кэшем тоже обойдётся более дорогим производством. При том что выигрыш лишь в паре определённых задач. Но очевидно стоило того.
117961921025203236501@google
Посмотрим, что сделал злой раджа.
80194941@vkontakte
512 блоков — меньше чем 1050?
Sawaru
https://www.techpowerup.com/gpu-specs/arc-7-a770m.c3909
Если в шейдера-то 4096 как бы. Ибо каждый блок у Интела содержит 8 шейдеров.
Если что у 1050, всего 5 SM Блоков. Но там больше шейдеров в блоке.

Добавить комментарий

Все новости за сегодня

Календарь

март
Пн
Вт
Ср
Чт
Пт
Сб
Вс