Представленные вчера видеокарты Intel Arc, как мы давно знаем, опираются на два GPU. Старший имеет 512 вычислительных блоков, и видеокарты на его основе якобы должны конкурировать с GeForce RTX 3070 и Radeon RX 6700 XT.
Как сообщается, GPU ACM-G10, который ранее мы знали под именем DG2-512, имеет площадь 406 мм2 и содержит 21,7 млрд транзисторов. То есть он крупнее, чем Navi 22 и GA104, и имеет ощутимо больше транзисторов. Кроме того, плотность транзисторов у него также выше.
Напомним, GPU Intel производятся на мощностях TSMC по техпроцессу 6 нм, то есть по этому параметру они современнее, чем конкурирующие решения AMD и Nvidia.
Что касается GPU ACM-G11 (DG2-128), он имеет площадь 157 мм2 и содержит 7,2 млрд транзисторов. То есть он опережает Navi 24, а вот относительно GA107 говорить сложно, так как его площадь известна лишь приблизительно (200 мм2), а количество транзисторов Nvidia вообще не раскрывала.
41 комментарий
Добавить комментарий
.
Но вот сроки конечно ужасные. Тут уж на носу следующее поколение. И фактически, решение интел будет уже не у дел.
-
Раджа наделал много шума в своём Twitter, потом все сроки вышли и когда карта вышла по более совершенному 14нм в сравнении с Pascal 16нм она ещё проиграла по потреблению, мало того, что сливала 1080 не говоря о 1080 Ti
-
GloFo 14нм — 30.59
TSMC 16нм — 28.88
-
Apple A9 на техпроцессе Samsung был эффективнее TSMC и при этом чип был меньше по размерам
-
https://www.tomshardware.com/news/iphone-6s-a9-samsung-vs-tsmc,30306.html
.
Я даже больше скажу, Vega по своей сути была спущена то серверного сегмента. За неимением хоть каких-то альтернатив.
.
И да по поводу ТП. 14нм у амд Это GF. Не TSMC. И тут говорить о совершенстве не приходиться. Дешёвый да. Лучше ли он TSMC сомнительно. Ибо при прочих равных, у тсмс ТП может оказаться энергоэффективней.
—
Наверно была спущена с серверов, но кто её пиарил как игровой топ который уничтожит все существующие чипы Nvidia в своём Twitter? :)
-
Ну и Раджа уже 5 лет работает на ВК и встройками в Intel(они на одной архитектуре). Успехи так себе, ибо Iris XE хуже Vega 8-11, а тут уже RDNA2 встройка появилась, за это время AMD прошли путь от кипятильника Radeon VII до классной 6900 XT и сейчас будет 7900 XT в которую докинут блоков и все будет топ.
.
И? 5 лет. Это едва ли 1-1.5 проекта. Цикл разработки ведётся 3-5 лет!!!
И что вы ожидали? Тем более, он как бы не один работает очевидно.
.
Не говоря, уже о том. И да та же RDNA 100% ещё начали разрабатывать при Кодури же. Ибо сроки минимум 3 года. При том это я пишу скорей для CPU. Для GPU может оказаться чуть дольше.
Выпускать, что-то ежегодно, выходит только за счёт рабы нескольких групп инженеров параллельно.
2. Ну Раджа же не с 0 делает карты, учитывая опыт intel во встройках и многие штуки Intel уже выпустил вроде встройки Iris Xe и дискретки DG1 и по ним видно, что ничего хорошего Intel в ближайшем будущем не выпустит, ибо продукты очень отстают от конкурентов во всем, кроме декодирования видео. Да и Раджа вовсе обещал карты в 2020 году :)
Ещё что-то выкатывают в рамках GPU Open.
.
И по поводу FP64. Та же 64 вега 791.6 GFLOPS (1:16).
У GeForce серии обычно (1:32), у амперов (1:64). Т.е. боюсь у амдшных вег, больше всег терафлопс, в потребительской то линейке. При том, ничто тебе не запрещает, купить их не для игр. Для рабочей станции, пусть и домашней. Такое бывает.
.
А по какой логике это все должно быть и у Интела — загадка. Вы наверное не «по логике» хотели сказать, а «при прочих равных».
https://ark.intel.com/content/www/us/en/ark/products/228341/intel-arc-a770m-graphics.html
.
TGP 120-150w. При частоте 1650МГц. Флопсы видим в новости.
Отсюда и исходил. Хотя всё же сомневаюсь немного в таком потреблении.
Ну и как бы спец блоки, по идее должны занимать не очень много места.
.
Видимо руководство дало отмашку, на хороший такой транзисторный бюджет. Который и был потрачен, на всё в целом.
.
А вот игры это отдельная задача, в которой важна производительность других блоков. TMU и ROP. По мимо шейдерной же производительности.
.
А по поводу RTX Ампер, скажу так. Флопсы у них бумажные. Ибо всё кроется в самой архитектуре. Тут нвидиа принесла в жертву INT 32 блоки. И теперь конвейер может считать и то и другое. Т.е. на бумаге у Амперов много терафлопсов, но в реальных задачах меньше. Ибо часть из них будет вести расчёты целочисленные.
Если я правильно понял изменения в конвейере.
.
При том в играх без РТ. У тебя опять же как минимум важны операции текстурированные, растрирования изображения и т.д. Т.е. всё то, что исполняется непосредственно на TMU и ROP.
.
При том, при уменьшении тех процесса, порой используются другие легирующие элементы. Что тоже отражается на свойствах.
.
Отсюда с каждым новым семейством тех. процессов. Мы получаем транзистор который требует меньше энергии.
.
Отсюда есть два ответвления. Понижение потребление. Или повышение частоты. Ибо при том же потреблении, транзистор сможет переключиться больше раз.
.
При том зависимость частоты от потребления показывает экспоненциальную зависимость! Т.е. каждые следующие МГц будут требовать всё больше энергии.
.
А тут разница в тех процессах, весомое. Ибо использует передовое оборудование. Т.е. рост качества на лицо.
.
А вот увеличения кол-ва транзисторов, приводит ближе к линейному росту потребления. Я бы даже сказал линейное, с учётом биннинга(отбраковки). Ибо те транзисторы, что не соответствуют ТТХ просто забракуют. Именно по этому старшие решения, основанные на полноценном чипе, имеют лучшие характеристики.
.
При том на самом деле транзистор, транзистору рознь. Разные исполнительные блоки, по мимо того, что могут работать на иной частоте. Так и иметь иное потребление. В виду загруженности данного блока. Т.е. очевидно, что КП или даже кеши потребляют меньше энергии нежели сам исполнительный конвейер. Ибо разная загруженность и плотность вычислений.
.
По этому ваша логика понятно, но уж слишком поверхностна. Хотя я свои знания считаю крайне скромными и поверхностными. Ибо я обычный обыватель.
.
По этому например, какая-нибудь эпл может взять дочерта транзисторов и склепать огромный чип, но который будет потреблять меньше конкурентов. Ибо банально будет работать на более низких частотах. Но естественно такое решение дороже в производстве.
И не вижу проблем, поступить Интелу подобным образом.
.
Простой пример. Берёшь много транзисторов. Снижаешь частоту.
Воуля, ты получаешь ту же производительность при меньшем потреблении.
.
Рост потребления, от количества транзисторов, практически линеен.
Рост потребления, от частоты экспоненциален.
.
При том опять же даже так, вы сильно ошибаетесь. Банально взяв больше транзисторов, уменьшение потребления транзисторов, может не только компенсировать линейно возросшее потребление, но и ещё и увеличить энергоэффективность. Например при качественном росте ТТХ транзистора. Т.е. снижение потребления больше, нежели рост от кол-ва.
.
И даже так. Всё равно то, что вы пишете не всегда истина. Допустим я пущу все транзисторы на кеш. А на другом кристале исключительно на вычислительные блоки. И при прочих равных, второй кристалл будет потреблять больше энергии. А первый меньше.
.
По это ваша простая логика, приводит к неверным выводам. Ибо не учитывает важных нюансов же.
.
Т.е. можно взять больше транзисторов, и уменьшить потребление.
.
Банальщина. M1PRO имеющий 33.7 миллиарда транзисторов, потребляет всего 34Вт.
М1MAX имеющий же 57миллиардов транзисторов, потребляет около 50Вт. В пике.
.
Для сравнения. 6900xt имеющая 26,8 миллиарда транзисторов, потребляет всего 300Вт.
.
Т.е. в 2,12 раза больше транзисторов, потребляют практически в 6 раз меньше энергии.
.
Ваша логика примерно такова, стоишь ты лицом к стене, шириной ну скажем метров 10 и высотой 20, и говоришь пофиг на прямую всего 10 метров. Но вот только вход за стену находиться в километре от вас. Формально то правы, а на практике нет. Ибо не учитываете, критичные вещи.
-
« При работе от батареи производительность не ограничивается как для процессорной части, так и для графики. С учетом потребления в ~115 Вт при максимальной нагрузке это удивительно, ведь батарея (99.9 Вт⋅ч) в таком случае проживет недолго. В наших тестах заряд иссяк уже через 63 минуты, при этом по достижении 5% заряда потребление чипа ограничилось до 13 Вт.»
-
https://www.notebookcheck-ru.com/Obzor-Apple-MacBook-Pro-16-2021-M1-Max-Maksimalnaja-proizvoditelnost-bez-trottlinga.581714.0.html
При том окей, я посмотрел не в ту графу. Так что под 100Вт в синтетике.
-
А потребление ОЗУ входит в TDP видеокарты, а GDDR6X потребляет немало
.
Простой пример. Берёшь много транзисторов. Снижаешь частоту.
Воуля, ты получаешь ту же производительность при большей плате за аренду мощностей TSMC.
.
При том нет, аренда мощностей TSMC зависит от того вообще сколько продукции ты хочешь выпустить.
.
При том, что стоимость производства тех же эпловских SoC всего около 100$. Примерно, в пересчёте на 1 чип. А учитывая что это APU. При том, с широкой шиной к памяти. С IGPU на уровне дискреток и отличным CPU. Такой метод имеет право на жизнь.
.
При том будьте уверены, стоимость разработки, колоссальна, ввиду серьёзных умственных трудозатрат.
.
Ну или как пример вам АМД. Выпускать отдельный кристалл с кэшем тоже обойдётся более дорогим производством. При том что выигрыш лишь в паре определённых задач. Но очевидно стоило того.
Если в шейдера-то 4096 как бы. Ибо каждый блок у Интела содержит 8 шейдеров.
Если что у 1050, всего 5 SM Блоков. Но там больше шейдеров в блоке.
Добавить комментарий