Комментарии / Публикации Civil / iXBT Live

Автор не входит в состав редакции iXBT.com (подробнее »)

тесты проводил далеко не только мцст, настройки крутили какие угодно, а резалт не менялся

Пруф в студию. Впрочем и так понятно, что ты выдумываешь на ходу. У Эльбруса результаты ОЧЕНЬ зависят от компилятора.

ну и резалты эти никакого отношения к ггц не имеют, в спеках нет вообще такого показателя, не надо сваливать в кучу
наконец

SPEC дает очки на базе скорости выполнения, в нем естественно нету (я и не заявлял такого). А вот МЦСТ, когда делает презентации и упоминает SPEC очень любят указывать SpecINT/GHz и SpecFP/GHz, потому что иначе все для Эльбруса выглядит крайне плачевно. Так что претензия к МЦСТ.
Презентации где они так делают ищутся крайне элементарно по запросу «Эльбрус SpecINT» в поисковике, буквально 2-3 ссылка.
Можете им написать и добиться прекращения публикации лживой метрики.

куда как более сомнительными и недобросовестными являются отсылки к частотам, особенно при сравнении vliw и risc/cisc

Ну на это ответ простой: нет
p.s. ну я думаю очевидно, что ты так и не подучил мат часть с прошлого раза, раз говоришь то что говоришь выше. Значит смысла дальше продолжать диалог с человеком, который не понимает о чем говорит — нет.

Ответ ZError на комментарий

Так речь о том, что все эти «тесты» делают, используя систему динамической двоичной трансляции кода х86.

То, что я выше привел — это результаты нативно собранного кода. Все эти тесты — opensource и их собирали и гоняли нативно. Поэтому тоже не катит аргумент.
В двоичной трансляции, кстати, результаты иногда будут лучше. К сожалению на Э16С я не видел результатов под RTC (система динамической трансляции от МЦСТ), видел только для Э8С и Э8СВ. Но чтоб понимать, на Э8СВ Coremark выдает почти в 2 раза лучший результат под транслятором. В dhrystone — на 30% хуже, в linpack — одинаковый, а в whetstone процентов на 5 хуже под эмулятором.
И то что иногда транслятор работает лучше — известная особенность. Связана с тем, что транслятор добавляет немного динамического планирования, ценой того что съедает два ядра системы под себя (по сути он анализирует исполнение кода и может переоптимизировать некоторые функции на лету). По этой же причине, интерпритаторы других языков под ним могут работать лучше (но все равно плохо).
Это все, кстати, прямые следствия особенностей VLIW как архитектуры. И прична, почему более-менее успешные VLIWы не давали доступа к своим кишочкам, а представлялись какой-то совсем другой архитектурой (ARM или x86).

А тут есть маааленькая проблема — под Эльбрус только компилятор от МЦСТ. Других нет.
В худшем случаи конечно будет интерпретатор или jit-компилятор конкретного языка в машинный код, оптимизированный сотрудниками МЦСТ (так уж устроены jit компиляторы, что их надо портировать, а ассемблер у Эльбруса — закрытый), собранный в итоге компилятором от МЦСТ. Так что аргумент мимо. К тому же браузер или скриптовые языки — это весомый кусок реальных задач. Или, там, JVM или .NET — тоже реальные задачи, которые нужны людям.

Я не говорю уже про рынок, который должен быть в 1 млн. процессоров в год, чтобы это хоть как-то отбивалось.

Кстати забыл про это сказать. Во первых в процессорах его измерять не стоит. У тебя есть 300мм пластина, на ней может быть как 1 процессор (waffer scale какой-нибудь), так и сотня мелких. Для фабы цена пластины фиксирована, кстати она же публична для TSMC (на 16нм пластина стоит 4к, то что для клиента, для 5нм уже 17к. Естественно USD. Без учета расходов на изготовление масок и прочего). Естественно в это включена и цена материалов, которая тоже не малая (и это уже не очень публично).
По различным свидетельствам где-то 40-50% цены пластины — это прибыль фабрики.
Вот посчитайте — извечтно что себестоимость фабрики на 5нм (если ты знаешь что и как делать, без учета зарплаты персонала, затрат на обучение и так далее) — 12 млрд USD, фабрика при этом сможет производить 20 тысяч пластин в месяц, с каждой пластины будет капать 9к USD в пользу фабрики (опять же без учета затрат на зарплаты, только после материалов). Банальная окупаемость в ноль — более 66 месяцев.
Взяв размер 121 кв. мм (Apple M1 — 120.5 кв. мм) и средние значения дефектов по калькулятору мы получим 427 годных чипов с пластины. 427 чипов по 20к пластин в месяц это 8.5 млн чипов в месяц. В год соответственно 102 млн.
Так что 1 млн процессоров в год — это просто смешно для современной фабы при современных же размерах процессоров.
Если пример с M1 не нравится, то для M1 Pro количество чипов уменьшиться примерно в 2.5 раза (чуть меньше на самом деле), а для M1 Max — в 5.5 раз, все равно это будет более 1 млн процессоров в месяц.
Выкладки можете перепроверить по какому-нибудь die yield калькулятора, условно считая что чип квадратный (для простоты). Площади чипов достаточно публичны.

У них сроки поставки даже до дефицита были в духе «закажи сейчас, получи через 2 года».

Ну это MrTO же. У него ничем не подкрепленное мнение по любому вопросу, которое чуть предъявишь реальный аргумент — скатывается в отрицание. Что ты сейчас и видишь, собственно говоря.

Ну так раз цифры на руках то в студию их. Подозреваю что вы о теоретически недостижимых FLOPS'ах, которые МЦСТ везде выпячивает.

чушь. Последние Эльбрусы примерно на уровне Core i5 3-4 поколения (смотря какие задачи ставить).

По тестам (производительность на 1 ядро) для Э16С:
Coremark — 4800 — это показатель чуть хуже Atom'ов примерно поколения 470-ого.
Dhrystone — 6900 MIPS — это чуть-чуть лучше чем у атома.
Linpack — 1760 MFLops — это тоже немного лучше чем у старого атома (но хуже чем у последних пары поколений).
Scimark — 560 — это показатель старого атома.
Whetstone — 2400 MWIPS — примерно на 20% лучше старого атома.
Потом, чтобы совсем сделать больно, можно посмотреть на производительность lua, js и прочих языков на Эльбрусе, где отставание будет даже от 270-ого в несколько раз.
Цифры легко ищутся в интернетах, таже как цифры для Core i 3-4 поколения.
Вы будете ближе к истине, если сравните в синтетических бенчмарках 8 ядер Э8СВ какого-нибудь с 4-я ядрами Core i 2-ого поколения. Но чем больше юз-кейсы будут похожи на реальные, тем больше будет отставание.
Все цифры выше легко найти в интернете.
У Эльбруса есть один класс задач, в которых он показывает себя хорошо при условии что писавший софт перепишет его с использованием либо интрисиков, предоставляемых Эльбрусом, либо оптимизирует на ассемблере — это любые операции с плавучкой, похожие на FMA (у Эльбруса несколько АЛУ, которые неравнозначные и пиковая производительность в теории достигается на FMA-подобном коде когда все АЛУ что-то делают, кажется у v5 это 5 FMA или около того). В реальной жизни это титанический труд по переписыванию кода, который gcc и msvc просто векторизует, и количество задач где это полезно — крайне мало. Плюс все идет лесом если в системе есть еще какой-нибудь потребитель ресурсов (статическое планирование не очень хорошо работает в многозадачных системах, увы)

> поэтому значимость его как хоть сколько-нибудь относящемуся к реальности примерно такая же, как у индекса свободы прессы
То есть отражает реальность достаточно хорошо? Ок, спасибо за подвтерждение.
p.s. если хочешь поспорить с рейтингом, то у него есть публичная методология, можешь провести разбор и указать места, где происходит манипуляция рейтингом. Или также данные у таких рейтингов обычно публичные, поэтому можно найти манипуляцию в данных. Пока этого нет — нет оснований им не доверять. Так работает научный подход.

Только вот публикации результатов SPEC'а от МЦСТ не было. Потому что публикации результатов обязаны следовать ряду правил — например доказать что не было вмешательство в код тестов, предоставить опции сборки (которые должны быть едиными для всего пакета), предоставить детализацию по каждому из тестов и так далее. Это все на spec.org описано.
То что не соответствует этим правилам не может считаться публикацией результатов (кстати тестов в SPEC'ах еще определенно 6 штук, какие из них приводятся — МЦСТ также не разглашает). Но даже если посмотреть по тем цифрам что есть и интерпретировать их в пользу МЦСТ, результат все равно плачевный (поэтому, кстати, его МЦСТ любит нормировать на ГГц, хотя частот в 4-5 ГГц как у современных x86 они достичь не могут в принципе).

От каких векторов атаки защищают Эльбрусы, выпущенные на TSMC и не защищают те же Байкалы, выпущенные на том же TSMC?

Притом в Китае тоже есть свои коррупционеры (почитайте историю HSMC, где ушлый предприимчивый человечек взял 18 млрд USD инвестиций, купил какое-то случайное оборудование, купил старый склад, что осталось от 18 лярдов после этого — попросту прихватизировал и исчез)

Если кончится Интел и АМД для России, то кончится и Эльбрус. Потому что TSMC с таким же успехом скажет «нет» на очередной заказ. Китай в данном случаи не поможет (мало того что миграция на другой завод может быть сложнее чем изначальное проектирование процессора, так еще единственный их завод что обладает тонким техпроцессорм — также использует технологии США и будет вынужден отказать)

С той лишь разницей, что введение санкций поставит крест на их производстве. Так что станут только на бумаге.

TSMC. В РФ нет производства мало-мальски сложных микросхем на процессах тоньше 90нм. И то зависит от внешнего импорта. При наличии санкций скорее всего самый тонкий техпроцесс что останется будет в районе 500-1000нм, и то если другие заводы в цепочке остались на территории РФ и способны производить те же пластины и химию.

Как неуловимый Джо.

Эльбрус-801-PC (ПК на базе Эльбрус-8С: http://ineum.ru/elbrus_801-pc_gen4) за 325 тыр поставляется с Radeon R5 230 как раз потому что 2Д Ускоритель там такой, что лучше б его не было (на плате есть 1 видеовыход — VGA, аналоговый: http://mcst.ru/e8c-eatx). А так там Линукс или винда через транслятор, под первым AMD на открытых драйверах как-то работает, народ игрушки даже запускает (заменив 230-ую карточку на что-то получше, естественно).
С nVidia — в теории nouveau под линуксом может заработать, закрытые драйвера естественно не заработают и никто их портировать не будет.

Ответ dimmvd на комментарий

например для офисных компов в госсекторе обязателен

Вот вы наверняка платите налоги, хотите чтобы с них, вместо устранения реальных проблем, закупали компьютеры по 300+ тыр в офисы в какую-нибудь гос структуру (а там в такой стране как Россия уже будет счет на миллионы рабочих мест), притом что по производительности это все аналог самого дешевого NUC'а на атоме за 20 тыр?

Ответ ZError на комментарий

шутник-не-шутник, а прогресс у Эльрусов от года к году измеряется ДЕСЯТКАМИ процентов

На бумаге там между каждым поколением рост в 2 раза. А в приближенных к реальности тестах — как был уровень ~Atom N450 (на 1 ядро), так и остался.

Ответ ZError на комментарий

Просто кому-то дали на лапу, чтобы это придушить на корню.

Врядли. У них идея на бумаге звучит хорошо, на практике обладает фундаментальными недостатками: как утилитарными — необходимость портировать с нуля все jit'ы и при этом сложно получить адекватную производительность jit-компилятора, так как это плохо ложится на архитектуру, так и более прозаичными — чрезмерная сложность чипа, невозможность наращивать тактовые частоты (из-за чего одноядерная производительность страдает), невозможность менять микроархитектуру без потери совместимости и прочие радости жизни. Хотели простоту, получили очень сложный и большой чип с низкой производитеьностью в реальных условиях (но хорошо выглядящий на бумаге).
В общем я бы не сказал, что кому-то дали на лапу, скорее наконец люди начали говорить в слух о фундаментальных проблемах подхода.

Если читать оригинал новостей, то можно выяснить что в современных самолетах (те же боинги 777 и 787) высотомеры уже работают на других частотах. Но установка новых на старые самолеты — это пересертификация (возможно и высотомера, даже если там просто корпус другой). Естественно никто не захочет такое делать, если можно будет избежать.