Мы используем файлы cookie и сервисы аналитики. Ознакомьтесь с нашей Политикой сбора данных и выберите, какие типы cookie вы разрешаете:
cookie_policy_accepted — хранит ваш выбор cookiePHPSESSID — сессияkey3 — запоминание входа_ix — единая сессия входа на ixbt.comadminuserskey — вход администратораtopic_add_autosave — автосохранение черновикаls_photoset_target_tmp — временные данные загрузки фотоgeo_country — определяет ваш регион_ga, _ga_*, _ym_uid, _ym_d, _ym_* — статистика посещений__gads, __gpi — таргетирование объявленийВы всегда можете изменить свои предпочтения в настройках.
Пруф в студию. Впрочем и так понятно, что ты выдумываешь на ходу. У Эльбруса результаты ОЧЕНЬ зависят от компилятора.
SPEC дает очки на базе скорости выполнения, в нем естественно нету (я и не заявлял такого). А вот МЦСТ, когда делает презентации и упоминает SPEC очень любят указывать SpecINT/GHz и SpecFP/GHz, потому что иначе все для Эльбруса выглядит крайне плачевно. Так что претензия к МЦСТ.
Презентации где они так делают ищутся крайне элементарно по запросу «Эльбрус SpecINT» в поисковике, буквально 2-3 ссылка.
Можете им написать и добиться прекращения публикации лживой метрики.
Ну на это ответ простой: нет
p.s. ну я думаю очевидно, что ты так и не подучил мат часть с прошлого раза, раз говоришь то что говоришь выше. Значит смысла дальше продолжать диалог с человеком, который не понимает о чем говорит — нет.
Ответ ZError на комментарий
То, что я выше привел — это результаты нативно собранного кода. Все эти тесты — opensource и их собирали и гоняли нативно. Поэтому тоже не катит аргумент.
В двоичной трансляции, кстати, результаты иногда будут лучше. К сожалению на Э16С я не видел результатов под RTC (система динамической трансляции от МЦСТ), видел только для Э8С и Э8СВ. Но чтоб понимать, на Э8СВ Coremark выдает почти в 2 раза лучший результат под транслятором. В dhrystone — на 30% хуже, в linpack — одинаковый, а в whetstone процентов на 5 хуже под эмулятором.
И то что иногда транслятор работает лучше — известная особенность. Связана с тем, что транслятор добавляет немного динамического планирования, ценой того что съедает два ядра системы под себя (по сути он анализирует исполнение кода и может переоптимизировать некоторые функции на лету). По этой же причине, интерпритаторы других языков под ним могут работать лучше (но все равно плохо).
Это все, кстати, прямые следствия особенностей VLIW как архитектуры. И прична, почему более-менее успешные VLIWы не давали доступа к своим кишочкам, а представлялись какой-то совсем другой архитектурой (ARM или x86).
В худшем случаи конечно будет интерпретатор или jit-компилятор конкретного языка в машинный код, оптимизированный сотрудниками МЦСТ (так уж устроены jit компиляторы, что их надо портировать, а ассемблер у Эльбруса — закрытый), собранный в итоге компилятором от МЦСТ. Так что аргумент мимо. К тому же браузер или скриптовые языки — это весомый кусок реальных задач. Или, там, JVM или .NET — тоже реальные задачи, которые нужны людям.
Кстати забыл про это сказать. Во первых в процессорах его измерять не стоит. У тебя есть 300мм пластина, на ней может быть как 1 процессор (waffer scale какой-нибудь), так и сотня мелких. Для фабы цена пластины фиксирована, кстати она же публична для TSMC (на 16нм пластина стоит 4к, то что для клиента, для 5нм уже 17к. Естественно USD. Без учета расходов на изготовление масок и прочего). Естественно в это включена и цена материалов, которая тоже не малая (и это уже не очень публично).
По различным свидетельствам где-то 40-50% цены пластины — это прибыль фабрики.
Вот посчитайте — извечтно что себестоимость фабрики на 5нм (если ты знаешь что и как делать, без учета зарплаты персонала, затрат на обучение и так далее) — 12 млрд USD, фабрика при этом сможет производить 20 тысяч пластин в месяц, с каждой пластины будет капать 9к USD в пользу фабрики (опять же без учета затрат на зарплаты, только после материалов). Банальная окупаемость в ноль — более 66 месяцев.
Взяв размер 121 кв. мм (Apple M1 — 120.5 кв. мм) и средние значения дефектов по калькулятору мы получим 427 годных чипов с пластины. 427 чипов по 20к пластин в месяц это 8.5 млн чипов в месяц. В год соответственно 102 млн.
Так что 1 млн процессоров в год — это просто смешно для современной фабы при современных же размерах процессоров.
Если пример с M1 не нравится, то для M1 Pro количество чипов уменьшиться примерно в 2.5 раза (чуть меньше на самом деле), а для M1 Max — в 5.5 раз, все равно это будет более 1 млн процессоров в месяц.
Выкладки можете перепроверить по какому-нибудь die yield калькулятора, условно считая что чип квадратный (для простоты). Площади чипов достаточно публичны.
По тестам (производительность на 1 ядро) для Э16С:
Coremark — 4800 — это показатель чуть хуже Atom'ов примерно поколения 470-ого.
Dhrystone — 6900 MIPS — это чуть-чуть лучше чем у атома.
Linpack — 1760 MFLops — это тоже немного лучше чем у старого атома (но хуже чем у последних пары поколений).
Scimark — 560 — это показатель старого атома.
Whetstone — 2400 MWIPS — примерно на 20% лучше старого атома.
Потом, чтобы совсем сделать больно, можно посмотреть на производительность lua, js и прочих языков на Эльбрусе, где отставание будет даже от 270-ого в несколько раз.
Цифры легко ищутся в интернетах, таже как цифры для Core i 3-4 поколения.
Вы будете ближе к истине, если сравните в синтетических бенчмарках 8 ядер Э8СВ какого-нибудь с 4-я ядрами Core i 2-ого поколения. Но чем больше юз-кейсы будут похожи на реальные, тем больше будет отставание.
Все цифры выше легко найти в интернете.
У Эльбруса есть один класс задач, в которых он показывает себя хорошо при условии что писавший софт перепишет его с использованием либо интрисиков, предоставляемых Эльбрусом, либо оптимизирует на ассемблере — это любые операции с плавучкой, похожие на FMA (у Эльбруса несколько АЛУ, которые неравнозначные и пиковая производительность в теории достигается на FMA-подобном коде когда все АЛУ что-то делают, кажется у v5 это 5 FMA или около того). В реальной жизни это титанический труд по переписыванию кода, который gcc и msvc просто векторизует, и количество задач где это полезно — крайне мало. Плюс все идет лесом если в системе есть еще какой-нибудь потребитель ресурсов (статическое планирование не очень хорошо работает в многозадачных системах, увы)
То есть отражает реальность достаточно хорошо? Ок, спасибо за подвтерждение.
p.s. если хочешь поспорить с рейтингом, то у него есть публичная методология, можешь провести разбор и указать места, где происходит манипуляция рейтингом. Или также данные у таких рейтингов обычно публичные, поэтому можно найти манипуляцию в данных. Пока этого нет — нет оснований им не доверять. Так работает научный подход.
То что не соответствует этим правилам не может считаться публикацией результатов (кстати тестов в SPEC'ах еще определенно 6 штук, какие из них приводятся — МЦСТ также не разглашает). Но даже если посмотреть по тем цифрам что есть и интерпретировать их в пользу МЦСТ, результат все равно плачевный (поэтому, кстати, его МЦСТ любит нормировать на ГГц, хотя частот в 4-5 ГГц как у современных x86 они достичь не могут в принципе).
С nVidia — в теории nouveau под линуксом может заработать, закрытые драйвера естественно не заработают и никто их портировать не будет.
Ответ dimmvd на комментарий
Вот вы наверняка платите налоги, хотите чтобы с них, вместо устранения реальных проблем, закупали компьютеры по 300+ тыр в офисы в какую-нибудь гос структуру (а там в такой стране как Россия уже будет счет на миллионы рабочих мест), притом что по производительности это все аналог самого дешевого NUC'а на атоме за 20 тыр?
Ответ ZError на комментарий
На бумаге там между каждым поколением рост в 2 раза. А в приближенных к реальности тестах — как был уровень ~Atom N450 (на 1 ядро), так и остался.
Ответ ZError на комментарий
Врядли. У них идея на бумаге звучит хорошо, на практике обладает фундаментальными недостатками: как утилитарными — необходимость портировать с нуля все jit'ы и при этом сложно получить адекватную производительность jit-компилятора, так как это плохо ложится на архитектуру, так и более прозаичными — чрезмерная сложность чипа, невозможность наращивать тактовые частоты (из-за чего одноядерная производительность страдает), невозможность менять микроархитектуру без потери совместимости и прочие радости жизни. Хотели простоту, получили очень сложный и большой чип с низкой производитеьностью в реальных условиях (но хорошо выглядящий на бумаге).
В общем я бы не сказал, что кому-то дали на лапу, скорее наконец люди начали говорить в слух о фундаментальных проблемах подхода.