Для работы проектов iXBT.com нужны файлы cookie и сервисы аналитики.
Продолжая посещать сайты проектов вы соглашаетесь с нашей
Политикой в отношении файлов cookie
kirill_rrr
Комментатор
kirill_rrr
Рейтинг
+426.50
Автор не входит в состав редакции iXBT.com (подробнее »)
Чем ещё надо грамотно и с пользой распорядиться! Что на самом деле встречается редко. Да собственно и задача то не простая и сам по себе паралелизм даётся не бесплатно — кучу работы надо сделать чтобы породить поток, поделить данные и объединить результаты.
>>Опять же сам факт внедрения таких ядер показывает что так наращивать производительность эффективней.
В каком нибудь 7-зипе да...
Но вот игровая производительность интелов 12-14 поколений i5-i7-i9 (заметь, как 6-и, так и 8-и ядерных!) распределялась практически идентично однопоточной производительности Р-ядра, которая в свою очередь зависела от того максимума частоты, который мог взять данный конкретный чип в силу настроек и качества кристалла.
А у амд — куча факторов, но в итоге всё сводилось к «бери самый быстрый одночиплетный». Что дошло до маразма в ризен 7900Х3Д, в котором для УСКОРЕНИЯ игровой производительности лишний чиплет и 8 ядер отключали. Официально одобренным способом! Я просто не в курсе подробностей 9950Х3Д, отключают или нет и какая разница.
>>При этом для работы на подобных скоростях у нас нынче 4 32 битных канала.
>>Вы эти каналы ещё развести на плате должны. Но и phy т.е. физический интерфейс в чипе.
Тут есть противоречие! С одной стороны гоняем данные пакетами по 4-8 байт с 64-битным адресом, а с другой начинаем изобретать режимы как бы поделить эти лишние провода на 4 канала поменьше...
Я не слышал чтобы там пробовали использовать всякие разные асинхронные варианты, деление на регионы, страничный доступ, физическое деление на мелкие каналы (логическое требует больше рассчётов, да и объединение малых каналов в большой всегда было проще), сжатие адреса или передачу адрес-данные за 2 такта.
Или например можно бы уже оптику применить. С одной стороны частоты ± сравнялись, а с другой оптика позволяет физически по 1 линии одновременно передавать 1 бит в одну сторону + 1 бит в обратную.
>>И этот алгоритм учитывает нагрев просто факт. Как и учитывает маркировку ядер.
Вы крайне сильно переоцениваете планировщики. Во первых там не какие то боги их делают и на проверку оказывается что интел внедряет самоочевидные вещи по 3-5 лет (например на релизе 12 поколения планировщик винды бодро кидал задачи на Е-ядра при пустых Р-ядрах)(а для вин10 так и не вышло финальной версии планировщика с грамотным порядком распределния) и только на 1 ОС из ~4, а во вторых там объективные требования чтобы алгоритм планировщика не был сложнее и дольше микро- или нано-секунд.
>>я никаких фризов при бусте не припомню.
Если у вас и так частота 120+, то лаги до 60 могут быть не заметны глазу. Но если настройки графики выставлены так, что там 60 с трудом, тогда лаги и фризы становятся болезнью.
И больше всего лагов и фризов я огрёб в 2-х играх, многопоточной версии HL2 под линукс и Ассасин БлэкФлаг под виндой, обе на амд А6 2,9ГгЦ с бустом до 3,5. Таким жирным бустом, что прям вентилятор прыгал на 1 дополнительный режим вверх. Отключение буста настолько явно увеличивало плавность. что снижение потребления было вообще второстепенным.
Вообще в принципе, любые непредсказуемые скачки производительности потока дают в играх фризы. Также экспериментально подтверждено (знакомым, которому 100% доверяю), что игры уровня киберпанка2077 на ризен 2600 идут значительно плавнее при отключении гиперпоточности. Некоторые, с очень малой нагрузкой на цпу в 1-2 потока — не подвержены эффекту, но большинство да.
>>А я открою вам тайну она всегда не стабильная. То что вы видите в мониторинге это не фактическая частота
Если ты отключаешь полностью автоматический режим и ставишь жёсткие лимиты вместо буста — она становится стабильной в пределах 0,1% колебаний. И производительность потока тоже почти не прыгает. И планировщику не надо перекидывать задачи с тротлящих ядер на полноскоросные. И вообще физически становится возможным распаралелить задачи так, чтобы они предсказуемо завершились.
>>Концентрация тепла на единицу площади ниже, отводить с большей площади проще = холоднее.
Ты не думаешь, что важной единицей площди может стать радатор а не термоинтерфейс чиплет-крышка? И тогда этобудет экономия на спичках, а особенно неважным это становится при температурах ниже 70-75.
>>Условные несколько потоков на 40… 60 остальные по 20...30
Хочешь сказать ни одного потока на 100%? Или ты простосмотришь на 1-секундном интервале? Или там реально процессор 40% времени нихрена не делает?
И нет, я не побегу ставить недогта с требованиями киберпанка. Слишком жирно и долго на просто посмотреть, да и цпу-трассера у меня нету.
Кстати, держать ядро под 20% нагрузкой это энергитически очень накладно во все времена и на любых архитектурах. Ну кроме нескалярных 8086...80286
Подожди, а как же тайминги памяти порядка 30-50? Если это конечно не самая форсированная ддр5 с собственным таймером, берущая рубеж 8ГГц. Да, это такты памяти, но сейчас такты процессора где то близко. а не в соотошении 50 к 350.
>>Если что межъядерная задержка внутри чиплета 20нс, при обращении ко второму чиплету 70нс. Все. Т.е. разница меньше чем при доступе к ОЗУ.
Да, а какой она должна быть? Особенно когда интел в 13-14 поколениях стабильно держал 15-20мс от любого ядра к любому независимо от чиплетов.
>>А тренингом зачем вам заниматься?
Не трейнингом а трекингом. Чтобы в очень малом масштабе увидеть как именно грзился цпу и в каких режимах частот. Подробные достоверные данные, а не средняя температура по больнице.
>>это точно. И тут даже обсуждать то нечего. У вас каждый проц многоядерный так ещё и суперсеплярный.
Суперскаляр суперскаляру рознь. Какой нибудь атом n270 мог выполнять 2 инструкци на такт в теории, а на практике в среднем мог только 1,1 т.к. всякие предсказатели и переупорядочивали были порезаны в ноль, а конвееры в жёстком дефиците. А вот например ФХ-8150 в синтетической задаче «много раз посчитать x+1 над ячейками огромного массива» показал уже 10,5 циклов чтение-сложение-запись на 1 такт процессора. После чего ядра стали ещё раз в 10 круче.
Но внутренняя кухня ядра по извращениям над кодом не имеет отношенния к вопросу. В ядро подаётся последовательный поток команд и оно всеми силами делает вид как будто он там последовательно выполняется. Вот и мы можем смотреть на 1 поток на 1 ядре как на однопоточный процесс.
Будь добр, или не звизди, или покажи мне в своём полностью настраиваемом переключалку тем оформления с настройкой масштаба, шрифта и цветов. Или хотя бы где в ланчере включается вызов меню приложений в 1 касание кнопки.
Там есть гугловский дизайн, а они самые худшие в этом за последние 10 лет с появление Материал Десигн. А ещё с андроид5 там вообще нет никаких настроек кроме обоины.
>>Стоковый в Андроид файервол и так полноценный прекрасно блокирует всем приложениям лезть в сеть.
А должен блокировать процессы а не права приложений! Не забывай что андроид это джава-машина над юниксом. Сеть на уровне юниикса, приложения внутри джава-машины. Права приложений не распостраняются на сетевую подсистему. И кстати, в стоковом андроиде ВООБЩЕ нет интерфейса к файерволу.
Что ещё хуже — в стоковом андроиде есть приложения, которые равнее прочих, их права запрещено менять или они вообще игнорирют систему прав, или ты их тупо не видишь в списке приложений (хочешь увидеть — ставь сторонний рутовый софт или подключайся к ADB).
>>и не потребляют более 0,2W при серфинге
И поэтому нагревают корпус до 40 и выше? И имеют официальный ТПД в 2-3-5Вт? Может быть 6 Ач батареи перестали быть нормой и 1,5 Ач снова достаточно? Когда ты вообще видел холодный снапдрагон?
>>и даже наоборот система начнёт работать менее плавно при любых ограничениях.
А нахрена мне плавность? Мне нужны мгновенные реакции а не ждать пока оно там прорисует анимацию. Это кстати ещё одна причина поставить кастом — vyjubt штатные прошивки и стоковый андроид в принципе имеет 150мс лаг перед любой анимацией абсолютно независимо от железа — он просто хером а не руками делался. Есть всякие ГармоньОС с крутой переработкой далвик-машины и там эта задержка снижена до 20-50мс, но это всё равно сорта говна. Анимаций быть не должно везде где без них можно обойтись.
И ещё одно соображение! Когда через высокоинтенсивное электрическое поле полетят очень быстрые заряды, то кроме отклонения их траектории, какие там электрические противо-токи возникнут и что будут делать?
>>мы до бесконечности зарядить не можем себя.
А вот до полного песца — легко и непринуждённо! Всю электронику в минус, да и биохимию наверняка подредактирует только так. А может и химию с механикой тоже, тут я не знаю.
Так там лагов в пару-тройку или может десяток тактов! А переключение контекста ядра это тысячи тактов через процедуру «остановить процесс, подгрузить планировщик, передать ему управление, произвести рассчёты, подгрузить поток, передать ему управление и продолжить работу. Всё это с 2-3-4 сбросами кешей как минимум L1+L2.
Это всё ещё недостаточно чтобы увидеть, жалкие доли милисекунды, но предстаавь себе что идёт трешинг с постоянными прерываниями потока на переброски. Серия переключений контекста вполне себе увидится как фризы и микролаги в игре. Или будет сглажено, но за счёт инпут-лага.
>>За счёт которого так или иначе мы и развиваемся последние лет так 20 точно.
Это не точно. Иначе 32 Е-ядра (или зен-с) уделывали бы 8 Р-ядер как стоячих. И уделывают в серверных и рабочих нагрузках, но точно не в играх. И скорость оперативки наращивали бы не частотой в 8Ггц (реально 4*2 канала если не ошибаюсь), а 16 каналов по 1000Мгц. Это дешевле и энергоэффективней.
А ещё разработчики цпу не расшибались бы в лепёшку чтобы ускорить флагманское ядро с 400 гикбенч попугаев до 3000 на поток.
>>И повторюсь планировщик распределяет нагрев. Вне зависимости от того сколько у вас там программа умеет создавать потоков.
Планировщик подбирает лучший алгоритм переброски задач для данной конкретной нагрузки. Но если у тебя всего 4 потока то откуда у 16-ядерника взяться преимуществам над 8-и ядерником? Ты даже 1 чиплет разогреть как следует не можешь!
В конце концо всё уже упёрлось в кеш, а это он самое горячее место, оно одно и гнать там нечего.
То что интел ставит на i9 более элитные чиплеты, способные брать большую частоту при том же напряжении не значит что дополнительные 8 Е-ядер дают процессору преимущество. А у АМД ещё с 3000 линейки ризен-7 лучше себя показывает в играх чем ризен-9. Кстати, у ФХ и А-серии было то же самое. Меньше ядер могли взять большую частоту.
>>И да следуя то вашей логике выше простой турбобуст должен был бы сегодня вызывать лаги.
»сейчас" не знаю, но с самого его появления и до ризен 2600 буст вызывал лаги. Средний фпс растёт, а 1% худших кадров не растёт или даже падает. Нестабильная частота так же плохо как и низкая.
>>Тдп нам известен.
Зато нам не известно какое реальное потребление даёт эта нагрузка на этот процессор. Слишком комплексный вопрос с дохренилиардом переменных. Вот просто тупо Распберри-4, 4*кортекс-А72. Если сжимать /dev/zero через pbzip2 то одно потребление, а если сжимать /dev/urandom — на 1,5Вт больше. А если браузер или 7-zip на все 4 ядра то ещё +0,5Вт.
>>Так что вот в вашем примере что лучше 2600 при ста градусах или при 60? Ответ очевиден.
А при 55 или 65 градусах — вообще без разницы. И даже 65 и 70 можо смело считать что без раницы. И джае 55 от 75 будут отличаться только лет через 10, если/когда чип успеет немного деградировать.
>>23% вы увидите распределение по всем ядрам.
В 7-зипе, упёршимся в диск — да. В игрушке, например Sereos Sam 4 — без 0,1мс трассера не разберёшь. А в каком нибудь unigine Valley — всё 100% однозначно — нагружено 1 ядро полностью и ещё 0,5 ядра куда то размазано. Браузер? Упор в 2 главных потока. Низкая загрузка цпу в может говорить или о бутылочном горлышке, или о том что нагрузка упирается в 1 единственный поток и все прочие ядра бесполезны.
А ещё нужен полноценный файлменеджер (естественно рутовый), какое то вменяемое управление приложениями (т.е. стороннее рутовое) и если ты собираешься вставлять туда симку то крайне желательно полноценный файервол (т.е. рутовый). А чтобы не заниматься обезьяней работой и не бегать с горящим задом — нужна какая нибудь система бэкапов к которой есть доступ (естественно не гугловская, там нет доступа так что это даже не бэкапер).
З.Ы. И если подумать — то к настройкам частот цпу надо получить доступ. А то все современные смартфоны настроены чтобы быть печками.