Скрытые дефекты микросхем могут приводить к повреждению данных в современных компьютерах

Пост опубликован в блогах iXBT.com, его автор не имеет отношения к редакции iXBT.com
| Новость | Платформа ПК

Специалисты, работающие с крупномасштабными дата-центрами, бьют тревогу: сообщая о подрыве одной из фундаментальных обещаний вычислительной техники — ее надежности. Речь идет о проблеме, известной как скрытое нарушение целостности данных (Silent Data Corruption, SDC). Это явление заключается в том, что аппаратные дефекты микросхем приводят к искажению результатов работы программ, при этом не вызывая сбоев, ошибок или каких-либо явных сигналов о проблеме.

AMD Ryzen 8000 Hawk Point
Автор: AMD Источник: www.reddit.com

Корнем проблемы являются дефекты в кремниевых компонентах процессоров, графических ускорителей и специализированных чипов для искусственного интеллекта. Эти дефекты могут возникнуть на стадиях проектирования и производства микросхем, а также появиться позднее вследствие старения компонентов или воздействия внешней среды. Несмотря на то, что производители проводят тестирование на наличие большинства дефектов в своих микросхемах, даже самые строгие заводские проверки выявляют лишь около 95-99% подобных проблем. Неизбежно, какая-то часть дефектных чипов попадает в эксплуатацию.

В ряде случаев такие дефекты провоцируют заметные сбои, например, приводя к зависанию системы. Однако гораздо более серьезную озабоченность у специалистов вызывают скрытые ошибки. При таком сценарии неисправный логический блок или арифметический узел выдает неверное значение в работе вычислительных систем. Если это некорректное значение распространяется в программе, не будучи обнаруженным механизмами проверки, система успешно завершает поставленную задачу и предоставляет неверный результат в виде правильного.

Автор: Intel Источник: cnx-software.ru

Долгое время считалось, что скрытые сбои в процессорах — явление редкое, почти фантастическое. Однако крупные операторы на рынке гипермасштабируемых вычислительных систем, в том числе Google и Alibaba, сообщают, что в среднем один процессор из тысячи в их парке может генерировать скрытые ошибки при определенных условиях. Подобные опасения высказываются специалистами и в отношении графических процессоров и ускорителей искусственного интеллекта.

Источник: digitaltrends

Автор не входит в состав редакции iXBT.com (подробнее »)

Сейчас на главной

Новости

Публикации

Обзор винилового проигрывателя Reproductor RP-300BT: хорошее звучание в белоснежном исполнении

Рынок виниловых проигрывателей не стоит на месте и предлагает всё больше и больше новинок на любой вкус. Виниловые проигрыватели поставляются в разнообразных цветах, с интересными формами,...

Обзор электрического духового шкафа Candy COXP08LTBX

В мире современной кухонной техники, особенно когда речь идет о приготовлении самых разнообразных блюд, многие люди всё чаще отдают предпочтение именно электрическим духовым шкафам. По сравнению с...

Касты будущего мира: как ИИ разделит человечество на «архитекторов», «кентавров» и «лишних людей»

Размышления о том, как будет выглядеть общество будущего. Рассмотрим 4 основные касты, на которые поделиться наш мир из-за революции искусственного интеллекта.

✦ ИИ  Критическая ошибка бытовой стирки: как хозяйственное мыло (pH 12) разрушает эластан и липидный барьер кожи

Слепая вера в ГОСТ уничтожает гардероб. Как среда pH 12 превращает хлопок в наждак, растворяет эластан и провоцирует дерматит. Разбор химии процесса.

✦ ИИ  Почему ноутбук греется и можно ли это исправить самому

Вы работаете за ноутбуком и чувствуете, что корпус стал горячим. Вентиляторы шумят так, будто ноутбук собирается взлететь. Это знакомая ситуация для многих. Но когда температура становится слишком...