Обзор SSD Silicon Power XPOWER XS90 – раскрываем потенциал PCIe Gen5 без синтетики
Пост опубликован в блогах iXBT.com, его автор не имеет отношения к редакции iXBT.com
Если автор пообещал вам публикацию на iXBT.com (а не в блогах iXBT.com), то сообщите об этом, пожалуйста, на почту abuse@corp.ixbt.com
Silicon Power XPOWER XS90 — накопитель на базе PCIe Gen5, и
в теории от него ждешь максимальной отдачи от интерфейса. В тестах я смотрю не
только на пиковые цифры, но и на поведение при переносе сотен гигабайт и работе
с мелкими файлами. В статье разберу, где Gen5 действительно чувствуется, а где
все решает тип нагрузки.
Упаковка, комплект поставки и внешний вид
Накопитель поставляется в компактной картонной коробке
темного цвета. Коробка содержит на себе базовые сведения о накопителе: PCIe Gen
5 x4 M.2 2280 SSD XS90 с поддержкой NVMe 2.0., указана максимальная скоростью
чтения до 14 300 МБ/с и емкостью 2 ТБ. Внутри — прозрачный пластиковый блистер,
в котором накопитель. Ни винта, ни радиатора, ни бумажной инструкции в
комплекте не предусмотрено.
Автор: BadMadSam
Автор: BadMadSam
Форм-фактор стандартный M.2 2280. Плата черного цвета. С
лицевой стороны установлена декоративная наклейка с логотипом XPOWER и надписью
M.2 PCIe Gen 5x4 SSD. Указана модель XS90 и объема 2TB, а также серийным
номером и QR-кодом. Наклейка глянцевая, тонкая, внутренняя поверхность
фальгилированая, без металлической пластины либо штатного радиатора. Контактная
группа выполнена под M-Key. Край аккуратный, пайка визуально чистая. По толщине
накопитель соответствует заявленным 2.3 мм, то есть он совместим с ноутбуками и
системами, где критична высота модуля.
С обратной стороны размещена крупная черная наклейка с
сертификационной информацией: CE, FCC, EAC, UKCA, RoHS и другие обозначения.
Поверхность также без элементов охлаждения.
Автор: BadMadSam
Автор: BadMadSam
После снятия декоративной наклейки плата полностью
открывается, и уже можно спокойно рассмотреть компоновку. Ближе к контактной
группе расположен контроллер Silicon Motion SM2508G AC — актуальное решение под
PCIe Gen5 x4. Он находится практически у ключа, что типично для такой схемы
разводки. На корпусе есть маркировка TSMC, что согласуется с официальной
информацией о современном техпроцессе. Сверху установлена металлическая крышка,
но это не радиатор в привычном понимании, а стандартный теплорассеиватель без
дополнительного ребрения. Рядом с контроллером размещена отдельная микросхема
DRAM с маркировкой 4JD77 D9WQK. Используется LPDDR4-кэш, то есть здесь
реализован полноценный буфер памяти, а не HMB через системную ОЗУ. Для
накопителя такого уровня это ожидаемая конфигурация.
Автор: BadMadSam
Автор: BadMadSam
Автор: BadMadSam
Автор: BadMadSam
Далее по плате расположены микросхемы NAND с маркировкой
LGM512G5BCB5. В версии на 2 ТБ используется несколько чипов памяти,
распределенных по плате. Монтаж аккуратный, пайка ровная, дорожки разведены
чисто, без следов избыточного флюса или небрежной обработки.
Вокруг контроллера плотная обвязка — много мелких элементов
питания и стабилизации. Для Gen5 это характерная картина: требования к питанию
и сигналу выше, чем у предыдущего поколения, поэтому силовая часть выглядит
насыщенной. Контактная группа выполнена аккуратно, позолота ровная, край платы
обработан чисто. Отверстие под крепеж стандартное для M.2 2280.
Особенности PCIe Gen5
PCIe Gen5 x4 — это скорость передачи 32.0 гигатранзакции в
секунду на линию, что дает теоретическую пропускную способность около 15.75
гигабайта в секунду в каждом направлении. Для четырех линий это практически
предел возможностей интерфейса. Заявленные 14 300 мегабайт в секунду по чтению
находятся очень близко к максимуму пределу протокола. Удвоение пропускной
способности по сравнению с Gen4 достигается за счет повышения частоты передачи
сигнала. Но вместе с этим возрастают требования к качеству разводки линий, стабильности
питания и подавлению помех. Поэтому на плате заметна плотная силовая обвязка
вокруг контроллера — система питания рассчитана на более высокие частоты и
нагрузки.
Контроллер класса SM2508G работает по протоколу NVMe 2.0.
Это означает поддержку современных механизмов управления очередями команд,
улучшенную телеметрию и оптимизированную обработку операций ввода-вывода.
Наличие отдельной микросхемы оперативной памяти типа LPDDR4 играет важную роль:
при таких скоростях полноценный буфер снижает задержки при работе с таблицей
трансляции адресов и позволяет удерживать высокую производительность при
длительной записи.
С точки зрения тепловыделения Gen5 — это уже другой уровень.
При последовательной записи на максимальной скорости энергопотребление
контроллера выше, чем у большинства решений Gen4. Это напрямую связано с
увеличенной частотой работы интерфейса. Без радиатора при продолжительной
нагрузке накопитель может перейти в режим ограничения частоты для удержания
температуры в допустимых пределах.
Автор: BadMadSam
Важно понимать, что PCIe Gen5 требует совместимой платформы —
процессора и материнской платы с поддержкой пятого поколения. При установке в
слот четвертого поколения скорость ограничится примерно 7 000 мегабайтами в
секунду, а в третьем поколении — около 3 500 мегабайт в секунду.
Тестирование
Начал с ATTO в режиме Direct I/O, без обхода кеша записи.
Диапазон блоков от 512 байт до 64 МБ, глубина очереди 4, тестовый файл 256 МБ.
Картина получилась ожидаемая для высокоскоростного Gen5-накопителя, но есть
нюансы.
На малых блоках до 4 КБ скорость растет постепенно, без
резких скачков. Уже на 8 КБ видно уверенное ускорение, а начиная с 16 КБ
накопитель выходит в гигабайтный диапазон. Это говорит о корректной работе
контроллера и отсутствии узких мест на уровне прошивки. При переходе к 64 КБ и
выше скорость записи быстро поднимается к 6-11 ГБ/с, а с 256 КБ фактически
стабилизируется на уровне около 12.4 ГБ/с. Чтение держится еще выше — порядка
13.7 ГБ/с на крупных блоках. То, что кривая практически выравнивается уже после
256 КБ, показывает, что интерфейс PCIe 5.0 x4 используется почти полностью.
Потолок близок к теоретическому пределу линии. Поведение ровное, без провалов,
без ступенчатых просадок — это характерно для контроллера с DRAM и хорошо
настроенного SLC-кеша.
Автор: ATTO Technology, Inc.
Автор: ATTO Technology, Inc.
Теперь про IOPS. На блоке 4 КБ при глубине очереди 4
получаем примерно 104-120 тысяч операций в секунду. Это нормальный показатель
для очереди QD4. Здесь важно понимать: ATTO не нагружает диск как профиль QD32
или QD64, поэтому цифры выглядят скромнее, чем заявляет производитель. Но с
точки зрения реального настольного сценария это как раз ближе к жизни. Интересный
момент — поведение на мелких блоках 512 байт и 1 КБ. Скорость не обваливается
критично, но видно, что контроллер начинает упираться в накладные расходы. Это
нормально. В реальных задачах такие размеры блоков почти не используются,
поэтому на практическую производительность это не влияет.
Далее накопитель тестировал в CrystalDiskMark 9 в двух
режимах — «Пиковой» и «Реальной» скорости. Оба сценария принципиально разные по
нагрузке. В режиме Пиковой скорости диск демонстрирует те значения, которые
ожидаешь от полноценного PCIe 5.0 x4 решения. Последовательное чтение выходит
на уровень 14202 МБ/с, запись — 13410 МБ/с. Это фактически потолок интерфейса.
Линия используется максимально эффективно, ограничений со стороны контроллера
или прошивки не видно. На случайных операциях 4K при высокой очереди (Q32T16)
получаем 6026 МБ/с на чтении и 5333 МБ/с на записи. В пересчете на операции —
около 1.47 млн IOPS на чтении и 1.30 млн IOPS на записи. Это уже уровень
топовых контроллеров с DRAM и агрессивной оптимизацией очередей. Задержки при
этом находятся в разумных пределах, без аномальных всплесков. Поведение ровное.
Никаких резких просадок внутри тестового объема 1 ГиБ не наблюдается. Понятно,
что это работа внутри SLC-кеша, но с точки зрения пиковых значений накопитель
полностью раскрывается.
Автор: Noriyuki Miyazaki
Автор: Noriyuki Miyazaki
В режиме «Реальной» скорости картина меняется, и именно этот
профиль интереснее для практики. Здесь используется Q1T1, то есть минимальная
глубина очереди, приближенная к бытовым сценариям. Последовательное чтение
составляет 5885 МБ/с, запись — 10091 МБ/с. Это уже не цифры из описания, а
результат, ближе к повседневной нагрузке. Чтение заметно ниже пикового
значения, и это логично: при Q1 контроллер не может распараллелить операции по
максимуму. По 4K Q1T1 получаем 80 МБ/с на чтении и 222 МБ/с на записи. В
операциях это около 19600 IOPS на чтении и 54365 IOPS на записи. Здесь уже
видно реальную картину работы FTL и алгоритмов распределения нагрузки. Задержки
50.77 мкс на чтении и 18.32 мкс на записи находятся в пределах нормы для
современного NVMe с DRAM.
В завершение провел линейное чтение и запись в AIDA64 с
размером блока 8 МБ. Этот тест уже показывает не кратковременный пик, а
поведение накопителя по всей площади, от 0 до 100 процентов. Картина получилась
ровной. Скорость на протяжении всего объема держится в районе 8.2-8.4 ГБ/с.
Минимум — 7831 МБ/с, максимум — 8442 МБ/с, среднее значение — 8288 МБ/с. График
без провалов, без ступенчатых переходов, без деградации к концу диска. Это
говорит о стабильной работе контроллера и отсутствии ограничений по термопакету
в режиме чтения. Нагрузка на процессор минимальная, что подтверждает корректную
работу NVMe-стека. Важно понимать, что здесь мы не видим 14 ГБ/с, как в пиковом
профиле. И это нормально. В линейном чтении AIDA использует другую методику и
не работает в экстремальной очереди, поэтому результат ближе к реальной
последовательной передаче крупных файлов.
Автор: Tamás Miklós
А вот запись дает куда более интересную картину. В начале
теста скорость держится на уровне около 9.5 ГБ/с — это работа в пределах
SLC-кеша. Примерно к отметке 18-20 процентов график резко падает до 1.5-1.6
ГБ/с. Это момент выхода из динамического SLC и перехода к записи напрямую в
TLC. Дальше накопитель удерживает скорость в диапазоне 1.3-1.6 ГБ/с достаточно
продолжительное время. Периодически наблюдаются кратковременные всплески до
8-10 ГБ/с — это перераспределение буфера и очистка SLC. Ближе к 70-75 процентам
начинается более выраженная нестабильность: появляются колебания, отдельные
просадки вплоть до 443 МБ/с. Средняя скорость по всему объему составила 3200
МБ/с. Поведение типичное для современного TLC-накопителя с агрессивным
SLC-кешированием. В пределах кеша скорость очень высокая, после его заполнения
диск переходит в режим устойчивой прямой записи с заметно более скромными
показателями.
Автор: Tamás Miklós
От синтетики переходим к практике. Переношу файлы и папки
различных объемов. В качестве источника используется Silicon Power XPOWER XS90,
приемником выступает XPG MARS 980 Blade. Перенос выполнялся через TeraCopy с
проверкой xxHash3-64, то есть запись сопровождалась верификацией данных.
Первый сценарий — один файл объемом 401.6 ГБ. Операция
заняла 3 минуты 06 секунд, средняя скорость составила около 2.2 ГБ/с. По
графику видно, что в начале запись идет на высокой скорости, затем происходит
снижение — это выход из SLC-кеша и переход к нативной TLC-записи. Далее
скорость держится на стабильном уровне без резких провалов, что указывает на
корректную работу контроллера и отсутствие выраженного троттлинга в данном
сценарии.
Автор: Code Sector Pty Ltd
Автор: Code Sector Pty Ltd
Следующий сценарий — перенос папки объемом 10.2 ГБ,
содержащей 36 989 файлов. Это уже не линейная запись, а нагрузка на файловую
систему и FTL-таблицы контроллера. Операция заняла 2 минуты 47 секунд. Средняя
скорость составила около 62 МБ/с. Разница по сравнению с переносом одного
крупного файла принципиальная. Здесь накопитель работает в режиме большого
количества мелких операций: создаются тысячи записей в MFT, обновляются
атрибуты, происходит постоянная фиксация метаданных. Линейной передачи почти
нет, основная нагрузка — случайная запись и управление таблицами. График
передачи отражает это поведение: скорость нестабильная, без длинной «полки», с
колебаниями. Это нормальная картина для сценария с десятками тысяч мелких
файлов.
Автор: Code Sector Pty Ltd
Автор: Code Sector Pty Ltd
Теперь выполняю обратную операцию: перенос того же крупного
файла объемом 401.6 ГБ с XPG Mars
980 Blade обратно на Silicon Power XPOWER XS90. Операция заняла 2
минуты 01 секунду. Средняя скорость составила около 3.3 ГБ/с. Картина передачи
ровная, без выраженных провалов. В отличие от теста записи в синтетике, где
после заполнения буфера наблюдалось снижение, в реальном сценарии накопитель
удерживает высокую скорость на протяжении всей операции. Это говорит о том, что
при копировании с другого быстрого NVMe контроллер работает в устойчивом режиме, а объем SLC-кэша достаточен для
такого объема записи.
Автор: Code Sector Pty Ltd
Автор: Code Sector Pty Ltd
Теперь переношу ту же папку объемом 10.2 ГБ, содержащую 36
989 файлов, обратно на Silicon Power XPOWER XS90.
Операция заняла 2 минуты 08 секунд. Средняя скорость составила около 81 МБ/с. В
сравнении с предыдущим направлением (62 МБ/с при записи на Mars 980 Blade) здесь результат выше. Однако речь
по-прежнему не идет о гигабайтах в секунду. При работе с десятками тысяч мелких
файлов накопитель упирается не в пропускную способность PCIe, а в обработку большого количества
мелких операций записи, обновление метаданных и внутреннюю организацию NAND. График передачи
характерный: без ровной полки, с постоянными колебаниями. Это типичное
поведение для сценария с большим числом небольших объектов.
Автор: Code Sector Pty Ltd
Автор: Code Sector Pty Ltd
Также получил информацию, которая позволяет точно
зафиксировать аппаратную конфигурацию Silicon Power XPOWER XS90. Контроллер
определен как SM2508AC, прошивка Y0804A00, ROM-версия 2508ACROM: X0613A. Это
восьмиканальное решение, что подтверждается параметром Channel: 8 и картой
каналов Ch map 0xFF — активированы все линии без урезания конфигурации.
Тип памяти определяется по строке FlashID: 0x2c, 0xd3,0x8,0x32,0xe8,0x30 — Micron
232L (B58R) TLC
1024Gb/CE, 1024Gb/die.
Таким образом, используется 232-слойная TLC NAND плотностью
1 Тбит на кристалл. Для 2 ТБ версии это соответствует современной высокоплотной
компоновке с полноценным распараллеливанием по восьми каналам.
Параметры организации памяти:
Pages/Block: 2784 — характерное значение для 232-слойной TLC
Total Fblock: 567
Bad Block From Pretest: 18 — значение в пределах нормы для
NAND данного поколения
Наличие DRAM подтверждается строкой DRAM Info [0x4E 0xD6],
что соответствует использованию внешнего буфера для FTL. Это напрямую
коррелирует с результатами тестов: при линейной записи 401.6 ГБ накопитель
демонстрировал устойчивую скорость около 3.3 ГБ/с без хаотичных провалов, а при
работе с мелкими файлами поведение оставалось контролируемым, без деградации до
сотен мегабайт в секунду на протяжении всей операции.
Заключение
По итогам всех проведенных тестов можно говорить, что
Silicon Power XPOWER XS90 — это полноценный NVMe-накопитель с интерфейсом PCIe
Gen5, который действительно работает на уровне своего поколения, а не просто
формально поддерживает стандарт. В синтетических тестах накопитель
демонстрирует высокий потолок пропускной способности и хороший запас по
линейной скорости. Но гораздо важнее то, как Silicon Power XPOWER XS90 ведет
себя в реальных задачах. При переносе крупных файлов объемом сотни гигабайт
диск показывает стабильную, высокую скорость без резких обвалов и затяжных
провалов. Это говорит о грамотно реализованной работе контроллера и
кэширования.
При работе с большим количеством мелких файлов поведение
закономерно меняется. Здесь уже интерфейс PCIe Gen5 не играет решающей роли, и
производительность определяется особенностями обработки мелких операций записи.
В этих условиях разница между быстрыми NVMe сокращается, что полностью
соответствует характеру нагрузки.
Как итог, Silicon Power XPOWER XS90 — это накопитель для
систем на современной платформе, где PCIe Gen5 действительно используется по
назначению. Он раскрывается в задачах с крупными массивами данных, в монтаже,
архивации, работе с большими проектами и объемными играми. Если платформа
поддерживает Gen5, модель XS90 имеет смысл. Это уже решение с запасом на
несколько лет вперед, рассчитанное на серьезную нагрузку, а не просто на
повседневную офисную работу.
Стоимость устройства Silicon Power XPOWER XS90 можно посмотреть здесь.