Каталог
ZV
ездный б-р, 19
+7 (495) 974-3333 +7 (495) 974-3333 Выбрать город: Москва
Подождите...
Получить токен
Соединиться
X
Сюда
Туда
x
Не выбрано товаров для сравнения
x
Корзина пуста
Итого: 
Оформить заказ
Поделиться
Открыть корзину
Калькуляция
Очистить корзину
x
Чат с оператором
Отправить
Мои заказы
Магазины
Каталог
Сравнения
Корзина
Магазины Доставка по РФ
Город
Область
Ваш город - ?
От выбранного города зависят цены, наличие товара и
способы доставки

Суббота, 16 мая 2026 08:39

Накопители в эпоху фабрик ИИ: обсуждение

Несколько недель назад автор этой статьи сподобился пообщаться с Грегом Мэтсоном (Greg Matson), старшим вице-президентом и руководителем департамента продуктов и маркетинга Solidigm, и Кевином Дайерлингом (Kevin Deierling), старшим вице-президентом департамента сетевых решений NVIDIA, на тему влияния ИИ на рынок накопителей. В этой статье вашему вниманию предлагается краткий конспект дискуссии, во время которой Кевин даже продемонстрировал свои «когти» OpenClaw/ NemoClaw.

1

За чипами NVIDIA CPX, SSD с жидкостным охлаждением и DPU NVIDIA BlueField-4 стоят некоторые любопытные подробности. Например, я узнал, как целая вафля NAND сегодня входит в один SSD. Кроме того, мы затронули следующие ключевые темы.

Переход к агентному ИИ требует больших емкостей. Если в 2025 году в фокусе внимания был ИИ-инференс, 2026 год обещает стать годом ИИ-«агентов», которые выполняют сложные многошаговые рассуждения. Так как агентные сценарии предполагают, что ИИ будет “думать”, планировать и запоминать информацию из все более больших контекстных окон, это приводит к росту требований к подсистемам памяти и хранения данных.

Новый “средний уровень” хранилищ для ИИ. Чтобы удовлетворить эти потребности, отрасль создает новый класс хранилищ. Традиционно серверы опирались или на исключительно быстрые, но дорогие подсистемы хранения данных с прямым подключением (например, память HBM, которая стоит 10 тысяч долларов за терабайт) или на очень емкие, но более медленные сетевые хранилища (NAS). Флэш-накопители занимают промежуточную позицию между этими двумя крайними точками.

KV-кэш оптимизирует производительность GPU. KV-кэш (кэш ключей и значений) оказывает значительное влияние на производительность фабрики ИИ, так как он сохраняет огромное количество результатов промежуточных вычислений, например, когда модель «заглатывает» большие объемы данных и использует их как источник для генерации будущих ответов. Так как исходные документы всегда могут быть пересчитаны, накопители для ИИ этого уровня не обязательно должны соответствовать самым строгим требованиям надежности, что позволяет производить дальнейшие оптимизации дизайна.

“Экстремальный комплексный дизайн” и жидкостное охлаждение. Дата-центры жестко ограничены в части физического пространства и энергопотребления. В целях максимизации продуктивности GPU на единицу пространства NVIDIA и Solidigm запустили программу “Экстремального комплексного дизайна” (Extreme Co-Design), в рамках которой они будут совместно работать над всеми аспектами эффективности, от регулирования температуры до подачи электричества. Примером могут служить SSD с жидкостным охлаждением, и мы уже рассказывали о разработках Solidigm в этой области и показывали, как такие решения используются в стойках следующего поколения NVIDIA Vera Rubin.

Перспективы фабрик ИИ. В ближайшие три-пять лет ИИ будет использоваться везде, в результате появятся фабрики любых размеров – от маленьких цеховых роботов и роботизированных тележек до больших гигаваттных дата-центров. Для оптимального функционирования одной гигаваттной ИИ-фабрики может потребоваться до 25 экзабайт емкости флэш-накопителей. В конечном счете, графические ускорители – это только часть общей формулы.

В ходе дискуссии Кевин также заметил, что KV-кэши – это принципиально другой уровень и тип хранения данных в дата-центрах, в корне отличающийся от других типов хранения. KV-кэши помогают снизить вычислительную нагрузку на ИИ-кластеры, что сразу увидит любой, кто запускал модели локально и включал/ выключал KV-кэш. Эти кэши должны быть высокопроизводительными, но что касается надежности, если данные будут потеряны, их можно вычислить заново. В этом и заключается принципиальное отличие этого типа хранения от других, где характеристики надежности часто имеют приоритет перед характеристиками скорости и задержки.

Резюме

Хотя эта статья, в отличие от большинства других наших статей, не содержит никаких обзоров «железа» (хотя Грег и принес в студию вафлю NAND и SSD), она может быть интересна с точки зрения информационного фона. Возможно, в будущем мы будем публиковать больше материалов на основе интервью с представителями отрасли, так как нас время от времени об этом спрашивают.