OceanStor Russia

Huawei AI Data Lake — платформа для хранения и обработки ИИ-данных нового поколения

На форуме Innovative Data Infrastructure (IDI) 2025 в Мюнхене компания Huawei представила комплексное решение AI Data Lake, предназначенное для хранения и обработки данных искусственного интеллекта. Платформа ориентирована на ускорение внедрения ИИ в различных секторах — от обучения больших языковых моделей (LLM) и инференса до обработки массивов данных экзабайтного масштаба.

Архитектурная основа: OceanStor + OceanProtect

Huawei AI Data Lake объединяет три ключевых компонента инфраструктуры хранения:
  • OceanStor A Series — обеспечивает быстрый доступ к часто используемым данным;
  • OceanStor Pacific — выступает в роли Nearline-хранилища с интеллектуальным распределением по уровням;
  • OceanProtect E8000 — система резервного копирования, поддерживающая до 16 Пбайт данных и скорость передачи до 255 ТБ/ч.
Такое сочетание обеспечивает баланс производительности, экономичности и надёжности при работе с критически важными ИИ-нагрузками.

Программный уровень: DME и Omni-Dataverse

Поверх аппаратной инфраструктуры работает двухуровневая программная среда:
  • Уровень управления данными на базе движка DME (Data Management Engine). Он включает продукты DME Omni-Dataverse, DME IQ и eDataInsight — отвечающие за каталогизацию, контроль доступа, управление версиями и работу с векторными базами данных.
  • Omni-Dataverse формирует глобальную файловую систему и единое пространство имён, устраняя фрагментацию данных в распределённых дата-центрах. Решение способно индексировать более 100 млрд файлов за секунды и обрабатывать данные экзабайтного уровня.
  • DME IQ — облачная система мониторинга на базе AIOps. Она анализирует большие массивы данных в реальном времени, выявляет сбои и уведомляет администраторов о проблемах.

Интеллектуальная автоматизация и интеграция ИИ

AI Data Lake не только хранит, но и обеспечивает подготовку данных для обучения и инференса. Платформа интегрируется с инструментами Huawei iData, ModelEngine и другими ИИ-движками, предоставляя полный цикл: от сбора и индексирования информации до подачи готовых наборов данных.

Концепция Data Center Solution (DCS)

Huawei AI Data Lake является частью концепции DCS (Data Center Solution), которая объединяет:
  • вычисления,
  • хранение,
  • сетевые технологии,
  • управление инфраструктурой.
Используя eSphere в связке с Omni-Dataverse, компании получают сквозной доступ к глобальному пространству имён и формируют централизованную, гибкую и масштабируемую инфраструктуру нового поколения.

Преимущества Huawei AI Data Lake

  • Высокая производительность — поддержка обучения LLM и инференса с обработкой экзабайтных данных.
  • Единое пространство данных — интеграция OceanStor и Omni-Dataverse.
  • Надёжность и защита — резервирование с OceanProtect E8000 и поддержка технологий WORM.
  • Интеллектуальное управление — мониторинг и аналитика в реальном времени на базе DME IQ и AIOps.
  • Гибкость — поддержка гибридных, локальных и облачных сценариев использования.

Заключение

Huawei AI Data Lake — это шаг к созданию единой интеллектуальной инфраструктуры для работы с данными ИИ. Решение объединяет передовые технологии хранения, резервного копирования и управления, позволяя компаниям ускорить цифровую трансформацию и повысить эффективность использования данных.