ИИ-кластер Huawei Atlas 900 является базовым блоком учебного кластера AI на базе процессоров Huawei Ascend 910 и Kunpeng 920. Представленный кластер вобрал в себя самые инновационные технологии и отличается мощными вычислениями AI, оптимальной энергоэффективностью AI, продвинутым функционалом и оптимальной масштабируемостью AI.
ИИ-кластер Huawei Atlas 900: мощный базовый блок кластера
ИИ-кластер Huawei Atlas 900 представляет собой базовую единицу кластера, которая широко используется в разработке моделей глубокого обучения, машинного обучения и других сценариях обучения моделей. Представленное решение является идеальным вариантом для отраслей с интенсивными вычислениями, таких как умный город, интеллектуальное здравоохранение, астрономические исследования и разведка нефти.
Основные преимущества и особенности
- Решение интегрирует высокоскоростные интерфейсы HCCS, PCIe 4.0 и 100G RoCE, а также вертикально интегрирует коммуникационную библиотеку, топологию и сеть с малой задержкой, обеспечивая линейность более 80% и максимальную производительность сети кластера.
- Устройство создало платформу для прогресса в широком спектре приложений в мобильной индустрии и за ее пределами, используя новейшие технологии для обеспечения невероятной скорости и производительности с минимальным выбросом углекислого газа.
- Кластер поддерживает гибридную систему охлаждения, способную отводить 50 кВт тепла на шкаф, с жидкостным охлаждением более 95% и показателем PUE <1,1, уменьшая пространство в помещении для оборудования на 79% по сравнению с традиционными решениями.
- Решение поддерживает разнообразные приложения для научных исследований и бизнес-инноваций, что позволяет исследователям быстрее обучать модели ИИ с помощью изображений и видео. Это не только приносит пользу научным исследованиям в области более эффективных и точных астрономических, нефтехимических и погодных прогнозов, но также обеспечивает существенные преимущества для бизнеса.
- Инновационная система жидкостного охлаждения значительно снижает совокупную стоимость владения заказчика за счет высокой мощности, высокой плотности и низкого PUE.
- Представленный кластер использует коммутаторы центра обработки данных из серии Huawei CloudEngine для поддержки сети синхронизации параметров полной сети для обучения модели искусственного интеллекта со скоростью более 100 ТБ (10 ^ 12) в секунду. Это снижает задержку синхронизации от 10% до 70%, что значительно повышает эффективность обучения.
- ИИ-кластер Huawei Atlas 900 обеспечивает ведущую вычислительная мощность на уровне 256–1024 PFLOPS при FP16, используя соединение тысяч процессоров Ascend 910 AI для самого быстрого в отрасли обучения ResNet-50.