+7 (495) 545-44-85 8 (800) 775-04-59

Российский системный интегратор
Серверы и сетевое оборудование
Суперкомпьютеры и HPC-кластеры
Импортозамещение в сфере ИТ

Надёжность
3:45
Спецпредложения
x
Посмотреть все
спецпредложения

LinQ HPS — высокопроизводительный ускоритель для высокоплотных вычислений с пиковой мощностью 960 TOPS (int8) и поддержкой до 40 моделей в формате 3U Rackmount. Идеален для реального времени инференса CNN и Transformer с задержкой до 1,5 мс, нативной интеграцией TF2 и PyTorch (ONNX) в облачных сервисах, видеоаналитике и биометрии.

Цена: 0 руб.*(по запросу)
Вы можете заказать это оборудование в лизинг Подробнее

LinQ HPS – универсальный ускоритель для высокоплотных вычислений

LinQ HPS – это высокопроизводительный уcкоритель для инференса сложных нейронных сетей (CNN, Transformer и т. д.) в реальном времени. Он обеспечивает низкую задержку при обработке малых батчей, обладает пиковой производительностью до 960 TOPS (int8) и интегрируется в стандартные 19-дюймовые стойки.

Ускоритель основан на оригинальной архитектуре LinQ H, не использует сторонние IP-ядра и поддерживает прямую интеграцию с экосистемой TensorFlow 2.x и PyTorch (через ONNX). Использование внутреннего компилятора LinQ Compiler с элементами ИИ обеспечивает глубокую оптимизацию вычислительных графов, что позволяет свести задержку инференса к минимуму.

Области применения

  • Корпоративные и облачные сервисы (MLaaS, таргетинг, рекомендации и пр.)
  • Интеллектуальная видеоаналитика и городская безопасность
  • Биометрия и контроль доступа
  • Научные исследования и разработка лекарств
  • Распределенные вычисления
  • Оптимизация энергопотребления

Смотрите также RSC ScaleStream-C GPU/TPU - модульная вычислительная платформа для ускорения задач искусственного интеллекта

Характеристики ускорителя LinQ HPS


Производительность и масштабируемость
  • До 960 TOPS (int8) на одном юните (node)
  • Объем памяти 640 ГБ DDR4 ECC (многоканальная конфигурация)
  • Возможность одновременного запуска до 40 моделей нейронных сетей
  • Линейная масштабируемость при установке нескольких ускорителей
Гибкая интеграция
  • Форм-фактор: 3U Rackmount, поддержка стандартной 19" стойки
  • Интерфейс 2x PCIe x16 Gen4
  • Дополнительные опции ASIC-плат для аппаратного видеокодирования (H.264, H.265 и др.)
Низкая задержка
  • ~2,3 мс для ResNet-50 (batch=1), при оптимизациях – до 1,5 мс
  • Специализированные оптимизаторы в компиляторе (DNN Quant, Graph Optimizer)
Программный стек собственной разработки
  • Нативная интеграция с TensorFlow 2.x
  • Поддержка PyTorch через ONNX
  • Собственные инструменты анализа производительности (Performance Profiler, DNN Stat)
Надёжность и защита
  • Watchdog Timer, Power Monitor, мониторинг температуры
  • Гибкое управление тактовой частотой для оптимизации TDP
Энергопотребление (TDP) 300/600/900/1500 Вт (зависит от частоты и режима охлаждения; есть троттлинг и возможность управлять питанием через ПО)