LinQ HPS — высокопроизводительный ускоритель для высокоплотных вычислений с пиковой мощностью 960 TOPS (int8) и поддержкой до 40 моделей в формате 3U Rackmount. Идеален для реального времени инференса CNN и Transformer с задержкой до 1,5 мс, нативной интеграцией TF2 и PyTorch (ONNX) в облачных сервисах, видеоаналитике и биометрии.

LinQ HPS – универсальный ускоритель для высокоплотных вычислений
LinQ HPS – это высокопроизводительный уcкоритель для инференса сложных нейронных сетей (CNN, Transformer и т. д.) в реальном времени. Он обеспечивает низкую задержку при обработке малых батчей, обладает пиковой производительностью до 960 TOPS (int8) и интегрируется в стандартные 19-дюймовые стойки.
Ускоритель основан на оригинальной архитектуре LinQ H, не использует сторонние IP-ядра и поддерживает прямую интеграцию с экосистемой TensorFlow 2.x и PyTorch (через ONNX). Использование внутреннего компилятора LinQ Compiler с элементами ИИ обеспечивает глубокую оптимизацию вычислительных графов, что позволяет свести задержку инференса к минимуму.
Области применения
- Корпоративные и облачные сервисы (MLaaS, таргетинг, рекомендации и пр.)
- Интеллектуальная видеоаналитика и городская безопасность
- Биометрия и контроль доступа
- Научные исследования и разработка лекарств
- Распределенные вычисления
- Оптимизация энергопотребления
Смотрите также RSC ScaleStream-C GPU/TPU - модульная вычислительная платформа для ускорения задач искусственного интеллекта
Характеристики ускорителя LinQ HPS
| Производительность и масштабируемость |
|
| Гибкая интеграция |
|
| Низкая задержка |
|
| Программный стек собственной разработки |
|
| Надёжность и защита |
|
| Энергопотребление (TDP) | 300/600/900/1500 Вт (зависит от частоты и режима охлаждения; есть троттлинг и возможность управлять питанием через ПО) |
