AI News Watcher
Monday, Jun 22, 2026  ·  Daily briefing
Feed Telegram
Daily briefing · By AI News Watcher · Jun 22, 2026 · 2 min read · Groq ← Back to feed

Groq привлёк $650 млн — и теперь строит инференс-облако вместе с NVIDIA daily

Цель — 200 МВт мощностей к концу 2027 года; LPU-чипы Groq уже встроены в платформу NVIDIA Vera Rubin.

Groq привлёк $650 млн — и теперь строит инференс-облако вместе с NVIDIA
Редакция · Daily briefing

Инференс потребует в 15–20 раз больше вычислений, чем обучение моделей, — и пока никто не занял эту нишу. Groq объявил о привлечении $650 млн и раскрыл, как именно собирается стать «фундаментальным слоем» AI-экономики: через собственные дата-центры, союз с NVIDIA и новую команду топ-менеджеров.

Раунд ведут Disruptive и Infinitum — оба реинвестируют. Сейчас у Groq 13 дата-центров в Северной Америке, Европе, на Ближнем Востоке и в APAC, больше пяти миллионов разработчиков и триллионы токенов в неделю. Деньги пойдут на дооснащение существующих площадок новейшими системами — цель к концу 2027 года выйти на 200 МВт.

В декабре 2025 Groq подписал лицензионное соглашение с NVIDIA, а в марте 2026 на конференции GTC NVIDIA представила платформу Vera Rubin с чипом NVIDIA Groq 3 LPX. Это стойка из 256 LPU (специализированных инференс-чипов Groq), которая в связке с Rubin GPU даёт 35-кратный рост пропускной способности на МВт для триллионных моделей. Groq перестал конкурировать с GPU и стал партнёром по гетерогенной инференс-архитектуре: GPU берут на себя часть вычислений, LPU — задачи с жёсткими требованиями к задержке.

Под коммерческий рост собрали новую команду:

Акцент очевиден: не R&D, а масштабирование продаж и enterprise-адопция.

Groq делает редкую ставку — не «ещё одно GPU-облако», а специализированный инференс-слой поверх гетерогенной инфраструктуры совместно с NVIDIA. Если это сработает, категория «inference cloud» получит первого явного лидера. Честный пробел: оценку компании Groq не раскрыл, юнит-экономику (цена токена против себестоимости) — тоже. И открытый вопрос: насколько лицензионное соглашение с NVIDIA ограничивает независимость Groq в долгосрочной перспективе.

Дополнительные источники

  1. https://www.nvidia.com/en-us/data-center/lpx/
  2. https://groq.com/lpu-architecture
  3. https://developer.nvidia.com/blog/inside-nvidia-groq-3-lpx-the-low-latency-inference-accelerator-for-the-nvidia-vera-rubin-platform/
  4. https://introl.com/blog/groq-lpu-infrastructure-ultra-low-latency-inference-guide-2025
  5. https://tracxn.com/d/companies/groq/__pMJjkNzO3GELYaHvYyAD0pQB4BYTFTHh4Klu4dAJvoU
  6. https://tsginvest.com/groq/
  7. nvidia.com
  8. models
  9. github.io
  10. tracxn.com

Источники

  1. https://groq.com/blog/groq-raises-usd650m-to-scale-its-ai-inference-cloud-business blog
→ Опубликовано в Telegram: @agentic_ai_news/553