AI News Watcher
Wednesday, Jul 1, 2026  ·  Daily briefing
Feed Telegram
Daily briefing · By AI News Watcher · Jul 01, 2026 · 3 min read · xAI (Grok) ← Back to feed

xAI: голосовой агент за две минуты — без кода и стека daily

Платформа объединяет разрозненные компоненты голосового стека, работая на Grok Voice — модели, обученной на самых сложных звонках.

xAI: голосовой агент за две минуты — без кода и стека
Редакция · Daily briefing

Создание сложного голосового AI-агента обычно требует интеграции нескольких сервисов: для распознавания речи, языковой модели и синтеза голоса. XAI упростила этот процесс, выпустив Voice Agent Builder — платформу без кода, которая объединяет все необходимые компоненты в едином интерфейсе на базе своей модели Grok Voice.

Платформа Voice Agent Builder предназначена для разработчиков и операторов, которым нужны высокопроизводительные голосовые агенты без необходимости строить всю вспомогательную инфраструктуру с нуля. Она предлагает готовые функции, включая телефонию, извлечение знаний, инструменты, защитные механизмы (guardrails) и мониторинг. Пользователи могут переносить существующие телефонные номера по SIP или подключать свои инструменты через API.

В отличие от большинства голосовых стеков, которые собирают из трёх отдельных API (распознавание речи, языковая модель, синтез речи), каждый из которых может быть от разных поставщиков, Voice Agent Builder представляет собой единый интерфейс. Он работает на Grok Voice — модели, тесно интегрированной с платформой, что позволяет избежать проблем с задержками, стоимостью и отказами, свойственными разрозненным системам.

Модель Grok Voice специально обучалась на «самых сложных звонках», которые xAI смогла найти. Это включает аудио низкого качества, фоновый шум, сильные акценты, прерывания и ситуации, когда абоненты меняют своё решение на середине фразы. Модель способна обрабатывать неясные запросы и работать с десятками инструментов на более чем 25 языках.

На бенчмарке τ-voice Bench, который оценивает полнодуплексные голосовые агенты в реалистичных условиях, Grok Voice Think Fast 1.0 показала лучшие результаты, чем конкуренты:

Создать работающего агента можно за две минуты. Достаточно описать желаемый ход разговора простым языком, затем прикрепить необходимые документы, инструменты и задать правила поведения.

Платформа предлагает широкий набор функциональных возможностей:

Ценовая политика xAI заявлена как простая и прозрачная. Агенты тарифицируются по ставке API — $0.05 за минуту аудио, включая голоса и без отдельной платы за платформу. Использование бесплатного телефонного номера добавляет $0.01 за минуту. Это контрастирует с распространённой практикой, когда каждый компонент голосового стека (распознавание, рассуждение, синтез) оплачивается отдельно.

XAI Voice Agent Builder предлагает интегрированное решение для создания голосовых агентов, которое пытается решить основные проблемы разрозненных голосовых стеков и низкого качества обработки реальных звонков. Простота развертывания и заявленная производительность модели Grok Voice могут ускорить внедрение голосовых AI-систем. Однако, как и любой бета-продукт, платформа ещё должна доказать свою стабильность и масштабируемость в условиях реальной производственной нагрузки.

Дополнительные источники

  1. Pricing
  2. Grok Voice Think Fast 1.0
  3. Grok Voice Agent Builder Beta
  4. seasalt.ai
  5. sourceforge.net
  6. basenor.com

Источники

  1. https://x.ai/news/grok-voice-agent-builder news
→ Опубликовано в Telegram: @agentic_ai_news/617