О чём эта новость
- Многоязычный фильтр ненормативной лексики теперь доступен для
language=multiмоделей.подробнее → - Значительно улучшено разделение слов для корейского языка в модели Nova-3.подробнее →
- Deepgram Self-Hosted подготовлен к рефакторингу движка с новыми переменными окружения.подробнее →
- Предложение Deepgram Self-Hosted выделяется гибкостью развертывания по сравнению с облачными аналогами.подробнее →
В мае 2026 года Deepgram представила значительное обновление для своей платформы Self-Hosted, ориентированное на улучшение возможностей распознавания речи для корпоративных пользователей. Этот релиз, обозначенный как 260528, включает в себя ключевые функции, такие как расширенная фильтрация ненормативной лексики для многоязычных моделей и существенные улучшения в обработке корейского языка. Помимо непосредственных функциональных преимуществ, обновление также закладывает важную основу для будущих архитектурных изменений движка, обеспечивая плавный переход для развертываний, расположенных на территории заказчика.
Обзор майского релиза Deepgram Self-Hosted
Майский релиз Deepgram Self-Hosted, версия 260528, включает в себя ряд ключевых улучшений и подготовительных шагов, направленных на повышение точности распознавания речи и упрощение будущих обновлений. Среди наиболее заметных нововведений — усовершенствованная система фильтрации ненормативной лексики, которая теперь доступна для многоязычных моделей, и значительное улучшение обработки корейского языка.
В рамках этого обновления были модернизированы основные контейнеры платформы. Обновленные образы включают quay.io/deepgram/self-hosted-api:release-260528 (эквивалентно версии 1.188.1), quay.io/deepgram/self-hosted-engine:release-260528 (эквивалентно 3.117.0), quay.io/deepgram/self-hosted-license-proxy:release-260528 (эквивалентно 1.10.1) и quay.io/deepgram/self-hosted-billing:release-260528 (эквивалентно 1.13.0). Для обеспечения стабильной работы этих контейнеров требуется минимальная версия драйвера NVIDIA 570.172.08 или выше. Эти изменения подчеркивают приверженность Deepgram к постоянному совершенствованию своего предложения для локального развертывания.
Кроме того, релиз включает в себя общие доработки, направленные на поддержание актуальности и эффективности программного обеспечения. Эти регулярные обновления являются частью стратегии Deepgram по предоставлению надежных и современных решений для преобразования речи в текст, особенно важных для клиентов, управляющих своими данными и инфраструктурой локально.
Расширенный фильтр ненормативной лексики для многоязычного STT
Одной из центральных функций майского релиза является новый фильтр ненормативной лексики, разработанный специально для многоязычных моделей распознавания речи (Speech-to-Text, STT). Эта функция позволяет автоматически маскировать обнаруженные непристойные слова в транскрипциях, заменяя их звездочками. Такой подход гарантирует, что конфиденциальный или профессиональный контент остается чистым, что критически важно для предприятий, работающих с публичными записями или чувствительными данными.
Функция фильтрации ненормативной лексики Deepgram поддерживается широким спектром языков, что делает ее универсальным инструментом для глобальных операций. Среди поддерживаемых языков: арабский, белорусский, бенгальский, боснийский, болгарский, каталанский, китайский (упрощенный и традиционный, мандаринский и кантонский), хорватский, чешский, датский, голландский, английский (различные диалекты), эстонский, финский, фламандский, французский, немецкий, греческий, гуджарати, иврит, хинди, венгерский, индонезийский, итальянский, японский, каннада, корейский, латышский, литовский, македонский, малайский, маратхи, норвежский, персидский, польский, португальский, румынский, русский, сербский, словацкий, словенский, испанский, шведский, тагальский, тамашек, тамильский, телугу, тайский, турецкий, украинский, урду и вьетнамский. Эта функция доступна для всех многоязычных моделей Deepgram, включая Nova-2 multi, Nova-3 multi и Flux multi.
Активация фильтра ненормативной лексики в Deepgram Self-Hosted осуществляется через параметр запроса. Пользователям достаточно установить profanity_filter=true при вызове конечной точки /listen API Deepgram. Например, это можно сделать с помощью следующей команды cURL:
curl \
--request POST \
--header 'Authorization: Token YOUR_DEEPGRAM_API_KEY' \
--header 'Content-Type: audio/wav' \
--data-binary @youraudio.wav \
--url '
После обработки аудиофильтр заменяет распознанные нецензурные слова звездочками непосредственно в транскрипции. Это позволяет сохранять контекст предложения, при этом эффективно скрывая нежелательный контент. В JSON-ответе отфильтрованные слова будут отображаться как последовательности ****. Этот подход дает предприятиям гибкий контроль над выходными данными, обеспечивая соответствие требованиям и стандартам контента. В источниках нет данных о планах по расширению фильтра ненормативной лексики на другие языки или модели, помимо language=multi. Тем не менее, широкая поддержка текущих многоязычных моделей является значительным шагом для глобальных корпоративных развертываний.
Улучшения для корейского языка и общие доработки
Майский релиз Deepgram Self-Hosted также привносит целевые улучшения в обработку корейского языка, что особенно важно для пользователей в азиатском регионе. Основное внимание было уделено исправлению проблемы, при которой транскрипции корейского языка, генерируемые моделью Nova-3 (для локалей ko и ko-KR), иногда содержали пропущенные пробелы между словами.
Эта проблема с разделением слов могла приводить к затруднениям в чтении и понимании транскрибированного текста, снижая общую полезность STT для корейского языка. С новым обновлением Deepgram исправил этот недостаток, гарантируя, что транскрипции теперь более точно отражают правильное корейское межсловное расстояние. Это улучшение повышает точность и читаемость корейских транскрипций, делая их более пригодными для использования в различных бизнес-сценариях, от центров обработки вызовов до создания субтитров.
В дополнение к этим специализированным улучшениям, релиз включает в себя ряд общих доработок, которые касаются всей платформы. Эти улучшения направлены на поддержание актуальности программного обеспечения и обеспечение его оптимальной производительности, что является стандартной практикой для обеспечения надежности и безопасности продукта. Хотя конкретные детали этих общих улучшений не указаны, они способствуют общей стабильности и эффективности Deepgram Self-Hosted.
Подготовка к будущим архитектурным изменениям движка
Важной частью майского релиза Deepgram Self-Hosted является подготовка к предстоящему рефакторингу контейнера движка. Хотя эти изменения пока не влияют на текущую работу, они критически важны для будущих обновлений и обеспечивают плавный переход на новую архитектуру. Пользователям рекомендуется внести эти конфигурационные изменения заранее, чтобы избежать необходимости корректировок при выпуске будущего рефакторинга.
Для контейнера движка теперь должны быть установлены две новые переменные окружения: NVIDIA_VISIBLE_DEVICES=all и NVIDIA_DRIVER_CAPABILITIES=compute,utility. Эти переменные в текущей версии движка (release-260528) являются "no-ops", то есть не оказывают прямого влияния. Однако они станут обязательными с выходом будущей обновленной архитектуры движка. Раннее внедрение этих настроек позволяет развертываниям быть готовыми к следующему этапу эволюции движка без дополнительных изменений конфигурации в будущем.
Эти необходимые настройки уже включены в официальный Helm-чарт версии 0.37.0 и выше, а также в файлы Docker и Podman compose, доступные в репозитории deepgram/self-hosted-resources. Пользователи, которые управляют собственными манифестами развертывания, могут безопасно добавить эти переменные окружения в контейнер движка в любое время. В документации не указано, когда именно будет выпущен упомянутый рефакторинг контейнера движка, а также какие конкретно улучшения производительности или функциональности он принесет, однако эти подготовительные шаги подчеркивают долгосрочное планирование Deepgram.
Deepgram Self-Hosted в конкурентном контексте
Предложение Deepgram Self-Hosted занимает особое место на рынке решений для преобразования речи в текст, особенно в сравнении с крупными облачными провайдерами, такими как Google Cloud и AWS. В то время как Google Cloud предлагает свое решение Speech-to-Text On-Prem, позволяющее клиентам развертывать технологию Google на собственной инфраструктуре, Deepgram Self-Hosted предоставляет аналогичный уровень контроля и гибкости.
Конкуренты также предлагают сопоставимые функции. Например, Google Cloud Speech-to-Text включает функцию фильтрации контента, аналогичную фильтру ненормативной лексики Deepgram, для обнаружения и очистки неприемлемого контента. В свою очередь, AWS Transcribe, хотя и является преимущественно облачным сервисом, обеспечивает частное подключение через AWS PrivateLink для своих API потоковой передачи в реальном времени, позволяя клиентам сохранять трафик внутри сети Amazon без использования публичных IP-адресов. Однако это отличается от полного локального развертывания, где вся обработка данных происходит на стороне клиента.
Основное конкурентное преимущество Deepgram Self-Hosted заключается в его архитектуре, предназначенной для полного развертывания на локальных серверах клиента. Это обеспечивает максимальный контроль над данными, соответствует строгим требованиям к суверенитету данных и безопасности, и позволяет глубокую интеграцию с существующей корпоративной инфраструктурой. Для организаций, которым требуется полная изоляция данных и настраиваемые решения, Deepgram Self-Hosted предлагает мощную альтернативу чисто облачным сервисам.
Что это значит
Майский релиз Deepgram Self-Hosted 2026 года включил многоязычную фильтрацию ненормативной лексики и улучшения для корейского языка. Одновременно ведется подготовка к архитектурным изменениям движка, что может быть важным сигналом для долгосрочного планирования интеграций.