Новости AI-стека
Daily · свежие материалы
Voice Finder от Together AI: 600 голосов теперь можно искать по запросу
Together AI представила новый инструмент Voice Finder, который должен упростить процесс подбора подходящего голоса для приложений. Разработчики теперь смогут использовать естественный язык или аудиосэмплы для навигации…
Perplexity Agent API: Finance Search теперь выдаёт структурированные финданные
Perplexity интегрировала инструмент Finance Search прямо в свой Agent API. Это значит, что теперь агенты могут напрямую запрашивать и получать структурированные финансовые и рыночные данные по публичным компаниям и…
Perplexity API: новые модели, безопасные ключи и список доступных через /v1/models
Perplexity обновила свой API, сосредоточившись на расширении возможностей Agent API, улучшении безопасности ключей и упрощении обнаружения доступных моделей. Теперь разработчики могут интегрировать новейшие модели…
Agent skills для Replicate: учим ассистентов работать с моделями как про
Replicate представил Agent skills — набор инструкций в формате Markdown, который позволяет кодирующим ассистентам лучше понимать, как искать, сравнивать и запускать модели ИИ на платформе. Это шаг к тому, чтобы сделать…
Groq расширяет выбор моделей: два новых LLM для Enterprise и голоса Orpheus
Groq усиливает свою платформу, добавляя две новые крупные языковые модели, доступные для корпоративных клиентов, и обогащает возможности синтеза речи новыми голосами. Это обновление направлено на предоставление более…
**Разработчики предлагают несколько советов для получения наилучшего результата:**
Детально описывайте сцену. Вместо «автомобильная погоня» пишите «высокоскоростная ночная погоня по залитым дождём улиц Токио, неоновые отражения на мокром асфальте, фары прорезают туман». Описывайте не только…
Agent API Perplexity: новые модели и прощание со старыми Gemini
Perplexity обновила свой Agent API, добавив поддержку сторонних моделей, таких как GPT-5.4, NVIDIA Nemotron и Claude Sonnet 4.6, одновременно прекратив поддержку нескольких версий Gemini. Это изменение перестраивает…
Orpheus TTS на GroqCloud: арабский акцент и голосовые команды для реального времени
На GroqCloud теперь доступен Orpheus TTS от Canopy Labs — движок синтеза речи, заточенный под сценарии с низкой задержкой, где скорость ответа и естественность голоса имеют решающее значение. Этот сервис предлагает…
Cohere убирает Embed v2 и Aya 8B: что делать с кодом?
Если вы используете старые модели Cohere для эмбеддингов или чата, возможно, ваши сервисы уже столкнулись с ошибками. С 4 апреля Cohere полностью вывел из эксплуатации пять моделей API, включая версии Embed v2.0 и Aya…
Cohere расширяет горизонты: новая модель ASR Transcribe
Cohere, до сих пор преимущественно известный своими сильными позициями в области обработки естественного языка, сделал неожиданный, но логичный шаг в сторону нового домена — автоматического распознавания речи. Этот…
Perplexity: Агенты и вложения — теперь в релизе для продакшена
Perplexity выпустила в общий доступ (GA) свои Agent API и Embeddings API. Это означает, что разработчики теперь могут использовать инструменты для создания автономных агентов и внедрения продвинутого семантического…
Nano Banana Pro: обходит лимиты Google с резервной моделью
Генерация изображений с помощью nano-banana-pro теперь стала надежнее. Replicate представил механизм резервирования, который позволяет продолжить работу, даже если основной API Google достигнет своих лимитов. Это…
Groq делится технологией инференса с Nvidia: команда переходит, GroqCloud продолжает работу
Groq, известный своими специализированными процессорами LPU для высокоскоростного инференса, объявил о неожиданном стратегическом шаге: компания заключила неисключительное лицензионное соглашение с Nvidia. Часть…
Cohere Rerank v4.0: ранжирование данных теперь с двумя режимами
Для инженеров, которые разрабатывают поисковые и рекомендательные системы, качество и задержка моделей переранжирования напрямую влияют на пользовательский опыт. Cohere обновила свою основную модель ранжирования…