Новости AI-стека
Daily · свежие материалы
Orpheus TTS на GroqCloud: арабский акцент и голосовые команды для реального времени
На GroqCloud теперь доступен Orpheus TTS от Canopy Labs — движок синтеза речи, заточенный под сценарии с низкой задержкой, где скорость ответа и естественность голоса имеют решающее значение. Этот сервис предлагает…
AI-новости
Обратите внимание на pipe.enable_model_cpu_offload() — эта строка кода демонстрирует типичную технику для дальнейшей оптимизации использования VRAM, перемещая части модели в CPU по мере необходимости.
Perplexity: Агенты и вложения — теперь в релизе для продакшена
Perplexity выпустила в общий доступ (GA) свои Agent API и Embeddings API. Это означает, что разработчики теперь могут использовать инструменты для создания автономных агентов и внедрения продвинутого семантического…
FLUX.2 [pro]: удвоение скорости без изменения API
Black Forest Labs представила ускорение своей флагманской модели FLUX.2 [pro] для генерации и редактирования изображений. Заявлено двукратное увеличение производительности без компромиссов в качестве и без повышения…
Nano Banana Pro: обходит лимиты Google с резервной моделью
Генерация изображений с помощью nano-banana-pro теперь стала надежнее. Replicate представил механизм резервирования, который позволяет продолжить работу, даже если основной API Google достигнет своих лимитов. Это…
Groq делится технологией инференса с Nvidia: команда переходит, GroqCloud продолжает работу
Groq, известный своими специализированными процессорами LPU для высокоскоростного инференса, объявил о неожиданном стратегическом шаге: компания заключила неисключительное лицензионное соглашение с Nvidia. Часть…