Новости AI-стека
Daily · свежие материалы
GitHub Copilot: стабильные метрики, новые модели и умный поиск
Разработка с помощью AI становится всё более детализированной, и за кадром постоянно меняется инфраструктура: от того, где хранятся отчеты, до того, какие модели скрываются за привычным чатом. GitHub Copilot продолжает…
Transformers 5.9.0: новые модели и меняющийся интерфейс эмбеддингов
HuggingFace выпустил библиотеку Transformers v5.9.0, добавив три новые модели и внеся важные изменения в обработку текстовых эмбеддингов для ряда моделей компьютерного зрения. Это обновление включает как новые…
Claude Code: HTML вместо Markdown — почему Anthropic сменил формат
Работая с большими языковыми моделями, мы привыкли, что Markdown — это универсальный формат для общения с ними: простой, переносимый, с базовыми возможностями разметки. Но команда Claude Code из Anthropic всё чаще…
Ettin Reranker: как пересортировать поиск без лишних затрат
Hugging Face представил семейство моделей Ettin Reranker. Это не просто очередной набор инструментов для ранжирования; они спроектированы, чтобы точно переупорядочивать результаты поиска, при этом удерживая контроль над…
Anthropic: ИИ-системы на исповеди — как формировать характер модели
Anthropic начал широкие диалоги с представителями самых разных традиций — от ученых до духовенства и философов. Цель этих бесед — понять, как формировать «характер» ИИ-систем, чтобы они приносили пользу человечеству и…
Stable Audio 3: открытая модель для музыки и звуков с инпейнтингом
Stability AI выпустила Stable Audio 3 — новую открытую модель для генерации и редактирования аудио. Эта модель представляет собой семейство быстрых латентных диффузионных моделей, способных создавать аудио переменной…
Anthropic приобретает Stainless: будущее агентов и API
Anthropic объявил о приобретении компании Stainless, которая специализируется на разработке SDK и инструментов для серверов MCP. Этот шаг сигнализирует об углублении стратегического фокуса Anthropic на расширении…
Инструмент веб-поиска: Claude глубже анализирует отчёты SEC
Инструмент веб-поиска в Claude получил обновление, которое позволяет извлекать более полные и детализированные данные из отчетов SEC. Это изменение призвано упростить финансовые исследования и процессы комплексной…
Stability AI: Как новый автоэнкодер SAME ускоряет генерацию аудио в Stable Audio 3
Stability AI представила SAME (Semantically-Aligned Music Autoencoder) — открытый автоэнкодер, который призван изменить подходы к работе с музыкальными и общими аудиоданными. Его основная задача — эффективное сжатие…
Gemma-4-31B-it-pearl: как крипто-майнинг удешевляет инференс AI
Together AI объединяет усилия с Pearl Research Labs, чтобы радикально изменить экономику инференса AI. В основе нового партнёрства лежит технология Proof of Useful Work, которая позволяет одновременно с вычислениями для…
Anthropic меняет правила игры для Claude Agent SDK: бесплатные кредиты для разработчиков
В постоянно развивающемся ландшафте AI-инфраструктуры, детали биллинга и доступа к инструментам могут существенно влиять на стратегию разработки. Anthropic сделал шаг, который, казалось бы, направлен на снижение…
violin: Открытый AI-перевод видео, который уважает голоса
Together AI выпустила Violin — полностью открытый инструмент для перевода видео, который разрушает языковые барьеры. Это комплексное решение объединяет распознавание речи, крупномодельный перевод и синтез речи, а также…
Claude Code: Opus 4.7 по умолчанию и новые флаги для агентов
Anthropic обновил Claude Code до версии 2.1.142, внедрив существенное изменение в поведении быстрого режима — теперь он по умолчанию работает на модели Opus 4.7. Это может незаметно повлиять на производительность и…
Anthropic выходит за рамки моделей: взгляды на конкуренцию и поддержка глобальных программ
Anthropic, известная в первую очередь своими моделями Claude, на этой неделе продемонстрировала активность, выходящую за рамки привычных технических анонсов. Компания опубликовала свой взгляд на геополитическое…
Voice Finder от Together AI: 600 голосов теперь можно искать по запросу
Together AI представила новый инструмент Voice Finder, который должен упростить процесс подбора подходящего голоса для приложений. Разработчики теперь смогут использовать естественный язык или аудиосэмплы для навигации…
Phi-Ground-Any: Модель для точного взаимодействия с UI
Microsoft выпустила новый открытый весовой вариант модели из семейства Phi-Ground — phi-ground-any. Это мультимодальная модель, ориентированная на взаимодействие с пользовательскими интерфейсами на основе визуального…
Perplexity Agent API: Finance Search теперь выдаёт структурированные финданные
Perplexity интегрировала инструмент Finance Search прямо в свой Agent API. Это значит, что теперь агенты могут напрямую запрашивать и получать структурированные финансовые и рыночные данные по публичным компаниям и…
Gemini Interactions API ломается второй раз за полгода — и снова срочно
Google анонсировал ломающее изменение в Gemini Interactions API: схема outputs→steps и response_format меняются, новая дефолтная 26 мая, старую удаляют 8 июня. И это не первый раз — API ломали ещё в декабре. Рядом …
Claude углубляется в финансы: 10 готовых агентов и интеграция с Microsoft 365
Интеграция больших языковых моделей в высокорегулируемые и консервативные отрасли, такие как финансовые услуги, всегда сопряжена с множеством вызовов — от безопасности данных до соответствия нормативным требованиям…
Diffusers 0.38.0: Больше изображений, больше звука — и новые «мозги» для генерации
HuggingFace Diffusers, библиотека для работы с диффузионными моделями, получила масштабное обновление 0.38.0. В новой версии появились конвейеры для генерации изображений и аудио, среди которых заметны тяжеловесы с…
Perplexity API: новые модели, безопасные ключи и список доступных через /v1/models
Perplexity обновила свой API, сосредоточившись на расширении возможностей Agent API, улучшении безопасности ключей и упрощении обнаружения доступных моделей. Теперь разработчики могут интегрировать новейшие модели…
Microsoft 365 Copilot: глубина анализа и генерация изображений прямо в офисных приложениях
Microsoft интегрирует две новые модели в microsoft-365-copilot: GPT-5.5 Thinking для углубленного анализа и многоэтапной работы, а также ChatGPT Images 2.0 для визуального создания контента. Эти обновления позволяют…
Gemini-embedding-2: модель внедрения в GA, что это значит для масштабирования LLM
Модель внедрения gemini-embedding-2 достигла статуса общей доступности (GA), что делает её готовой для продакшен-нагрузок и интеграции в полноценные приложения. Это событие совпало с презентацией Google DeepMind новой…
Agent skills для Replicate: учим ассистентов работать с моделями как про
Replicate представил Agent skills — набор инструкций в формате Markdown, который позволяет кодирующим ассистентам лучше понимать, как искать, сравнивать и запускать модели ИИ на платформе. Это шаг к тому, чтобы сделать…
**Разработчики предлагают несколько советов для получения наилучшего результата:**
Детально описывайте сцену. Вместо «автомобильная погоня» пишите «высокоскоростная ночная погоня по залитым дождём улиц Токио, неоновые отражения на мокром асфальте, фары прорезают туман». Описывайте не только…
Gemini 3.1 Flash TTS: озвучку теперь режиссируют, а не выбирают голос
Google выкатил в preview Gemini 3.1 Flash TTS. Раньше синтез речи — «выбери голос из списка». Теперь голосом управляют как режиссёр актёром, указаниями прямо в тексте через аудиометки, а найденную постановку можно…
Vertex AI: Claude Opus 4.7 в Model Garden, Gemini Robotics читает приборы
Google расширяет свою AI-инфраструктуру, предлагая как новые возможности для сторонних моделей, так и улучшения для собственных. На этой неделе стал доступен Claude Opus 4.7 в Vertex AI Model Garden, предоставляя…
Claude: Исследования надзора — теперь полностью автономно, и дешевле людей
Anthropic сообщает о новом векторе в исследованиях масштабируемого надзора: модели Claude теперь могут полностью автономно развивать этот процесс, превосходя эффективность команд из людей-исследователей. Этот результат…
Claude Sonnet 4 и Opus 4: пора прощаться?
Anthropic объявила о скором выводе из эксплуатации некоторых моделей Claude API. Разработчики, использующие версии Sonnet 4 и Opus 4, должны быть готовы к переходу, поскольку поддержка этих моделей будет прекращена в…
Agent API Perplexity: новые модели и прощание со старыми Gemini
Perplexity обновила свой Agent API, добавив поддержку сторонних моделей, таких как GPT-5.4, NVIDIA Nemotron и Claude Sonnet 4.6, одновременно прекратив поддержку нескольких версий Gemini. Это изменение перестраивает…