Новости AI-стека
Daily · свежие материалы
Ettin Reranker: как пересортировать поиск без лишних затрат
Hugging Face представил семейство моделей Ettin Reranker. Это не просто очередной набор инструментов для ранжирования; они спроектированы, чтобы точно переупорядочивать результаты поиска, при этом удерживая контроль над…
Anthropic: ИИ-системы на исповеди — как формировать характер модели
Anthropic начал широкие диалоги с представителями самых разных традиций — от ученых до духовенства и философов. Цель этих бесед — понять, как формировать «характер» ИИ-систем, чтобы они приносили пользу человечеству и…
Anthropic приобретает Stainless: будущее агентов и API
Anthropic объявил о приобретении компании Stainless, которая специализируется на разработке SDK и инструментов для серверов MCP. Этот шаг сигнализирует об углублении стратегического фокуса Anthropic на расширении…
Инструмент веб-поиска: Claude глубже анализирует отчёты SEC
Инструмент веб-поиска в Claude получил обновление, которое позволяет извлекать более полные и детализированные данные из отчетов SEC. Это изменение призвано упростить финансовые исследования и процессы комплексной…
Gemma-4-31B-it-pearl: как крипто-майнинг удешевляет инференс AI
Together AI объединяет усилия с Pearl Research Labs, чтобы радикально изменить экономику инференса AI. В основе нового партнёрства лежит технология Proof of Useful Work, которая позволяет одновременно с вычислениями для…
Anthropic меняет правила игры для Claude Agent SDK: бесплатные кредиты для разработчиков
В постоянно развивающемся ландшафте AI-инфраструктуры, детали биллинга и доступа к инструментам могут существенно влиять на стратегию разработки. Anthropic сделал шаг, который, казалось бы, направлен на снижение…
violin: Открытый AI-перевод видео, который уважает голоса
Together AI выпустила Violin — полностью открытый инструмент для перевода видео, который разрушает языковые барьеры. Это комплексное решение объединяет распознавание речи, крупномодельный перевод и синтез речи, а также…
Claude Code: Opus 4.7 по умолчанию и новые флаги для агентов
Anthropic обновил Claude Code до версии 2.1.142, внедрив существенное изменение в поведении быстрого режима — теперь он по умолчанию работает на модели Opus 4.7. Это может незаметно повлиять на производительность и…
Anthropic выходит за рамки моделей: взгляды на конкуренцию и поддержка глобальных программ
Anthropic, известная в первую очередь своими моделями Claude, на этой неделе продемонстрировала активность, выходящую за рамки привычных технических анонсов. Компания опубликовала свой взгляд на геополитическое…
Voice Finder от Together AI: 600 голосов теперь можно искать по запросу
Together AI представила новый инструмент Voice Finder, который должен упростить процесс подбора подходящего голоса для приложений. Разработчики теперь смогут использовать естественный язык или аудиосэмплы для навигации…
Phi-Ground-Any: Модель для точного взаимодействия с UI
Microsoft выпустила новый открытый весовой вариант модели из семейства Phi-Ground — phi-ground-any. Это мультимодальная модель, ориентированная на взаимодействие с пользовательскими интерфейсами на основе визуального…
Perplexity Agent API: Finance Search теперь выдаёт структурированные финданные
Perplexity интегрировала инструмент Finance Search прямо в свой Agent API. Это значит, что теперь агенты могут напрямую запрашивать и получать структурированные финансовые и рыночные данные по публичным компаниям и…
Gemini Interactions API ломается второй раз за полгода — и снова срочно
Google анонсировал ломающее изменение в Gemini Interactions API: схема outputs→steps и response_format меняются, новая дефолтная 26 мая, старую удаляют 8 июня. И это не первый раз — API ломали ещё в декабре. Рядом …
Claude углубляется в финансы: 10 готовых агентов и интеграция с Microsoft 365
Интеграция больших языковых моделей в высокорегулируемые и консервативные отрасли, такие как финансовые услуги, всегда сопряжена с множеством вызовов — от безопасности данных до соответствия нормативным требованиям…
Diffusers 0.38.0: Больше изображений, больше звука — и новые «мозги» для генерации
HuggingFace Diffusers, библиотека для работы с диффузионными моделями, получила масштабное обновление 0.38.0. В новой версии появились конвейеры для генерации изображений и аудио, среди которых заметны тяжеловесы с…
Perplexity API: новые модели, безопасные ключи и список доступных через /v1/models
Perplexity обновила свой API, сосредоточившись на расширении возможностей Agent API, улучшении безопасности ключей и упрощении обнаружения доступных моделей. Теперь разработчики могут интегрировать новейшие модели…
Microsoft 365 Copilot: глубина анализа и генерация изображений прямо в офисных приложениях
Microsoft интегрирует две новые модели в microsoft-365-copilot: GPT-5.5 Thinking для углубленного анализа и многоэтапной работы, а также ChatGPT Images 2.0 для визуального создания контента. Эти обновления позволяют…
Gemini-embedding-2: модель внедрения в GA, что это значит для масштабирования LLM
Модель внедрения gemini-embedding-2 достигла статуса общей доступности (GA), что делает её готовой для продакшен-нагрузок и интеграции в полноценные приложения. Это событие совпало с презентацией Google DeepMind новой…
Agent skills для Replicate: учим ассистентов работать с моделями как про
Replicate представил Agent skills — набор инструкций в формате Markdown, который позволяет кодирующим ассистентам лучше понимать, как искать, сравнивать и запускать модели ИИ на платформе. Это шаг к тому, чтобы сделать…
**Разработчики предлагают несколько советов для получения наилучшего результата:**
Детально описывайте сцену. Вместо «автомобильная погоня» пишите «высокоскоростная ночная погоня по залитым дождём улиц Токио, неоновые отражения на мокром асфальте, фары прорезают туман». Описывайте не только…
Gemini 3.1 Flash TTS: озвучку теперь режиссируют, а не выбирают голос
Google выкатил в preview Gemini 3.1 Flash TTS. Раньше синтез речи — «выбери голос из списка». Теперь голосом управляют как режиссёр актёром, указаниями прямо в тексте через аудиометки, а найденную постановку можно…
Vertex AI: Claude Opus 4.7 в Model Garden, Gemini Robotics читает приборы
Google расширяет свою AI-инфраструктуру, предлагая как новые возможности для сторонних моделей, так и улучшения для собственных. На этой неделе стал доступен Claude Opus 4.7 в Vertex AI Model Garden, предоставляя…
Claude: Исследования надзора — теперь полностью автономно, и дешевле людей
Anthropic сообщает о новом векторе в исследованиях масштабируемого надзора: модели Claude теперь могут полностью автономно развивать этот процесс, превосходя эффективность команд из людей-исследователей. Этот результат…
Claude Sonnet 4 и Opus 4: пора прощаться?
Anthropic объявила о скором выводе из эксплуатации некоторых моделей Claude API. Разработчики, использующие версии Sonnet 4 и Opus 4, должны быть готовы к переходу, поскольку поддержка этих моделей будет прекращена в…
Agent API Perplexity: новые модели и прощание со старыми Gemini
Perplexity обновила свой Agent API, добавив поддержку сторонних моделей, таких как GPT-5.4, NVIDIA Nemotron и Claude Sonnet 4.6, одновременно прекратив поддержку нескольких версий Gemini. Это изменение перестраивает…
Gemma 4 отдают даром — и в тот же день ставят таймер на Gemini 2.5
Google выпустил Gemma 4 — открытые модели под Apache 2.0: 3-е и 6-е места среди всех open-моделей мира, обходят те, что в 20 раз крупнее, запускаются хоть на телефоне, хоть на одной видеокарте. А в том же окне тихо…
Lyria 3 Pro: песня целиком — но имитировать артиста модель отказывается
Google выпустил Lyria 3 Pro — модель генерации музыки: уже не 30-секундная петля, а трек до трёх минут с заданной структурой (интро/куплет/припев/бридж по запросу). Но Google намеренно сделал так, что имитировать…
Claude Code: «Автоматический режим» против усталости от согласований
Инженеры, работающие с Claude Code, знакомы с проблемой «усталости от согласований»: система запрашивает подтверждение перед каждой потенциально опасной командой или изменением файла. 93% таких запросов пользователи в…
Perplexity: Агенты и вложения — теперь в релизе для продакшена
Perplexity выпустила в общий доступ (GA) свои Agent API и Embeddings API. Это означает, что разработчики теперь могут использовать инструменты для создания автономных агентов и внедрения продвинутого семантического…
Nano Banana Pro: обходит лимиты Google с резервной моделью
Генерация изображений с помощью nano-banana-pro теперь стала надежнее. Replicate представил механизм резервирования, который позволяет продолжить работу, даже если основной API Google достигнет своих лимитов. Это…