Новости AI-стека
Daily · свежие материалы
Claude Code: HTML вместо Markdown — почему Anthropic сменил формат
Работая с большими языковыми моделями, мы привыкли, что Markdown — это универсальный формат для общения с ними: простой, переносимый, с базовыми возможностями разметки. Но команда Claude Code из Anthropic всё чаще…
Anthropic: ИИ-системы на исповеди — как формировать характер модели
Anthropic начал широкие диалоги с представителями самых разных традиций — от ученых до духовенства и философов. Цель этих бесед — понять, как формировать «характер» ИИ-систем, чтобы они приносили пользу человечеству и…
Anthropic приобретает Stainless: будущее агентов и API
Anthropic объявил о приобретении компании Stainless, которая специализируется на разработке SDK и инструментов для серверов MCP. Этот шаг сигнализирует об углублении стратегического фокуса Anthropic на расширении…
Инструмент веб-поиска: Claude глубже анализирует отчёты SEC
Инструмент веб-поиска в Claude получил обновление, которое позволяет извлекать более полные и детализированные данные из отчетов SEC. Это изменение призвано упростить финансовые исследования и процессы комплексной…
Anthropic меняет правила игры для Claude Agent SDK: бесплатные кредиты для разработчиков
В постоянно развивающемся ландшафте AI-инфраструктуры, детали биллинга и доступа к инструментам могут существенно влиять на стратегию разработки. Anthropic сделал шаг, который, казалось бы, направлен на снижение…
FLUX Outpainting: ИИ-расширение изображений в один API-вызов, без промтов
Black Forest Labs представила новую возможность для своей линейки FLUX Tools — FLUX Outpainting. Инструмент позволяет расширять любое изображение за его исходные границы, автоматически сохраняя при этом целостность…
Claude Code: Opus 4.7 по умолчанию и новые флаги для агентов
Anthropic обновил Claude Code до версии 2.1.142, внедрив существенное изменение в поведении быстрого режима — теперь он по умолчанию работает на модели Opus 4.7. Это может незаметно повлиять на производительность и…
Anthropic выходит за рамки моделей: взгляды на конкуренцию и поддержка глобальных программ
Anthropic, известная в первую очередь своими моделями Claude, на этой неделе продемонстрировала активность, выходящую за рамки привычных технических анонсов. Компания опубликовала свой взгляд на геополитическое…
Phi-Ground-Any: Модель для точного взаимодействия с UI
Microsoft выпустила новый открытый весовой вариант модели из семейства Phi-Ground — phi-ground-any. Это мультимодальная модель, ориентированная на взаимодействие с пользовательскими интерфейсами на основе визуального…
Perplexity Agent API: Finance Search теперь выдаёт структурированные финданные
Perplexity интегрировала инструмент Finance Search прямо в свой Agent API. Это значит, что теперь агенты могут напрямую запрашивать и получать структурированные финансовые и рыночные данные по публичным компаниям и…
Gemini Interactions API ломается второй раз за полгода — и снова срочно
Google анонсировал ломающее изменение в Gemini Interactions API: схема outputs→steps и response_format меняются, новая дефолтная 26 мая, старую удаляют 8 июня. И это не первый раз — API ломали ещё в декабре. Рядом …
Claude углубляется в финансы: 10 готовых агентов и интеграция с Microsoft 365
Интеграция больших языковых моделей в высокорегулируемые и консервативные отрасли, такие как финансовые услуги, всегда сопряжена с множеством вызовов — от безопасности данных до соответствия нормативным требованиям…
Perplexity API: новые модели, безопасные ключи и список доступных через /v1/models
Perplexity обновила свой API, сосредоточившись на расширении возможностей Agent API, улучшении безопасности ключей и упрощении обнаружения доступных моделей. Теперь разработчики могут интегрировать новейшие модели…
Microsoft 365 Copilot: глубина анализа и генерация изображений прямо в офисных приложениях
Microsoft интегрирует две новые модели в microsoft-365-copilot: GPT-5.5 Thinking для углубленного анализа и многоэтапной работы, а также ChatGPT Images 2.0 для визуального создания контента. Эти обновления позволяют…
Gemini-embedding-2: модель внедрения в GA, что это значит для масштабирования LLM
Модель внедрения gemini-embedding-2 достигла статуса общей доступности (GA), что делает её готовой для продакшен-нагрузок и интеграции в полноценные приложения. Это событие совпало с презентацией Google DeepMind новой…
Agent skills для Replicate: учим ассистентов работать с моделями как про
Replicate представил Agent skills — набор инструкций в формате Markdown, который позволяет кодирующим ассистентам лучше понимать, как искать, сравнивать и запускать модели ИИ на платформе. Это шаг к тому, чтобы сделать…
**Разработчики предлагают несколько советов для получения наилучшего результата:**
Детально описывайте сцену. Вместо «автомобильная погоня» пишите «высокоскоростная ночная погоня по залитым дождём улиц Токио, неоновые отражения на мокром асфальте, фары прорезают туман». Описывайте не только…
Gemini 3.1 Flash TTS: озвучку теперь режиссируют, а не выбирают голос
Google выкатил в preview Gemini 3.1 Flash TTS. Раньше синтез речи — «выбери голос из списка». Теперь голосом управляют как режиссёр актёром, указаниями прямо в тексте через аудиометки, а найденную постановку можно…
Vertex AI: Claude Opus 4.7 в Model Garden, Gemini Robotics читает приборы
Google расширяет свою AI-инфраструктуру, предлагая как новые возможности для сторонних моделей, так и улучшения для собственных. На этой неделе стал доступен Claude Opus 4.7 в Vertex AI Model Garden, предоставляя…
Claude: Исследования надзора — теперь полностью автономно, и дешевле людей
Anthropic сообщает о новом векторе в исследованиях масштабируемого надзора: модели Claude теперь могут полностью автономно развивать этот процесс, превосходя эффективность команд из людей-исследователей. Этот результат…
Claude Sonnet 4 и Opus 4: пора прощаться?
Anthropic объявила о скором выводе из эксплуатации некоторых моделей Claude API. Разработчики, использующие версии Sonnet 4 и Opus 4, должны быть готовы к переходу, поскольку поддержка этих моделей будет прекращена в…
Agent API Perplexity: новые модели и прощание со старыми Gemini
Perplexity обновила свой Agent API, добавив поддержку сторонних моделей, таких как GPT-5.4, NVIDIA Nemotron и Claude Sonnet 4.6, одновременно прекратив поддержку нескольких версий Gemini. Это изменение перестраивает…
AI-новости
Обратите внимание на pipe.enable_model_cpu_offload() — эта строка кода демонстрирует типичную технику для дальнейшей оптимизации использования VRAM, перемещая части модели в CPU по мере необходимости.
Gemma 4 отдают даром — и в тот же день ставят таймер на Gemini 2.5
Google выпустил Gemma 4 — открытые модели под Apache 2.0: 3-е и 6-е места среди всех open-моделей мира, обходят те, что в 20 раз крупнее, запускаются хоть на телефоне, хоть на одной видеокарте. А в том же окне тихо…
Lyria 3 Pro: песня целиком — но имитировать артиста модель отказывается
Google выпустил Lyria 3 Pro — модель генерации музыки: уже не 30-секундная петля, а трек до трёх минут с заданной структурой (интро/куплет/припев/бридж по запросу). Но Google намеренно сделал так, что имитировать…
Claude Code: «Автоматический режим» против усталости от согласований
Инженеры, работающие с Claude Code, знакомы с проблемой «усталости от согласований»: система запрашивает подтверждение перед каждой потенциально опасной командой или изменением файла. 93% таких запросов пользователи в…
Perplexity: Агенты и вложения — теперь в релизе для продакшена
Perplexity выпустила в общий доступ (GA) свои Agent API и Embeddings API. Это означает, что разработчики теперь могут использовать инструменты для создания автономных агентов и внедрения продвинутого семантического…
FLUX.2 [pro]: удвоение скорости без изменения API
Black Forest Labs представила ускорение своей флагманской модели FLUX.2 [pro] для генерации и редактирования изображений. Заявлено двукратное увеличение производительности без компромиссов в качестве и без повышения…
Nano Banana Pro: обходит лимиты Google с резервной моделью
Генерация изображений с помощью nano-banana-pro теперь стала надежнее. Replicate представил механизм резервирования, который позволяет продолжить работу, даже если основной API Google достигнет своих лимитов. Это…