Новости AI-стека
Daily · свежие материалы
Command A+: агенты стали умнее, модель заговорила на 48 языках
Cohere выпустила Command A+, новую модель, которая меняет подход к созданию умных агентов. Теперь они не только лучше понимают контекст, но и могут работать с изображениями и общаться на десятках языков, предлагая…
Gemini 3.1 Flash Lite: Deepgram обновляет Voice Agent API — пора мигрировать
Deepgram объявил о доступности Gemini 3.1 Flash Lite в своём Voice Agent API, который теперь полностью управляем Google. Это означает, что предварительная версия модели устаревает, и всем пользователям предстоит…
Guaranteed Capacity: OpenAI предлагает зарезервировать вычислительные мощности
На фоне растущего спроса на вычислительные ресурсы для масштабных AI-моделей, OpenAI представила новую услугу, которая призвана решить одну из ключевых проблем разработчиков: гарантированный доступ к мощностям. Это шаг…
OpenAI и SynthID: двойная защита от подделок, но без стопроцентной гарантии
OpenAI усиливает свои шаги по идентификации AI-генерируемого контента, внедряя комплексный подход, который призван повысить доверие к медиа в цифровую эпоху. Компания объединяет открытые стандарты происхождения с…
Cohere: покупка Reliant AI и фокус на фармацевтике
Компания Cohere сделала ставку на корпоративный ИИ в медицине, приобретя Reliant AI — фирму, специализирующуюся на суверенных решениях для здравоохранения и биофармацевтики. Этот шаг стратегически совпадает с…
Codex: Mac не спит ради ваших рассылок и долгих задач
OpenAI продолжает развивать свой инструмент Codex, позволяющий автоматизировать рутинные задачи на Mac. На этот раз фокус сместился на новые возможности для поддержания непрерывной работы и избавления от цифрового шума…
Codex: от облака к локальным данным — но через Dell
OpenAI и Dell Technologies объединяют усилия, чтобы перенести Codex в гибридные и локальные корпоративные среды. Этот шаг призван решить ключевую проблему безопасности и конфиденциальности данных для предприятий…
Глава Cohere назвал Торонто центром вселенной
В мире, где Кремниевая долина и крупные технологические хабы часто заявляют о своем превосходстве, один из лидеров AI-индустрии высказал неожиданное мнение. Эйдан Гомес, сооснователь и CEO Cohere, предложил взглянуть на…
OpenAI: Кратковременное снижение производительности GPT5.5 устранено
Сегодняшний день для пользователей OpenAI прошёл относительно спокойно, за исключением одного кратковременного инцидента. Компания оперативно отреагировала на сообщение о снижении производительности одной из своих…
Gemma-4-31B-it-pearl: как крипто-майнинг удешевляет инференс AI
Together AI объединяет усилия с Pearl Research Labs, чтобы радикально изменить экономику инференса AI. В основе нового партнёрства лежит технология Proof of Useful Work, которая позволяет одновременно с вычислениями для…
OpenAI: codex и chatgpt как агенты для рутины и разработки
Высшее руководство OpenAI активно делится в X (бывший Twitter) своим видением будущего codex и chatgpt, где модели выступают в роли глубоко интегрированных персональных помощников. От фоновой работы во время…
Сооснователь Cohere: «i am ice man» – о чем это?
Иван Чжан, соучредитель и технический директор компании Cohere, опубликовал на своей странице в X короткое, но крайне лаконичное личное сообщение. Этот пост, состоящий всего из нескольких фраз, вызвал вопросы из-за…
Автоматизация рутины: [[entity:codex|Codex]] выходит в операционку и финансы
Для команд, занятых бизнес-операциями, создание отчётов, брифов и планов часто начинается с разрозненных данных — трекеров проектов, дашбордов KPI, заметок со встреч, Slack-обсуждений и таблиц. Этот процесс, требующий…
violin: Открытый AI-перевод видео, который уважает голоса
Together AI выпустила Violin — полностью открытый инструмент для перевода видео, который разрушает языковые барьеры. Это комплексное решение объединяет распознавание речи, крупномодельный перевод и синтез речи, а также…
Codex: теперь код можно контролировать с телефона
OpenAI сделала своего кодового помощника Codex доступным для управления прямо из мобильного приложения ChatGPT на iOS и Android. Это не просто просмотр результатов: пользователи теперь могут запускать новую работу…
Deepgram: когда ненормативная лексика под контролем, а Азия говорит на родных языках
Deepgram представил обновление, которое меняет подход к цензурированию речи в транскрипциях: теперь функция фильтрации ненормативной лексики доступна для 50+ языков, охватывая широкий спектр мировых языков, а не только…
Codex под управлением с телефона: кодинг без привязки к рабочему месту
Возможность отойти от стола, продолжая управлять процессом разработки, всегда была желанной, но для реальных инженерных задач часто оставалась в области мечтаний. Теперь OpenAI разворачивает полноценный удаленный доступ…
Cohere намекает на новую инициативу «Project Pursue» и ищет истину в данных
Загадочное сообщение «The truth is out there…» появилось сегодня в аккаунте Cohere на X, сопровождаемое ссылкой на новую страницу «Project Pursue» на их официальном веб-сайте. Деталей инициативы пока нет, но это…
Voice Finder от Together AI: 600 голосов теперь можно искать по запросу
Together AI представила новый инструмент Voice Finder, который должен упростить процесс подбора подходящего голоса для приложений. Разработчики теперь смогут использовать естественный язык или аудиосэмплы для навигации…
Phi-Ground-Any: Модель для точного взаимодействия с UI
Microsoft выпустила новый открытый весовой вариант модели из семейства Phi-Ground — phi-ground-any. Это мультимодальная модель, ориентированная на взаимодействие с пользовательскими интерфейсами на основе визуального…
Perplexity Agent API: Finance Search теперь выдаёт структурированные финданные
Perplexity интегрировала инструмент Finance Search прямо в свой Agent API. Это значит, что теперь агенты могут напрямую запрашивать и получать структурированные финансовые и рыночные данные по публичным компаниям и…
Gemini Interactions API ломается второй раз за полгода — и снова срочно
Google анонсировал ломающее изменение в Gemini Interactions API: схема outputs→steps и response_format меняются, новая дефолтная 26 мая, старую удаляют 8 июня. И это не первый раз — API ломали ещё в декабре. Рядом …
ChatGPT приходит в Excel и Google Sheets: бесплатный пробник для бизнеса и образовательных учреждений
Интеграция больших языковых моделей с корпоративным софтом продолжает развиваться, но в основном это происходит на уровне кастомных API-интеграций и сторонних плагинов. На этот раз OpenAI самостоятельно внедрила…
Flux Multilingual: единая модель для глобальных голосовых агентов — без компромиссов в скорости и точности
Deepgram выкатил flux-multilingual — свою модель разговорного распознавания речи в общедоступную версию. Это шаг к унификации: теперь одна модель поддерживает 10 языков, автоматически обнаруживает и переключает языки…
Perplexity API: новые модели, безопасные ключи и список доступных через /v1/models
Perplexity обновила свой API, сосредоточившись на расширении возможностей Agent API, улучшении безопасности ключей и упрощении обнаружения доступных моделей. Теперь разработчики могут интегрировать новейшие модели…
Microsoft 365 Copilot: глубина анализа и генерация изображений прямо в офисных приложениях
Microsoft интегрирует две новые модели в microsoft-365-copilot: GPT-5.5 Thinking для углубленного анализа и многоэтапной работы, а также ChatGPT Images 2.0 для визуального создания контента. Эти обновления позволяют…
OpenAI и X: Закулисные сигналы от главного научного сотрудника
Платформа X (ранее Twitter) часто становится площадкой для неформальных анонсов и комментариев от инженеров и руководителей AI-компаний. OpenAI не исключение, и именно здесь главный научный сотрудник Марк Чен поделился…
Codex: инцидент устранен, GPT-5.5 доступен
Codex, среда разработки от OpenAI, теперь предлагает модель GPT-5.5 всем платным пользователям. Эта новость последовала за недавним сбоем, когда в сервисе наблюдался повышенный уровень ошибок, но инженерам удалось…
ChatGPT: командные агенты, приватный фильтр и большая чистка моделей
OpenAI выпустила сразу несколько продуктов, ориентированных на корпоративных пользователей и безопасность данных. Среди них — командные агенты для ChatGPT, призванные автоматизировать рутину в организациях, и новый…
Gemini-embedding-2: модель внедрения в GA, что это значит для масштабирования LLM
Модель внедрения gemini-embedding-2 достигла статуса общей доступности (GA), что делает её готовой для продакшен-нагрузок и интеграции в полноценные приложения. Это событие совпало с презентацией Google DeepMind новой…