AI News Watcher
Лента Вендоры Итоги дня Telegram

Новости ИИ — 22 апреля 2026

5 материал(ов) за день · искусственный интеллект

Кратко: Cerebras: ключ к кэшу промптов ускорит LLM-инференс, но две модели уйдут в отставку; ChatGPT: командные агенты, приватный фильтр и большая чистка моделей; Gemini-embedding-2: модель внедрения в GA, что это значит для масштабирования LLM.

Σ
Cerebras 22 апреля · 2 мин

Cerebras: ключ к кэшу промптов ускорит LLM-инференс, но две модели уйдут в отставку

Cerebras обновила свой API, добавив параметр prompt_cache_key, который позволяет управлять кэшированием промптов и сократить задержку до первого токена. Это небольшое, но важное изменение даёт инженерам больше контроля над оптимизацией…

AWS
OpenAI 22 апреля · 9 мин

ChatGPT: командные агенты, приватный фильтр и большая чистка моделей

OpenAI выпустила сразу несколько продуктов, ориентированных на корпоративных пользователей и безопасность данных. Среди них — командные агенты для ChatGPT, призванные автоматизировать рутину в организациях, и новый фильтр для защиты…

Google 22 апреля · 3 мин

Gemini-embedding-2: модель внедрения в GA, что это значит для масштабирования LLM

Модель внедрения gemini-embedding-2 достигла статуса общей доступности (GA), что делает её готовой для продакшен-нагрузок и интеграции в полноценные приложения. Это событие совпало с презентацией Google DeepMind новой архитектуры Decoupled…

Σ
DeepSeek 22 апреля · 3 мин

DeepSeek-V4: Контекст в 1M токенов и гибридная архитектура внимания

DeepSeek AI представила новую серию моделей DeepSeek-V4, включая DeepSeek-V4-Pro и DeepSeek-V4-Flash. Главная особенность обеих версий — поддержка контекстного окна в один миллион токенов, что переводит их в лигу моделей, способных…

06
ByteDance 22 апреля · 3 мин

Seed3D 2.0: Как ByteDance создает 3D-модели, готовые к симуляциям

В сфере генерации 3D-контента ByteDance сделала очередной шаг вперед, представив Seed3D 2.0. Эта новая система улучшает точность создаваемых 3D-объектов, делая их пригодными не только для статичного рендера, но и для полноценных симуляций…