О чём эта новость
- Codex от OpenAI теперь ориентирован на нетехнических пользователей с новыми функциями и персонализацией.подробнее →
- в голосовых агентах реального времени был продемонстрирован на хакатоне Voice Hack Night.подробнее →
- OpenAI видит ИИ как ускоритель научных исследований, расширяющий возможности математиков и учёных.подробнее →
- Обновления открывают новые возможности для разработчиков и конечных пользователей в создании интуитивных ИИ-инструментов.подробнее →
Грег Брокман, соучредитель и президент OpenAI, возглавляющий объединенную продуктовую организацию, недавно поделился в X своим позитивным опытом использования Codex для разработки, подчеркнув его удобство и эффективность. Его заявление появилось на фоне изменений в стратегии OpenAI, направленной на расширение доступности инструмента и его интеграцию в более широкий спектр задач, выходящих за рамки традиционного кодинга. Это подчеркивает стремление компании сделать сложные ИИ-инструменты доступными для максимально широкой аудитории. Брокман также отметил потенциал ИИ в ускорении научных исследований, предоставляя новые возможности математикам и ученым. Эти события, хоть и не являются выпуском новых продуктов, демонстрируют зрелость существующих технологий и стратегическое видение OpenAI в развитии ИИ.
Трансформация Codex: от разработчиков к широкой аудитории
Codex, который ранее был известен преимущественно как инструмент для разработчиков, теперь переживает трансформацию, переориентируясь на нетехнических специалистов. Этот сдвиг отражает более широкую стратегию OpenAI по демократизации доступа к ИИ-инструментам. В рамках нового подхода, обновленный Codex теперь при запуске задает пользователю вопрос о типе выполняемой работы, предлагая варианты от финансов и маркетинга до науки о данных и дизайна. Это позволяет персонализировать предложения задач и начальные подсказки, упрощая взаимодействие для пользователей без технического бэкграунда.
Ключевым изменением в функциональности является встроенная генерация изображений, которая теперь доступна без необходимости настройки внешних серверов MCP или подключения сторонних инструментов. Например, при запросе на создание Google Формы для регистрации на баскетбольный матч, Codex самостоятельно сгенерировал рекламный плакат для мероприятия, не требуя дополнительных указаний. Это существенно упрощает рабочие процессы для нетехнических пользователей, позволяя им выполнять многозадачные проекты в рамках одной платформы. Ромен Юэ, глава отдела по работе с разработчиками OpenAI, также отметил, что можно просто попросить Codex организовать его собственный код, что демонстрирует способность инструмента к самоорганизации и управлению сложными задачами.
Для обычных пользователей и их рабочих процессов это означает снижение порога входа и повышение продуктивности. Исчезает необходимость в глубоком понимании технических деталей или освоении нескольких отдельных инструментов. Благодаря новому интерфейсу, который предлагает релевантные отправные точки на основе выбранного типа работы, пользователи могут сразу приступить к решению своих задач, будь то составление маркетинговых материалов, анализ данных или создание дизайна. Несмотря на то, что базовая модель не изменилась (по данным MindStudio, это обновление касается в основном UI и слоя предложений подсказок), первые впечатления играют решающую роль в принятии продукта, и именно на это направлены последние изменения. Впрочем, конкретные даты выпуска всех новых функций Codex для нетехнических специалистов в источниках не указаны.
Тем не менее, остаются вопросы относительно пользовательских метрик или отзывов о влиянии редизайна Codex на нетехнических пользователей, а также о ценовой политике в связи с его расширенным использованием. Эти данные могли бы дать более полное представление об эффективности нового подхода и его долгосрочных последствиях для разных категорий пользователей. Текущая версия Codex, как отмечено в «The Codex Handbook», включает в себя обновление модели до GPT-5.5, которая интегрируется в Codex, предлагая улучшения в работе с агентами и длинными контекстами, что также способствует расширению его возможностей для более широкой аудитории.
Голосовые агенты в реальном времени: Hack Night и технологии
OpenAI активно развивает направление голосовых агентов, способных обрабатывать речь в реальном времени, что было ярко продемонстрировано на недавнем хакатоне Voice Hack Night. Это мероприятие, организованное OpenAI Developers, объединило команды, которым за 6 часов предстояло создать голосовых агентов для реальных сценариев использования. Четыре проекта-финалиста были представлены публике для голосования, что подчеркивает практическую направленность и потенциал в этой области. Целью хакатона было не только выявить талантливые решения, но и показать возможности интерактивного голосового взаимодействия.
Несмотря на то что список победителей Voice Hack Night пока не объявлен (результаты ожидаются в понедельник), само проведение мероприятия акцентирует внимание на ключевых архитектурных подходах OpenAI к созданию таких агентов. OpenAI предлагает две основные архитектуры для голосовых агентов: Speech-to-speech (S2S) и Chained (последовательная). Архитектура S2S, использующая мультимодальную модель gpt-4o-realtime-preview, напрямую обрабатывает аудиовходы и выходы, думая и отвечая на речь. Эта модель слышит эмоции и намерения, фильтруя шум и реагируя напрямую голосом, что идеально подходит для интерактивных сценариев с низкой задержкой, таких как языковое обучение или клиентская поддержка.
Последовательная архитектура, в свою очередь, включает в себя цепочку моделей (gpt-4o-transcribe → gpt-4o → gpt-4o-mini-tts), где аудио сначала преобразуется в текст, затем обрабатывается LLM для генерации ответа, а затем синтезируется обратно в речь. Этот подход рекомендуется для структурированных рабочих процессов и сценариев, требующих высокой прозрачности, поскольку он предоставляет текстовую запись как пользовательского ввода, так и ответа модели. Обе архитектуры позволяют разработчикам использовать API и SDK OpenAI для создания, контекстно-ориентированных голосовых агентов, открывая широкие возможности для инноваций в области голосового взаимодействия.
Широкое видение OpenAI: Codex и будущее исследований
За заявлениями о переориентации Codex и демонстрацией голосовых агентов стоит широкое стратегическое видение OpenAI, направленное на использование искусственного интеллекта для расширения человеческих возможностей. Грег Брокман подчеркивает, что ИИ может ускорить исследования, расширяя горизонты для математиков и ученых. Это означает не просто автоматизацию рутинных задач, а создание инструментов, которые позволяют специалистам браться за более сложные и амбициозные проекты, которые ранее казались невыполнимыми из-за их масштабности или сложности.
OpenAI активно работает над тем, чтобы инструменты вроде Codex стали катализатором для научного прогресса. Это включает в себя не только предоставление средств для написания и отладки кода, но и интеграцию с возможностями анализа данных, моделирования и даже генерации гипотез. Последние обновления моделей, таких как GPT-5.5 (выпущенная в апреле 2026 года), играют ключевую роль в этом видении. GPT-5.5 демонстрирует существенный прирост производительности в задачах, связанных с агентами и обработкой длинных контекстов. Например, бенчмарк MRCR v2 для контекстов в 1 млн токенов подскочил с 36.6% на GPT-5.4 до 74.0% на GPT-5.5, а Terminal-Bench 2.0 достиг 82.7%, при этом коэффициент галлюцинаций снизился примерно на 60% по сравнению с предыдущими поколениями.
Такие улучшения **усиливают возможности ИИ в качестве
Последствия для разработчиков и пользователей
Эти последние новости от OpenAI имеют ** последствия как для разработчиков, так и для конечных пользователей**. Для разработчиков расширение возможностей Codex означает появление новых сценариев его использования. Теперь они могут создавать более сложные и интуитивно понятные ИИ-приложения, которые интегрируют не только генерацию кода, но и такие функции, как создание изображений, что позволяет разрабатывать многофункциональные инструменты для нетехнических аудиторий. С другой стороны, углубление работы с голосовыми агентами в реальном времени открывает путь к созданию высокоинтерактивных голосовых интерфейсов для различных сфер — от клиентской поддержки до образовательных платформ.
Конечные пользователи, в свою очередь, получат доступ к более и интуитивно понятным ИИ-инструментам. Переориентация Codex на нетехнических специалистов и его новые функции, такие как выбор типа работы и встроенная генерация изображений, упрощают повседневные задачи. Пользователи смогут быстрее и эффективнее выполнять такие действия, как анализ данных, создание контента или управление проектами, без необходимости осваивать сложные технические навыки. Новые сценарии использования становятся возможными благодаря этим обновлениям, позволяя даже тем, кто никогда не работал с кодом, использовать ИИ для решения широкого круга творческих и аналитических задач. Однако, остаются вопросы относительно конкретных дат выпуска всех новых функций Codex для нетехнических специалистов, что важно для планирования внедрения.
Что это значит
OpenAI переориентирует Codex на широкую аудиторию и продвигает голосовых агентов в реальном времени. Какие из этих решений окажутся действительно востребованы и найдут широкое применение, покажет время.