О чём эта новость
- Детская больница Бостона диагностировала более 40 редких заболеваний и сократила расходы на $7 млн с помощью ИИ OpenAI.подробнее →
- Braintrust ускорил разработку ПО, используя Codex и GPT-5.5 для преобразования запросов в код за минуты.подробнее →
- По данным AISI, GPT-5.5 продемонстрировал высокую эффективность в сложных киберзадачах, решая многоступенчатые атаки.подробнее →
- OpenAI запустил Rosalind Biodefense для укрепления биозащиты, предоставив доступ правительственным партнерам США.подробнее →
OpenAI продолжает демонстрировать глубокую интеграцию своих ИИ-моделей в критически важные секторы. Детская больница Бостона успешно внедрила технологии OpenAI для трансформации педиатрической помощи, обеспечивая диагностические возможности, оптимизацию операционных процессов и существенную экономию ресурсов. Эти достижения подчеркивают растущую зрелость и универсальность искусственного интеллекта в решении сложных задач, ранее считавшихся трудноразрешимыми.
ИИ OpenAI трансформирует детскую медицину в Бостоне
Детская больница Бостона внедрила искусственный интеллект от OpenAI не просто ради экспериментов, а как ключевой элемент своей клинической и операционной инфраструктуры. Целью стало улучшение качества помощи педиатрическим пациентам, особенно тем, кто страдает от сложных и редких заболеваний, а также оптимизация внутренних процессов.
Благодаря интеграции ИИ в повседневные рабочие процессы были достигнуты результаты. Больница диагностировала более 40 редких заболеваний, которые ранее оставались неразрешенными. Кроме того, удалось сэкономить более 60 000 рабочих часов благодаря автоматизации рабочих процессов с использованием ИИ, что привело к перераспределению трудовых ресурсов на сумму более 7 миллионов долларов за счет операционной экономии времени. В общей сложности более 50 автоматизаций теперь поддерживают операционные процессы.
ИИ помогает справляться с тем, что Джон Браунштейн, директор по инновациям Детской больницы Бостона, называет «человеческими когнитивными ограничениями». При диагностике редких заболеваний врачи сталкиваются с фрагментированными генетическими данными, неполными историями болезни и огромным объемом медицинской литературы. Даже в исследовательских учреждениях врачи не могут достаточно быстро синтезировать всю эту информацию, чтобы поставить каждый диагноз. ИИ, в частности, защищенная внутренняя среда ChatGPT, помогает преодолеть эти барьеры, ускоряя анализ и предоставление критически важной информации.
Больница начала с отдельных вариантов использования ИИ, таких как инструменты для документирования и перевода. Однако эти ранние усилия быстро выявили ограничения фрагментированного подхода. В ответ на это Детская больница Бостона перешла к созданию так называемого «корпоративного ИИ-уровня». Вместо того чтобы рассматривать ИИ как набор разрозненных инструментов, организация создала общую основу, где новые возможности могут быстро разрабатываться и внедряться как в исследовательских, так и в клинических и административных командах. Это позволяет быстро масштабировать применение ИИ по всему учреждению.
В источниках не раскрывается долгосрочная стратегия OpenAI по дальнейшему расширению применения ИИ именно в сфере здравоохранения, а также то, какие следующие шаги планируются после текущих успехов в Бостонской детской больнице.
Codex и GPT-5.5 ускоряют разработку ПО в Braintrust
Платформа Braintrust, специализирующаяся на наблюдаемости и оценке качества продуктов ИИ, существенно оптимизировала процесс разработки функций благодаря интеграции OpenAI Codex с GPT-5.5. Инженеры компании теперь могут преобразовывать запросы клиентов в готовые превью-ветки кода за считанные минуты, что ускоряет циклы обратной связи и эксперименты.
Как отмечает основатель и генеральный директор Braintrust Анкур Гоял, ключевое изменение заключается не только в скорости написания кода, но и в ускорении цикла обратной связи с клиентами. «Codex может буквально печатать больше текста в терминале без замедлений, и другие модели просто не могут это повторить», — говорит Гоял. Эта скорость позволяет команде Braintrust встраивать итерации в рабочий процесс разработки, вместо того чтобы откладывать запросы в бэклог. Теперь они могут копировать и вставлять запросы в Codex, создавать предварительную ветку и демонстрировать завершенный запрос клиенту почти в реальном времени, способствуя совместной разработке идей.
Скорость Codex также делает возможным автономное решение проблем. Ранее для работы с другими моделями требовалось более детальное и пошаговое взаимодействие. С Codex подход изменился: инженеры могут определить проблему, создать изолированную среду («песочницу»), а затем позволить Codex работать в ней самостоятельно. Это существенно снижает затраты на эксперименты и позволяет команде быстрее переходить от идеи к работающему решению.
Всего за один месяц 50% команды Braintrust перешли на использование Codex, что демонстрирует быструю адаптацию и высокую эффективность инструмента в их рабочих процессах. Однако для полной автономии Codex по-прежнему необходимы четко определенные тестовые сценарии и среды, что позволяет эффективно проверять и интегрировать генерируемый код.
кибервозможности GPT-5.5 по данным внешних оценок
Согласно результатам независимой оценки, проведенной Агентством по стандартам и инфраструктуре ИИ (AISI), модель GPT-5.5 от OpenAI продемонстрировала высокую эффективность в выполнении сложных киберзадач, став одной из самых сильных моделей, протестированных агентством. Она оказалась второй моделью, успешно решившей одну из многоступенчатых симуляций кибератак от начала до конца.
AISI использовала набор из 95 узкоспециализированных киберзадач четырех уровней сложности, которые проверяют широкий спектр навыков кибербезопасности. Тестировались такие ключевые возможности, как исследование уязвимостей и их эксплуатация, включая обратный инжиниринг, веб-эксплуатацию и криптографию. В базовых задачах, где требуется лишь несколько шагов для решения (например, извлечение флага из захваченного пакета), модели достигали полного насыщения еще в феврале 2026 года. Расширенные задачи, разработанные совместно с фирмами Crystal Peak Security и Irregular, сосредоточены на исследовании уязвимостей и эксплуатации против реалистичных целей с современными методами защиты.
В задачах экспертного уровня GPT-5.5 достиг среднего показателя успешности в 71,4% (±8,0%), опередив Mythos Preview (68,6% ±8,7%), GPT-5.4 (52,4% ±9,8%) и Opus 4.7 (48,6% ±10,0%). Модель справилась с корпоративной имитацией сетевой атаки от начала до конца — многоступенчатым упражнением, которое, по оценкам AISI, заняло бы у человека около 20 часов. Это подчеркивает способность GPT-5.5 к решению комплексных, многоэтапных киберугроз.
Перед выпуском GPT-5.5 OpenAI провела полный комплекс оценок безопасности на этапе преддеплоймента и применила свою Систему готовности (Preparedness Framework). Включались целевое красное тестирование для выявления кибербезопасных и биологических возможностей, а также сбор отзывов от почти 200 партнеров по раннему доступу. Модель была выпущена с самым сильным набором защитных мер на сегодняшний день, разработанных для снижения рисков злоупотребления при сохранении законных и полезных применений возможностей.
Запуск Rosalind Biodefense для укрепления биозащиты
OpenAI объявила о запуске платформы Rosalind Biodefense, призванной расширить доверенный доступ к модели GPT-Rosalind для проверенных разработчиков и правительственных партнеров США. Эта инициатива направлена на укрепление биозащиты, общественного здравоохранения и готовности к пандемиям с использованием возможностей искусственного интеллекта.
Основное предназначение платформы Rosalind Biodefense — повышение устойчивости общества перед лицом биологических угроз. Через эту инициативу доступ к GPT-Rosalind получат только проверенные разработчики и партнеры правительства США, что обеспечивает контролируемое и ответственное использование ИИ-инструментов в чувствительных областях. Это включает в себя анализ биоданных, моделирование распространения заболеваний и разработку контрмер.
Запуская Rosalind Biodefense, OpenAI преследует цель не только предоставить доступ к своим моделям, но и содействовать исследованиям и разработкам в критически важных областях, где скорость и точность анализа могут иметь решающее значение для национальной безопасности и глобального здоровья. ИИ будет использоваться для выявления потенциальных угроз, ускорения научных открытий и улучшения координации реагирования на чрезвычайные ситуации в области общественного здравоохранения.
В источниках не указано, планируются ли аналогичные программы биозащиты с Rosalind Biodefense в других регионах или с другими международными партнерами. Также отсутствуют подробности о технической архитектуре самой платформы Rosalind Biodefense, что затрудняет понимание масштабов и механизмов её развёртывания.
Единый подход OpenAI к независимой оценке фронтирных моделей
OpenAI активно разрабатывает и внедряет надежные методы сторонней оценки своих фронтирных моделей, признавая, что традиционные подходы к тестированию ИИ уже не соответствуют возросшим возможностям современных систем. Раньше модели оценивались как простые чат-боты, отвечающие на вопросы пользователя. Однако сегодняшние ИИ могут использовать инструменты, отслеживать информацию на многих этапах и действовать в рамках более широкого рабочего процесса.
Такая многофункциональность означает, что производительность модели зависит не только от самой модели, но и от среды, в которой выполняется задача, а также от «harness» — окружающей установки, которая облегчает ее действия. Harness может существенно влиять на использование инструментов, отслеживание информации и восстановление после ошибок, что делает критически важным его описание в отчетах об оценке.
OpenAI выделяет три основных типа утверждений, которые проверяются в рамках оценок:
- Извлечение возможностей: Способна ли модель правдоподобно воспроизвести оцениваемую возможность?
- Производительность защитных мер: Насколько устойчивы протестированные защитные меры против оцениваемого поведения или атаки?
- Сравнение: Как различные модели показывают себя в эквивалентных условиях?
Для обеспечения валидности результатов оценок OpenAI также проверяет на наличие таких факторов, как «накрутка вознаграждения» (эксплуатация ярлыков для получения кредита без демонстрации истинного поведения), «отказы» (отказ от выполнения задач, скрывающий проверяемое поведение), «загрязнение» (перепроизводительность из-за присутствия задач или ответов в тренировочных данных) и «саботаж» (намеренное снижение производительности при осознании оценки).
OpenAI делится полученными уроками и рекомендует подходы к разработке оценок, которые могут достоверно оценивать фронтирные модели. Эти усилия призваны информировать формирующиеся стандарты в этой области, согласуясь с такими инициативами, как черновик NIST AI 800-2 по лучшим практикам автоматизированных бенчмарков и разрабатываемый стандарт ISO/IEC AWI TS 42119-8 по оценке качества систем на основе генеративного ИИ.
Краткие операционные сбои в сервисах OpenAI
В течение недавнего периода сервисы OpenAI столкнулись с несколькими кратковременными операционными сбоями, которые были оперативно устранены. Эти инциденты затронули различные аспекты пользовательского взаимодействия, но не привели к длительным простоям.
Среди затронутых сервисов были проблемы с оформлением подписок на тариф Business plan на веб- и мобильных платформах, которые были расследованы и устранены в течение примерно 4,5 часов. Также пользователи сталкивались с проблемами в беседах и трудностями при входе в систему или создании учетной записи; эти инциденты были разрешены в течение 1,5–1,75 часов соответственно. Наконец, наблюдались кратковременные проблемы с доступом к ChatGPT, которые были полностью устранены всего за 8 минут.
Все эти сбои были оперативно выявлены и устранены, что демонстрирует способность команды OpenAI быстро реагировать на инциденты. Отчеты о статусе указывают на то, что эти проблемы не были связаны с крупными системными сбоями, а представляли собой отдельные, быстро разрешенные инциденты.
Что это значит
Инициативы OpenAI охватывают сферы от диагностических инструментов в медицине до усиления кибербезопасности и биозащиты, включая формирование стандартов независимой оценки. Остается актуальным вопрос развития механизмов прозрачности и контроля.