Крупные ИИ-компании давно стремятся к вертикальной интеграции, чтобы снизить зависимость от сторонних поставщиков оборудования. OpenAI сделала важный шаг в этом направлении, представив свой первый ИИ-чип под названием Jalapeño, разработанный специально для рабочих нагрузок больших языковых моделей (LLM).
Чип Jalapeño спроектирован с нуля самой OpenAI в партнёрстве с Broadcom. Его основное назначение — ускорение инференса (генерации ответов после обучения) для таких продуктов, как ChatGPT, Codex, API и будущих агентных систем. Разработка заняла всего девять месяцев, что, по словам OpenAI, было ускорено благодаря использованию их собственных моделей.
По данным Broadcom, Jalapeño обещает экономию: он должен быть примерно на 50% дешевле в эксплуатации по сравнению с типичными графическими процессорами (GPU) для ИИ. Ранние тесты также показывают лучшую производительность на ватт по сравнению с современными решениями. Инженерные образцы чипа уже работают с задачами машинного обучения в лаборатории.
Этот шаг ставит OpenAI в один ряд с технологическими гигантами, такими как Google, Amazon, Microsoft и Meta, которые также активно инвестируют в собственные ИИ-чипы. Цель — уменьшить зависимость от сторонних поставщиков (в частности, от Nvidia), оптимизировать производительность и сократить затраты для дальнейшего масштабирования ИИ-сервисов.
OpenAI планирует развернуть Jalapeño в гигаваттном масштабе в сотрудничестве с партнёрами по центрам обработки данных, включая Microsoft. Ожидается, что готовые чипы начнут интегрироваться в крупные дата-центры уже в этом году. Компания намерена потратить десятки миллиардов долларов на чипы Broadcom в рамках этой стратегии.
Создание Jalapeño — это прямой вызов доминированию Nvidia на рынке ИИ-железа и логичное продолжение стратегии OpenAI по контролю над всей цепочкой создания ИИ. Заявленные 50% экономии могут существенно снизить операционные расходы на масштабирование LLM, но эти цифры пока основаны на внутренних тестах и словах партнёра.