Большинство облачных платформ проектировались под разработчика с браузером: найди эндпоинт, напиши вызов, научи агента. Alibaba Cloud поставила вопрос иначе: что нужно агенту? 26 мая в Сингапуре запустился Qwen Cloud — платформа, где главный «пользователь» по замыслу это AI-агент, а не человек.
Архитектура трёх входов — центральная идея платформы. Qwen Cloud делит потребителей на три категории и даёт каждому свой вход:
- Skills — для агентов. Сложные возможности (генерация изображений, обработка видео, распознавание речи) упакованы в стандартизированные Skills Prompts. Агент читает
skills.mdи вызывает нужную функцию одной инструкцией — без поиска документации, без написания API-вызовов вручную. - CLI — для скриптов и CI/CD. Детерминированный, воспроизводимый слой для автоматизированных пайплайнов и пакетных задач.
- Website — для людей. Сравнение моделей, онлайн-тестирование и получение API-ключа без привязки карты — всё в одной вкладке.
Смысл разделения: агент перестаёт зависеть от того, насколько хорошо его «обучили» работать с платформой. Skills Prompts читаемы машиной напрямую.
Один API-ключ покрывает шесть модальностей: текст, зрение, изображения, видео, речь и эмбеддинги. Флагман Qwen3.7-Max доступен по $1.25/M токенов на входе и $3.75/M на выходе, контекст — 1M токенов. Для сравнения: тот же Qwen3.7-Max на Model Studio стоит $2.5/$7.5 за миллион токенов — Qwen Cloud даёт скидку около 50% на флагманской модели.
Token Plan решает проблему бюджетной непредсказуемости для команд: фиксированная месячная подписка покрывает текст, изображения и речь. При превышении квоты сервис не обрывается — трафик автоматически переходит на pay-as-you-go. Дополнительно: мультиместные аккаунты для команд, workspace-изоляция и детализация расходов по API-ключу, модели и типу токенов.
Ценовой разрыв с Model Studio выглядит как инструмент захвата глобального рынка — особенно в связке с Skills-архитектурой, которая снижает порог интеграции для агентных сценариев. Что остаётся за кадром: реальные SLA за пределами декларируемых 99.9% uptime, конкретная стоимость и лимиты квот Token Plan, доступность по регионам — и главное, как Skills-промпты версионируются при обновлении моделей. Агент, завязанный на skills.md, уязвим к любому изменению в этом файле.