Раньше один релиз huggingface_hub занимал полдня работы и выходил раз в 4–6 недель. Теперь — каждую неделю, почти автоматически. Hugging Face опубликовали устройство этого процесса целиком — и явно рассчитывают, что другие возьмут и повторят.
Механические шаги ушли в GitHub Actions полностью: bump версии в __init__.py, коммит, тег, push, открытие тестовых веток в downstream-библиотеках (transformers, datasets, diffusers и других), PR после релиза. Никаких решений — просто правильная последовательность, каждый раз одинаково.
Единственное место, где остался человек, — проверка черновика release notes перед публикацией. Это осознанный выбор: черновик, который выглядит уверенно и при этом незаметно врёт, хуже, чем никакого черновика.
Сам черновик пишет GLM-5.2 от Z.ai — open-weights модель, которая запускается через HF Inference Providers. Агентный рантайм — OpenCode. Модель получает десятки PR-заголовков и превращает их в связный текст release notes и Slack-анонс. Ни vendor-контракта, ни закрытой модели, ни инфраструктуры, которую нельзя поднять самостоятельно — авторы называют это явным требованием к дизайну с самого начала.
Весь стек воспроизводим для любого OSS-проекта:
- GitHub Actions — оркестрирует весь релиз.
- OpenCode — агентный рантайм, который управляет моделью.
- GLM-5.2 — пишет release notes и анонс.
- HF Inference Providers — обслуживает модель.
- PyPI Trusted Publishing — публикует пакет.
Для мейнтейнеров других библиотек это практически готовый шаблон: авторы прямо говорят, что хотели сделать workflow, который можно взять и адаптировать под свой проект.
Пробел, который в посте не закрыт: сколько времени человек теперь реально тратит на проверку черновика и как часто модель ошибается настолько, что правки существенные. Без этих цифр оценить реальную экономию пока нельзя.