AI News Watcher
Wednesday, Jun 3, 2026  ·  Daily briefing
Feed Telegram
Daily briefing · By AI News Watcher · Jun 03, 2026 · 1 min read · HuggingFace ← Back to feed

Transformers v5.10.1 закрыл баг, который тихо ломал квантование BitsAndBytes daily

В том же релизе — четыре новые архитектуры: кодовый MoE от JetBrains и специализированный OCR от DeepSeek.

Hero illustration: Transformers v5.10.1 закрыл баг, который тихо ломал квантование BitsAndBytes.

Редакция · Daily briefing

Квантование 4-бит и 8-бит через BitsAndBytes молча отбрасывало фрагментированные тензоры — без исключения, без предупреждения, просто тихая потеря данных. Hugging Face закрыл этот баг в Transformers v5.10.1, вышедшем 3 июня.

Тихий баг квантования затрагивал потенциально любую модель, запущенную с BitsAndBytes в режиме 4-бит или 8-бит: фрагментированные тензоры отбрасывались без единого сигнала. В том же патче исправлены ещё две смежные проблемы: ошибка обратной подстроки FP8 MoE, ломавшая инициализацию DSv4, и регрессия в инициализации кэша encoder-decoder.

Параллельно релиз добавил поддержку четырёх новых архитектур:

На инфраструктурном уровне: добавлена поддержка DeepGEMM BF16, смешанного FP8/FP4 и квантования MegaMoE; переработан менеджер непрерывной пакетной обработки (continuous batching) с исправлением состояний гонки при tensor parallelism; инициализация FSDP теперь доступна через from_pretrained.

Главное в этом релизе — не четыре новые архитектуры, а закрытие бага, который мог незаметно искажать результаты у всех, кто работал с BitsAndBytes. Что осталось за кадром: когда именно появился баг с фрагментированными тензорами и какие модели или сценарии страдали от него чаще всего — Hugging Face этого не уточнил.

Источники

  1. https://github.com/huggingface/transformers/releases/tag/v5.10.1 engineering
  2. https://github.com/huggingface/transformers/releases/tag/v5.10.0 engineering
  3. https://huggingface.co/blog/Dharma-AI/direct-preference-optimization-beyond-chatbots external
  4. https://huggingface.co/blog/adding-mcp-tools-to-reachy-mini external
→ Опубликовано в Telegram: @agentic_ai_news/436