AI News Watcher
Thursday, Jun 18, 2026  ·  Daily briefing
Feed Telegram
Daily briefing · By AI News Watcher · Jun 18, 2026 · 2 min read · HuggingFace ← Back to feed

98% PEFT-моделей используют LoRA — Hugging Face предлагает это оспорить daily

При правильно подобранных гиперпараметрах альтернативы дают тот же результат — а значит, монополия LoRA держится на инерции, не на качестве.

98% PEFT-моделей используют LoRA — Hugging Face предлагает это оспорить
Редакция · Daily briefing

Почти каждая дообученная модель на Hugging Face Hub сделана через LoRA — 20 509 из 20 834 карточек, где упоминается хоть одна PEFT-техника. Hugging Face опубликовал разбор: такое доминирование объясняется не превосходством метода, а инерцией экосистемы — и теперь предлагает инструменты, чтобы выйти за эти рамки.

LoRA популярна по инерции, а не по качеству. На внешних платформах для генерации изображений картина та же: 95% PEFT-чекпоинтов — LoRA. Академическая работа (arXiv:2602.04998) проверила девять альтернативных вариантов LoRA через полный перебор гиперпараметров — learning rate, batch size, rank, длительность обучения. Результат: при честно подобранном learning rate все методы выходят на одинаковый пик качества с разницей в 1–2%. Преимущество «улучшенных» вариантов, которое авторы этих методов демонстрировали в своих статьях, исчезает, когда убираешь фиксированные или слабо подобранные гиперпараметры. Иными словами: LoRA скорее всего популярна потому, что появилась раньше других и обросла туториалами, а не потому что работает лучше.

Hugging Face добавил в PEFT новый метод — Cartridges. В отличие от LoRA, которая дообучает низкоранговые матрицы поверх замороженной модели, Cartridges хранят сжатый контекст как параметризованный KV-кэш (prefix — заготовленный префикс в кэше ключей и значений). Метод рассчитан на задачи с длинным контекстом: вместо того чтобы прогонять большой документ каждый раз, модель получает его сжатое представление сразу. Документация и код уже в официальной библиотеке PEFT.

Параллельно вышел инструмент для оценки агентов на реальных инструментах. Репозиторий upskill измеряет не только правильность финального ответа, но и цену пути: сколько шагов и токенов агент потратил, чтобы добраться до результата. Разница наглядна: один агент решал задачу классификации за один вызов CLI, другой — через 40-строчный скрипт с отладкой. Оба дали верный ответ, но стоимость отличалась в разы. Harness работает на открытых моделях и рассчитан на любой инструмент с командной строкой.

Обе публикации вышли в один день и держатся на одной логике: не доверять популярности по умолчанию — ни в выборе метода дообучения, ни в оценке агентов «по финальному ответу». Честный пробел при этом остаётся: Hugging Face не публикует сравнительных бенчмарков Cartridges против LoRA на стандартных задачах, так что выбор альтернативы пока — эксперимент на свой страх.

Дополнительные источники

  1. Learning Rate Matters: Vanilla LoRA May Suffice for LLM Fine-tuning
  2. PEFT documentation - Cartridges
  3. huggingface/upskill
  4. arxiv.org
  5. vellum.ai
  6. ibm.com

Источники

  1. https://huggingface.co/blog/peft-beyond-lora external
  2. https://huggingface.co/blog/is-it-agentic-enough external
→ Опубликовано в Telegram: @agentic_ai_news/540