AI News Watcher
Tuesday, May 19, 2026  ·  Daily briefing
Feed Telegram
Daily briefing · By AI News Watcher · May 19, 2026 · 4 min read · HuggingFace ← Back to feed

Ettin Reranker: как пересортировать поиск без лишних затрат daily

Hugging Face представил семейство моделей Ettin Reranker. Это не просто очередной набор инструментов для ранжирования; они спроектированы, чтобы точно переупорядочивать результаты поиска, при этом удерживая контроль над вычислительными расходами. Разработчики получают возможность масштабировать системы извлечения информации, где первичный быстрый поиск дополняется более детальной, но прицельной пересортировкой.

Hero illustration: Ettin Reranker: как пересортировать поиск без лишних затрат.

Редакция · Daily briefing

Стоит читать если: работаете с Retrieval Augmented Generation (RAG), системами поиска или нужно повысить точность ранжирования документов при сохранении скорости. Можно пропустить если: не используете механизмы извлечения информации или вас устраивает текущая точность поиска.

Семейство Ettin Reranker: точность и скорость в связке

Для чего нужен реранкер. Модель-реранкер (или CrossEncoder) принимает пару «запрос-документ» и выдаёт единый показатель релевантности. В отличие от эмбеддинг-моделей, которые кодируют запрос и документ отдельно, реранкер позволяет текстам взаимодействовать на каждом слое трансформера. Это совместное кодирование точнее, но и дороже: модель должна быть запущена один раз для каждой пары, а не один раз для каждого текста.

Паттерн retrieve-then-rerank. Поскольку кросс-энкодеры слишком дороги для прогона по всему корпусу, распространённый производственный паттерн — этоretrieve-then-rerank: быстрая эмбеддинг-модель извлекает топ-K кандидатов (дёшево), затем кросс-энкодер переупорядочивает только эти K с высокой точностью. Общая стоимость остаётся ограниченной, в то время как итоговый рейтинг гораздо ближе к тому, что дал бы исчерпывающий проход кросс-энкодера.

Шесть новых моделей. Выпущено семейство из шести новых реранкеров Sentence Transformers CrossEncoder:

Архитектура и обучение. Все модели основаны на ModernBERT-кодерах Ettin и обучены с использованием рецепта дистилляции: поточечная среднеквадратичная ошибка (MSE) на оценках от mixedbread-ai/mxbai-rerank-large-v2 на наборе данных cross-encoder/ettin-reranker-v1-data. Все шесть реранкеров поддерживают до 8K токенов контекста благодаря ModernBERT.

Оптимизация пропускной способности. Для максимальной пропускной способности рекомендуется установка kernels и использование model_kwargs={"dtype": "bfloat16", "attn_implementation": "flash_attention_2"}. Это может дать прирост скорости от 1.7x до 8.3x в зависимости от размера модели и длины последовательности.

Результаты бенчмарков. Модели Ettin Reranker были протестированы на бенчмарке MTEB(eng, v2) Retrieval. Результаты показали, что Ettin Reranker 1b-v1 (1.00B параметров) достигает NDCG@10 в 0.6114, что очень близко к показателям обучающей модели mixedbread-ai/mxbai-rerank-large-v2 (1.54B параметров, NDCG@10 0.6115). Меньшие модели семейства Ettin также показали сильные результаты для своих размеров, например, Ettin Reranker 68m-v1 (68.6M параметров) достигла 0.5915. Это подтверждает, что модели Ettin Reranker являются передовыми для своих размеров.

OlmoEarth v1.1: Эффективность для наблюдения Земли

Сокращение вычислительных затрат. AllenAI выпустила OlmoEarth v1.1, новое семейство моделей наблюдения Земли, которое сокращает вычислительные затраты до 3 раз при сохранении производительности OlmoEarth v1. Это достигается за счёт уменьшения длины последовательности токенов, что критически важно, поскольку вычислительные затраты масштабируются квадратично с длиной последовательности.

Механизм оптимизации. Модели OlmoEarth обрабатывают данные дистанционного зондирования, преобразуя их в последовательность токенов. В новой версии оптимизация произошла за счёт объединения токенов разрешения в один, что привело к трёхкратному сокращению количества токенов. Хотя наивное объединение токенов может привести к снижению производительности, модификации в режиме предварительного обучения OlmoEarth v1.1 позволили избежать этого.

Для исследователей. Модели OlmoEarth v1.1 обучаются на том же наборе данных, что и OlmoEarth v1. Это позволяет изолировать влияние методологических изменений, помогая глубже понять научные принципы при предварительном обучении моделей для дистанционного зондирования.

Также за день

Что это значит

Специализация как путь к масштабированию. Новые релизы HuggingFace показывают движение к специализированным, но более эффективным моделям. Ettin Reranker предоставляет инженерам инструменты для точного ранжирования, не жертвуя скоростью, а OlmoEarth v1.1 демонстрирует, как можно снизить операционные расходы для задач наблюдения Земли, сохраняя качество. Это подчёркивает тренд на разработку моделей, которые не только точны, но и экономически выгодны в реальных продакшен-средах.

Ссылки

Источники

  1. https://huggingface.co/blog/ettin-reranker external
  2. https://huggingface.co/blog/allenai/olmoearth-v1-1 external
  3. https://huggingface.co/papers?date=2026-05-19 external
  4. https://arxiv.org/abs/2605.18747 external
  5. https://arxiv.org/abs/2605.18401 external
  6. https://arxiv.org/abs/2605.18739 external
  7. https://arxiv.org/abs/2605.18678 external
  8. https://arxiv.org/abs/2605.18661 external
  9. https://arxiv.org/abs/2605.17757 external
  10. https://arxiv.org/abs/2605.16679 external
  11. https://arxiv.org/abs/2605.18451 external
  12. https://arxiv.org/abs/2605.14278 external
  13. https://arxiv.org/abs/2605.18643 external
  14. https://arxiv.org/abs/2605.17283 external
  15. https://arxiv.org/abs/2605.16079 external
  16. https://arxiv.org/abs/2605.17260 external
  17. https://arxiv.org/abs/2605.17672 external