Новость24 апреля 2026 г.

vLLM, LoRA и GPU-кластеры: как Авито внедрил мультимодальные модели в поиск

Инженеры Авито описали внедрение мультимодальной модели Qwen2.5-VL для улучшения поиска объявлений, когда текстового описания недостаточно. Статья раскрывает архитектуру на базе vLLM и LoRA-адаптеров, а также инфраструктурные решения для обработки миллионов обновлений без роста задержек.

habr.comhttps://habr.com/ru/companies/avito/articles/1024136/?utm_campaign=1024136&utm_source=habrahabr&utm_medium=rss