Ван Хачатрян — «ML-свадьба» между миллионами товаров, или Как выдержать нагрузку в потоке
В докладе мы расскажем о том, как нам удалось построить крутой real-time-алгоритм матчинга для товаров на огромной e-commerce-площадке. Раньше нашим алгоритмом могли пользоваться только мы, а теперь — любой разработчик компании.
Нам удалось сохранить высокие нагрузки, отказавшись от batch-подхода при онбординге большого количества новых товаров, которые у нас представлены в виде длинных векторов. Речь пойдет об используемых технологиях, а также ML/DL-подходах, которые мы используем при сопоставлении и ранжировании товаров.
Основные пункты доклада: 1. Про нашу задачу и цель. 2. Стек и технологии. 3. Метрики и мониторинг на всех уровнях. 4. Про ML и используемые SOTA-подходы. 5. Как мы боремся с деградацией наших моделей. 6. Нагрузки и поток данных, с которым нам приходится работать.