Ранжування документів

Тaras Shevchenko

ML Engineer @ Rails Reactor (Ukraine)

Лекція:

8 березня (НД)

9:00-10:20

Практика:

8 березня (НД)

10:30-11:50

Застосування машинного навчання у ранжуванні текстових документів.

У цій лекції спочатку поговоримо про задачу, про те, які дані можуть бути корисними для побудови моделі, коротко проаналізуємо класичні підходи: точковий, попарний, списковий. Потім розглянемо різні функції втрат та методи вимірювання якості пошуку.

Презентація

GitHub Repository (Lecture + Practice)

Практика

Моделі ранжування та нюанси впровадження.

Підберемо вектор ознак для задачі ранжування, порівняємо якість пошуку при застосуванні різних підходів та методів ранжування.

Після цього перейдемо до того, як застосовувати отримані моделі у реальних проектах.

Вимоги до учасників

Мінімальні вимоги до учасників:

Базові знання лінійної алгебри, теорії оптимізації та статистики.
Володіння будь-якою сучасною мовою програмування.

Рекомендовані вимоги:

Володіння базовими поняттями NLP.
Досвід розв'язку задач регресії та класифікації.
Вміння оцінювати якість моделі.
Вільне володіння Пітоном.

Додаткові вимоги для учасників практичного заннятя:

Вміння писати код з використанням numpy, scipy, sklearn.
Базові знання про взаємодію з базами даних.
Опціональний досвід роботи з ElasticSearch/Solr/Lucene/Sphinx.