В данной работе необходимо реализовать алгоритм градиентного спуска для решения задачи восстановления линейной регрессии и для задачи бинарной классификации. Нельзя пользоваться готовыми библиотеками.
Данные для обучения:
Обязательная часть:
Задание повышенной сложности. Обучить многослойную нейронную сеть прямого распространения для задач из ЛР №1.
Во второй работе необходимо обучить классификатор изображений с пересекающимися классами объектов (multilabel classifier).
Данные для обучения:
Обязательная часть. Провести сравнительный анализ архитектуры ResNet и "классической" сверточной сети. Для этого реализовать и обучить пятислойную сверточную нейронную сеть с архитектурой Alexnet или VGG. Затем добавить в нее skip-связи, чтобы получить архитектуру ResNet. Провести сравнительный анализ реализованных сетей.
Условие сдачи работы: значение F1-score (https://en.wikipedia.org/wiki/F1_score) должно превысить порог 0.2 на тестовой выборке. Чтобы достичь этот порог рекомендуется в качестве класса алгоритмов взять сверточные нейронные сети (CNN).
В данной работе необходимо обучить бинарный классификатор для разнородных данных с пропусками. Целевая переменная находится в последнем столбце.
Вспомогательная информация.
Рекомендуется воспользоваться библиотекой sklearn, можно пользоваться любыми алгоритмами. Для работы с выборкой рекомендуется воспользоваться библиотекой pandas. Выборка содержит пропуски, для заполнения можно применить стандартный класс Imputer, подбор параметров поможет сделать GridSearchCV. Пример работы с библиотекой можно посмотреть в видео лекциях.
Обязательная часть. Провести сравнение точности машины опорных векторов и градиентного бустинга над деревьями. Объяснить результаты.
Условие сдачи работы: >80% точноcть классификации на тестовой выборке.
В данном задании необходимо научиться классифицировать текстовые запросы пользователей.
Формат выборки.
Текстовые запросы пользователей сгруппированы по файлам - каждый файл с префиксом train содержит примеры запросы из одного класса. Цифра перед префиксом - метка класса. Файл test.txt содержит тестовые запросы.
Обязательная часть. Провести сравнение различных методов векторизации запросов:
Условие сдачи работы: >95% точноcть классификации на тестовой выборке.
Здесь.