Анализ данных (весна, 2017)
Л.Р. №1. Исследование алгоритмов обучения нейронных сетей
Реализовать обучение нейронной сети прямого распространения с помощью метода обратного распространения ошибки.
- Тренировочное множество. Состоит из 50000 объектов из 10 классов. Каждый объект описывается 3072 признаками. Каждая строка в файле содержит описание одного объекта в формате: метка_класса,признак1,признак2,...,признак3072.
- Тестовое множество. Содержит 10000 тестовых объектов без меток класса.
Порог сдачи лабораторной работы: 25% точность классификации на тестовой выборке. Для расчета точности на тестовой выборке необходимо отправить мне по электронной почте текстовый файл (большая просьба высылать файл в архиве), в каждой строке которого будет предсказанная метка (от 0 до 9) для соответствующего объекта из тестового множества.
Л.Р. №2. Знакомство с библиотекой sklearn
Реализовать двоичный классификатор с использованием библиотеки sklearn. Целевая переменная находится в последнем столбце. Для работы с выборкой рекомендуется воспользоваться библиотекой pandas.
Можно пользоваться любыми алгоритмами из библиотеки sklearn. Выборка содержит пропуски, для заполнения можно воспользоваться стандартным классом Imputer, для подбора параметров - поиском с помощью GridSearchCV.
Порог сдачи работы: 65% точноcть классификации на тестовой выборке. Формат сдачи: совпадает с первой работой.
Пример работы с библиотекой можно посмотреть в видео лекциях.