Анализ данных (весна, 2017)

Л.Р. №1. Исследование алгоритмов обучения нейронных сетей

Реализовать обучение нейронной сети прямого распространения с помощью метода обратного распространения ошибки.

  • Тренировочное множество. Состоит из 50000 объектов из 10 классов. Каждый объект описывается 3072 признаками. Каждая строка в файле содержит описание одного объекта в формате: метка_класса,признак1,признак2,...,признак3072.
  • Тестовое множество. Содержит 10000 тестовых объектов без меток класса.

Порог сдачи лабораторной работы: 25% точность классификации на тестовой выборке. Для расчета точности на тестовой выборке необходимо отправить мне по электронной почте текстовый файл (большая просьба высылать файл в архиве), в каждой строке которого будет предсказанная метка (от 0 до 9) для соответствующего объекта из тестового множества.

Л.Р. №2. Знакомство с библиотекой sklearn

Реализовать двоичный классификатор с использованием библиотеки sklearn. Целевая переменная находится в последнем столбце. Для работы с выборкой рекомендуется воспользоваться библиотекой pandas.

Можно пользоваться любыми алгоритмами из библиотеки sklearn. Выборка содержит пропуски, для заполнения можно воспользоваться стандартным классом Imputer, для подбора параметров - поиском с помощью GridSearchCV.

Порог сдачи работы: 65% точноcть классификации на тестовой выборке. Формат сдачи: совпадает с первой работой.

Пример работы с библиотекой можно посмотреть в видео лекциях.

Результаты

Здесь

Список тем курсовых

Здесь

Список вопросов к экзамену

Здесь