Программа курса

Анализ данных — критически важная область для исследователя как в области науки, так и в индустрии. Но в привычных университетских курсах встречается ряд проблем. Это и непоследовательность изложения материала, и недостаточное внимание к математической составляющей, и слабое фундирование математических концепций в предметном материале исследовательской области. Все эти проблемы автор постарался решить в данном курсе.

Подавляющее большинство существующих методов анализа данных основаны на линейных моделях, поэтому им мы уделим основное внимание в нашем курсе. И все же аналитика невозможна без хорошего знания специального программного обеспечения и математической статистики. Поэтому в данном курсе мы начнем с самого начала. Всего нас ждет 15 лекций и 30 практических занятий, в ходе которых, начав с освоения языка R как самого популярного в социальных науках и заложив некоторый математический фундамент, мы изучим самые важные темы математической статистики и последовательно будем двигаться в бескрайнем океане линейных моделей. Мы не сможем освоить всё — это факт. Однако в ходе курса вы получите необходимые и достаточные знания для того, чтобы свободно ориентироваться в анализе данных научных исследований. Кроме того, опираясь на полученные знания, вы сможете далее самостоятельно расширять их в сторону, например, машинного обучения и других методов, активно используемых в индустрии.

Нас ждем много теории и много практики, ведь научиться анализу данных можно только анализируя данные. Курс главным образом нацелен на исследователей в области психологии и смежных социальных и гуманитарных наук, однако освоение рассматриваемых в курсе методов будет полезно исследователям широкого круга специальностей, поэтому мы не ставим ограничений по профилю и уровню знаний.

Ждём ваших заявок!

Тематический план

    • R programming

      • Знакомство с R и RStudio

      • Типы данных

      • Структуры данных

      • Функции

      • Работа с реальными данными

      • Предобработка данных. Концепция tidy data

      • Визуализация данных

    • Теория вероятностей и математическая статистика

      • Избранные темы из математического анализа, линейной алгебры и других разделов математики

      • Введение в статистику

      • Случайный эксперимент

      • Вероятность и случайные величины

      • Оценивание параметров в практике статистического анализа

      • Тестирование статистических гипотез

    • Анализ данных

      • Описательные статистики

      • Корреляционный анализ

      • Общие линейные модели. Простая линейная регрессия

      • Множественная линейная регрессия

      • Дисперсионный анализ

      • Ковариационный анализ

      • Обобщенные линейные модели. Логистическая регрессия

      • Пуассоновская регрессия

      • Регуляризация регрессии

      • Смешанные линейные модели

      • Кластерный анализ

      • Анализ главных компонент

      • Факторный анализ

16 недель

15 лекций

30 практических занятий

1 проект

Возможность получить сертификат

Образец сертификата
Оформление и данные финального варианта могут отличаться
При отсутствии подписей организаторов сертификат не действителен