Программа курса
Анализ данных — критически важная область для исследователя как в области науки, так и в индустрии. Но в привычных университетских курсах встречается ряд проблем. Это и непоследовательность изложения материала, и недостаточное внимание к математической составляющей, и слабое фундирование математических концепций в предметном материале исследовательской области. Все эти проблемы автор постарался решить в данном курсе.
Подавляющее большинство существующих методов анализа данных основаны на линейных моделях, поэтому им мы уделим основное внимание в нашем курсе. И все же аналитика невозможна без хорошего знания специального программного обеспечения и математической статистики. Поэтому в данном курсе мы начнем с самого начала. Всего нас ждет 15 лекций и 30 практических занятий, в ходе которых, начав с освоения языка R как самого популярного в социальных науках и заложив некоторый математический фундамент, мы изучим самые важные темы математической статистики и последовательно будем двигаться в бескрайнем океане линейных моделей. Мы не сможем освоить всё — это факт. Однако в ходе курса вы получите необходимые и достаточные знания для того, чтобы свободно ориентироваться в анализе данных научных исследований. Кроме того, опираясь на полученные знания, вы сможете далее самостоятельно расширять их в сторону, например, машинного обучения и других методов, активно используемых в индустрии.
Нас ждем много теории и много практики, ведь научиться анализу данных можно только анализируя данные. Курс главным образом нацелен на исследователей в области психологии и смежных социальных и гуманитарных наук, однако освоение рассматриваемых в курсе методов будет полезно исследователям широкого круга специальностей, поэтому мы не ставим ограничений по профилю и уровню знаний.
Ждём ваших заявок!
Тематический план
R programming
Знакомство с R и RStudio
Типы данных
Структуры данных
Функции
Работа с реальными данными
Предобработка данных. Концепция tidy data
Визуализация данных
Теория вероятностей и математическая статистика
Избранные темы из математического анализа, линейной алгебры и других разделов математики
Введение в статистику
Случайный эксперимент
Вероятность и случайные величины
Оценивание параметров в практике статистического анализа
Тестирование статистических гипотез
Анализ данных
Описательные статистики
Корреляционный анализ
Общие линейные модели. Простая линейная регрессия
Множественная линейная регрессия
Дисперсионный анализ
Ковариационный анализ
Обобщенные линейные модели. Логистическая регрессия
Пуассоновская регрессия
Регуляризация регрессии
Смешанные линейные модели
Кластерный анализ
Анализ главных компонент
Факторный анализ
16 недель
15 лекций
30 практических занятий
1 проект
Возможность получить сертификат
Оформление и данные финального варианта могут отличатьсяПри отсутствии подписей организаторов сертификат не действителен