Обязательные вопросы:
До начала работы:
1)Покажите преподавателю директорию (папку) MatStat в корне диска C: или D: и в ней папку Zan1, где лежат все материалы. В папке должны быть видны расширения файлов
Занятие 1:
1.Что такое коэффициент вариации?
2.Почему нужно обязательно указывать объем выборки при представлении результатов исследования?
3.Как грамотно представить результаты исследования?
4.Сколько знаков после запятой указывается при представлении результатов?
Занятие 2:
1.Что такое квантиль? В каких случаях и для каких целей используются квантили? 2.Что такое гистограмма? 3.Что изображено на коробочке с усиками (диаграмме размаха)?
Занятие 3:
1) Правила 1,2 и 3 сигм; 2) основное свойство нормального распределения (z- трансформация);
3) Стандартный порядок действий при работе с файлами (см. лекцию 2)
Занятие 4:
1)Почему надо запомнить число 1,96; 2) Как построить доверительный интервал для оценки? 3) зачем сравнивать дисперсии при сравнении средних по t-критерию?
Занятие 5. 1) Что такое сумма квадратов отклонений, деленная на число степеней свободы?; 2) В чем состоит нулевая гипотеза дисперсионного анализа? Альтернативная? 3) По какому критерию проверяется нулевая гипотеза дисперсионного анализа? Всегда ли в этом случае большую дисперсию делят на меньшую?
Занятие 6. 1) Как раскладываются общая сумма квадратов отклонений и число степеней свободы в 2-факторном ДА ? 2) Что такое НСР? В каких единица измеряется? Как используется? 3) Почему анализ назван дисперсионным?
Занятие 8. 1) Какие условия накладываются на X(X1, X2...) и Y для возможности проведения корреляционного анализа? 2) Какие условия накладываются на X (X1, X2...) и Y для возможности проведения регрессионного анализа? 3) Коэффициент корреляции равен 0,23/0,78. Есть ли связь между признаками или нет? Что можно сказать? 4) Что такое коэффициент детерминации? Что он показывает? 5) Что такое остатки? 6) Что показывает график: наблюдаемые значения – предсказанные значения. Как данный график должен выглядеть в идеальном случае?
Варианты задач 8.1 и 9 совпадают
Занятие 9. 1) Какие требования предъявляются к остаткам? 2) Каким образом проверяется гипотеза о том, что регрессионный анализ можно проводить? 3) Каким образом проверяется гипотеза об отличии от нуля конкретного коэффициента регрессии? 3) Что понимается под термином «мультиколлинеарность»? На что она влияет?
Занятие 10. 1) Кластерный анализ относится к эвристическим процедурам - что это значит? 2)Что такое расстояние, и какие расстояния используются в кластерном анализе? 3) Что такое меры объединения, и какие Вы знаете?
Занятие 11. 1) Какие задачи решает МГК? 2) Что такое собственные числа?
Для работы Вам понадобиться установить некоторые программы.
Excel или его аналог.
Все программы устанавливайте от имени администратора.
R и оболочка к нему Posit (раньше называлось RStudio) – свободное ПО, его можно скачать и установить совершенно бесплатно. Конкретный способ, зависит от установленной у вас ОС: Linux, Mac OS X или Windows.
Скачать R https://cran.r-project.org/bin/windows/base/
Установить Rtools (программа для сборки пакетов) https://cran.r-project.org/bin/windows/Rtools/
Скачать Posit (ранее RStudio) http://www.rstudio.com/products/rstudio/download/
Под Windows 7 нужно установить версию Rstudio ver.2023.03.2 Build 454
Если Вы какой-то причине пропускаете занятия - задание нужно прислать заранее (jlmesh@list.ru):
1/ Пожалуйста, присылайте задание в письме, где в теме стоит Stat2 и комментарий, например,ММ2025задание 3.
2/В имени скрипта и данных (csv) указывайте номер варианта и свою фамилию, например, 3_Mazeeva_zad3_var11.r и 3_data_var11.csv
3/Присылайте письма по принципу - одно письмо - одно задание.
4/Пожалуйста файлы не архивируйте !