Название курса у почвоведов: Информационные технологии в почвоведении
Название курса у экологов: Компьютерные технологии и статистические методы в экологии и природопользовании
Первое занятие в 13 февраля. Начало в 9 ч.
Занятия проводятся по четвергам, с 9 до 12-25 ауд 5Д
Преподаватели :
Мешалкина Юлия Львовна
Манакова Ольга Ивановна
Коноплина Лидия Юрьевна
Филиппов Даниил Дмитриевич
Варианты - см. файл
Список тем занятий (Какие задачи сдаем). Лекции опережают на 1:
13 февр. Занятие 1. Введение в язык R. Создание векторов.
Нужно сделать задачи 1.1 , 2.1 и 2.2
20 февр. Занятие 2. Введение в язык R. Логические выражения. Простейшие графики. Таблицы данных.
27 февр. Занятие 3. Понятие испытания. Характеристики распределения случайной величины.
6 марта. Занятие 4. Виды пробоотбора. Ошибка среднего. Функция - случайное число.
13 марта. Занятие 5. Нормальное распределение. Проверка на нормальность.
20 марта. Занятие 6. Сравнение средних.
27 марта. Занятие 7. Дисперсионный анализ: однофакторный и двухфакторный. Условия применимости.
3 апреля. Занятие 8. Дисперсионный анализ. Модели. Сравнение групп средних.
10 апреля. Занятие 9. Регрессионный анализ. Условия применимости.
17 апреля. Занятие 10. Регрессионный анализ. Анализ остатков. Оценка качества моделей.
24 апреля. Занятие 11. Метод главных компонент и Зачет
Обязательные вопросы по занятия (знать наизусть определения)
Занятие 2. 1) Стандартный порядок действий при работе с файлами (см. лекцию 2)
Занятие 3. 1) дисперсия, 2)стандартное отклонение, 3)коэффициент вариации, 4) Квантиль, медиана, квартили, децили 5) огива 6) коробочка с усиками
Занятие 4. 1) Основное требование к выборке и как его можно достичь ; 2) ошибка среднего: определение; 3) оценка ошибки среднего по 1 выборке
Занятие 5. 1) Правила 1,2 и 3 сигм; 2) основное свойство нормального распределения (z- трансформация); 3) какие характеристики рассчитываются для нормально- распредеделенных данных?
Занятие 6. 1)Почему надо запомнить число 1,96; 2) Как построить доверительный интервал для оценки? 3) зачем сравнивать дисперсии при сравнении средних по t-критерию?
Занятие 7. 1) Что такое сумма квадратов отклонений, деленная на число степеней свободы?; 2) Как раскладываются общая сумма квадратов отклонений и число степеней свободы в 1- и 2-факторном ДА? 3) По какому критерию проверяется нулевая гипотеза дисперсионного анализа? Всегда ли в этом случае большую дисперсию делят на меньшую?
Занятие 8. 1) В чем состоит нулевая гипотеза дисперсионного анализа? Альтернативная?; 2) Что такое НСР? В каких единица измеряется? Как используется? 3)Охарактеризуйте непараметрический дисперсионный анализ.
Занятие 9. 1) Каким образом проверяется гипотеза о том, что регрессионный анализ можно проводить? 2) Что такое коэффициент детерминации? Что он показывает?
Задание 10. 1) Что такое остатки? Какие требования предъявляются к остаткам? 2) Что показывает график: наблюдаемые значения – предсказанные значения. Как данный график должен выглядеть в идеальном случае? 3) Что понимается под термином «мультиколлинеарность»? На что она влияет?
Задание 11. 1) Какие задачи решает МГК? 2) Что такое собственные числа?
Если Вы какой-то причине пропускаете занятия - задание нужно прислать заранее (jlmesh@list.ru):
1/ Пожалуйста, присылайте задание в письме, где в теме стоит ММ2025 и комментарий, например,ММ2025задание 3.
2/В имени скрипта и данных (csv) указывайте номер варианта и свою фамилию, например, 3_Mazeeva_zad3_var11.r и 3_data_var11.csv
3/Присылайте письма по принципу - одно письмо - одно задание.
4/Пожалуйста файлы не архивируйте !
Ссылка на видео А.М. Ярославцева по установке программ
https://www.youtube.com/watch?v=X6bYzHm88sg&feature=emb_title
Ссылка на очень полезную книгу "Статистика и котики" https://disk.yandex.ru/i/OX1uPONgG5ahfA
Ссылка на другие книги по анализу данных https://disk.yandex.ru/d/wmgdc3X7fT8neA
Для работы Вам понадобиться установить некоторые программы.
Все программы устанавливайте от имени администратора.
1. R и оболочка к нему RStudio – свободное ПО, его можно скачать и установить совершенно бесплатно. Конкретный способ, зависит от установленной у вас ОС: Linux, Mac OS X или Windows.
Скачать R https://cran.r-project.org/bin/windows/base/ - R-4.4.2.
Скачать RTools https://cran.r-project.org/bin/windows/Rtools/ - RTools4.4
Скачать RStudio - Posit (Пишется слитно!) http://www.rstudio.com/products/rstudio/download/
Ссылки: книги по курсу, на которые можно сослаться в научной работе (соответствуют тому, что вывешено на сайте):
Мешалкина Ю. Л., Самсонова В. П. Математическая статистика в почвоведении: Практикум. — МАКС Пресс Москва, 2008. — 84 с.
Мешалкина Ю. Л., Самсонова В. П., Васенев И. И. Информационные технологии. Практические занятия: учебное пособие. — ФГБНУ Росинформагротех Москва, 2017. — 142 с.
Если Вы используете R. то сослаться нужно на
R Core Team (2021). R: A language and environment for statistical computing. R Foundation for Statistical Computing, Vienna, Austria. Available online at https://www.R-project.org/.
Записи 2023 года:
9 февраля 2023. Занятие 1 и лекция 1. Введение в R. https://disk.yandex.ru/i/afMPG7nTpwo0Xg
Записи 2022 года:
10 февр. Лекция 1 и занятие 1. Введение в язык R. Создание векторов. https://disk.yandex.ru/i/F8QPDTF-Ni4JYQ
17 февр. Лекция 2 и занятие 2. Введение в язык R. Логические выражения. Простейшие графики. Таблицы данных. https://disk.yandex.ru/i/Z6pF5QzCUwd-NQ
24 февр. Лекция 3 и занятие 3. Понятие испытания. Характеристики распределения случайной величины. https://disk.yandex.ru/i/ZidP8P9te7pC8g
3 марта. Лекция 4 и занятие 4. Виды пробоотбора. Ошибка среднего. Функция - случайное число. https://disk.yandex.ru/d/WZ2FS7SZ1QA8nA
10 марта Лекция 5 и занятие 5. Нормальное распределение. Проверка на нормальность. https://disk.yandex.ru/i/wkcJnouRxhtJgw
17 марта Лекция 6 и занятие 6. Сравнение средних. https://disk.yandex.ru/i/Y0U-ennDAMYINg
24 марта Лекция 7 и занятие 7. Дисперсионный анализ: однофакторный и двухфакторный. Условия применимости. https://disk.yandex.ru/i/v1qn0rSvy3_FUw
31 марта Лекция 8 и занятие 8. Дисперсионный анализ. Модели. Сравнение групп средних. https://disk.yandex.ru/i/OvrS9NRMTcoOZw
7 апреля Лекция 9 и занятие 9. Регрессионный анализ. Условия применимости. Модели. https://disk.yandex.ru/i/blhv49sbi1BB3g
14 апреля Лекция 10 и занятие 10. Регрессионный анализ. Анализ остатков. Оценка качества моделей. https://disk.yandex.ru/i/O_2YftD46CLAqA
21 апреля Разбор обязательных вопросов к зачету https://disk.yandex.ru/i/7VbTXkEtYfLAvQ
https://disk.yandex.ru/i/7VbTXkEtYfLAvQ