Предлагаю поучаствовать в конкурсе компьютерных презентаций "Наследие вечно"
Работы присылать и консультироваться у Броницкой Н.В. до 10 февраля, обязательно предупредите об участии.
Номинация "Человек в современном информационно-коммуникационном пространстве".
Темы:
Роль информации в повседневной жизни человека.
Этикет в социальных сетях как основа безопасной интернет-коммуникации.
Современная форма информационного остракизма "Культура отмены".
Роль информационного обеспечения в криминальной, экстремистской и террористической деятельности.
Проблемы информационной безопасности.
Уязвимость персональных данных в сети Интернет.
К участию принимаются только индивидуальные работы.
ВАЖНО! Требования к конкурсным материалам
Мультимедийная презентация:
должна отвечать выбранной теме;
выполнена в MS PowerPoint и состоять из 12-15 слайдов;
первый слайд - титульный: тематика конкурса, номинация, полностью ФИО автора и руководителя, название школы, класс;
последний слайд - список использованных источников, иллюстраций и видеоматериалов;
сохранение единого стиля (цвет, шрифт, начертание, выравнивание);
не допускаются изображения с водяными знаками;
демонстрация презентации в автоматическом режиме, т.е. смена слайдов происходит без вмешательства пользователя;
длительность автодемонстрации - 3-5 минут.
Авторский видеоролик (демонстрация компьютерной презентации и устный доклад участника):
разрешение не менее HD - 1920х1080, форматы - MOV, mp4, avi, mv;
длительность - 3-5 минут;
обязательно наличие входных и выходных титров - информация о школе, название номинации, ФИО автора.
Оценивается: оригинальный творческий подход к раскрытию темы, проработанность, эмоциональное восприятие, количество и эффективность применяемых возможностей программы PowerPoint (текст, звук, видео, фото, гиперссылки, кнопки).
Тема урока "Модели статистического прогнозирования"
Сегодня на уроке вы:
узнаете какая наука называется статистикой и какие данные называются статистическими, для чего используется метод наименьших квадратов;
рассмотрите на конкретном примере, каким способом можно найти зависимость между статистическими величинами.
Внимательно изучи материал этого урока, посмотри видеоролик
(на следующем уроке будем строить регрессионную модель и прогнозировать)
На прошлом уроке мы с вами выяснили, что моделирование, да и любое другое исследование начинают с выделения основных количественных характеристик исследуемого объекта, то есть величин.
Понятие величина включает три свойства: имя, значение, тип.
Математической моделью называется совокупность математических соотношений, уравнений, неравенств, описывающих основные закономерности изучаемого объекта, процесса или явления.
Отображать зависимости между величинами можно: математически с помощью формулы, таблично и графически.
Информационные модели, описывающие объекты, явления, процессы в определённый момент времени, без учёта их изменений в пространстве и времени, называются статическими.
Такими моделями являются, например, структура кристаллов, классификация растений или животных.
Динамические модели учитывают изменения параметров процессов и явлений с течением времени.
Каждому человеку понятно, без лишних доказательств, что чем хуже воздух, тем больше будет больных бронхиальной астмой. Но это общее мнение и на регулирование уровнем загрязнённости воздуха оно никак не влияет.
Для того чтобы в городе начали принимать меры по устранению загрязнённости, необходимы более конкретные данные.
Для начала нужно установить, какие именно примеси сильнее всего влияют на здоровье людей. Затем, как связана концентрация этих примесей в воздухе с числом заболеваний.
Найти такую зависимость можно только экспериментально.
Начинают наблюдать и собирать сведения, затем анализировать их и делать выводы.
Статистикой занимаются в разных научных областях. Это и математическая статистика, экономическая статистика, социальная статистика и другие виды. На этом уроке мы рассмотрим пример медицинской статистики.
Решением таких задач занимается статистика.
Статистика – это наука, в которой изучаются общие вопросы сбора, измерения и анализа массовых количественных или качественных данных.
По данным исследований известно, что самое большое влияние на бронхиально-лёгочные заболевания оказывает угарный газ.
Работники медицинской статистики начинаю проводить сбор данных. В разных городах берут пробы воздуха, устанавливают концентрацию в нём угарного газа и сравнивают с числом хронических больных бронхиальной астмой на 1000 жителей города.
Полученные данные заносят в таблицу и строят диаграммы.
По статистическим данным нельзя достоверно сказать, например, сколько больных астмой в городе. Так как они приближенные или ещё говорят усреднённые. Статистические данные носят оценочный характер, то есть они проверяют уровень зависимости и правильно показывают её вид.
Также важно отметить, чтобы получить более точный результат, статистических данных должно быть много.
Рассмотрим таблицу на странице 114 учебника, в которую внесены статистические данные, собранные в нескольких городах. Для наглядности примера нам будет достаточно десяти таких данных. И построим график по данной таблице.
Теперь по данным из таблицы, а также по графику можно сделать вывод, что при концентрации угарного газа до 3 миллиграмм на метр кубический его влияние на заболеваемость астмой слабое. Но с ростом концентрации угарного газа наступает и резкий рост заболеваемости астмой.
Теперь нам нужно построить математическую модель данного явления.
Напомним, математической моделью называется совокупность математических соотношений, уравнений, неравенств, описывающих основные закономерности изучаемого объекта, процесса или явления.
Получается, для построения математической модели нам нужно формула, которая будет показывать зависимость по данным собранным медицинскими статистами.
Напомним: концентрацию примесей мы обозначили буквой C и его единица измерения миллиграмм на метр кубический. Уровень заболеваемости обозначили буквой P, измеряется в больных на тысячу.
Иначе говоря, нам нужно получить функцию P от C. Но такой функции нет и получить её мы можем только методом подбора по экспериментальным данным.
Для начала отметим, что график функции, который нам нужно получить должен проходить близко к точкам диаграммы. Необходимости в том, чтобы координаты графика точно совпадали с точками диаграммы, нет. Так, как и формула может получиться сложной, да и точности не нужно (мы уже говорили, что статистические данные являются приближёнными).
Полученную таким образом функцию в статистике называют регрессионной моделью.
Регрессионная модель – это функция, описывающая зависимость между количественными характеристиками сложных систем.
Для получения регрессионной модели нужно сначала подобрать вид функции, затем вычислить параметры функции.
Для того чтобы подобрать вид функции чаще всего рассматривают стандартные функций:
линейную;
квадратичную;
логарифмическую;
экспоненциальную.
Нужно внимательно посмотреть на диаграмму. Определить, на график какой из предложенных функций больше всего похожа линия диаграммы.
Из уроков математики вы знаете, что во всех формулах используют следующие обозначения. x — это аргумент, y — значение функции, а a, b и c — коэффициенты функции, также используются обозначения для натурального логарифма и для постоянного значения основания натурального логарифма.
Итак, больше всего нам подходят графики линейной функции, одной ветви квадратичной функции и экспоненциальной функции. Оставим пока все три варианта.
На следующем этапе получения регрессионной модели нужно вычислить параметры функции. Подобрать коэффициенты для функции. Причём коэффициенты должны быть такими, чтобы полученный график функции располагался как можно ближе к экспериментальным точкам.
Подберём коэффициенты с помощью метода наименьших квадратов (или сокращённо МНК), который был предложен в 18 веке немецким математиком Карлом Фридрихом Гауссом.
По данному методу искомая функция должна быть построена так, чтобы сумма квадратов отклонений y-координат всех экспериментальных точек от y-координат графика функции была минимальной.
Метод наименьших квадратов часто используется в статистике и встроен во многие математические программы.
Главное нужно понять: методом наименьших квадратов по данному набору экспериментальных точек можно построить любую функцию.
Здесь, для построения графиков использовался табличный процессор Microsoft Excel.
Полученный таким образом график регрессионной модели называется трендом.
Английское слово trend можно перевести как «общее направление» или «тенденция».
Даже по первому взгляду понятно, что линейный тренд не подходит. Как вы помните график линейной функции — это прямая. Полученная по Методу Наименьших Квадратов прямая отражает факт роста заболеваемости от концентрации угарного газа, но по этому графику трудно что-либо сказать о характере этого роста. А вот квадратичный и экспоненциальный тренды правдоподобны.
Остановимся подробнее на надписях, присутствующих на графиках. Здесь записаны искомые формулы математической модели или регрессионные модели:
линейной функции;
экспоненциальной функции;
квадратичной функции.
Обратите внимание!
На графиках присутствует ещё одна величина, полученная в результате построения трендов, обозначенная как R2.
В статистике эта величина называется коэффициентом детерминированности.
Коэффициент детерминированности показывает, насколько удачной является полученная регрессионная модель.
R2 всегда заключён в диапазоне от 0 до 1 (Здесь и далее читать единица в нужном склонении). Если он равен 1, то функция точно проходит через табличные значения, т.е. мы получили хорошую модель.
Чем R2 ближе к 1, тем удачнее считается регрессионная модель.
Если коэффициент детерминированности равен 0, то выбранный вид регрессионной модели неправильный, т.е. модель плохая.
Как вы видите, из трёх выбранных моделей значение R2 наименьшее у линейной, т.е. она самая неудачная (что мы и выяснили ранее).
У двух других моделей значения R2 достаточно близки. Значит, обе эти модели одинаково удачны. Поэтому, для того чтобы выбрать один график, необходимо рассмотреть другие характеристики. Например, если считать, что наиболее существенно влияние концентрации угарного газа проявляется при больших величинах, то, глядя на графики, понятно, что квадратичная модель подходит нам больше. Она лучше отражает резкий рост заболеваемости при больших концентрациях примеси.
Посмотри видеоролик "Модели статистического прогнозирования"
Выполни задания
Изучи § 18, устно ответь на вопросы после параграфа.
Запомни!
Статистика – это наука в которой изучаются общие вопросы сбора, измерения и анализа массовых количественных или качественных данных.
Статистические данные – это совокупность объектов (наблюдений, случаев) и признаков (переменных), их характеризующих.
Метод наименьших квадратов — математический метод, применяемый для решения различных задач, основанный на минимизации суммы квадратов отклонений некоторых функций от искомых переменных.