Люблю работать в программе Gretl. Она позволяет в пару кликов получать наглядные результаты при анализе больших массивов данных, с которыми в Excel из-за громоздкости не очень удобно работать. Особенно это касается моделирования: в Excel приходится для каждой модели формировать таблицу данных, тогда как в Gretl создается список переменных и в модель выбираются нужные.
Полный текст приведу для следующей небольшой работы:
И приведу условия некоторых других решенных лабораторных и задач:
Моделирование временного ряда (линейный тренд, сезонная компонента в аддитивной и мультипликативной формах)
1. Постройте график временного ряда. По графику сделайте предположения о наличии тренда, сезонных или циклических колебаний.
2. Проверьте наличие тенденции в ряду с помощью метода равенства средних (двухвыборочный тест Стьюдента).
3. Постройте модель линейного тренда (модель №1). Оцените качество модели. В случае, если модель линейного тренда окажется не значима в целом, используйте простое среднее или скользящее среднее.
4. Выделите сезонную компоненту, используя две формы: аддитивную (модель №2) и мультипликативную (модель №3).
5. Для трех моделей (линейный тренд (№1); сезонная компонента – аддитивная форма (№2); сезонная компонента – мультипликативная форма (№3)) оцените прогностическую способность по тестовой выборке, рассчитав значение коэффициента Тейла (КТ) и средней абсолютной процентной ошибки (MAPE). Выберите лучшую модель.
6. С помощью лучшей модели постройте точечный и интервальный прогноз на 3 следующих периода.
Вариант 62 – Средняя цена 1 кв.м. всех типов квартир для региона – Хабаровский край (набор 1)
Измерения поквартальные с 1 кв. 2001 года по 4 кв. 2019 года
Решение.
Выполнение работы проведем в Gretl.
1. График временного ряда:
По графику прослеживается в среднем положительная тенденция. Существенной сезонности и цикличности предположительно нет.
2. Проверим наличие тенденции в ряду с помощью метода равенства средних.
Прежде всего, нужно разделить временной ряд на две подвыборки. Всего у нас 76 наблюдений, поэтому в одной подвыборке оставим первые 36, а в другой – оставшиеся 40.
Далее предварительно проверяем равенство дисперсий выборок:
H0: дисперсия в начале и в конце ряда Y одинакова (т.е. дисперсия ряда Y постоянна)
H1: дисперсия ряда Y не постоянна
результат:
Нулевая гипотеза: генеральные дисперсии совпадают
1-я выборка:
размер = 36, дисперсия = 4,72567e+007
2-я выборка:
размер = 40, дисперсия = 2,21213e+008
Тестовая статистика: F(39, 35) = 4,6811
Двухстороннее p-значение = 1,115e-005
(одностороннее = 5,577e-006)
Поскольку р-значение = 0,000 <0,05, нулевая гипотеза отклоняется. Дисперсия ряда не является постоянной с вероятностью 0,95. Учтём это в тесте на постоянство среднего.
Тест на постоянство среднего.
H0: среднее в начале и в конце ряда Y одинаково (т.е. среднее ряда Y постоянно)
H1: среднее ряда Y не постоянно
результат:
Нулевая гипотеза: разница средних = 0
1-я выборка:
размер = 36, среднее = 62992,3, ст. отклонение = 6874,35
стандартная ошибка среднего = 1145,72
95% доверительный интервал для среднего: от 60666,4 до 65318,3
2-я выборка:
размер = 40, среднее = 31429,6, ст. отклонение = 14873,2
стандартная ошибка среднего = 2351,66
95% доверительный интервал для среднего: от 26672,9 до 36186,3
Тестовая статистика: t(56) = (62992,3 - 31429,6)/2615,91 = 12,0656
Двухстороннее p-значение = 3,3e-017
(одностороннее = 1,65e-017)
Т.к. р-значение = 0,000 <0,05, гипотеза H0 отвергается. Принимается гипотеза Н1 о значимости различия средних первой и второй половины ряда и неслучайности (наличии) временного тренда.
Таким образом, наличие тренда подтверждено.
3. Построим модель линейного тренда (модель №1).
Модель → Ordinary Least Squares (Метод наименьших квадратов)
Предварительно выделим контрольную выборки (первые 72 квартала) и тестовую (последние 4 квартала).
Модель 1 в явном виде: Y=13227,6+872,517∙t+ε; R2=0.883; s=6699,288
- модель значима в целом (Prob(F) < 0,05),
- оба коэффициента модели значимые (Р-значения меньше 0,05),
- модель высокого качества: объясняет 88,3% вариации Y,
- статистика Дарбина-Вотсона = 0,098 -есть положительная автокорреляция.
Сравнение моделей, построенных с помощью декомпозиционного анализа ВР и моделей ARIMA.
1. Работа продолжается с теми же данными, которые были в предыдущем задании. Цель работы – сравнить модели, построенные с помощью декомпозиционного анализа ВР (тренд, аддитивное выделение сезонности, мультипликативное выделение сезонности) и модели, построенные по методологии ARIMA, выбрать среди них лучшую. Кратко охарактеризуйте данные своего варианта. По графику сделайте предположения о характере тренда (детерминированный, стохастический).
2. Построить АКФ и ЧАКФ ряда Y. Сделать вывод о стационарности.
3. Провести тест на единичные корни, обосновать степень интеграции ряда (параметр d модели ARIMA).
4. Построить АКФ, ЧАКФ для проинтегрированного ряда (если это необходимо). Обосновать глубину лагов авторегрессии и скользящего среднего модели ARMA (параметры p, q).
5. Построить конкурирующие модели ARIMA в соответствии с предположениями о максимальных значениях параметров p, d, q.
6. Проверить соответствие остатков моделей процессу «белый шум». Сравнить модели по характеристикам качества. Выбрать лучшую.
7. Сравните модели из прошлого задания (тренд, аддитивное выделение сезонности, мультипликативное выделение сезонности) и полученную модель ARIMA. Сравнение представьте в виде таблицы. Необходимо привести сравнение по следующим критериям: значимость модели в целом и отдельных параметров, характеристики качества (коэффициент детерминации, стандартная ошибка, критерий Акаике), прогностическая способность (коэффициент Тейла, МАРЕ) и соответствие остатков процессу «белый шум».
Выберите лучшую модель.
Вариант 2 – Средняя цена 1 кв.м. всех типов квартир для региона - Брянская область (набор 1)
Измерения поквартальные с 1 кв. 2001 года по 4 кв. 2019 года
Решение.
Выполнение работы проведем в Gretl.
1. График временного ряда:
В прошлой работе показано, что дисперсия и среднее ряда Y не постоянны.
По графику видим, что ряд Y имеет детерминированный тренд (в прошлой работе показано, что он описывается статистически значимым линейным трендом Y=9489,22+401,549∙t+ε; R2=0.807; s=4366,124).
Построим графики автокорреляционной и частной автокорреляционных функций (АКФ и ЧАКФ соответственно) ряда Y.
Автокорреляционная функция для Y
***, **, * indicate significance at the 1%, 5%, 10% levels
using standard error 1/T^0,5
Лаг ACF PACF Q-стат. [p-значение]
1 0,9548 *** 0,9548 *** 72,0533 [0,000]
2 0,9077 *** -0,0443 138,0542 [0,000]
3 0,8570 *** -0,0652 197,6935 [0,000]
4 0,8057 *** -0,0327 251,1370 [0,000]
5 0,7608 *** 0,0464 299,4609 [0,000]
6 0,7145 *** -0,0438 342,6905 [0,000]
7 0,6678 *** -0,0369 380,9999 [0,000]
8 0,6203 *** -0,0363 414,5408 [0,000]
9 0,5745 *** -0,0037 443,7398 [0,000]
10 0,5292 *** -0,0254 468,8933 [0,000]
11 0,4861 *** -0,0075 490,4425 [0,000]
12 0,4466 *** 0,0100 508,9195 [0,000]
13 0,4100 *** 0,0042 524,7347 [0,000]
14 0,3707 *** -0,0622 537,8705 [0,000]
15 0,3315 *** -0,0269 548,5484 [0,000]
Поскольку в функциях присутствуют значимые лаги, этот ряд неслучаен. АКФ убывает медленно и остаётся значимой на всех 14ти лагах, что подтверждает предположение о нестационарности ряда Y по среднему. Крайний значимый на уровне 0,05 коэффициент АКФ у лага 14, следовательно, для Y надо строить модель MA с максимальным лагом q =14. По ЧАКФ определяем максимальный лаг p = 1 для модели AR. Получаем максимальные лаги: ARIMA(1, 0, 14).
Перейдем к ряду случайной составляющей ε̂t=Yt-Ŷt (по отклонениям от линейного тренда).
Многофакторное регрессионное моделирование
Министерство науки и высшего образования Российской Федерации
Федеральное государственное бюджетное образовательное учреждение
высшего образования
«ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ УПРАВЛЕНИЯ»
ИНСТИТУТ ИНФОРМАЦИОННЫХ СИСТЕМ
Кафедра математических методов в экономике и управлении
О Т Ч Ё Т
о выполнении практического домашнего задания
по дисциплине: Эконометрика (продвинутый уровень)
вариант:
Выполнил студент заочной формы обучения
2 курса магистратуры группы …
ФИО.
Проверил:
К.э.н., доцент кафедры ММЭУ
Писарева О.М.
Москва – 2021г.
Структура отчёта
Описание исходных данных
Этапы моделирования
1. Предварительный анализ данных.
Графики распределения показателей, корреляционная матрица
Рис. 1. Графики разброса показателей
Таблица 1. – Корреляционная матрица переменных
2. Построение моделей регрессии на всей выборке
Список спецификаций моделей регрессии по корреляционной матрице.
Результаты оценки параметров моделей
Таблица 2. – Характеристики информационной пригодности и значимость параметров конкурирующих моделей (вся выборка)
Проверка наличия ошибок спецификации моделей
Таблица 3. – Показатели для выявления ошибок спецификации конкурирующих моделей (вся выборка)
Исправление ошибок спецификации
Таблица 4. – Характеристики информационной пригодности и значимость параметров исправленных моделей (вся выборка; такая же по структуре, как таблица 3)
3. Построение моделей регрессии на выборке без аномальных
Устранение аномальных и значимых наблюдений.
Графики распределения показателей, корреляционная матрица после устранения аномальных наблюдений.
Рис. 2. Графики разброса показателей после исключения аномальных наблюдений
Таблица 5. – Корреляционная матрица переменных после исключения аномальных наблюдений
Список спецификаций моделей регрессии по корреляционной матрице.
Результаты оценки параметров моделей
Таблица 5. – Характеристики информационной пригодности и значимость параметров конкурирующих моделей (без аномальных)
Проверка наличия ошибок спецификации моделей
Таблица 6. – Показатели для выявления ошибок спецификации конкурирующих моделей (без аномальных)
Исправление ошибок спецификации
Таблица 4. – Характеристики информационной пригодности и значимость параметров исправленных моделей (без аномальных)
4. Выбор лучшей модели регрессии
Сравнение моделей на всей выборке с моделями без аномальных
Выбор лучшей модели
Рис. 4. График прогноз-реализация для лучшей модели
Выводы
Экономическая интерпретация лучшей модели
Прогноз по лучшей модели
Таблица 6. – Прогноз по лучшей модели
Приложение 1. Таблица исходных данных
Приложение 2. Отчёты Gretl по моделям
Описание исходных данных
В приложении 1 представлены данные по 88 компаниям. У последних трёх наблюдений удалили значения по Y, поскольку эти наблюдения предназначены для прогноза по лучшей модели. Данные представлены по следующим переменным:
Obs - Биржевой тикер
Эндогенная переменная:
Y - Выручка, тысяч долл. США
Экзогенные переменные:
X1 - Оборотные активы, тысяч долларов США
X2 - Активы без учёта оборотных, тысяч долларов США
X3 - Текущие обязательства, тысяч долларов США
X4 - Объём капитальных расходов, тысяч долларов США
Суть работы заключается в изучении влияния факторов на эндогенную переменную, поиска наилучшей модели и составление прогноза по ней.
Сформулируем гипотезы о статистической взаимосвязи зависимой переменной и независимыми:
1) предполагаем прямую зависимость между Y и Х1, т.е. увеличение оборотных активов повышает величину выручки;
2) предполагаем прямую зависимость между Y и Х2, т.е. увеличение активов без учёта оборотных повышает величину выручки;
3) предполагаем прямую зависимость между Y и Х3, т.е. увеличение текущих обязательств повышает величину выручки;
4) предполагаем обратную зависимость между Y и Х4, т.е. увеличение капитальных расходов снижает величину выручки.
Проведем корреляционно-регрессионный анализ с помощью пакета Gretl для подбора наиболее приемлемой модели взаимосвязи между перечисленными факторами.
Предварительный анализ данных.
Проведем предварительный анализ данных, а именно проверим, как распределены показатели с помощью описательных статистик (Рис. 1).
Рис.1. Просмотр описательных статистик переменных
Коэффициенты вариации превышают порог 30-35% (по переменной Y составляет 367,5%), что говорит о сильной неоднородности данных. Значения коэффициентов асимметрии и эксцесса далеки от нулевого значения, значит, выборки не подчинены нормальному распределению.
Для переменных Y, Х1, Х2, Х3 коэффициенты асимметрии положительные, что указывает на наличие правосторонней асимметрии (более длинная ветвь вправо). Для переменной Х4 – наблюдаем левостороннюю асимметрию.
Эксцессы по всем переменным положительны, значит, распределения показателей более островершинные, чем нормально распределение.
Кроме того, согласованность с нормальным распределением показателей можно проверить с помощью анализа гистограмм.
Рис.2. Гистограмма для переменной Y
Тест на нормальное распределение Н0: et ~ N (a, σ), H1: H0 не верна.
P-значение = 0,0000 < 0,05. Нулевая гипотеза отвергается с вероятностью 95%, распределение выручки не подчинено нормальному закону.
Моделирование ARIMA.
Задание
1. Содержательный анализ: информация о компании из своего варианта[1] (провести анализ на основе данных сети), ответив на вопросы: Какова специфика деятельности компании, с акциями которой Вы работаете? Насколько велика общая стоимость акции? Доля рынка? Исходя из этого, должна ли цена на акции компании сильно влиять на композитный индекс биржи? Происходили ли с компанией за ретроспективный период события, которые потенциально могли сильно повлиять на динамику цены акций? Построить график временного ряда (цены закрытия на акции компании, долл. США, далее Y) и композитного индекса. Провести дескриптивный анализ рядов. Сформулировать гипотезы, которые собираетесь проверять в ходе исследования.
2. Тестирование рядов на наличие детерминированного тренда и/или стохастического тренда (DT, ST). При необходимости построить модель тренда и дать ее характеристику. Выделить случайную составляющую ε̂t (ε̂t=Yt-Ŷt) и далее работать с ней. Если трендовых составляющих не обнаружено – далее исследуем закономерности исходного ряда Yt.
3. Построить АКФ и ЧАКФ ряда Y (или ε̂t). Сделать вывод о стационарности.
4. Проверить ряд на наличие структурных переломов, которые значительно изменили динамику ряда (например, единственное за весь интервал резкое сокращение/взлёт цены). При необходимости сократить временной интервал, чтобы моделировать динамику ряда после этого перелома.
5. Провести тест на единичные корни, обосновать степень интеграции ряда (параметр d модели ARIMA).
6. Построить АКФ, ЧАКФ для проинтегрированного ряда (если это необходимо). Обосновать глубину лагов авторегрессии и скользящего среднего модели ARIMA (параметры p, q).
7. Построить конкурирующие модели ARIMA в соответствии с предположениями о максимальных значениях параметров p, d, q.
8. Проверить соответствие остатков моделей процессу «белый шум». Сравнить модели по характеристикам качества. Выбрать лучшую.
9. Проверить ряд на кросс-корреляцию с композитным индексом NASDAQ.
10. Содержательный анализ: вернуться к гипотезам из пункта 1. Подтверждаются они или нет? Привести окончательный вид модели, который можно использовать для прогнозирования цены акции.
Решение.
1. Рассмотрим компанию: Yandex N.V. (тикер YNDX.Close). Объем рынка фев 2019: 13,737B USD.
«Яндекс» — многопрофильная технологическая компания, создающая интеллектуальные продукты и услуги на основе машинного обучения. Является крупнейшим поисковым сервисом и ведущим участником рынка онлайн-заказа такси в России. Кроме того, компания предоставляет десятки других сервисов: интернет-реклама, e-commerce, онлайн-объявления, медиа, образование и др.
Имеет представительства и офисы в девяти странах мира. В России зарегистрирована как ООО «Яндекс», но 100% капитала компании принадлежат зарегистрированному в Нидерландах акционерному обществу Yandex N.V.
У «Яндекса» шесть направлений бизнеса, включающих более 70 сервисов. Большую часть выручки компания получает за счёт интернет-рекламы. Поисковый сервис «Яндекса» в 2018 году генерировал 56,3% всего трафика в России по данным «Яндекс.Радар».
За 1 квартал 2020 года чистая прибыль составила 5,5 млрд рублей[2] (70,7 млн долларов США) и увеличилась на 76% по сравнению с аналогичным показателем за первый квартал 2019 года. Рентабельность по чистой прибыли — 11,7%.
В рамках борьбы с пандемией коронавируса Яндекс запустил проект поддержки медицинских и социальных служб «Помощь рядом». Компания организовала перевозку врачей и доставку медикаментов, товаров первой необходимости и тестов на коронавирус. Яндекс выделил около 1,5 млрд рублей на различные инициативы, в том числе на поддержку водителей и курьеров, программу поддержки малого и среднего бизнеса, а также финансирование образовательных проектов.
Яндекс разместил конвертируемые облигации на сумму 1,25 млрд долларов со ставкой купона 0,75% годовых и погашением в 2025 году.
В рамках программы обратного выкупа акций, объявленной в ноябре 2019 года, в первом квартале 2020 года было выкуплено 3,5 млн акций класса А.
Выручка от продажи интернет-рекламы увеличилась на 11% по сравнению с аналогичным показателем за первый квартал 2019 года и составила 64% от общей выручки компании в первом квартале 2020 года. Выручка от продажи интернет-рекламы включает выручку от продажи контекстной и медийной рекламы на сайтах Яндекса и на сайтах Рекламной сети.
Выручка от продажи рекламы на сайтах Яндекса выросла на 16% по сравнению с аналогичным показателем за первый квартал 2019 года. В структуре общей выручки Яндекса в первом квартале 2020 года она составила 52%.
Выручка от продажи рекламы на сайтах Рекламной сети Яндекса снизилась на 4% по сравнению с аналогичным показателем за первый квартал 2019 года. В структуре общей выручки компании в первом квартале 2020 года она составила 12%.
Выручка, относящаяся к сегменту Такси, в первом квартале 2020 года выросла на 49% по сравнению с аналогичным показателем за первый квартал 2019 года и составила 24% в структуре общей выручки компании, тогда как в первом квартале прошлого года она составляла 20%. Такой результат в основном обусловлен ростом сервиса онлайн-заказа такси, в частности увеличением количества поездок, ростом фудтех-направления, которое включает сервисы Яндекс.Лавка и Яндекс.Еда, и быстрым развитием сервиса Яндекс.Такси для бизнеса (учитывается на валовой основе).
Средний объем (Avg. Volume) торговых сделок за сессию акциями YNDX 3,325,671[3], а для композитного индекса биржи 3,420,101,986[4]. Доля сделок по акциям YNDX с общем объеме NASDAQ составляет 0,097%. Исходя из этого, можно предположить, что цена на акции компании YNDX незначительно влияет на композитный индекс биржи.
Построим графики цены закрытия YNDX и композитного индекса.
Рис.1. График динамики цены закрытия акций YNDX
Рис.2. График динамики композитного индекса
По графикам динамики Y и композитного индекса можно сделать предположение о нестационарности рядов.
Анализ графика ряда Y позволяет отметить в среднем тенденцию роста, ряд не стационарен по среднему. Поскольку колебания вокруг восходящего тренда имеют разную амплитуду, ряд, скорее всего, не стационарен по дисперсии.
Анализ графика композитного индекса позволяет отметить тенденцию роста, ряд не стационарен по среднему. Поскольку колебания вокруг восходящего тренда имеют приблизительно одинаковую амплитуду, ряд, скорее всего, стационарен по дисперсии.
В следующем пункте работы подкрепим данные предположения статистическими тестами.
В основе дескриптивного (описательного) анализа лежат такие статистические показатели как средняя величина, мода, медиана, стандартное отклонение и другие.
Приведем описательные статистики обоих рядов:
Рис.3. Описательные статистики рядов
И построим графическое отображение рядов в виде коробчатых диаграмм и гистограмм с тестированием нормальности.
Рис.4. Коробчатые диаграммы
Рис.5. Гистограммы распределения YNDX и NASDAQ
Средняя цена акции YNDX составила 30,739 долл. США за акцию, а для композитного индекса – 6990,9 долл. США.
На диаграмме размаха цены акций YNDX видим, что медиана почти не имеет смещения. Это говорит об однородности данных, что подтверждает коэффициент вариации, равный 7,99%. Аномальных наблюдений судя по диаграмме не наблюдается.
На диаграмме размаха композитного индекса также не наблюдается наличие аномальных наблюдений. Можно говорить об однородности данных, что подтверждает и коэффициент вариации, составивший всего 4,78%.
Для ряда YNDX асимметрии отрицательный, но при этом практически равен нулю (-0,07), значит, скошенности распределения нет. Отрицательный эксцесс говорит о плосковершинности распределения. Распределение не согласуется с нормальным (Р=0,02011 < 0,05).
Для композитного индекса показатель асимметрии равен -0,509, наблюдается незначительная скошенность влево, отрицательный эксцесс говорит о плосковершинности распределения. Но в целом значения асимметрии и эксцесса здесь по модулю меньше 1, можно говорить о близости распределения композитного индекса к нормальному закону (Р=0,1118> 0,05).
Сравнивая графики динамики цены закрытия акций YNDX и композитного индекса можно отметить схожие тенденции – в исследуемом временном интервале эти ряды имеют одновременные интервалы роста и снижения.
Рис.6. Одновременные динамики YNDX и NASDAQ
В качестве основной гипотезы будем рассматривать факт, что динамика цены закрытия акций YNDX имеет положительную тенденцию и зависит от изменения композитного индекса.
[1] На сайте finance.yahoo.com по тикеру кроме статистики и архива цен компании можно найти новости о ней (в разделе «Summary»).
[2] https://yandex.ru/company/press_releases/2020/2020-04-28
[3] https://finance.yahoo.com/quote/YNDX?p=YNDX&.tsrc=fin-srch
[4] https://finance.yahoo.com/quote/%5EIXIC?p=^IXIC&.tsrc=fin-srch
Линейная множественная модель. Исследование модели на адекватность, мультиколлинеарность, устранение мультиколлинеарности.
Содержание
1 Постановка задачи. 3
2 Оценивание линейной модели регрессии. 4
3 Проверка характера распределения регрессионных остатков. 6
4 Исследование построенной регрессионной модели. 8
4.1 Проверка адекватности линейной модели множественной регрессии (ЛММР) выборочным данным. 8
4.2 Проверка значимости коэффициентов ЛММР. 10
5 Исследование модели на мультиколлинеарность. 12
6 Устранение мультиколлинеарности. 17
7 Интерпретация результатов. 22
Список использованных источников. 23
По данным Приложения А:
1) построить МНК-оценки коэффициентов линейной модели множественной регрессии и провести ее анализ;
2) провести анализ построенной модели на мультиколлинеарность;
3) устранить мультиколлинеарность методом пошаговой регрессии.
Целью проводимого исследования является изучение регрессионной зависимости ввода в действие жилых домов (Y, кв. м), от ряда факторов:
,
где – условное среднее значение ввода в действие жилых домов, соответствующее текущим значениям х1, х2, х3, х4, х5 (кв. м);
х1 – инвестиции в основной капитал, тыс. руб.
х2 – площадь жилищ, приходящаяся в среднем на одного жителя, кв. м
х3 – среднесписочная численность работников, человек
х4 – среднемесячная начисленная заработная плата работников, руб.
х5 – удельный вес убыточных организаций, в % от общего числа организаций
Объектом исследования выступают районы Оренбургской области. Предметом исследования – взаимосвязи между вводом в действие жилых домов и указанными экономическими показателями. Информационная база представлена данными о значениях соответствующих показателей для 35 районов Оренбургской области за 2007 год. Таким образом, для оценки линейной функции множественной регрессии взята выборка объемом n = 35. Результаты наблюдений на результативным признаком представлены вектором и матрицей Х типа «объект-свойство» наблюдаемых значений :
........................................................
Для проверки значимости модели и значимости коэффициентов нужно убедиться, что остатки нормально распределены.
Н0: распределение регрессионных остатков не отличается от нормального.
Н1: распределение регрессионных остатков отличается от нормального.
Тестируем нормальность остатков модели 1.
............................................................
Расчет моделей ARIMA, линейной и адаптивной моделей.
1. Произвести расчет основных характеристик экономических процессов: среднее значение, дисперсию (стандартное отклонение), функции ковариации, автокорреляции (множественной и частной), периодограмму и спектр процесса, а также результаты выполнения теста на наличие единичного корня, т.е. проверки степени интеграции процесса I(d).
Построить основные модели экономических процессов (в программе GRETL производится обоснование выбора полиномиальной модели тренда), построить эконометрические модели сезонных колебаний, авторегрессионные модели AR(p), модели ARIMA (p, d, q), ARMA (p, q), рассмотреть процедуры исключения сезонности.
Прогноз осуществить на два периода вперед.
2. Произвести построение линейной модели и адаптивной модели прогнозирования в соответствие с этапами построения прогноза. Расчеты произвести в MS Excel или ином табличном процессоре. Данные для выполнения задания целесообразно брать с сайтов статистических данных.
Решение.
Исходные данные – временной ряд за 2013 – 2019 годы о динамике уровня безработицы в Венгрии. Данные помесячные.
Исходные данные:
Рис.1. Исходные данные
График исходного временного ряда показан на рисунке ниже:
Рис.2. График исходного ряда динамики
По графику видно, что ряд имеет отрицательную тенденцию, сезонности нет. Можно предположить нестационарность ряда.
Основные описательные статистики:
Рис.3. Описательная статистика
Таким образом, среднее значение уровня безработицы:
стандартное отклонение:
Коэффициент вариации составил 0,396%, что говорит о высокой однородности исходного ряда данных.
Найдем функции автокорреляции и частной автокорреляции. Укажем максимальный период запаздывания (он не должен превышать 15-20% длины ряда; здесь n=84 и ). Получили два окна результатов расчета порядка автокорреляции: графическое и текстовое.