Модель множественной линейной регрессии - это уравнение вида:
Вектор-столбец коэффициентов этого уравнения можно найти при помощи метода наименьших квадратов по формуле:
где:
Отбор факторов для построения модели множественной линейной регрессии обычно проводится в две стадии:
1.Факторы отбираются исходя из сути проблемы.
2.Изучается корреляционная матрица – матрица коэффициентов парной (частной) линейной корреляции.
Два фактора явно коллинеарны, если
Включать в модель следует те факторы, которые при достаточно тесной связи с результатом имеют наименьшую взаимосвязь между собой. Т.е. следует избегать мультиколлинеарности.
Мультиколлинеарность – тесная линейная зависимость между независимыми переменными.
Отсутствие мультиколлинеарности - это шестая предпосылка метода наименьших квадратов.
Коэффициент детерминации
оценивает качество модели.
Коэффициент множественной линейной корреляции
оценивает силу совокупного влияния факторов на результирующую переменную.
Статистика Фишера
проверяет статистическую значимость модели.
Если F > Fкр, то говорят, что построенная модель адекватна. Критическое значение статистики Фишера зависит от уровня значимости и степеней свободы df1 и df2 . Уровень значимости обычно равен 0,05, степени свободы 1 соответствуют числу факторов: df1 = m , степени свободы 2 равны: df2 = n – m – 1 .
Статистики Стьюдента параметров
оценивают их статистическую значимость.
где
zii - i-й диагональный элемент матрицы
Точечный прогноз:
Стандартная ошибка прогноза:
где
Интервальный прогноз: