Множественная регрессия

Содержание

Слайд 2

Множественная регрессия – это уравнение статистической связи с несколькими независимыми переменными:

Множественная регрессия – это уравнение статистической связи с несколькими независимыми переменными:
y

= f(x1, x2, …, xp)
где y – зависимая переменная (результативный признак);
x1, x2, …, xp – независимые переменные (факторы).
Слайд 3

Факторы, включаемые во множественную регрессию, должны отвечать следующим требованиям: Они должны

Факторы, включаемые во множественную регрессию, должны отвечать следующим требованиям:
Они должны быть

количественно измеримы. Если необходимо включить в модель качественный фактор, не имеющий количественного измерения, то ему нужно придать количественную определенность.
2. Факторы не должны быть интеркоррелированы и тем более находиться в точной функциональной связи.
Слайд 4

Считается, что две переменные явно коллинеарны, т.е. находятся между собой в

Считается, что две переменные явно коллинеарны, т.е. находятся между собой в

линейной зависимости, если

Если факторы явно коллинеарны, то они дублируют друг друга и один из них рекомендуется исключить из регрессии.

Слайд 5

Пусть, например, при изучении зависимости матрица парных коэффициентов корреляции оказалась следующей

Пусть, например, при изучении зависимости

матрица парных коэффициентов корреляции оказалась следующей

Очевидно,

что факторы х1 и х2 дублируют друг друга. В анализ целесообразно включить фактор х2, а не х1, хотя корреляция х2 с результатом у слабее, чем у х1 с у , но зато значительно слабее межфакторная корреляция . Поэтому в данному случае в уравнение множественной регрессии включаются факторы х2, х3.
Слайд 6

Включение в модель мультиколлинеарных факторов нежелательно в силу следующих последствий: 1)

Включение в модель мультиколлинеарных факторов нежелательно в силу следующих последствий:
1) Затрудняется

интерпретация параметров множественной регрессии как характеристик действия факторов в «чистом» виде, ибо факторы коррелированы; параметры линейной регрессии теряют экономический смысл.
2) Оценки параметров ненадежны, обнаруживают большие стандартные ошибки и меняются с изменением объема наблюдений (не только по величине, но и по знаку), что делает модель непригодной для анализа и прогнозирования.
Слайд 7

Если бы факторы не коррелировали между собой, то матрица парных коэффициентов

Если бы факторы не коррелировали между собой, то матрица парных коэффициентов

корреляции между факторами была бы единичной матрицей, поскольку все недиагональные элементы

были бы равны нулю.

Так, для уравнения, включающего три объясняющих переменных

матрица коэффициентов корреляции между факторами имела бы определитель, равный единице:

Слайд 8

Одним из путей учета внутренней корреляции факторов является переход к совмещенным

Одним из путей учета внутренней корреляции факторов является переход к совмещенным

уравнениям регрессии, т.е. к уравнениям, которые отражают не только влияние факторов, но и их взаимодействие. Так, если

то возможно построение следующего совмещенного уравнения:

Слайд 9

Наиболее широкое применение получили следующие методы построения уравнения множественной регрессии: Метод

Наиболее широкое применение получили следующие методы построения уравнения множественной регрессии:
Метод исключения

– отсев факторов из полного его набора.
2) Метод включения – дополнительное введение фактора.
3) Шаговый регрессионный анализ – исключение ранее введенного фактора.
Слайд 10

Метод наименьших квадратов (МНК). Свойства оценок на основе МНК В линейной

Метод наименьших квадратов (МНК).
Свойства оценок на основе МНК

В линейной множественной регрессии


параметры при Х называются коэффициентами «чистой» регрессии.

Рассмотрим линейную модель множественной регрессии

(1)

МНК позволяет получить такие оценки параметров, при которых сумма квадратов отклонений фактических значений результативного признака у от расчетных минимальна:

(2)

Слайд 11

Имеем функцию аргумента: Находим частные производные первого порядка:

Имеем функцию аргумента:

Находим частные производные первого порядка:

Слайд 12

После элементарных преобразований приходим к системе линейных нормальных уравнений для нахождения

После элементарных преобразований приходим к системе линейных нормальных уравнений для нахождения

параметров линейного уравнения множественной регрессии (1):

(3)

Для двухфакторной модели данная система будет иметь вид:

Слайд 13

МНК применим и к уравнению множественной регрессии в стандартизированном масштабе: (4)

МНК применим и к уравнению множественной регрессии в стандартизированном масштабе:

(4)

где

– стандартизированные

переменные:

для которых среднее значение равно нулю:

а среднее квадратическое отклонение равно единице:

– стандартизированные коэффициенты регрессии.

Слайд 14

Применяя МНК к уравнению множественной регрессии в стандартизированном масштабе, получим систему

Применяя МНК к уравнению множественной регрессии в стандартизированном масштабе, получим систему

нормальных уравнений вида

(5)

Где и – коэффициенты парной и межфакторной корреляции

Слайд 15

Коэффициенты «чистой» регрессии связаны со стандартизованными коэффициентами регрессии следующим образом: (6)

Коэффициенты «чистой» регрессии связаны со стандартизованными коэффициентами регрессии следующим образом:

(6)

Поэтому

можно переходить от уравнения регрессии в стандартизованном масштабе (4) к уравнению регрессии в натуральном масштабе переменных (1), при этом параметр а определяется как

На основе линейного уравнения множественной регрессии

(7)

могут быть найдены частные уравнения регрессии:

(8)

Слайд 16

При подстановке в эти уравнения средних значений соответствующих факторов они принимают

При подстановке в эти уравнения средних значений соответствующих факторов они принимают

вид парных уравнений линейной регрессии, т.е. имеем

(9)

где