Элементы дисперсионного анализа

Содержание

Слайд 2

План Основные понятия Описание метода дисперсионного анализа Решение типовой задачи (однофакторный дисперсионный анализ несвязанных выборок)

План

Основные понятия
Описание метода дисперсионного анализа
Решение типовой задачи (однофакторный дисперсионный анализ
несвязанных

выборок)
Слайд 3

Дисперсионный анализ (от латинского DISPERSIO – рассеивание / на английском Analysis

Дисперсионный анализ (от латинского DISPERSIO – рассеивание / на английском Analysis

Of Variance - ANOVA) буквально: анализ факторных эффектов

Рональд Эйлмер Фишер
( 1890 - 1962 )
Разработал:
дисперсионный анализ
теорию планирования эксперимента
метод максимального правдоподобия оценки параметров.

Слайд 4

Фундаментальная концепция дисперсионного анализа предложена ФИШЕРОМ в 1920 году. Первоначально дисперсионный

Фундаментальная концепция дисперсионного анализа предложена ФИШЕРОМ в 1920 году.
Первоначально дисперсионный

анализ был разработан для обработки данных, полученных в ходе специально поставленных экспериментов, и считался единственным методом, корректно исследующим ПРИЧИННЫЕ связи.
Метод применялся для оценки экспериментов в растениеводстве.
Слайд 5

В дальнейшем выяснилась общенаучная значимость дисперсионного анализа для экспериментов в психологии,

В дальнейшем выяснилась общенаучная значимость дисперсионного анализа для экспериментов в

психологии, педагогике, медицине и др.
Возможно, более естественным был бы термин анализ суммы квадратов или анализ вариации, но в силу традиции употребляется термин дисперсионный анализ.
Слайд 6

Дисперсионный анализ — метод в математической статистике, направленный на поиск зависимостей

Дисперсионный анализ — метод в математической статистике, направленный на поиск зависимостей в

экспериментальных данных путём исследования значимости различий в средних значениях.
В отличие от t-критерия позволяет сравнивать средние значения трёх и более групп.
Слайд 7

1. Основные понятия Сущность ДА заключается в изучении статистического влияния одного

1. Основные понятия

Сущность ДА заключается в изучении статистического влияния одного или

нескольких факторов на результативный признак (результат)
Результативные признаки — это те признаки, которые изменяются под влиянием факторных признаков.
Результативный признак – это элементарное качество или свойство объектов, изучаемое как результат влияния факторов: организованных в исследовании и всех остальных, неорганизованных в данном исследовании
Слайд 8

К результативным признакам можно отнести: точно измеряемые параметры объектов: рост, масса,

К результативным признакам можно отнести:
точно измеряемые параметры объектов: рост, масса, АД,

содержание гемоглобина в крови
неточно измеряемые параметры: умственные способности, например
комбинированные признаки
качественные признаки
Слайд 9

Фактор – это любое влияние, воздействие или состояние, разнообразие которых может

Фактор – это любое влияние, воздействие или состояние, разнообразие которых может

так или иначе отражаться в разнообразии результативного признака

Факторами могут быть
Физические воздействия (температура, влажность, радиация)
Химические воздействия: питание, стимуляторы, мутагены, алкоголь
Биологические: здоровье, болезни, наследственность, талантливость, идиотизм
Окружающая среда: ареал обитания, условия жизни
Возраст, пол и др.

Слайд 10

Факторы могут иметь различные ГРАДАЦИИ или различные условия действия Градация (

Факторы могут иметь различные ГРАДАЦИИ или различные условия действия
Градация (

c лат. GRADATIO – постепенное возвышение, усиление) фактора – это изменение его величины при переходе от одной группы к другой
Пример (шутка),
если отыщется исследователь, желающий определить зависимость яйценоскости от цвета курицы, то ничто не помешает ему применить дисперсионный анализ, и в качестве условий действия фактора «цвет» избрать, скажем, ЧЕРНЫХ, БЕЛЫХ И ПЕСТРЫХ кур.
Слайд 11

Фактор регулируемый Уровень 1 Уровень 2 неконтролируемый Случайный



Фактор
регулируемый
Уровень 1
Уровень 2
неконтролируемый
Случайный

Слайд 12

Виды дисперсионного анализа По количеству выявляемых регулируемых факторов дисперсионный анализ может

Виды дисперсионного анализа

По количеству выявляемых регулируемых факторов дисперсионный анализ может

быть
однофакторным (при этом изучается влияние одного фактора на результаты эксперимента),
двухфакторным (при изучении влияния двух факторов)
многофакторным (позволяет оценить не только влияние каждого из факторов в отдельности, но и их взаимодействие).
Слайд 13

ДА несвязанных (различных, независимых) выборок. В зависимости от поставленной цели и

ДА несвязанных (различных, независимых) выборок.
В зависимости от поставленной цели

и задач выборочные группы формируются случайным образом независимо друг от друга (контрольная и экспериментальная группы для изучения некоторого показателя, например, влияние высокого артериального давления на развитие инсульта).
Слайд 14

ДА связанных выборок (зависимых). Результаты воздействия факторов исследуются у одной и

ДА связанных выборок (зависимых).
Результаты воздействия факторов исследуются у одной

и той же выборочной группы (например, у одних и тех же пациентов) до и после воздействия (лечение, профилактика, реабилитационные мероприятия)
Слайд 15

дисперсионный анализ одномерный и многомерный (одна или несколько зависимых переменных)

дисперсионный анализ одномерный и многомерный (одна или несколько зависимых переменных)

Слайд 16

Условия применения дисперсионного анализа - выборочные данные должны быть взяты из

Условия применения дисперсионного анализа

- выборочные данные должны быть взяты из

НОРМАЛЬНЫХ совокупностей
- исправленные выборочные дисперсии каждого уровня контролируемого фактора должны быть равны (оценки выборочных дисперсий)
- результаты наблюдений должны быть независимыми
Слайд 17

2. Принцип применения метода дисперсионного анализа Формулируется НУЛЕВАЯ ГИПОТЕЗА, то есть

2. Принцип применения метода дисперсионного анализа

Формулируется
НУЛЕВАЯ ГИПОТЕЗА, то

есть предполагается, что исследуемые факторы не оказывают никакого влияния на значения результативного признака и полученные различия случайны.
Слайд 18

Очевидно, что если регулируемый фактор ОКАЗЫВАЕТ влияние на признак, то при

Очевидно, что если регулируемый фактор ОКАЗЫВАЕТ влияние на признак, то при

различных уровнях этого фактора будут наблюдаться существенные изменения средних значений признака.
Слайд 19

Следовательно, ИЗМЕНЕНИЯ, вызванные влиянием контролируемого фактора будут БОЛЕЕ ЗНАЧИМЫ, чем влияние

Следовательно, ИЗМЕНЕНИЯ, вызванные влиянием контролируемого фактора будут БОЛЕЕ ЗНАЧИМЫ, чем влияние

неконтролируемых (случайных) факторов.
Оценить изменения можно с помощью дисперсий.
Слайд 20

ОСНОВНАЯ ЗАДАЧА ДИСПЕРСИОННОГО АНАЛИЗА заключается в разложении общей дисперсии признака на


ОСНОВНАЯ ЗАДАЧА
ДИСПЕРСИОННОГО АНАЛИЗА
заключается в разложении общей дисперсии

признака на дисперсию, вызванную действием контролируемого фактора (факторную дисперсию Dфакт) и дисперсию остаточную (остаточную дисперсию Dост), т.е. вызванную неконтролируемыми факторами:
Doбщ. = Dфакт + D ост
Слайд 21

Doбщ. - общая дисперсия наблюдаемых значений (вариант), характеризуется разбросом вариант от

Doбщ. - общая дисперсия наблюдаемых значений (вариант), характеризуется разбросом вариант от

общего среднего. Измеряет вариацию признака во всей совокупности под влиянием всех факторов, обусловивших эту вариацию.
ОБЩЕЕ РАЗНООБРАЗИЕ СКЛАДЫВАЕТСЯ ИЗ МЕЖГРУППОВОГО И ВНУТРИГРУППОВОГО
Слайд 22

Dфакт - факторная (межгрупповая) дисперсия, характеризуется различием средних в каждой группе

Dфакт - факторная (межгрупповая) дисперсия, характеризуется различием средних в каждой группе

и зависит от влияния исследуемого фактора, по которому дифференцируется каждая группа.
Например, в группах различных по этиологическому фактору клинического течения пневмонии средний уровень проведенного койко-дня неодинаков — наблюдается межгрупповое разнообразие.
Слайд 23

D ост. - остаточная (внутригрупповая) дисперсия, которая характеризует рассеяние вариант внутри

D ост. - остаточная (внутригрупповая) дисперсия, которая характеризует рассеяние вариант внутри

групп. Отражает случайную вариацию, т.е. часть вариации, происходящую под влиянием неучтенных факторов и не зависящую от признака — фактора, положенного в основание группировки.
Вариация изучаемого признака зависит от силы влияния каких-то неучтенных случайных факторов, как от организованных (заданных исследователем), так и от случайных (неизвестных) факторов.
Слайд 24

Этапы дисперсионного анализа Построение дисперсионного комплекса. Вычисление квадратов отклонений. Вычисление дисперсий.

Этапы дисперсионного анализа
Построение дисперсионного комплекса.
Вычисление квадратов отклонений.
Вычисление дисперсий.
Сравнение

факторной и остаточной дисперсий.
Статистическая проверка нулевой гипотезы о несущественности различий факторной и остаточной дисперсий
Слайд 25

Замечание Для проверки нулевой гипотезы используется F-статистика С помощью критерия Фишера-Снедекора

Замечание
Для проверки нулевой гипотезы используется F-статистика
С помощью критерия Фишера-Снедекора можно

определить значимость отличия факторной и остаточной дисперсий и тем самым подтвердить или опровергнуть гипотезу о значимости влияния изучаемого фактора на контролируемый признак.
Слайд 26

Например, пусть число наблюдений при действии каждого из уровней фактора одинаково

Например, пусть число наблюдений при действии каждого из уровней фактора одинаково

(q) и результаты представлены в таблице.
Слайд 27

Все значения величины х, наблюдаемые при каждом фиксированном уровне фактора ,

Все значения величины х, наблюдаемые при каждом фиксированном уровне фактора ,

составляют группу, и в последней строке таблицы представлены соответствующие выборочные групповые средние, вычисленные по формуле:
Слайд 28

Скорее всего выборочные средние по каждому уровню будут отличаться друг от


Скорее всего выборочные средние по каждому уровню будут отличаться друг

от друга. Но является ли это отличие значимым и вызвано ли это отличие действием фактора?
Выдвигаются две гипотезы:
Н0 – фактор не влияет на признак и, следовательно, средние значения величины признака на разных уровнях равны, т.е.
Н1 – фактор влияет на признак, и следовательно, хотя бы одно выборочное среднее значимо отличается от других.


Слайд 29

Пример. Методом дисперсионного анализа на уровне значимости установить существенность влияния реагента


Пример. Методом дисперсионного анализа на уровне значимости установить существенность влияния

реагента A (фактора F) на синтез лекарственного препарата (выход Х в условных единицах – результативный признак). Установить силу влияния фактора на признак.
Слайд 30

Найдем групповые среднии:


Найдем групповые среднии:

Слайд 31

Выборочные средние по каждому уровню отличаются друг от друга. Но является


Выборочные средние по каждому уровню отличаются друг от друга. Но

является ли это отличие значимым и вызвано ли это отличие действием фактора?
Выдвигаем нулевую гипотезу:
фактор не влияет на признак и, следовательно, средние значения величины признака на разных уровнях равны, т.е. H0:
Слайд 32

Для проверки предположения о случайном различи средних воспользуемся методом дисперсионного анализа

Для проверки предположения
о случайном различи средних воспользуемся
методом
дисперсионного

анализа
Слайд 33

ФОРМУЛЫ для вычислия сумм квадратов отклонений

ФОРМУЛЫ для вычислия сумм квадратов отклонений

Слайд 34

ФОРМУЛЫ ДЛЯ ВЫЧИСЛЕНИЯ ДИСПЕРСИЙ Нужные суммы вычислим в таблице

ФОРМУЛЫ ДЛЯ ВЫЧИСЛЕНИЯ ДИСПЕРСИЙ

Нужные суммы вычислим
в таблице

Слайд 35


Слайд 36


Слайд 37


Слайд 38

Вычислим суммы квадратов отклонений

Вычислим суммы квадратов отклонений

Слайд 39

Вычислим дисперсии

Вычислим дисперсии

Слайд 40

Сравнение факторной и остаточной дисперсий показывает, что > Прежде, чем делать


Сравнение факторной и остаточной дисперсий показывает, что
>
Прежде,

чем делать окончательный вывод о влиянии фактора на признак, необходимо проверить статистическую значимость различий дисперсий




.

Слайд 41

Проверка гипотез для дисперсий. 1. Нулевая гипотеза Н0 : 2. Конкурирующая

Проверка гипотез для дисперсий.

1. Нулевая гипотеза Н0 :
2. Конкурирующая

гипотеза Н1: ≠
3. Для проверки нулевой гипотезы используем F-критерий Фишера
Слайд 42

Проверим значимость различия дисперсий: найдем наблюдаемое значение критерия различия: найдем табличное

Проверим значимость различия дисперсий:
найдем наблюдаемое значение критерия различия:
найдем табличное значение

критерия достоверности используя таблицу Фишера – Снедекора:
Сравним и
Слайд 43

Вывод: дисперсии различаются значимо на уровне значимости 0,05 . Следовательно, фактор

Вывод: дисперсии различаются значимо на уровне значимости 0,05 . Следовательно, фактор

(указать какой) оказывает существенное влияние на признак (указать признак) .
Слайд 44

ОЦЕНИМ СИЛУ ВЛИЯНИЯ ФАКТОРА НА ПРИЗНАК Вывод: Изменения признака (выхода лекарственного


ОЦЕНИМ СИЛУ ВЛИЯНИЯ ФАКТОРА НА ПРИЗНАК
Вывод: Изменения признака (выхода

лекарственного препарата при его синтезе) на 76% обусловлены влиянием регулируемого фактора (реагента А) и на 24% влиянием всех других нерегулируемых факторов.
Слайд 45

Математики шутят ТЕОРВЕР БОЛЬШОЙ... Во время сессии в коридоре института встречаются

Математики шутят

ТЕОРВЕР БОЛЬШОЙ...
Во время сессии в коридоре института

встречаются преподаватели В. и К., только что закончившие принимать экзамены в своих группах.
— Ну, как студенты? — спрашивает В. — Нормально сдают?
— Да как сказать, — мнется К. — Вот сейчас мне сдавал один студент. По билету ничего не сказал, на дополнительные вопросы не ответил. Но я ему все-таки поставил «четыре».
— Как?! За что? — поражается собеседник. — Он же ничего не знает!
— Теорвер большой, — задумчиво отвечает К. — что-нибудь да знает...
Слайд 46

Потом спрашивает В. — А у тебя как студенты? — Да

Потом спрашивает В.
— А у тебя как студенты?
— Да тоже не

очень, — отвечает тот. — Только что принимал экзамен у студента. По билету все рассказал без запинки, на все дополнительные вопросы ответил, однако я ему поставил-таки «три».
— Но почему?! — теперь уже поражается К.
— Теорвер большой, — невозмутимо говорит В., — что-нибудь да не знает.