Меню

КРИТЕРИЙ ЛЯМБДА КОЛМОГОРОВА СМИРНОВА

Критерий согласия Колмогорова

date image2015-04-30
views image13754

facebook icon vkontakte icon twitter icon odnoklasniki icon

В качестве меры расхождения принимается величина, пропорциональная максимуму абсолютной величины отклонений функций распределения предполагаемого теоретического закона и эмпирической функции распределения

F(x) — теоретическая функция распределения.

Алгоритм применения критерия Колмогорова:

1. Исходя из известных значений эмпирических частот попадания в i-тый интервал, выдвигают нулевую гипотезу о предполагаемом законе распределения случайной величины X и находят его параметры.

2. В результате n независимых наблюдений строится F*(x) — эмпирическая функция распределения непрерывной случайной величины Х. По рассчитанным параметрам строится предполагаемая теоретическая функция распределения F(х).

3. Определяется мера расхождения между теоретическими и эмпирическими значениями функции распределения:

4. На заданном уровне значимости по таблице распределения критических значений для критерия Колмогорова находят критическое значение из таблицы

0.1 0.05 0.025 0.01 0.005 0.001
1.22 1.36 1.48 1.63 1.73 1.95

5. Если – принимается нулевая гипотеза (теоретический закон распределения не противоречит эмпирическим данным). Если – нулевую гипотезу отвергают.

Пример 1. По данному статистическому распределению выборки определить гипотетично закон распределения вероятностей и на уровне значимости 0,05 проверить гипотезу о согласовании 2-х распределений с использованием критерия Пирсона.

Составим интервальный ряд.

Интервалы 0 — 10 10 — 20 20 — 30 30 — 40 40-50
mi

Построим гистограмму частостей (рисунок 7.1)

Рисунок 7.1 — Гистограмма частостей

По форме гистограммы можно предположить, что закон распределения – экспоненциальный. Для проверки этого утверждения используем критерий согласия Пирсона. Т.к. предполагаемый закон распределения экспоненциальный, то произведем “выравнивание” статистических данных по показательному закону. Для нахождения точечной оценки параметра необходимо вычислить Тогда l=0,064.

Дифференциальная функция предполагаемого показательного закона распределения имеет вид f(x)=0,064 -0,064 x

Для нахождения c 2 набл. построим вспомогательную таблицу с необходимыми вычислениями (табл.7.1)

Таблица 7.1 Вычисление c 2 набл.

xi xi+1 mi pi npi (mi — npi) 2 /npi
0,51 2,37
0,25
0,13 1,23
0,07 0,14
0,03 1,33
0,99 6,08

Число степеней свободы r=5-1-1=3

Т.к. то нулевая гипотеза H0 об экспоненциальном законе распределения принимается.

Пример 2. По критерию Колмогорова на уровне значимости 0,05 проверить гипотезу о том, что СВ Х имеет нормальный закон распределения c параметрами N(9,87; 0,71).

Для нахождения lнабл. построим вспомогательную таблицу с необходимыми вычислениями (табл.7.2)

Таблица 7.2 Вычисление lнабл.

x F*(x) F(x) | F*(x)- F(x)|
8,6 0,06 0,06
9,03 0,14 0,18 0,04
9,46 0,314 0,37 0,056
9,89 0,514 0,504 0,01
10,32 0,74 0,73 0,01
10,75 0,85 0,89 0,04
11,2 0,97 0,03

то гипотеза не противоречит опытным данным

Контрольные вопросы

1. В чем состоит проблема проверки согласия ?

2. Почему необходима проверка согласия при решении стат. задач?

3. Приведите выражение статистики Пирсона для проверки согласия.

4. Сформулируйте правило проверки согласия (критерий Пирсона).

5. Приведите выражение статистики Колмогорова проверки согласия.

6. Сформулируйте правило проверки согласия( критерий Колмогорова).

Источник

Критерий согласия Пирсона (Хи-квадрат) и критерий Колмогорова-Смирнова

Задание

ПН ВТ СР ЧТ ПТ СБ ВС
2 3 4 6 4 3
5 4 2 1 4 5 3
4 5 3 5 8 2 2
3 1 3 6 2 1 3
2 7 1

П риняв уровень значимости alpha=0.05, проверить согласие этих данных обычного месяца с распределением Пуассона, пользуясь критерием Хи-квадрат. Перепроверить данные с помощью критерия Колмогорова-Смирнова, по прежнему принимая alpha =0.05.

Читайте также:  4816 ХАРАКТЕРИСТИКА РЕФОРМ НИКОЛАЯ II изучаем в общих чертах

Методические указания

Критерий Хи-квадрат предпочтителен, когда исследуются большие объемы выборок. При малых объемах выборок этот критерий практически не пригоден.

Нулевая гипотеза при применении общих критериев согласия записывается в форме

где Fn(x) – эмпирическая функция распределения вероятностей; F(x) – гипотетическая функция распределения вероятностей.

Критерий Пирсона X 2 основан на сравнении эмпирической гистограммы распределения случайной величины с ее теоретической плотностью. Диапазон изменения экспериментальных данных разбивается на k интервалов, и подсчитывается статистика:

Формула Хи-квадрата

где ni – количество значений случайной величины, попавших в i-й интервал; n – объем выборки; F(x) – гипотетический теоретический закон распределения вероятностей случайной величины; pi = F(xi+1) — F(xi) – теоретическая вероятность попадания случайной величины в i-й интервал.

Статистика X 2 имеет распределение Хи-квадрат с f = n — 1 степенями свободы в том случае, когда проверяется простая нулевая гипотеза H0, т.е., когда гипотетическое распределение, на соответствие которому проверяется эмпирический ряд данных, известно с точностью до значения своих параметров.

Правило проверки гипотезы:

то на уровне значимости alpha, т. е. с достоверностью (1 — alpha) гипотеза

На мощность статистического критерия X 2 сильное влияние оказывает чиcло интервалов разбиения гистограммы (k) и порядок ее разбиения (т. е. выбор длин интервалов внутри диапазона изменения значений случайной величины). На практике принято считать, что статистику X 2 можно использовать, когда npi >= 5.

Такое приближение допустимо и тогда, когда не более, чем в 20% интервалов имеет место 1 k = 1+ 3,32·lg n

При n >= 200 можно выбирать k из условия

Еще одно простое правило: выбрать как можно большее k, но не превышающее n/5:

Критерий Крамера-фон Мизеса дает хорошие результаты при малых объемах выборок (менее 10). Однако вопрос о доверительной вероятности остается нерешенным (эта вероятность мала при значительных размерах доверительных интервалов.
Исходя из этого, полагают, что реальные объемы выборок, которые можно получить, находятся в диапазоне от 10 до 100.

Критерий Колмогорова-Смирнова также целесообразно использовать для выборки указанных объемов в тех случаях, когда проверяемое распределение непрерывно и известны среднее значение и дисперсия проверяемой совокупности.
Алгоритм реализации критерия Колмогорова-Смирнова предполагает использование критического значения D extr для проверки принятой гипотезы. Для этого используется приведенная ниже табл. 1.

Решение

1. Критерий Хи-квадрат

1.1. Реализация в MathCad

1.2. Реализация в Excel

Реализация критерия согласия Хи-квадрат Пирсона в Excel

Формулы ячеек на листе Excel представлены в табл. 2.

Ячейка Характеристика Формула
В15 – число случаев исхода =СЧЁТЕСЛИ($B$3:$H$7;A15)
С15 – вероятность наступления =ПУАССОН.РАСП(A15;$E$11;ЛОЖЬ)
D15 – ожидаемое число случаев исхода =ОКРУГЛ(C15*$H$9;0)
H19 – статистика Хи-квадрат =СУММ(H15:H18)
H23 – критическое значение Хи-квадрата (максимальное значение для заданного уровня значимости) =ХИ2.ОБР(1-H22;H21)
J19 – p-value (вероятность получить расчетное значение Хи-квадрата) =ХИ2.РАСП.ПХ(H19;H21)
J20 – Хи-квадрат тест =ХИ2.ТЕСТ(F15:F18;G15:G18)

2. Критерий Колмогорова-Смирнова

Литература

  1. Емельянов А.А., Власова Е.А., Дума Р.В. Имитационное моделирование экономических процессов: уч. пособ. — М.: Финансы и статистика, 2002. — 368с.
  2. Кобзарь А. И. Прикладная математическая статистика. Для инженеров и научных работников. — М.: ФИЗМАТЛИТ, 2006. — 816 с.
Читайте также:  Изменение численности и основных составляющих по городскому и сельскому населению

© В.Н. Кравченко
Последнее обновление: 2018.11.03

Источник



Критерий Колмогорова

Критерий Колмогорова формула

Критерий Колмогорова применяется для проверки гипотезы распределения непрерывных функций СВ.
Объем выборки n≥50.
Критерий Колмогорова находится по формуле:

Если проведено две выборки, то формула критерия Колмогорова примет вид:

Критерий Колмогорова формула для двух выборок

Fn(xi) — значения эмпирической функции распределения;
F(xi) — значения теоретической функции распределения.
При λ

Критерий Колмогорова часто применяют для проверки полученных значений в ходе эксперимента и подчиняются ли они нормальному закону распределения случайной величины.

Пример
Приведена таблица результатов исследования n=100

Количество предметов 1 2 3 4 5
Частота 18 16 26 22 18

На уровне значимости α=0,2 с помощью критерия Колмогорова определите подчиняются ли данные выборки на интервале [0,5] при n=100 равномерному закону распределения случайной величины.

Решение
Запишем функцию равномерного закона распределения случайной величины
функция равномерного распределения случайной величины пример

xi F(xi)=0,2xi x ni Fn(xi) |F(xi)Fn(xi)|
1 0,2 18 0,18 0,02
2 0,4 16 0,34 0,06
3 0,6 26 0,6
4 0,8 22 0,82 0,02
5 1 18 1
max=0,06

Отсюда λ=0,6 и по таблице критических значений критерий Колмогорова при α=0,2 λкр=0,65.
λ

Насколько публикация полезна?

Нажмите на звезду, чтобы оценить!

Средняя оценка 5 / 5. Количество оценок: 1

Оценок пока нет. Поставьте оценку первым.

2073

Источник

Критерии согласия

Критерием согласия называется критерий значимости, применяемый для проверки гипотезы о законе распределения генеральной совокупности, из которой взята выборка.

Чаще всего исследователя интересует, соответствует ли распределение экспериментальных данных нормальному закону. Поэтому примеры будут связаны с проверкой экспериментального распределения на нормальность.

  • Критерий Шапиро-Уилки
  • Критерий хи-квадрат
  • Критерий лямбда Колмогорова-Смирнова

КРИТЕРИЙ ШАПИРО-УИЛКИ

Условия применения: выборка небольшого объема

Н – распределение генеральной совокупности из которой получена выборка совокупности соответствует нормальному закону.

Н1— распределение генеральной совокупности из которой получена выборка совокупности не соответствует нормальному закону.

Таблица 1 – Алгоритм расчета критерия Шапиро-Уилки.

x x Δk k ank ankΔk
1 2 3 4 5 6 7
1 11,8 13,8 2 1 0,5739 1,1478
2 12 13,2 1,2 2 0,3291 0,39492
3 12,1 13 0,9 3 0,2141 0,19269
4 12,3 12,8 0,5 4 0,1224 0,0612
5 12,6 12,6 5 0,0399
6 12,6 12,6
7 12,8 12,3 Сумма=b = 17966
8 13 12,1
9 13,2 12
10 13,8 11,8

Порядок расчета критерия Шапиро-Уилки

  1. Формулируем гипотезу Н о соответствии распределения генеральной совокупности, из которой получены данные нормальному закону. Назначаем уровень значимости α=0,05.
  2. Получаем выборку экспериментальных данных (столбец 1 табл.1). В нашем случае n=10.
  3. Рассчитываем значение выборочной дисперсии. Для примера S 2 =0, 37.
  4. Ранжируем выборку в возрастающем и убывающем порядке (столбцы 2 и 3)
  5. Считаем разности Δk (столбец 5)
  6. Из таблицы 6 Приложения(см. В.С.Иванов, 1990) находим значения коэффициентов ank (столбец 6)
  7. Находим произведение ankΔk
  8. Вычисляем b=сумма ankΔk= 1,7966
  9. Рассчитываем значение критерия Wф по формуле:

Критерии согласия

  1. Из табл. 7 Приложения (см. В.С.Иванов, 1990) находим критическое значение критерия Шапиро-Уилки для α=0,05 Wкрит= 0,842.
  2. Вывод. Так как Wф>Wкрит, можно говорить, что экспериментальные данные соответствуют нормальному закону на уровне значимости 0,05.

КРИТЕРИЙ ХИ-КВАДРАТ

Разработан Карлом Пирсоном. Основан на построении интервального вариационного ряда и сравнении эмпирических (nэм) и теоретических (nт) частот (Рис.1).

Читайте также:  Оценка и выбор поставщиков наблюдение за поставщиками развитие поставщиков

Критерии согласия

Рис.1. Гистограмма, характеризующая эмпирическое распределение и функция плотности вероятностей нормального распределения.

Статистическая гипотеза: плотность распределения генеральной совокупности, из которой взята выборка, соответствует теоретической модели нормального распределения.

Значение фактического критерия хи-квадрат вычисляется по формуле:

Критерии согласия

Если фактическое значение критерия хи-квадрат больше или равно чем критическое значение критерия хи-квадрат, можно сделать вывод, что эмпирическое распределение не соответствует нормальному закону на уровне значимости α.

КРИТЕРИЙ ЛЯМБДА КОЛМОГОРОВА-СМИРНОВА

Разработан Андреем Николаевичем Колмогоровым и Николаем Васильевичем Смирновым.

Статистическая гипотеза: функция распределения генеральной совокупности (рис. 2 ), из которой взята выборка, соответствует функции распределения нормального закона.

Критерии согласия

Рис.2. Красные точки — кумулята, построенная на основе экспериментальных данных, синяя кривая — теоретическая функция распределения (нормальное распределение).

Значение критерия λф вычисляется по формуле:

Критерии согласия

Вывод: если λф> λкрит – эмпирическое распределение не соответствует нормальному на уровне значимости α.

Источник

Критерий согласия Колмогорова. Критерий согласия Колмогорова отличается своей простотой и находит широкое применение в исследовании надежности машин и их элементов

Критерий согласия Колмогорова отличается своей простотой и находит широкое применение в исследовании надежности машин и их элементов. Для его применения на графике строится эмпирическая функция распределения F*(x,) и выбранная аппроксимирующая функция F(x) предполагаемого закона распределения. При этом за меру расхождения между F*(x,) и F(x) выбирается величина:

где = max | F(x) — F*(x) | — максимальное расхождение между опытной и теоретической плотностями вероятности случайных величин;

N— объем статистических данных.

На основе специальных таблиц

определяется вероятность Р ( )того, что если конкретный вариационный признак распределен по рассматриваемому теоретическому распределению, то из-за чисто случайных причин максимальное расхождение между фактическими и теоретическими накопленными частотами будет не меньшим, чем фактически наблюдаемое. По результатам вычислений величины Р ( ) делают следующие выводы:

1. Если вероятность Р ( ) достаточно велика, то гипотезу

о том, что фактическое распределение близко к теоретическому,

можно считать подтвержденной;

2. Если же вероятность Р ( ) мала — гипотеза отвергается.

Так, если )> 0,5, если N> 100, то Р( ) = 0,01. ..0,05.

Критерий Колмогорова рекомендуется применять, если параметры распределения F(x) известны до опыта и ставится задача по результатам эксперимента проверить только согласованность теоретического и опытного распределения.

Большим достоинством критерия Колмогорова является возможность оценки справедливости гипотезы при малых объемах наблюдений случайной величины. Однако необходимо отметить, что при больших объемах наблюдений (N> 100) лучше пользоваться критерием Пирсона

Пример. В результате наблюдений получено 170 значений случайной величины х. Наибольшее расхождение между теоретическим и расчетным значениями функции F(x) составляет: Dn = max |F(x) — F*(x)| = 0,0149. Необходимо оценить принадлежность распределения к нормальному закону.

Решение. Вычисляем значение параметра :

Из таблицы находим значение вероятности Р( ) : Р (0,194) = 1,0.

Таким образом Р( )>0,05 и гипотеза о нормальном законе распределения случайной величины справедлива.

Источник