Меню

Определение коэффициентов Пирсона и Чупрова

Определение коэффициентов Пирсона и Чупрова

Существуют различные подходы к определению данных коэффициентов. Один из подходов основан на использовании c 2 — критерия Пирсона.

, (60)

, ( 61 )

где k 1 — число строк в таблице;

k 2 — число граф в таблице;

n — число наблюдений.

Критерий c 2 определяется по формуле

, (62)

где n i – суммы показателей по строкам;

n j — суммы показателей по столбцам;

n ij — показатель, находящийся на пересечении i – ой строки и j – столбца.

Оба коэффициента изменяются в пределах от 0 дот 1.

Методика аналиа наличия связи с использованием коэффициентов Пирсона и Чупрова заключается в следующем:

— если оба коэффициента ³ 0,3 то связь имеется;

— чем ближе значения коэффициентов к 1 , тем теснее связь;

— если оба коэффициента £ 0,3 то связь отсутствует;

— если К П > 0,3 , а К Ч ориентируемся на значение коэффициента Чупрова, так как он учитывает размерность таблицы и более точен.

Пример. С помощью коэффициента взаимной сопряженности исследовать связь между вопросом об увеличении учебной нагрузки по специальным дисциплинам и увеличением (таблица 29).

Таблица 29 — Данные опросов студентов ВУЗа

Следует ли увеличить учебную нагрузку по спец. дисц.? Из них студентов Всего ответило (чел)
2- го курса 4-го курса дипломники
1.Да 2. Затрудняюсь ответить 3. Нет
Итого

По данным таблицы 29 получены следующие результаты

.

Вывод. Связь между ответами на вопрос и курсом, на котором обучаются студенты достаточно тесная. Можно также предположить, что чем старше студенты, тем более они заинтересованы в увеличении учебной нагрузки по специальным дисциплинам.

Следующая группа коэффициентов, а именно коэффициенты Спирмена (r) и коэффициент множественной корреляции, называемый также коэффициентом конкордации (W) связаны с понятием ранжирование.

Определение коэффициентов взаимосвязи на основе ранжирования статистических данных

Ранжирование — это процедура упорядочения объектов изучения, которая выполняется на основе признака предпочтения.

Ранг — это порядковый номер значений признака, расположенных в порядке возрастания или убывания их величин. Если значения признака имеют одинаковую количественную оценку, то ранг всех этих значений принимается равным средней арифметической от соответствующих номеров мест, которые они определяют. Данные ранги называют связными.

Читайте также:  Закон xii таблиц литература

Пример.Проранжировать предприятия автомобильной промышленности одного из регионов по величине балансовой прибыли ( таблица 30).

Таблица 30 — Балансовая прибыль предприятий автомобильной промышленности одного из регионов в 1998 г. ( цифры условные)

№ предприятия Балансовая прибыль, млн. руб. Ранжирование ( ранги)
6,5 6,5

Наиболее предпочтительному предприятию, величина балансовой прибыли которого наибольшая, присваивается ранг «1»; затем в порядке уменьшения величины балансовой прибыли были проранжированы все рассматриваемые предприятия.

Коэффициент Спирмена (r) рассчитывается по формуле

, (63)

Источник

Расчет коэффициентов Пирсона и Чупрова

Зависимость ориентирования на моду от рода деятельности опрошенных исследуем при помощи коэффициентов взаимной сопряженности Пирсона и Чупрова, предварительно занеся данные в таблицу.

Род деятельности Ориентация на моду Всего
да нет иногда
Учащийся
Руководитель
Рабочий
Специалист
Безработный
Итого:

По данным таблицы можно построить диаграмму, которая сделает полученные данные более понятными.

Полученные значения коэффициентов показывают, что зависимость стиля одежды от рода деятельности опрошенных низкая. Это можно объяснить тем, что каждый человек имеет свой вкус и меняет стиль одежды в зависимости от ситуации.

Стоимость Рынки Магазины, ТЦ Итого:
1000-3000
3000 и более
Итого:

Расчет показателей вариации

Расчет показателей вариации проведем на основе денежных сумм, которые готовы потратить опрошенные за одно посещение магазина.

5.1 Расчет абсолютных показателей вариации

Таблица 5.1 – Группировка стоимости одежды

Номер группы Группы цен, р. Количество опрошенных, чел
единиц % к итогу
I 1000 — 2400
II 2400 — 3800
III 3800 — 5200
IV 5200 — 6600
V 6600 — 8000
Итого:

Мода определяется по следующей формуле:

Подстановкой значений получаем:

Медиана определяется по следующей формуле:

Подстановкой значений получаем:

Размах вариации определяется по следующей формуле:

Подстановкой значений получаем:

R = 8000 – 1000 = 7000 р.

Средняя арифметическая стоимость определяется по следующей формуле:

Подстановкой значений получаем:

Читайте также:  Из чего состоит зарплата учителя

Середины интервалов определяются по следующей формуле:

Подстановкой значений получаем:

Среднее линейное отклонение определяется по следующей формуле:

Подстановкой значений получаем:

Дисперсия определяется по следующей формуле:

Подстановкой значений получаем:

Среднее квадратичное отклонение определяется по следующей формуле:

Подстановкой значений получаем:

Для определения однородности совокупности сравним среднее квадратичное отклонение с одной третьей средней арифметической стоимости:

Так как среднее квадратичное отклонение больше, то совокупность является неоднородной.

5.2 Расчет относительных показателей вариации

Источник



Коэффициент взаимной сопряженности Чупрова и Пирсона

СТАТИСТИЧЕСКОЕ ИЗУЧЕНИЕ ВЗАИМОСВЯЗИ

Исследование объективно существующих связей между явлениями -важнейшая задача теории статистики . Статистика разработала множество методов изучения связей, выбор которых зависит от поставленных задач. Связи между явлениями ввиду их большого разнообразия классифицируются по ряду оснований. Признаки по их значению для изучения взаимосвязи делятся на два класса.

Факторные (факторы) – это такие признаки, которые оказывают влияние и вызывают изменение других, связанных с ними признаков. Признаки, которые меняются под влиянием факторных, называются результативными.

Существует два основных вида связей:

Функциональные связи являются точными и полными. Это такие связи, когда каждому значению факторного признака соответствует единственное значение результативного признака. Выражаются эти связи в виде формулы.

Например, зависимость площади круга от его диаметра:

Здесь R – факторный признак, S – результативный.

Такие связи в общественной жизни, экономике встречаются крайне редко.

В массовых общественных явлениях проявляются зависимости распределения результативного признака в зависимости от одного или нескольких признаков-факторов. Такие связи называются стохастическими .

Частным случаем стохастических связей являются связи корреляционные, когда под действием одного или нескольких признаков-факторов меняется среднее значение результативного признака.

Особенностью корреляционных связей является то, что эти связи требуют массовых наблюдений и являются неполными.

Различают следующие виды связей:

1) в зависимости от направления действия различают связи прямые (прямопропорциональная зависимость) и обратные (обратно-пропорциональная зависимость);

2) по аналитическому выражению различают связи прямолинейные и криволинейные .

Прямолинейные – это такие связи, когда величина результативного признака меняется равномерно под влиянием признака-фактора.

Читайте также:  Вишн вый сад драма или комедия по пьесе А П Чехова

3) в зависимости от количества выбранных факторов различают связи однофакторные (парные) и многофакторные , когда факторов два и более.

Измерение тесноты связи между атрибутивным признаками

В статистической практике приходится сталкиваться с задачами измерения связи между качественными признаками. Для этого статистической наукой разработаны методы, которые называются непараметрическими .

Источник

Коэффициент контингенции

Коэффициент контингенции формула

Пример . Получено выборочное распределение отношения респондентов к покупке товара «А» в зависимости от пола. Результаты приведены в таблице:

мужчина женщины ni*
купили 35 15 50
не купили 10 30 40
n*j 45 45 90

Получено выборочное распределение признака «А» в зависимости от B. Результаты приведены в таблице:
Для проверки независимости признаков «A» и «B» проверяем нулевую гипотезу Н:(pij = pi*p*j для всех i, j). Вычислим статистику χ 2 набл по формуле:

где nij – наблюдаемые частоты.
Если значение χ 2 набл попало в критическую область: χ 2 > χ 2 крит(α ; v=1), нулевая гипотеза отвергается с вероятностью ошибки α и признаки считаются зависимыми.
В этом случае имеет смысл измерить полученную связь между X и Y с помощью коэффициентов связи (сопряженности).
Рассчитаем теоретические частоты по формуле: для всех клеток таблицы

Получим таблицу сопряженности теоретических частот распределения:

A1 A2 ni*
P1 25 25 50
P2 20 20 40
n*j 45 45 90

Вычислим статистику χ 2 :

По таблице χ 2 -распределения находим:
χ 2 крит(0.05;1) = 3.84146
где v = (r-1)(s-1) = (2-1)(2-1) = 1 — число степеней свободы.
Критическая область имеет вид χ 2 > χ 2 крит. Так как вычисленное значение хи-квадрат попадает в критическую область, то гипотеза о независимости отвергается с вероятностью ошибки 0,05.
Воспользуемся критерием χ 2 *

Сравнив χ 2 * с χ 2 крит, 16.245>3.84146 отвергаем гипотезу о независимости.

Определим силу связи по коэффициентам сопряженности.
Коэффициент ассоциации:

Коэффициент контингенции

Коэффициент φ (Коэффициент Чупрова-Крамера)

τ-коэффициент (коэффициент Гудмена-Краскала):

Коэффициент сопряженности Пирсона:

Таким образом, связь между желанием приобрести товар «А» и полом средняя.

Источник