Меню

Элементы математической статистики Статистическое распределение выборки



Статистическим распределением выборки.

Лекция 2. Статистические ряды распределения.

Цели и задачи изучения темы

изучить понятия статистического ряда распределения, вариационного ряда распределения (дискретного/интервального); исследовать статистическое распределение выборки; определять величины интервала; изучить статистическую таблицу и графические способы изображения статистических данных.

1 .Понятие статистического ряда распределения, вариационного ряда распределения (дискретного/интервального).

2. Статистическое распределение выборки.

3. Определение величины интервала. Формула Стерджесса.

4. Статистическая таблица (подлежащее статистической таблицы, сказуемое статистической таблицы, групповая таблица, комбинационная таблица, простая таблица, сложная таблица).

5. Графический способ изображения статистических данных.

Понятие статистического ряда распределения, вариационного ряда распределения (дискретного/интервального).

Результаты сводки и группировки материалов статистического наблюдения оформляются в виде статистических рядов распределения.

Статистический ряд распределения представляет собой упорядоченное расположение единиц изучаемой совокупности по какому-либо признаку.

Ряды распределения, образованные по атрибутивному признаку, называют атрибутивными.

Вариационные ряды распределения — ряды распределения, образованные по количественному признаку. Вариационный ряд предполагает расположение единиц совокупности в порядке возрастания (или убывания) значений признака.

Отдельное значение варьируемого признака, которое он принимает в вариационном ряду, называется вариантой. Численности отдельных вариант или групп вариационного ряда, показывающие, как часто встречаются те или иные варианты в ряду распределения, называют частотами.

Пусть требуется изучить генеральную совокупность относительно некоторого количественного признака (показателя) X. Извлечем из генеральной совокупности выборку. При этом оказалось, что значение случайной величины X, равное x 1, наблюдалось п 1 раз, значение х 2 — п 2 раз, . х k — n k раз. Объем выборки —

Наблюдаемые значения x i есть варианты, а последовательность вариант, записанных в возрастающем порядке, есть вариационный ряд. Числанаблюдений n i, есть частоты, а их отношение к объему выборки — относительные частоты.

Вариационные ряды распределения подразделяются на дискретные и интервальные.

Дискретными называются вариационные ряды, в которых значения признаков, положенных в основу их образования, являются дискретными и часто выражены целыми числами. Примерами дискретных вариационных рядов являются распределение рабочих по тарифному разряду; распределение отделов по числу работников и т.п.

Дискретные ряды распределения строятся по дискретным признакам, которые варьируются в ограниченных пределах.

Дискретный ряд распределения обычно оформляется в виде статистического распределения выборки.

Статистическим распределением выборки.

Статистическим распределением выборкиназывают перечень вариант и соответствующих им частот (или относительных частот).

Статистическое распределение выборки можно задать в виде таблицы, в первой графе которой располагаются варианты , а во второй — соответствующие этим вариантам частоты n i, или относительные частоты P i .

Статистическое распределение выборки

Варианты х i x 1 x 2 x 3 x i x k
Число наблюдений (частота) ni n 1 n 2 n 3 n i n k
Относительная частота Pi P 1 P 2 P 3 P i P k

Интервальными называются вариационные ряды, в которых значения признаков, положенных в основу их образования, выражены в определенных пределах (интервалах). Частоты в этом случае относятся, не к отдельным значениям признака, а ко всему интервалу.

Интервальные ряды распределения строятся по непрерывным количественным признакам, а также по дискретным признакам, варьирующим в значительных пределах.

Интервальный ряд можно представить статистическим распределением выборки с указанием интервалов и соответствующих им частот. При этом в качестве частоты интервала принимают сумму частот вариант, попавших в этот интервал.

При группировке по количественным непрерывным признакам важное значение имеет определение размера интервала.

3. Определение величины интервала. Формула Стерджесса.

Величина интервала — разность между наибольшим и наименьшим значениями признака в каждой группе, называемыми границами интервала.

Интервалы групп могут быть равными и неравными. Интервалы устанавливаются в зависимости от характера распределения единиц совокупности по данному признаку. Если вариация (изменение) признака проявляется в сравнительно узких границах и распределение носит более или менее равномерный характер, то целесообразно устанавливать равные интервалы. В этом случае величину интервала определяют по формуле:

где х тах , х т1п — соответственно максимальное и минимальное значения признака в ряду;

к -число интервалов (групп).

Часто строят ряды с равновеликими интервалами. При построении вариационного ряда с равными интервалами определяют число групп (к) и величину интервала ( h).

Оптимальное число групп (интервалов) может быть определено по формулеСтерджесса:

где n — число единиц совокупности.

Сами интервалы могут быть закрытыми(с указанием нижней и верхней границ) и открытыми(с указанием лишь одной из границ интервала).

При количественных группировках следует обращать внимание на правильное обозначение нижней и верхней границ интервала. При образовании интервалов по дискретным признакам это достигается посредством обозначения верхней и нижней границ смежных интервалов значениями признаков, отличных на единицу.

При построении интервальных вариационных рядов по непрерывным признакам необходимо указать, в какой интервал входит значение признака, являющегося границей смежных интервалов. То есть для устранения неопределенности необходимо решить вопрос о том, считать ли верхние границы каждой группы «включительно» или «исключительно».

Читайте также:  Мифы и легенды Др Греции и Рима в живописи Часть 2 Зевс

После того как в результате сводки, материал статистического наблюдения сгруппирован, он, как правило, представляется в виде таблиц.

4. Статистическая таблица (подлежащее статистической таблицы, сказуемое статистической таблицы, групповая таблица, комбинационная таблица, простая таблица, сложная таблица).

Статистическая таблица — форма наиболее рационального, наглядного и систематического изложения числовых результатов сводки и группировки статистических, материалов в виде ряда строк и столбцов. Основными элементами статистической таблицы являются подлежащее и сказуемое.

Подлежащее статистической таблицы — объекты изучения или перечень групп совокупности, характеризуемые цифровыми данными.

Сказуемое статистической таблицы — это цифровые показатели, которые характеризуют изучаемый объект. Сказуемое таблицы отражает то, что в ней говорится о подлежащем с помощью цифровых данных.

В зависимости от характера построения подлежащего различают простые, групповые и комбинационные таблицы.

Простой называется таблица, в подлежащем которой содержится перечень объектов наблюдения, например перечень работников предприятия.

Групповойназывается таблица, в подлежащем которой объекты наблюдения разгруппированы по одному признаку, например по профессиям работников предприятия. Комбинационной называется таблица, в подлежащем которой объекты наблюдения разгруппированы по двум и более признакам в комбинации, например, по категориям работников, в том числе и по полу.

По структуре сказуемого различают простые и сложные таблицы.

Простая таблицапредусматривает разработку показателей, характеризующих изучаемые объекты независимо друг от друга.

Сложная таблица предусматривает разработку показателей, характеризующих изучаемые объекты в комбинации.

Например, при характеристике объема перевозок в сказуемом таблицы можно дать перечень признаков, характеризующих объем перевозок по типам тяги и по видам движения. Это будет таблица с простой разработкой сказуемого.

Можно построить таблицу, сказуемое которой будет содержать перечень признаков по типам тяги и в том числе по видам движения. Это будет таблица со сложной разработкой сказуемого.

Наряду с таблицами, для наглядного изображения данных наблюдения и сводки, в статистике используются графики.

Источник

Статистическое распределение выборки

Глава 5 МАТЕМАТИЧЕСКАЯ СТАТИСТИКА

Математическая статистика – раздел математики, в котором изучаются методы сбора, систематизации и обработки результатов наблюдений массовых случайных явлений для выявления существующих закономерностей. В математической статистике решаются две категории задач: оценивание и статистическая проверка гипотез. Первая задача разделяется на точечное оценивание и интервальное оценивание параметров распределения. Вторая задача заключается в том, что мы делаем предположение о распределении вероятностей случайной величины и решаем, согласуются ли эти значения параметров с полученными результатами наблюдения.

Совокупность всех подлежащих изучению объектов или возможных результатов наблюдений, проводимых в неизменных условиях над одним объектом, называется генеральной совокупностью.

Выборочной совокупностью (выборкой) называется совокупность объектов, отобранных случайным образом из генеральной совокупности. Число объектов в совокупности называется ее объемом. Считается, что объем генеральной выборки бесконечен. Конкретные значения выборки, полученные в результате наблюдений, называют реализацией выборки и обозначают Выборки разделяются на повторные (с возвращением) и бесповторные (без возвращения). Выборка должна достаточно полно отражать особенности всех объектов генеральной совокупности, т.е. выборка должна быть репрезентативной.

Выборки различаются по способу отбора:

1) Простой случайный выбор – все элементы генеральной совокупности нумеруются и их таблицы случайных чисел берут, например, последовательность любых 30-ти идущих подряд чисел.

2) Типический отбор – производится тогда, когда генеральную совокупность можно представить в виде объединения подмножеств, состоящих из однородных объектов.

3) Механический – отбирают каждый сотый интервал.

4) Серийный отбор.

Статистическое распределение выборки

Пусть изучается случайная величина, над ней производится ряд независимых опытов. Величина принимает то или иное значение. Пусть она приняла раз значение , раз – значение ,…, раз – значение . При этом

объем выборки. Значения называются вариантами случайной величины . Всю совокупность значений случайной величины необходимо ранжировать – расположить признаки по неубыванию. Полученная последовательность называется вариационным рядом. Числа , показывающие сколько раз встречаются варианты в ряде наблюдений, называются частотами, а отношение их к объему выборки – частостями или относительными частотами , т.е.

где . (1)

Перечень вариантов и соответствующих им частот (или частостей) называется статистическим распределением выборки или статистическим рядом.

Пример 1: В результате тестирования группа из 10 абитуриентов набрала баллы: 5,3,0,1,4,2,5,4,1,5. Записать выборку в виде: вариационного ряда, статистического ряда.

Решение: а) проранжируем данные, получим вариационный ряд (0,1,1,2,3,4,4,5,5,5);

Источник

Виды таблиц статистического распределения выборки

1. Статистическое дискретное распределение. Полигон.
Пусть из генеральной совокупности извлечена выборка, причем х1 наблюдалось n1 раз, х2 – n2 раз, хk – nk раз и ∑ni=n — объем выборки. Наблюдаемые значения х1 называют вариантами, а последовательность вариант, записанных в возрастающем порядке – вариационным рядом. Число наблюдений варианты называют частотой, а ее отношение к объему выборки — относительной частотой ni/n=wi

Читайте также:  Онлайн калькулятор по определению допускаемых напряжений материалов сталей и сплавов алюминия меди и титана

ОПРЕДЕЛЕНИЕ. Статистическим (эмпирическим) законом распределения выборки, или просто статистическим распределением выборки называют последовательность вариант хi и соответствующих им частот ni или относительных частот wi.

Статистическое распределение выборки удобно представлять в форме таблицы распределения частот, называемой статистическим дискретным рядом распределения:

x1 x2 . xm
n1 n2 . nm

(сумма всех частот равна объему выборки ∑ni=n)
или в виде таблицы распределения относительных частот:

x1 x2 . xm
w1 w2 . wm

(сумма всех относительных частот равна единице ∑wi=1)

Пример 1. При измерениях в однородных группах обследуемых получены следующие выборки: 71, 72, 74, 70, 70, 72, 71, 74, 71, 72, 71, 73, 72, 72, 72, 74, 72, 73, 72, 74 (частота пульса). Составить по этим результатам статистический ряд распределения частот и относительных частот.

Решение. 1) Статистический ряд распределения частот:

xi 70 71 72 73 74
ni 2 4 8 2 4

2) Объем выборки: n=2+4+8+2+4=20. Найдем относительные частоты, для чего разделим частоты на объем выборки ni/n=wi: wi=2/20=0.1; w2=4/20=0.2; w3=0.4; w4=4/20=0.1; w5=2/20=0.2. Напишем распределение относительных частот:

xi 70 71 72 73 74
wi 0.1 0.2 0.4 0.1 0.2

Полигоном частот называют ломаную, отрезки, которой соединяют точки (х1,n1),(х2,n2). (хk,nk). Для построения полигона частот на оси абсцисс откладывают варианты х2, а на оси ординат – соответствующие им частоты ni. Точки (хi,ni) соединяют отрезками и получают полигон частот.

Полигоном относительных частот называют ломаную, отрезки, которой соединяют точки (х1,w1),(х2,w2). (хk,wk). Для построения полигона относительных частот на оси абсцисс откладывают варианты хi, а на оси ординат соответствующие им частоты wi. Точки (хi,wi) соединяют отрезками и получают полигон относительных частот.

Пример 2. Постройте полигон частот и относительных частот по данным примера 1.
Решение: Используя дискретный статистический ряд распределения, составленный в примере 1 построим полигон частот и полигон относительных частот:

2. Статистический интервальный ряд распределения. Гистограмма. Статистическим дискретным рядом (или эмпирической функцией распределения) обычно пользуются в том случае, когда отличных друг от друга вариант в выборке не слишком много, или тогда, когда дискретность по тем или иным причинам существенна для исследователя. Если же интересующий нас признак генеральной совокупности Х распределен непрерывно или его дискретность нецелесообразно ( или невозможно) учитывать, то варианты группируются в интервалы.

Статистическое распределение можно задать также в виде последовательности интервалов и соответствующих им частот (в качестве частоты, соответствующей интервалу, принимают сумму частот, попавших в этот интервал).

Замечание. Часто hi-hi-1=h при всех i, т.е. группировку осуществляют с равным шагом h. В этой ситуации можно руководствоваться следующими эмперическими рекомендациями по выборке а, k и hi:

1. Rразмах=Xmax-Xmin
2. h=R/k; k-число групп
3. k≥1+3.321lgn (формула Стерджеса)
4. a=xmin, b=xmax
5. h=a+ih, i=0,1. k

Полученную группировку удобно представить в форме частотной таблицы, которая носит название статистический интервальный ряд распределения:

Интервалы группировки [h;h1) [h1;h2) . [hk-2;hk-1) [hk-1;hk)
Частоты n1 n2 . nk-1 nk

Аналогическую таблицу можно образовать, заменяя частоты ni относительными частотами:

Интервалы группировки [h;h1) [h1;h2) . [hk-2;hk-1) [hk-1;hk)
Отн. частоты w1 w2 . wk-1 wk

Пример 3. Из очень большой партии деталей извлечена случайная выборка объема 50 интересующий нас признак Х-размеры деталей, измеренные с точностью до 1см, представлен следующим вариоционным рядом: 22, 47, 26, 26, 30, 28, 28, 31, 31, 31, 32, 32, 33, 33, 33, 33, 34, 34, 34, 34, 34, 35, 35, 36, 36, 36, 36, 36, 37, 37, 37, 37, 37, 37, 38, 38, 40, 40, 40, 40, 40, 41, 41, 43, 44, 44, 45, 45, 47, 50. Найти статистический интервальный ряд распределения.

Решение. Определим характеристики группировки с помощью замечания.
k≥1+3.321lg50=1+3.32lg(5•10)=1+3.32(lg5+lg10)=6.6
Имеем, a=22, k=7, h=(50-22)/7=4, hi=22+4i, i=0,1,…,7.

Интервалы группировки 22-26 26-30 30-34 34-38 38-42 42-46 46-50
Частоты ni 1 4 10 18 9 5 3
Отн.частоты wi 0.02 0.08 0.2 0.36 0.18 0.1 0.06

Десятичные логарифмы от 1 до 10

n 1 2 3 4 5 6 7 8 9 10
lnn 0.3 0.48 0.6 0.7 0.78 0.85 0.9 0.95 1

Наиболее информативной графической формой частот является специальный график, называемы гистограммой частот.

Гистограммой частот называют ступенчатую фигуру, состоящую из прямоугольников, основаниями которых служат частичные интервалы длиною h, а высоты равны отношению ni/h (плотность частоты).

Для построения гистограммы частот на оси абсцисс откладывают частичные интервалы, а над ними проводят отрезки, параллельные оси абсцисс на расстоянии ni/h. Площадь i-го частичного прямоугольника равна h•ni/h=ni — сумме частот вариант i-го интервала; следовательно, площадь гистограммы частот равна сумме всех частот, т.е. объему выборки.

Читайте также:  Проверка древнекитайской таблицы планирования пола реб нка

Гистограммой относительных частот называют ступенчатую фигуру, состоящую из прямоугольников, основаниями которых служат частичные интервалы длиною h, а высоты равны отношению wi/h (плотность относительной частоты).

Для построения гистограммы относительных частот на оси абсцисс откладывают частичные интервалы, а над ними проводят отрезки, параллельные оси абсцисс на расстоянии wi/h. Площадь i-го частичного прямоугольника равна h•wi/h=wi — относительной частоте вариант, попавших в i-й интервал. Следовательно, площадь гистограммы относительных частот равна сумме всех относительных частот, т.е. единице.

Пример 4. Постройте гистограмму частот и относительных частот по данным примера 3.

Выборочная медиана – это середина вариационного ряда, значение, расположенное на одинаковом расстоянии от левой и правой границы выборки.

Выборочная мода – это наиболее вероятное, т.е. чаще всего встречающееся, значение в выборке.

Источник

Элементы математической статистики. Статистическое распределение выборки

Элементы математической статистики. Статистическое распределение выборки
  1. Услуги проектирования
  2. Теория вероятности [Калинин В.М., Тихомиров С.Р.]
  3. Элементы математической статистики. Статистическое распределение выборки

Элементы математической статистики. Статистическое распределение выборки

Элементы математической статистики

Математическая статистика изучает массовые случайные явления методами теории вероятностей. Отличие вероятности от статистики в том, что вероятность есть модель, свойства которой изучаются.

На практике мы имеем ряд данных и по этим данным надо подобрать подходящую модель и уже по подобранной модели можно посчитать вероятностные характеристики. Термин «статистика» имеет несколько смысловых значений:

  1. Совокупность показателей характеризующих процесс,
  2. Совокупность приёмов сбора информации,
  3. Совокупность приёмов обработки информации,
  4. Разработка новых методов обработки информации.

Мы будем изучать статистику только в смысле термина «3». Выделим основные приёмы математической статистики.

  1. Оценка неизвестной функции распределения.
  2. Оценка параметров распределения.
  3. Проверка статистических гипотез.
  4. Корреляционный анализ.

Статистическое распределение выборки

В статистике применяются уже известные нам термины: генеральная совокупность, выборка. Выборка должна быть представительной или репрезентативной < т. е. отражать набор данных >.

Установление статистических закономерностей основано на изучении статистических данных — сведений о том, какие значения принял в результате наблюдений интересующий нас признак < случайная величина Х >.

Различные значения признака случайной величины называются вариантами.

Опр Последовательность вариантов, записанная в возрастающем порядке, называется вариационным рядом.

Вариационный ряд называется дискретным, если любые его варианты отличаются на постоянную величину и — непрерывным , если варианты могут отличаться один от другого на сколь угодно малую величину.

Пусть из генеральной совокупности извлечена выборка, причём

$x_1-$ наблюдалоcь $n_1$ раз

$x_2-$ наблюдалось $n_2$ раз

$x_3-$ наблюдалось $n_3$ раз

$x_k-$ наблюдалось $n_k$ раз и

$\sum < n_i =n >-$ объему выборки

$n_1 ,n_2 . n_k -$ числа наблюдений называемые абсолютными частотами.

$x_1 ,x_2 . x_k -$ наблюдаемые значения называемые вариантами.

Отношения $n_1 ,n_2 . n_k$ к объёму выборки называются относительными < эмпирическими >частотами $ W_i =\frac < n_i > < n >$

Определение Статистическим распределением выборки называется перечень вариантов и соответствующих им частот или относительных частот, представленных в виде таблицы.

Задать статистическое распределение можно в виде последовательности интервалов и соответствующих им частот.

Замечание В качестве частоты, соответствующей интервалу, принимают сумму частот, попавших в этот интервал.

Пример. Имея конкретную выборку: 2, 6, 12, 6, 6, 2, 6,12, 12, 6, 6, 6, 12, 12, 6, 12, 2, 6, 12, 6 (n=20), записать вариационный ряд и таблицу статистического распределения выборки.

Решение. Составим вариационный ряд — запишем варианты в возрастающем порядке 2, 2, 2, 6, 6, 6, 6, 6, 6, 6, 6, 6, 6, 12, 12, 12, 12, 12, 12, 12.

Статистическое распределение выборки

\begin < |l|l|l|l| >\hline Варианты& 2& 6& 12 \\ \hline Абсолютные

частоты — n_i & 3& 10& 7 \\ \hline Относительные

W_i =\frac < n_i > < n >& \frac < 3 > < 20 >& \frac < 10 > < 20 >& \frac < 7 > < 20 >\\ \hline \end

Далее:

Односторонние и двусторонние поверхности. Ориентация поверхности

Теорема об алгоритме распознавания полноты

Теорема о полныx системаx в Pk

Поверхностный интеграл первого рода и его свойства

Теорема об аналоге СДНФ в Pk

Выражение площади плоской области через криволинейный интеграл

Вычисление площади поверхности

Определение двойного интеграла

Формула Грина

Вычисление криволинейного интеграла первого рода. Примеры

Решение задач с помощью алгебры высказываний

Механические и физические приложения поверхностного интеграла первого рода

Криволинейный интеграл первого рода

Формула Гаусса — Остроградского

Огравление $\Rightarrow $

Источник