Построение интервального вариационного ряда для непрерывных количественных данных. Построение дискретного вариационного ряда

Группировка – это разбиение совокупности на группы, однородные по какому-либо признаку.

Назначение сервиса . С помощью онлайн-калькулятора Вы сможете:

  • построить вариационный ряд , построить гистограмму и полигон;
  • найти показатели вариации (среднюю, моду (в т.ч. и графическим способом), медиану, размах вариации, квартили, децили, квартильный коэффициент дифференциации, коэффициент вариации и другие показатели);

Инструкция . Для группировки ряда необходимо выбрать вид получаемого вариационного ряда (дискретный или интервальный) и указать количество данных (количество строк). Полученное решение сохраняется в файле Word (см. пример группировки статистических данных).

Количество исходных данных
",0);">

Если группировка уже осуществлена и заданы дискретный вариационный ряд или интервальный ряд , то необходимо воспользоваться онлайн-калькулятором Показатели вариации . Проверка гипотезы о виде распределения производится с помощью сервиса Изучение формы распределения .

Виды статистических группировок

Вариационный ряд . В случае наблюдений дискретной случайной величины одно и то же значение можно встретить несколько раз. Такие значения x i случайной величины записывают с указанием n i числа раз его появления в n наблюдениях, это и есть частота данного значения.
В случае непрерывной случайной величины на практике применяют группировку.
  1. Типологическая группировка – это разделение исследуемой качественно разнородной совокупности на классы, социально–экономические типы, однородные группы единиц. Для построения данной группировки используйте параметр Дискретный вариационный ряд.
  2. Структурной называется группировка , в которой происходит разделение однородной совокупности на группы, характеризующие ее структуру по какому–либо варьирующему признаку. Для построения данной группировки используйте параметр Интервальный ряд.
  3. Группировка, выявляющая взаимосвязи между изучаемыми явлениями и их признаками, называется аналитической группировкой (см. аналитическая группировка ряда).

Принципы построения статистических группировок

Ряд наблюдений, упорядоченных по возрастанию, называется вариационным рядом . Группировочным признаком называется признак, по которому производится разбивка совокупности на отдельные группы. Его называют основанием группировки. В основание группировки могут быть положены как количественные, так и качественные признаки.
После определения основания группировки следует решить вопрос о количестве групп, на которые надо разбить исследуемую совокупность.

При использовании персональных компьютеров для обработки статистических данных группировка единиц объекта производится с помощью стандартных процедур.
Одна из таких процедур основана на использовании формулы Стерджесса для определения оптимального числа групп:

k = 1+3,322*lg(N)

Где k – число групп, N – число единиц совокупности.

Длину частичных интервалов вычисляют как h=(x max -x min)/k

Затем подсчитывают числа попаданий наблюдений в эти интервалы, которые принимают за частоты n i . Малочисленные частоты, значения которых меньше 5 (n i < 5), следует объединить. в этом случае надо объединить и соответствующие интервалы.
В качестве новых значений вариант берут середины интервалов x i =(c i-1 +c i)/2.

Лабораторная работа №1

По математической статистике

Тема: Первичная обработка экспериментальных данных

3. Оценка в баллах. 1

5. Контрольные вопросы.. 2

6. Методика выполнения лабораторной работы.. 3

Цель работы

Приобретение навыков первичной обработки эмпирических данных методами математической статистики.

На основе совокупности опытных данных выполнить следующие задания:

Задание 1. Построить интервальный вариационный ряд распределения.

Задание 2. Построить гистограмму частот интервального вариационного ряда.

Задание 3. Составить эмпирическую функцию распределения и построить график.

а) моду и медиану;

б) условные начальные моменты;

в) выборочную среднюю;

г) выборочную дисперсию, исправленную дисперсию генеральной совокупности, исправленное среднее квадратичное отклонение;

д) коэффициент вариации;

е) асимметрию;

ж) эксцесс;

Задание 5. Определить границы истинных значений числовых характеристик, изучаемой случайной величины с заданной надёжностью.

Задание 6. Содержательная интерпретация результатов первичной обработки по условию задачи.

Оценка в баллах

Задания 1-5 6 баллов

Задание 6 2 балла

Защита лабораторной работы (устное собеседование по контрольным вопросам и лабораторной работе) - 2 балла

Работа сдается в письменной форме на листах формата А4 и включает:

1) Титульный лист (Приложение 1)

2) Исходные данные.

3) Представление работы по указанному образцу.

4) Результаты расчетов (выполненные вручную и/или с помощью MS Excel) в указанном порядке.

5) Выводы - содержательная интерпретация результатов первичной обработки по условию задачи.

6) Устное собеседование по работе и контрольным вопросам.



5. Контрольные вопросы


Методика выполнения лабораторной работы

Задание 1. Построить интервальный вариационный ряд распределения

Для того, чтобы статистические данные представить в виде вариационного ряда с равноотстоящими вариантами необходимо:

1.В исходной таблице данных найти наименьшее и наибольшее значения.

2.Определить размах варьирования :

3. Определить длину интервала h, если в выборке до 1000 данных, используют формулу: , где n – объем выборки – количество данных в выборке; для вычислений берут lgn).

Вычисленное отношение округляют до удобногоцелого значения .

4. Определить начало первого интервала для четного числа интервалов рекомендуют брать величину ; а для нечетного числа интервалов .

5. Записать интервалы группировок и расположить их в порядке возрастания границ

, ,………., ,

где - нижняя граница первого интервала. За берется удобное число не большее , верхняя граница последнего интервала должна быть не меньше . Рекомендуется, чтобы интервалы содержали в себе исходные значения случайной величины и выделять от 5 до 20 интервалов.

6. Записать исходные данные по интервалам группировок, т.е. подсчитать по исходной таблице число значений случайной величины, попадающих в указанные интервалы. Если некоторые значения совпадают с границами интервалов, то их относят либо только к предыдущему, либо только к последующему интервалу.

Замечание 1. Интервалы необязательно брать равными по длине. На участках, где значения располагаются гуще, удобнее брать более мелкие короткие интервалы, а там где реже - более крупные.

Замечание 2 .Если для некоторых значений получены “нулевые”, либо малые значения частот , то необходимо перегруппировать данные, укрупняя интервалы (увеличивая шаг ).

Лабораторная работа №1. Первичная обработка статистических данных

Построение рядов распределения

Упорядоченное распределение единиц совокупности на группы по какому-либо одному признаку называется рядом распределения . При этом признак может быть как количественным, тогда ряд называется вариационным , так и качественным, тогда ряд называют атрибутивным . Так, например, население города может быть распределено по возрастным группам в вариационный ряд, или по профессиональной принадлежности в атрибутивный ряд (конечно, можно предложить еще множество качественных и количественных признаков для построения рядов распределения, выбор признака определяется задачей статистического исследования).

Любой ряд распределения характеризуется двумя элементами:

- варианта (х i ) – это отдельные значения признака единиц выборочной совокупности. Для вариационного ряда варианта принимает числовые значения, для атрибутивного – качественные (например, х=«государственный служащий»);

- частота (n i ) – число, показывающее, сколько раз встречается то или иное значение признака. Если частота выражена относительным числом (т.е. долей элементов совокупности, соответствующих данному значению варианты, в общем объеме совокупности), то она называется относительной частотой или частостью .

Вариационный ряд может быть:

- дискретным , когда изучаемый признак характеризуется определенным числом (как правило целым).

- интервальным , когда определены границы «от» и «до» для непрерывно варьируемого признака. Интервальный ряд также строят если множество значений дискретно варьируемого признака велико.

Интервальный ряд может строиться как с интервалами равной длины (равноинтервальный ряд) так и с неодинаковыми интервалами, если это диктуется условиями статистического исследования. Например, может рассматриваться ряд распределения доходов населения со следующими интервалами: <5тыс р., 5-10 тыс р., 10-20 тыс.р., 20-50 тыс р., и т.д. Если цель исследования не определяет способ построения интервального ряда, то строится равноинтервальный ряд, число интервалов в котором определяется по формуле Стерджесса:



где k – число интервалов, n – объем выборки. (Конечно, формула обычно дает число дробное, а в качестве числа интервалов выбирается ближайшее целое к полученному число.) Длина интервала в таком случае определяется по формуле

.

Графически вариационные ряды могут быть представлены в виде гистограммы (над каждым интервалом интервального ряда выстраивается «столбик» высоты, соответствующей частоте в этом интервале), полигона распределения (ломаная линия, соединяющая точки (х i ;n i ) либо кумуляты (строится по накопленным частотам, т.е. для каждого значения признака берется частота появления в совокупности объектов со значением признака меньшим данного).

При работе в Excel для построения вариационных рядов могут быть использованы следующие функции:

СЧЁТ(массив данных ) – для определения объема выборки. Аргументом является диапазон ячеек, в котором находятся выборочные данные.

СЧЁТЕСЛИ(диапазон; критерий ) – может быть использована для построения атрибутивного или вариационного ряда. Аргументами являются диапазон массива выборочных значений признака и критерий – числовое или текстовое значение признака или номер ячейки, в которой оно находится. Результатом является частота появления этого значения в выборке.

ЧАСТОТА(массив данных; массив интервалов ) – для построение вариационного ряда. Аргументами являются диапазон массива выборочных данных и столбец интервалов. Если требуется построить дискретный ряд, то здесь указываются значения варианты, если интервальный – то верхние границы интервалов (их еще называют «карманами»). Поскольку результатом является столбец частот, введение функции следует завершить нажатием сочетания клавиш CTRL+SHIFT+ENTER. Заметим, что задавая массив интервалов при введении функции, последнее значение в нем можно и не указывать – в соответствующий «карман» будут помещены все значения, не попавшие в предыдущие «карманы». Иногда это помогает избежать ошибки, состоящей в том, что наибольшее выборочное значение не помещается автоматически в последний «карман»

Кроме того, для сложных группировок (по нескольким признакам) используют инструмент «сводные таблицы». Для построения атрибутивных и вариационных рядов их тоже можно использовать, но это излишне усложняет задачу. Также для построения вариационного ряда и гистограммы существует процедура «гистограмма» из надстройки «Пакет анализа» (чтобы использовать надстройки в Excel, их нужно сначала загрузить, по умолчанию они не устанавливаются)

Проиллюстрируем процесс первичной обработки данных на следующих примерах.

Пример 1.1 . имеются данные о количественном составе 60 семей.

Построить вариационный ряд и полигон распределения

Решение .

Откроем таблицы Excel. Введем массив данных в диапазон А1:L5. Если Вы изучаете документ в электронной форме (в формате Word, например), для этого достаточно выделить таблицу с данными и скопировать ее в буфер, затем выделить ячейку А1 и вставить данные – они автоматически займут подходящий диапазон. Подсчитаем объем выборки n – число выборочных данных, для этого в ячейку В7 введем формулу =СЧЁТ(А1:L5). Заметим, что для того, чтобы в формулу ввести нужный диапазон, необязательно вводить его обозначение с клавиатуры, достаточно его выделить. Определим минимальное и максимальное значение в выборке, введя в ячейку В8 формулу =МИН(А1:L5), и в ячейку В9: =МАКС(А1:L5).

Рис.1.1 Пример 1. Первичная обработка статистических данных в таблицах Excel

Далее, подготовим таблицу для построения вариационного ряда, введя названия для столбца интервалов (значений варианты) и столбца частот. В столбец интервалов введем значения признака от минимального (1) до максимального (6), заняв диапазон В12:В17. Выделим столбец частот, введем формулу =ЧАСТОТА(А1:L5;В12:В17) и нажмем сочетание клавиш CTRL+SHIFT+ENTER

Рис.1.2 Пример 1. Построение вариационного ряда

Для контроля вычислим сумму частот при помощи функции СУММ (значок функции S в группе «Редактирование» на вкладке «Главная»), вычисленная сумма должна совпасть с ранее вычисленным объемом выборки в ячейке В7.

Теперь построим полигон: выделив полученный диапазон частот, выберем команду «График» на вкладке «Вставка». По умолчанию значениями на горизонтальной оси будут порядковые числа - в нашем случае от 1 до 6, что совпадает со значениями варианты (номерами тарифных разрядов).

Название ряда диаграммы «ряд 1» можно либо изменить, воспользовавшись той же опцией «выбрать данные» вкладки «Конструктор», либо просто удалить.

Рис.1.3. Пример 1. Построение полигона частот

Пример 1.2 . Имеются данные о выбросах загрязняющих веществ из 50 источников:

10,4 18,6 10,3 26,0 45,0 18,2 17,3 19,2 25,8 18,7
28,2 25,2 18,4 17,5 41,8 14,6 10,0 37,8 10,5 16,0
18,1 16,8 38,5 37,7 17,9 29,0 10,1 28,0 12,0 14,0
14,2 20,8 13,5 42,4 15,5 17,9 19, 10,8 12,1 12,4
12,9 12,6 16,8 19,7 18,3 36,8 15,0 37,0 13,0 19,5

Составить равноинтервальный ряд, построить гистограмму

Решение

Внесем массив данных в лист Excel, он займет диапазон А1:J5 Как и в предыдущей задаче, определим объем выборки n, минимальное и максимальное значения в выборке. Поскольку теперь требуется не дискретный, а интервальный ряд, и число интервалов в задаче не задано, вычислим число интервалов k по формуле Стерджесса. Для этого в ячейку В10 введем формулу =1+3,322*LOG10(B7).

Рис.1.4. Пример 2. Построение равноинтервального ряда

Полученное значение не является целым, оно равно примерно 6,64. Поскольку при k=7 длина интервалов будет выражаться целым числом (в отличие от случая k=6) выберем k=7, введя это значение в ячейку С10. Длину интервала d вычислим в ячейке В11, введя формулу =(В9-В8)/С10.

Зададим массив интервалов, указывая для каждого из 7 интервалов верхнюю границу. Для этого в ячейке Е8 вычислим верхнюю границу первого интервала, введя формулу =B8+B11; в ячейке Е9 верхнюю границу второго интервала, введя формулу =E8+B11. Для вычисления оставшихся значений верхних границ интервалов зафиксируем номер ячейки В11 в введенной формуле при помощи знака $, так что формула в ячейке Е9 примет вид =E8+B$11, и скопируем содержимое ячейки Е9 в ячейки Е10-Е14. Последнее полученное значение равно вычисленному ранее в ячейке В9 максимальному значению в выборке.

Рис.1.5. Пример 2. Построение равноинтервального ряда


Теперь заполним массив «карманов» при помощи функции ЧАСТОТА, как это было сделано в примере 1.

Рис.1.6. Пример 2. Построение равноинтервального ряда

По полученному вариационном ряду построим гистограмму: выделим столбец частот и выберем на вкладке «Вставка» «Гистограмма». Получив гистограмму, изменим в ней подписи горизонтальной оси на значения в диапазоне интервалов, для этого выберем опцию «Выбрать данные» вкладки «Конструктор». В появившемся окне выберем команду «Изменить» для раздела «Подписи горизонтальной оси» и введем диапазон значений варианты, выделив его «мышью».

Рис.1.7. Пример 2. Построение гистограммы

Рис.1.8. Пример 2. Построение гистограммы

Дискретный вариационный ряд строится для дискретный признаков.

Для того, чтобы построить дискретный вариационный ряд нужно выполнить следующие действия: 1) упорядочить единицы наблюдения по возрастанию изучаемого значения признака,

2) определить все возможные значения признака x i , упорядочить их по возрастанию,

значением признака, i .

частота значения признака и обозначают f i . Сумма всех частот ряда равна количеству элементов в изучаемой совокупности.

Пример 1 .

Список оценок полученных студентами на экзаменах: 3; 4; 3; 5; 4; 2; 2; 4; 4; 3; 5; 2; 4; 5; 4; 3; 4; 3; 3; 4; 4; 2; 2; 5; 5; 4; 5; 2; 3; 4; 4; 3; 4; 5; 2; 5; 5; 4; 3; 3; 4; 2; 4; 4; 5; 4; 3; 5; 3; 5; 4; 4; 5; 4; 4; 5; 4; 5; 5; 5.

Здесь число Х – оценка является дискретной случайной величиной, а полученный список оценок - статистические (наблюдаемые) данные .

    упорядочить единицы наблюдения по возрастанию изучаемого значения признака:

2; 2; 2; 2; 2; 2; 2; 2; 3; 3; 3; 3; 3; 3; 3; 3; 3; 3; 3; 3; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5.

2) определить все возможные значения признака x i , упорядочить их по возрастанию:

В данном примере все оценки можно разделить на четыре группы со следующими значениями: 2; 3; 4; 5.

Значение случайной величины, соответствующее отдельной группе наблюдаемых данных, называют значением признака, вариантом (вариантой) и обознпчают x i .

Число, которое показывает, сколько раз встречается соответствующее значение признака в ряде наблюдений называют частота значения признака и обозначают f i .

Для нашего примера

оценка 2 встречается - 8 раз,

оценка 3 встречается - 12 раз,

оценка 4 встречается - 23 раза,

оценка 5 встречается - 17 раз.

Всего 60 оценок.

4) записать полученные данные в таблицу из двух строк (столбцов) - x i и f i .

На основании этих данных можно построить дискретный вариационный ряд

Дискретный вариационный ряд – это таблица, в которой указаны встречающиеся значения изучаемого признака как отдельные значения по возрастанию и их частоты

  1. Построение интервального вариационного ряда

Кроме дискретного вариационного ряда часто встречается такой способ группировки данных, как интервальный вариационный ряд.

Интервальный ряд строится если:

    признак имеет непрерывный характер изменения;

    дискретных значений получилось очень много (больше 10)

    частоты дискретных значений очень малы (не превышают 1-3 при относительно большем количестве единиц наблюдения);

    много дискретных значений признака с одинаковыми частотами.

Интервальный вариационный ряд – это способ группировки данных в виде таблицы, которая имеет две графы (значения признака в виде интервала значений и частота каждого интервала).

В отличие от дискретного ряда значения признака интервального ряда представлены не отдельными значениями, а интервалом значений («от - до»).

Число, которое показывает, сколько единиц наблюдения попало в каждый выделенный интервал, называется частота значения признака и обозначают f i . Сумма всех частот ряда равна количеству элементов (единиц наблюдения) в изучаемой совокупности.

Если единица обладает значением признака, равным величине верхней границы интервала, то ее следует относить к следующему интервалу.

Например, ребёнок с ростом 100 см попадёт во 2-ой интервал, а не в первый; а ребёнок с ростом 130 см попадёт в последний интервал, а не в третий.

На основании этих данных можно построить интервальный вариационный ряд.

У каждого интервала есть нижняя граница (х н), верхняя граница (х в) и ширина интервала (i ).

Граница интервала – это значение признака, которое лежит на границе двух интервалов.

рост детей (см)

рост детей (см)

количество детей

больше 130

Если у интервала есть верхняя и нижняя граница, то он называется закрытый интервал . Если у интервала есть только нижняя или только верхняя граница, то это – открытый интервал. Открытым может быть только самый первый или самый последний интервал. В приведённом примере последний интервал – открытый.

Ширина интервала (i ) – разница между верхней и нижней границей.

i = х н - х в

Ширина открытого интервала принимается такой же, как ширина соседнего закрытого интервала.

рост детей (см)

количество детей

Ширина интервала (i)

для расчётов 130+20=150

20 (потому что ширина соседнего закрытого интервала – 20)

Все интервальные ряды делятся на интервальные ряды с равными интервалами и интервальные ряды с неравными интервалами. В интервальных рядах с равными интервалами ширина всех интервалов одинаковая. В интервальных рядах с неравными интервалами ширина интервалов разная.

В рассматриваемом примере - интервальный ряд с неравными интервалами.

Во многих случаях, кота статистическая совокупность включает большое или тем более бесконечное число вариант, что чаще всего встречается при непрерывной вариации, практически невозможно и нецелесообразно формировать группу единиц для каждой варианты. В таких случаях объединение статистических единиц в группы возможно лишь на базе интервала, т.е. такой группы, которая имеет определенные пределы значений варьирующего признака. Эти пределы обозначаются двумя числами, указывающими верхнюю и нижнюю границы каждой группы. Применение интервалов приводит к формированию интервального ряда распределения.

Интервальный рад - это вариационный ряд, варианты которого представлены в виде интервалов.

Интервальный ряд может формироваться с равными инеравными ин­тервалами, при этом выбор принципа построения этого ряда зависит главным образом от степени представительности и удобности статистической совокупности. Если совокупность достаточно велика (представительна) по числу единиц и вполне однородна по своему составу, то в основу формирования интервального ряда целесообразно положить равенства интервалов. Обычно по этому принципу образуют интервальный ряд по тем совокупностям, где размах вариации сравнительно невелик, т.е. максимальная и минимальная варианты различаются между собой обычно в несколько раз. При этом величина равных интервалов рассчитывается отношением размаха вариации признака к заданному числу образуемых интервалов. Для определения равного и нтервала может быть ииспользована формула Стерджесса (обычно при небольшой вариации интервальных признаков и большом числе единиц в статистической совокупности):

где х i - величина равного интервала; X max, X min- максимальная и минимальная варианты в статистической совокупности; n. - число единиц в совокупности.

Пример . Целесообразно рассчитать размер равного интервала по плотности радиоактивного загрязнения цезием – 137 в 100 населенных пунктах Краснопольского района Могилевской области, если известно, что начальная (минимальная) варианта равна I км/км 2 , конечная (максимальная) - 65 ки/км 2 . Воспользовавшись формулой 5.1. получим:

Следовательно, чтобы сформировать интервальный ряд с равными интервалами по плотности загрязнения цезием - 137 населенных пунктов Краснопольского района, размер равного интервала может составить 8 ки/км 2 .

В условиях неравномерного распределения т.е. когда максимальная иминимальная варианты сотни раз, при формировании интервального ряда можно применить принцип неравных интервалов. Неравные интервалы обычно увеличиваются по мере перехода к большим значениям признака.

По форме интервалы могут быть закрытыми и открытыми. Закрытыми принято называть интервалы, у которых обозначены как нижняя, так и верхняя границы. Открытые интервалы имеют только одну границу: в первом интервале – верхняя, в последнем - нижняя граница.

Оценку интервальных рядов, особенно с неравным интервалами, целесообразно проводить с учетом плотности распределения , простейшим способом расчета которого является отношение локальной частоты (или частости) к размеру интервала.

Для практического формирования интервального ряда можно воспользоваться макетом табл. 5.3.

Т а б л и ц а 5.3. Порядок формирования интервального ряда населённых пунктов Краснопольского района по плотности радиоактивного загрязнения цезием –137

Основное преимущество интервального ряда - его предельная компактность. в то же время в интервальном ряду распределения индивидуальные варианты признака скрыты в соответствующих интервалах

При графическом изображении интервального ряда в системе прямоугольных координат на оси абсцисс откладывают верхние границы интервалов, на ос ординат - локальные частоты ряда. Графическое построение интервального ряда отличается от построения полигона распределения тем, что каждый интервал имеет нижнюю и верхнею границы, а одному какому- либо значению ординаты соответствуют две абсциссы. Поэтому на графике интервального ряда отмечается не точка, как в полигоне, а линия, соединяющая две точку. Эти горизонтальные линии соединяются друг с другом вертикальными линиями и получается фигура ступенчатого многоугольника, который принято называть гистограммой распределения (рис.5.3).

При графическом построении интервального ряда по достаточно большой статистической совокупности гистограмма приближается к симметричной форме распределения. В тех же случаях, где статистическая совокупность невелика, как правило, формируется асимметричная гистограмма.

В некоторых случаях имеется целесообразность в формировании ряда накопленных частот, т.е. кумулятивного ряда. Кумулятивный ряд можно образовать на основе дискретного либо интервального ряда распределения. При графическом изображении кумулятивного ряда в системе прямоугольных координат на оси абсцисс откладывают вариан­ты, на оси ординат - накопленные частоты (частости). Полученную при этом кривую линию принято называть кумулятой распределения (рис.5.4).

Формирование и графическое изображение различных видов вариационных рядов способствует упрощенному расчету основных статистических характеристик, которые подробно рассматриваются в теме 6, помогает лучше понять сущность законов распределения статистической совокупности. Анализ вариационного ряда приобретает особенное значение в тех случаях, когда необходимо выявить и проследить зависимость между вариантами и частотами (частостями). Эта зависимость проявляется в том, что число случаев, приходящихся на каждую варианту, определенным образом связано с величиной этой варианты, т.е. с возрастанием значений варьирующего признака частоты (частости) этих значений испытывают определенные, систематические изменения. Это означает, что числа в столбце частот (частостей) подвержены не хаотическим колебаниям, а изменяются в определенном направлении, в определенном порядке и последовательности.

Если частоты в своих изменениях обнаруживают определенную систематичность, то это означает, что мы находимся на пути к выявлению закономерности. Система, порядок, последовательность в изменении частот - это отражение общих причин, общих условий, характерных для всей совокупности.

Не следует считать, что закономерность распределения всегда дается в готовом виде. Встречается довольно много вариационных рядов, в которых частоты причудливо скачут, то возрастая, то уменьшаясь. В таких случаях целесообразно выяснить, с каким распределением имеет дело исследователь: то ли этому распределению вовсе не присущи закономерности, то его характер еще не выявлен: Первый случай встречается редко, второй же, второй же случай - явление довольно частое и весьма распространенное.

Так, при формировании интервального ряда общее число статистических единиц может быть небольшим, и в каждый интервал попадает малое число вариант (например, 1-3 единицы). В таких случаях рассчитывать на проявление какой-либо закономерности не приходится. Для того чтобы на основе случайных наблюдений получился закономерный результат, необходимо вступление в силу закона больших чисел, т.е. чтобы на каждый интервал приходилось бы не несколько, а десятки и сотни статистических единиц. С этой целью надо стараться, по возможности увеличивать число наблюдений. Это самый верный способ обнаружения закономерности в массовых процессах. Если же не представляется реальная возможность увеличить число наблюдений, то выявление закономерности может быть достигнуто уменьшением числа интервалов в ряду распределения. Уменьшая число интервалов в вариационном ряду, тем самым увеличивается численность частот в каждом интервале. Это означает, что случайные колебания каждой статистической единицы накладываются друг на друга, "сглаживается", превращаясь в закономерность.

Формирование и построение вариационных рядов позволяет получить лишь общую, приближенную картину распределения статистической совокупности. Например, гистограмма лишь в грубой форме выражает зависимость между значениями признака и его частотами (частостями) Поэтому вариационные ряды по существу являются лишь основой для дальнейшего, углубленного изучения внутренней закономерности статического распределения.

КОНТРОЛЬНЫЕ ВОПРОСЫ К ТЕМЕ 5

1. Что представляет собой вариация? Чем вызывается вариация признака в статистической совокупности?

2. Какие виды варьирующих признаков могут иметь место в статистике?

3. Что такое вариационный ряд? Какие могут быть виды вариационных рядов?

4. Что представляет собой ранжированный ряд? Какие его преимущества и недостатки?

5. Что такое дискретный ряд и какие его преимущества и недостатки?

6. Каков порядок формирования интервального ряда, какие его преимущества и недостатки?

7. Что представляет собой графическое изображение ранжированного, дискретного, интервального рядов распределения?

8. Что такое кумулята распределения и что она характеризует?