Серии за дистрибуција. Групирање на податоци и конструирање на дистрибутивна серија

Групирање- ова е поделба на населението на групи кои се хомогени според некоја карактеристика.

Цел на услугата. Користејќи го онлајн калкулаторот можете:

  • изгради серија на варијации, изгради хистограм и многуаголник;
  • најдете индикатори за варијација (просек, режим (вклучувајќи графички), медијана, опсег на варијација, квартили, децили, коефициент на диференцијација на квартили, коефициент на варијација и други индикатори);

Инструкции. За да групирате серија, мора да го изберете типот на добиената серија на варијации (дискретна или интервал) и да ја наведете количината на податоци (број на редови). Добиеното решение се зачувува во датотека Word (види пример за групирање статистички податоци).

Број на влезни податоци
",0);">

Доколку групирањето е веќе извршено и на серии на дискретни варијацииили интервални серии, тогаш треба да го користите онлајн калкулаторот Variation Indices. Тестирање на хипотезата за типот на дистрибуцијасе врши со користење на услугата Проучување на формуларот за дистрибуција.

Видови статистички групирања

Серија на варијации. Во случај на набљудување на дискретна случајна променлива, истата вредност може да се сретне неколку пати. Ваквите вредности x i на случајна променлива се запишуваат што укажува на n i колку пати се појавува во n набљудувања, ова е фреквенцијата на оваа вредност.
Во случај на континуирана случајна променлива, групирањето се користи во пракса.
  1. Типолошка групација- ова е поделба на квалитативно хетерогеното население што се проучува на класи, социо-економски типови, хомогени групи единици. За да ја изградите оваа групација, користете го параметарот серија на дискретни варијации.
  2. Групирањето се нарекува структурно, во која хомогена популација е поделена на групи кои ја карактеризираат нејзината структура според некои различни карактеристики. За да ја изградите оваа групација, користете го параметарот серија интервал.
  3. Се нарекува групирање што ги открива односите помеѓу појавите што се проучуваат и нивните карактеристики аналитичка група(види аналитичко групирање на серии).

Принципи за конструирање статистички групирања

Серијата на набљудувања подредени во растечки редослед се нарекува серија на варијации. Функција за групирањее карактеристика со која населението се дели на посебни групи. Се нарекува основа на групата. Групирањето може да се заснова и на квантитативни и на квалитативни карактеристики.
По утврдувањето на основата на групирањето, треба да се реши прашањето за бројот на групи на кои треба да се подели популацијата што се проучува.

Кога се користат персонални компјутери за обработка на статистички податоци, групирањето на објектните единици се врши со користење на стандардни процедури.
Една таква постапка се заснова на употребата на формулата Sturgess за да се одреди оптималниот број на групи:

k = 1+3,322*log(N)

Каде што k е бројот на групи, N е бројот на единици на населението.

Должината на парцијалните интервали се пресметува како h=(x max -x min)/k

Потоа се бројат броевите на набљудувања кои спаѓаат во овие интервали, кои се земаат како фреквенции n i. Неколку фреквенции, чии вредности се помали од 5 (n i< 5), следует объединить. в этом случае надо объединить и соответствующие интервалы.
Средните вредности на интервалите x i =(c i-1 +c i)/2 се земаат како нови вредности.

Конструирана е серија на дискретни варијации за дискретни карактеристики.

За да се конструира дискретна серија на варијации, треба да ги извршите следните чекори: 1) подредете ги единиците за набљудување по зголемен редослед на проучуваната вредност на карактеристиката,

2) утврдете ги сите можни вредности на атрибутот x i, распоредете ги во растечки редослед,

вредноста на атрибутот, јас .

фреквенција на вредноста на атрибутот и означуваат ѓ јас . Збирот на сите фреквенции на серијата е еднаков на бројот на елементи во популацијата што се проучува.

Пример 1 .

Список на оценки добиени од студентите на испитите: 3; 4; 3; 5; 4; 2; 2; 4; 4; 3; 5; 2; 4; 5; 4; 3; 4; 3; 3; 4; 4; 2; 2; 5; 5; 4; 5; 2; 3; 4; 4; 3; 4; 5; 2; 5; 5; 4; 3; 3; 4; 2; 4; 4; 5; 4; 3; 5; 3; 5; 4; 4; 5; 4; 4; 5; 4; 5; 5; 5.

Еве го бројот X - оценкае дискретна случајна променлива, а добиената листа на проценки естатистички (забележливи) податоци .

    подредете ги единиците за набљудување по растечки редослед на проучуваната карактеристична вредност:

2; 2; 2; 2; 2; 2; 2; 2; 3; 3; 3; 3; 3; 3; 3; 3; 3; 3; 3; 3; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5.

2) утврдете ги сите можни вредности на атрибутот x i, подредете ги во растечки редослед:

Во овој пример, сите проценки може да се поделат во четири групи со следните вредности: 2; 3; 4; 5.

Се нарекува вредноста на случајната променлива што одговара на одредена група на набљудувани податоци вредноста на атрибутот, опција (опција) и означете x јас .

Се нарекува број кој покажува колку пати соодветната вредност на карактеристиката се појавува во голем број набљудувања фреквенција на вредноста на атрибутот и означуваат ѓ јас .

За нашиот пример

се јавува резултат 2 - 8 пати,

се јавува резултат 3 - 12 пати,

се јавува резултат 4 - 23 пати,

се јавува резултат 5 - 17 пати.

Има вкупно 60 оценки.

4) запишете ги примените податоци во табела од два реда (колони) - x i и f i.

Врз основа на овие податоци, можно е да се конструира дискретна серија на варијации

Дискретна варијација серија - ова е табела во која настанатите вредности на карактеристиката што се проучува се означени како поединечни вредности во растечки редослед и нивните фреквенции

  1. Конструкција на серија на варијации на интервал

Покрај дискретната варијациска серија, често се среќава метод за групирање податоци како што е интервална варијациска серија.

Серии на интервал се конструираат ако:

    знакот има континуирана природа на промена;

    Имаше многу дискретни вредности (повеќе од 10)

    фреквенциите на дискретни вредности се многу мали (не надминувајте 1-3 со релативно голем број единици за набљудување);

    многу дискретни вредности на карактеристика со исти фреквенции.

Серијата на варијации на интервал е начин на групирање податоци во форма на табела која има две колони (вредностите на карактеристиката во форма на интервал на вредности и фреквенцијата на секој интервал).

За разлика од дискретна серија, вредностите на карактеристиката на интервалната серија не се претставени со поединечни вредности, туку со интервал на вредности („од - до“).

Се вика бројот што покажува колку единици за набљудување паднале во секој одбран интервал фреквенција на вредноста на атрибутот и означуваат ѓ јас . Збирот на сите фреквенции на серијата е еднаков на бројот на елементи (единици на набљудување) во популацијата што се проучува.

Ако единицата има карактеристична вредност еднаква на горната граница на интервалот, тогаш таа треба да се додели на следниот интервал.

На пример, дете со висина од 100 см ќе падне во вториот интервал, а не во првиот; а дете со висина од 130 см ќе падне во последниот интервал, а не во третиот.

Врз основа на овие податоци, може да се конструира серија на варијации на интервал.

Секој интервал има долна граница (xn), горна граница (xw) и ширина на интервал ( јас).

Границата на интервалот е вредноста на атрибутот што лежи на границата на два интервали.

детска висина (см)

детска висина (см)

количина на деца

повеќе од 130

Ако интервалот има горна и долна граница, тогаш тој се нарекува затворен интервал. Ако интервалот има само долна или само горна граница, тогаш тоа е - отворен интервал.Може да биде отворен само првиот или последниот интервал. Во горниот пример, последниот интервал е отворен.

Ширина на интервалот (јас) – разликата помеѓу горната и долната граница.

јас = x n - x во

Ширината на отворениот интервал се претпоставува дека е иста со ширината на соседниот затворен интервал.

детска висина (см)

количина на деца

Ширина на интервалот (i)

за пресметки 130+20=150

20 (бидејќи ширината на соседниот затворен интервал е 20)

Сите интервални серии се поделени на интервални серии со еднакви интервали и интервални серии со нееднакви интервали . Во распоредени редови со еднакви интервали, ширината на сите интервали е иста. Во интервалните серии со нееднакви интервали, ширината на интервалите е различна.

Во примерот што се разгледува - интервална серија со нееднакви интервали.

Број на групи (интервали)приближно се одредува со формулата на Sturgess:

m = 1 + 3,322 × log(n)

каде што n е вкупниот број на набљудувачки единици (вкупниот број на елементи во популацијата итн.), log(n) е декаден логаритам од n.

Примено според формулата Sturgess, вредноста обично се заокружува до најблискиот цел бројброеви, бидејќи бројот на групи не може да биде дробен број.

Ако интервалната серија со толку многу групи не е задоволителна за некои критериуми, тогаш можете да изградите друга интервална серија со заокружување мна помал цел број и изберете го посоодветниот од двата реда.

Бројот на групи не треба да биде повеќе од 15.

Можете исто така да ја користите следната табела ако воопшто не е можно да се пресмета декадниот логаритам.

    Одредување на ширината на интервалот

Ширина на интервалотза серија на варијации на интервали со еднакви интервали се одредува со формулата:

каде што X max е максимум од вредностите на x i, X min е минимум од вредностите на x i; m - број на групи (интервали).

Големината на интервалот (јас ) обично се заокружува до најблискиот цел број,единствените исклучоци се случаите кога се проучуваат најмалите флуктуации на некоја карактеристика (на пример, кога се групираат делови според големината на отстапувањата од номиналната вредност, мерени во фракции од милиметар).

Често се користи следново правило:

Број на децимални места

Голем број симболи по запирка

Пример за ширина на интервал користејќи ја формулата

На кој знак заокружуваме?

Пример за заоблена ширина на растојание

    Одредување на границите на интервалите

Долна граница првиот интервалсе зема еднакво на минималната вредност на атрибутот (најчесто прво се заокружува на помал цел број со ист ранг како ширината на интервалот). На пример, x min = 15, i=130, x n од првиот интервал = 10.

x n1 ≈ x мин

Горна границапрвиот интервал одговара на вредноста (Xmin + јас).

Долната граница на вториот интервал е секогаш еднаква на горната граница на првиот интервал. За следните групи, границите се одредуваат слично, односно вредноста на интервалот последователно се додава.

x В јас = x n јас

x n јас = x В i-1

    Определете ги фреквенциите на интервалите.

Броиме колку вредности спаѓаат во секој интервал. Во исто време, се сеќаваме дека ако единицата има карактеристична вредност еднаква на вредноста на горната граница на интервалот, тогаш таа треба да се додели на следниот интервал.

    Ние градиме интервална серија во форма на табела.

    Определете ги средните точки на интервалите.

За понатамошна анализа на интервалните серии, ќе треба да изберете карактеристична вредност за секој интервал. Оваа вредност на атрибутот ќе биде заедничка за сите набљудувачки единици кои спаѓаат во овој интервал. Оние. поединечните елементи ги „губат“ нивните индивидуални вредности на атрибутот и им се доделува една заедничка вредност на атрибутот. Ова општо значење е средината на интервалот, што се означува x" јас .

Користејќи го примерот на растот на децата, ајде да погледнеме како да изградиме интервална серија со еднакви интервали.

Достапни се првичните податоци.

90, 91, 92, 93, 94, 95, 96, 97, 98, 99 , 92, 93, 94, 95, 96, 98 , , 100, 101, 102, 103, 104, 105, 106, 107, 108, 109 , 100, 101, 102, 104 , 110, 112, 114, 116, 117, 120, 122, 123, 124, 129, 110, 111, 113, 115, 116, 117, 121, 125, 126, 127 , 110, 111, 112, 113, 114, 115, 116, 117, 118, 119, 120, 121, 122, 123, 124, 125, 126, 127, 128, 129 , 111, 113, 116, 127 , 123, 122, 130, 131, 132, 133, 134, 136, 137, 138, 139, 140, 141, 142, 143, 144, 145, 146, 147, 148, 149, 150 , 131, 133, 135, 136, 138, 139, 140, 141, 142, 143, 145, 146, 147, 148

Резултатите од групирањето на собраните статистички податоци обично се прикажуваат во форма на дистрибутивни серии. Серијата на дистрибуција е подредена распределба на единиците на населението во групи според карактеристиката што се проучува.

Сериите на дистрибуција се поделени на атрибутивни и варијациски, во зависност од карактеристиката што ја формира основата на групирањето. Ако атрибутот е квалитативен, тогаш серијата на дистрибуција се нарекува атрибутивна. Пример за серија на атрибути е распределбата на претпријатијата и организациите според видот на сопственоста (види Табела 3.1).

Ако карактеристиката според која се конструира дистрибутивната серија е квантитативна, тогаш серијата се нарекува варијациска.

Варијациската серија на дистрибуција секогаш се состои од два дела: варијанта и соодветните фреквенции (или фреквенции). Варијанта е вредноста што една карактеристика може да ја преземе во единици на население, додека фреквенцијата е бројот на единици за набљудување кои имаат дадена вредност на карактеристиката. Збирот на фреквенциите е секогаш еднаков на волуменот на популацијата. Понекогаш, наместо фреквенции, се пресметуваат фреквенции - тоа се фреквенции изразени или како фракции од единица (тогаш збирот на сите фреквенции е еднаков на 1), или како процент од волуменот на популацијата (збирот на фреквенциите ќе да биде еднаква на 100%).

Сериите на варијации се дискретни и интервални. За дискретни серии (табела 3.7), опциите се изразени во одредени броеви, најчесто цели броеви.

Табела 3.8. Распределба на вработените по време на работа во осигурителната компанија
Време на работа во компанијата, цели години (опции) Број на вработени
Човек (фреквенции) во % од вкупното (фреквенција)
до една година 15 11,6
1 17 13,2
2 19 14,7
3 26 20,2
4 10 7,8
5 18 13,9
6 24 18,6
Вкупно 129 100,0

Во интервалните серии (види Табела 3.2), вредностите на индикаторот се наведени во форма на интервали. Интервалите имаат две граници: долна и горна. Интервалите можат да бидат отворени или затворени. Отворените немаат една од границите, така што во Табела. 3.2 првиот интервал нема долна граница, а последниот нема горна граница. Кога се конструира интервална серија, во зависност од природата на дисперзијата на вредностите на атрибутите, се користат и еднакви и нееднакви интервали (Табела 3.2 покажува варијација серија со еднакви интервали).

Ако некоја карактеристика добива ограничен број вредности, обично не повеќе од 10, се конструираат дискретни дистрибутивни серии. Ако опцијата е поголема, тогаш дискретната серија ја губи својата јасност; во овој случај, препорачливо е да се користи интервалната форма на серијата на варијации. Со континуирана варијација на некоја карактеристика, кога нејзините вредности во одредени граници се разликуваат една од друга за произволно мала количина, се конструира и интервална дистрибутивна серија.

3.3.1. Конструкција на дискретна варијација серија

Да ја разгледаме методологијата за конструирање на дискретни серии на варијации користејќи пример.

Пример 3.2. Достапни се следните податоци за квантитативниот состав на 60 семејства:

За да се добие идеја за распределбата на семејствата по бројот на нивните членови, треба да се изгради серија на варијации. Бидејќи знакот зема ограничен број цели броеви, конструираме дискретна серија на варијации. За да го направите ова, прво се препорачува да ги запишете сите вредности на атрибутот (бројот на членови во семејството) во растечки редослед (т.е., рангирање на статистичките податоци):

Потоа треба да го броите бројот на семејства со ист состав. Бројот на членови на семејството (вредноста на различна карактеристика) се варијанти (ќе ги означиме со x), бројот на семејства со ист состав се фреквенции (ќе ги означиме со f). Резултатите од групирањето ги прикажуваме во форма на следните дискретни серии на дистрибуција на варијации:

Табела 3.11.
Број на членови на семејството (x) Број на семејства (y)
1 8
2 14
3 20
4 9
5 5
6 4
Вкупно 60

3.3.2. Конструкција на серии на интервални варијации

Дозволете ни да ја демонстрираме методологијата за конструирање на серии на дистрибуција на интервални варијации користејќи го следниов пример.

Пример 3.3. Како резултат на статистичкото набљудување, добиени се следните податоци за просечната каматна стапка на 50 деловни банки (%):

Табела 3.12.
14,7 19,0 24,5 20,8 12,3 24,6 17,0 14,2 19,7 18,8
18,1 20,5 21,0 20,7 20,4 14,7 25,1 22,7 19,0 19,6
19,0 18,9 17,4 20,0 13,8 25,6 13,0 19,0 18,7 21,1
13,3 20,7 15,2 19,9 21,9 16,0 16,9 15,3 21,4 20,4
12,8 20,8 14,3 18,0 15,1 23,8 18,5 14,4 14,4 21,0

Како што можеме да видиме, гледањето на таква низа податоци е крајно незгодно, освен тоа, не се видливи модели на промени во индикаторот. Ајде да конструираме интервална дистрибутивна серија.

  1. Ајде да го одредиме бројот на интервали.

    Бројот на интервали во пракса често го поставува самиот истражувач врз основа на целите на секое конкретно набљудување. Во исто време, може да се пресмета и математички користејќи ја формулата Sturgess

    n = 1 + 3,322 lgN,

    каде n е бројот на интервали;

    N е волуменот на населението (број на единици за набљудување).

    За нашиот пример добиваме: n = 1 + 3,322lgN = 1 + 3,322lg50 = 6,6"7.

  2. Дозволете ни да ја одредиме големината на интервалите (i) користејќи ја формулата

    каде што x max е максималната вредност на атрибутот;

    x min - минимална вредност на атрибутот.

    За нашиот пример

    Интервалите на серијата на варијации се јасни ако нивните граници имаат „округли“ вредности, па да ја заокружиме вредноста на интервалот 1,9 на 2, а минималната вредност на карактеристиката 12,3 на 12,0.

  3. Ајде да ги одредиме границите на интервалите.

    Интервалите, по правило, се пишуваат на таков начин што горната граница на еден интервал е и долната граница на следниот интервал. Така, за нашиот пример добиваме: 12,0-14,0; 14,0-16,0; 16,0-18,0; 18,0-20,0; 20,0-22,0; 22,0-24,0; 24,0-26,0.

    Ваквиот запис значи дека атрибутот е континуиран. Ако варијантите на некоја карактеристика земаат строго дефинирани вредности, на пример, само цели броеви, но нивниот број е премногу голем за да се конструира дискретна серија, тогаш можете да креирате интервална серија, каде што долната граница на интервалот нема да се совпаѓа со горната граница на следниот интервал (ова ќе значи дека карактеристиката е дискретна). На пример, при распределбата на вработените во претпријатието по возраст, можете да ги креирате следните интервални групи на години: 18-25, 26-33, 34-41, 42-49, 50-57, 58-65, 66 и повеќе.

    Дополнително, во нашиот пример, би можеле да ги отвориме првиот и последниот интервал, итн. напишете: до 14,0; 24.0 и погоре.

  4. Врз основа на првичните податоци, ќе конструираме рангирана серија. За да го направите ова, ги запишуваме во растечки редослед вредностите што ги зема знакот. Резултатите ги прикажуваме во табелата: Табела 3.13. Рангирани серии на каматни стапки на деловните банки
    Банкарска стапка % (опции)
    12,3 17,0 19,9 23,8
    12,8 17,4 20,0 24,5
    13,0 18,0 20,0 24,6
    13,3 18,1 20,4 25,1
    13,8 18,5 20,4 25,6
    14,2 18,7 20,5
    14,3 18,8 20,7
    14,4 18,9 20,7
    14,7 19,0 20,8
    14,7 19,0 21,0
    15,1 19,0 21,0
    15,2 19,0 21,1
    15,3 19,0 21,4
    16,0 19,6 21,9
    16,9 19,7 22,7
  5. Ајде да ги броиме фреквенциите.

    При броење на фреквенции, може да се појави ситуација кога вредноста на карактеристиката паѓа на границата на одреден интервал. Во овој случај, можете да се водите според правилото: дадена единица е доделена на интервалот за кој неговата вредност е горната граница. Значи, вредноста 16.0 во нашиот пример ќе се однесува на вториот интервал.

Резултатите од групирањето добиени во нашиот пример ќе бидат претставени во табела.

Табела 3.14. Распределба на деловните банки по кредитна стапка
Кратка стапка, % Број на банки, единици (фреквенции) Акумулирани фреквенции
12,0-14,0 5 5
14,0-16,0 9 14
16,0-18,0 4 18
18,0-20,0 15 33
20,0-22,0 11 44
22,0-24,0 2 46
24,0-26,0 4 50
Вкупно 50 -

Последната колона од табелата ги прикажува акумулираните фреквенции, кои се добиваат со последователно собирање фреквенции почнувајќи од првиот (на пример, за првиот интервал - 5, за вториот интервал 5 + 9 = 14, за третиот интервал 5 + 9 + 4 = 18, итн.). Акумулираната фреквенција, на пример, 33, покажува дека 33 банки имаат стапка на заем што не надминува 20% (горната граница на соодветниот интервал).

Во процесот на групирање податоци при конструирање на серии на варијации, понекогаш се користат нееднакви интервали. Ова се однесува на оние случаи кога вредностите на карактеристиката го почитуваат правилото за аритметичка или геометриска прогресија или кога примената на формулата Sturgess доведува до појава на „празни“ интервални групи кои не содржат ниту една единица за набљудување. Потоа, границите на интервалите се поставуваат произволно од самиот истражувач, врз основа на здравиот разум и целите на истражувањето, или користејќи формули. Значи, за податоци кои се менуваат во аритметичката прогресија, големината на интервалите се пресметува на следниов начин.

Лабораториска работа бр.1. Примарна обработка на статистички податоци

Изградба на дистрибутивни серии

Се нарекува подредена распределба на единиците на населението во групи според која било карактеристика во близина на дистрибуција . Во овој случај, карактеристиката може да биде или квантитативна, тогаш серијата се нарекува варијациски , и квалитативно, тогаш серијата се нарекува атрибутивен . Така, на пример, населението на градот може да се дистрибуира по возрасни групи во серија на варијации или по професионална припадност во серија на атрибути (се разбира, многу повеќе квалитативни и квантитативни карактеристики може да се предложат за изградба на дистрибутивни серии; изборот на карактеристика се определува со задача на статистичко истражување).

Секоја дистрибутивна серија се карактеризира со два елементи:

- опција(x i) - ова се индивидуални вредности на карактеристиките на единиците во популацијата на примерокот. За серијата варијации, опцијата зема нумерички вредности, за атрибутивните серии – квалитативни (на пример, x = „државен службеник“);

- фреквенција(n јас) – број кој покажува колку пати се појавува одредена вредност на атрибутот. Ако фреквенцијата е изразена како релативен број (т.е. пропорција на елементи од популацијата што одговара на дадена вредност на опциите во вкупниот волумен на популацијата), тогаш се нарекува релативна фреквенцијаили фреквенција.

Серијата на варијации може да биде:

- дискретни, кога карактеристиката што се проучува се карактеризира со одреден број (обично цел број).

- интервал, кога границите „од“ и „до“ се дефинирани за постојано променлива карактеристика. Исто така, се конструира интервална серија ако збирот на вредности на дискретно разновидна карактеристика е голем.

Може да се конструира интервална серија и со интервали со еднаква должина (серии со еднакви интервали) и со нееднакви интервали, доколку тоа е диктирано од условите на статистичкото истражување. На пример, може да се разгледаат серија распределби на приход со следните интервали:<5тыс р., 5-10 тыс р., 10-20 тыс.р., 20-50 тыс р., и т.д. Если цель исследования не определяет способ построения интервального ряда, то строится равноинтервальный ряд, число интервалов в котором определяется по формуле Стерджесса:



каде k е бројот на интервали, n е големината на примерокот. (Се разбира, формулата обично дава дробен број, а како број на интервали се избира најблискиот цел број до добиениот број.) Должината на интервалот во овој случај се одредува со формулата

.

Графички, варијационите серии можат да бидат претставени во форма хистограми(над секој интервал од интервалната серија се гради „колона“ со висина што одговара на фреквенцијата во овој интервал), дистрибутивен полигон(скршена линија што ги поврзува точките ( x i;n i) или се кумулира(изграден на акумулирани фреквенции, т.е. за секоја вредност на атрибутот се зема фреквенцијата на појавување во збир на објекти со вредност на атрибутот помала од дадената).

Кога работите во Excel, следните функции може да се користат за да се конструираат серии на варијации:

ПРОВЕРЕТЕ( низа на податоци) – за одредување на големината на примерокот. Аргументот е опсегот на ќелии во кои се наоѓаат податоците од примерокот.

COUNTIF( опсег; критериуми) – може да се користи за конструирање на атрибут или варијациска серија. Аргументите се опсегот на низата примероци вредности на атрибутот и критериумот - нумеричката или текстуалната вредност на атрибутот или бројот на ќелијата во која се наоѓа. Резултатот е фреквенцијата на појавување на таа вредност во примерокот.

ФРЕКВЕНЦИЈА( низа на податоци; низа интервали) – за конструирање на варијација серија. Аргументите се опсегот на низата со податоци за примерок и колоната за интервал. Ако треба да конструирате дискретна серија, тогаш вредностите на опциите се означени овде; ако е интервална серија, тогаш горните граници на интервалите (тие се нарекуваат и „џебови“). Бидејќи резултатот е колона од фреквенции, мора да го завршите внесот на функцијата со притискање на CTRL+SHIFT+ENTER. Забележете дека кога одредувате низа интервали при воведување функција, не мора да ја наведете последната вредност во неа - сите вредности што не беа вклучени во претходните „џебови“ ќе бидат ставени во соодветниот „џеб“. Ова понекогаш може да помогне да се избегне грешката со автоматско не ставање на најголемата вредност на примерокот во последниот џеб.

Дополнително, за сложени групирања (врз основа на неколку карактеристики), користете ја алатката „стожерни табели“. Тие исто така може да се користат за конструирање на серии на атрибути и варијации, но ова непотребно ја комплицира задачата. Исто така, за да се изгради серија на варијации и хистограм, постои процедура „хистограм“ од додатокот „Пакет за анализа“ (за да користите додатоци во Excel, прво мора да ги преземете; тие не се стандардно инсталирани)

Дозволете ни да го илустрираме процесот на примарната обработка на податоците со следните примери.

Пример 1.1. Има податоци за квантитативниот состав на 60 семејства.

Конструирај серија на варијации и дистрибутивен полигон

Решение.

Ајде да отвориме табели на Excel. Ајде да ја внесеме низата со податоци во опсегот A1:L5. Ако студирате документ во електронска форма (во Word формат, на пример), за да го направите ова, само изберете ја табелата со податоците и копирајте ја на таблата со исечоци, потоа изберете ја ќелијата A1 и залепете ги податоците - тие автоматски ќе го окупираат соодветен опсег. Ајде да го пресметаме волуменот на примерокот n - бројот на податоци за примерокот; за да го направите ова, внесете ја формулата =COUNT(A1:L5) во ќелијата B7. Забележете дека за да го внесете саканиот опсег во формулата, не е неопходно да го внесете неговото означување од тастатурата, доволно е да го изберете. Ајде да ги одредиме минималните и максималните вредности во примерокот со внесување на формулата =MIN(A1:L5) во ќелијата B8 и =MAX(A1:L5) во ќелијата B9.

Сл.1.1 Пример 1. Примарна обработка на статистички податоци во табелите на Excel

Следно, ќе подготвиме табела за конструирање на серија на варијации со внесување имиња за колоната за интервал (вредности на варијанти) и колоната за фреквенција. Во колоната за интервал, внесете ги карактеристичните вредности од минимум (1) до максимум (6), зафаќајќи го опсегот B12: B17. Изберете ја колоната за фреквенција, внесете ја формулата =FREQUENCY(A1:L5,B12:B17) и притиснете ја комбинацијата на копчиња CTRL+SHIFT+ENTER

Сл. 1.2 Пример 1. Конструкција на варијација серија

За контрола, ајде да го пресметаме збирот на фреквенции користејќи ја функцијата SUM (икона на функцијата S во групата „Уредување“ на табулаторот „Дома“), пресметаната сума треба да се совпадне со претходно пресметаниот волумен на примерокот во ќелијата B7.

Сега да изградиме многуаголник: откако го избравте добиениот опсег на фреквенција, изберете ја командата „График“ на табулаторот „Вметни“. Стандардно, вредностите на хоризонталната оска ќе бидат редни броеви - во нашиот случај од 1 до 6, што се совпаѓа со вредностите на опциите (број на тарифни категории).

Името на серијата графикони „серија 1“ може или да се смени со користење на истата опција „избери податоци“ од табулаторот „Дизајн“ или едноставно да се избрише.

Сл.1.3. Пример 1. Конструкција на фреквентен многуаголник

Пример 1.2. Постојат податоци за емисиите на загадувачи од 50 извори:

10,4 18,6 10,3 26,0 45,0 18,2 17,3 19,2 25,8 18,7
28,2 25,2 18,4 17,5 41,8 14,6 10,0 37,8 10,5 16,0
18,1 16,8 38,5 37,7 17,9 29,0 10,1 28,0 12,0 14,0
14,2 20,8 13,5 42,4 15,5 17,9 19, 10,8 12,1 12,4
12,9 12,6 16,8 19,7 18,3 36,8 15,0 37,0 13,0 19,5

Составете серија со еднаков интервал, изградете хистограм

Решение

Ајде да ја внесеме низата со податоци во лист на Excel, тој ќе го окупира опсегот A1:J5 Како и во претходната задача, ќе ја одредиме големината на примерокот n, минималните и максималните вредности во примерокот. Бидејќи сега не ни треба дискретна серија, туку интервална серија, а бројот на интервали во проблемот не е одреден, го пресметуваме бројот на интервали k користејќи ја формулата Sturgess. За да го направите ова, внесете ја формулата =1+3.322*LOG10(B7) во ќелијата B10.

Сл.1.4. Пример 2. Конструкција на серија со еднаков интервал

Добиената вредност не е цел број, таа е приближно 6,64. Бидејќи со k=7 должината на интервалите ќе биде изразена како цел број (за разлика од случајот k=6), избираме k=7 со внесување на оваа вредност во ќелијата C10. Ја пресметуваме должината на интервалот d во ќелијата B11 ​​со внесување на формулата =(B9-B8)/C10.

Ајде да дефинираме низа од интервали, означувајќи ја горната граница за секој од 7-те интервали. За да го направите ова, во ќелијата Е8 ја пресметуваме горната граница на првиот интервал со внесување на формулата =B8+B11; во ќелијата Е9 горната граница на вториот интервал со внесување на формулата =E8+B11. За да ги пресметаме преостанатите вредности на горните граници на интервалите, го поправаме бројот на ќелијата B11 ​​во внесената формула со помош на знакот $, така што формулата во ќелијата E9 ја има формата =E8+B$11 и копирајте ја содржината на ќелијата Е9 до ќелиите Е10-Е14. Последната добиена вредност е еднаква на максималната вредност во примерокот пресметан претходно во ќелијата B9.

Сл.1.5. Пример 2. Конструкција на серија со еднаков интервал


Сега да ја пополниме низата „џебови“ користејќи ја функцијата FREQUENCY, како што беше направено во пример 1.

Сл.1.6. Пример 2. Конструкција на серија со еднаков интервал

Користејќи ја добиената серија на варијации, ќе изградиме хистограм: изберете ја колоната за фреквенција и изберете „Хистограм“ на табулаторот „Вметни“. Откако го добивме хистограмот, ајде да ги смениме етикетите на хоризонталната оска во неа на вредности во опсегот на интервали; за да го направите ова, изберете ја опцијата „Избери податоци“ на табулаторот „Дизајнер“. Во прозорецот што се појавува, изберете ја командата „Промени“ за делот „Етикети на хоризонталната оска“ и внесете го опсегот на вредности за опциите, избирајќи го со глувчето.

Сл.1.7. Пример 2. Конструирање на хистограм

Сл.1.8. Пример 2. Конструирање на хистограм