Dağıtım seriyası. Məlumatların qruplaşdırılması və paylama seriyasının qurulması

Qruplaşdırma- bu, populyasiyanın hansısa xüsusiyyətə görə homojen olan qruplara bölünməsidir.

Xidmətin məqsədi. Onlayn kalkulyatordan istifadə edərək aşağıdakıları edə bilərsiniz:

  • variasiya seriyası qurun, histoqram və çoxbucaqlı qurmaq;
  • variasiya göstəricilərini tapın (orta, rejim (o cümlədən qrafik), median, variasiya diapazonu, kvartillər, desillər, kvartil diferensiallaşma əmsalı, variasiya əmsalı və digər göstəricilər);

Təlimatlar. Bir sıra qruplaşdırmaq üçün əldə edilmiş variasiya seriyasının növünü (diskret və ya interval) seçməlisiniz və məlumatların miqdarını (sətirlərin sayını) göstərməlisiniz. Nəticə həlli Word faylında saxlanılır (statistik məlumatların qruplaşdırılması nümunəsinə baxın).

Daxil edilmiş məlumatların sayı
",0);">

Əgər qruplaşdırma artıq aparılıbsa və diskret variasiya seriyası və ya interval seriyası, sonra onlayn kalkulyator Variasiya İndekslərindən istifadə etməlisiniz. Paylanma növü haqqında fərziyyənin sınaqdan keçirilməsi paylanma formasının öyrənilməsi xidmətindən istifadə etməklə həyata keçirilir.

Statistik qruplaşmaların növləri

Variasiya seriyası. Diskret təsadüfi kəmiyyətin müşahidəsi zamanı eyni qiymətə bir neçə dəfə rast gəlmək olar. Təsadüfi dəyişənin belə x i dəyərləri qeyd olunur ki, n i n müşahidədə neçə dəfə göründüyünü göstərir, bu, bu dəyərin tezliyidir.
Davamlı təsadüfi kəmiyyət halında praktikada qruplaşdırmadan istifadə edilir.
  1. Tipoloji qruplaşdırma- bu, öyrənilən keyfiyyətcə heterojen əhalinin siniflərə, sosial-iqtisadi tiplərə, vahid vahid qruplarına bölünməsidir. Bu qruplaşmanı qurmaq üçün Diskret variasiya seriyası parametrindən istifadə edin.
  2. Qruplaşmaya struktur deyilir, burada homojen populyasiya bəzi dəyişən xüsusiyyətlərə görə strukturunu xarakterizə edən qruplara bölünür. Bu qruplaşmanı qurmaq üçün Interval seriyası parametrindən istifadə edin.
  3. Öyrənilən hadisələrlə onların xüsusiyyətləri arasında əlaqələri aşkar edən qruplaşma deyilir analitik qrup(seriyaların analitik qruplaşdırılmasına baxın).

Statistik qruplaşmaların qurulması prinsipləri

Artan ardıcıllıqla düzülmüş müşahidələr silsiləsi variasiya seriyası adlanır. Qruplaşdırma xüsusiyyətiəhalinin ayrı-ayrı qruplara bölünməsi xüsusiyyətidir. Qrupun əsası adlanır. Qruplaşdırma həm kəmiyyət, həm də keyfiyyət xüsusiyyətlərinə əsaslana bilər.
Qruplaşmanın əsasını müəyyən etdikdən sonra öyrənilən əhalinin neçə qrupa bölünməli olduğu məsələsi həll edilməlidir.

Statistik məlumatların emalı üçün fərdi kompüterlərdən istifadə edilərkən obyekt vahidlərinin qruplaşdırılması standart prosedurlardan istifadə etməklə həyata keçirilir.
Belə prosedurlardan biri qrupların optimal sayını təyin etmək üçün Sturgess düsturunun istifadəsinə əsaslanır:

k = 1+3,322*log(N)

Burada k qrupların sayı, N əhali vahidlərinin sayıdır.

Qismən intervalların uzunluğu h=(x max -x min)/k kimi hesablanır

Sonra bu intervallara düşən müşahidələrin sayları sayılır və onlar tezliklər kimi qəbul edilir n i . Qiymətləri 5-dən az olan bir neçə tezlik (n i< 5), следует объединить. в этом случае надо объединить и соответствующие интервалы.
x i =(c i-1 +c i)/2 intervallarının orta qiymətləri yeni qiymətlər kimi qəbul edilir.

Diskret xüsusiyyətlər üçün diskret variasiya seriyası qurulur.

Diskret variasiya silsiləsi qurmaq üçün aşağıdakı addımları yerinə yetirmək lazımdır: 1) müşahidə vahidlərini xarakteristikanın öyrənilən dəyərinin artan ardıcıllığı ilə düzün;

2) x i atributunun bütün mümkün dəyərlərini təyin edin, onları artan qaydada düzün,

atributun dəyəri, i .

atribut dəyərinin tezliyi və işarə edir f i . Bir sıranın bütün tezliklərinin cəmi tədqiq olunan populyasiyadakı elementlərin sayına bərabərdir.

Misal 1 .

Şagirdlərin imtahanlarda aldıqları qiymətlərin siyahısı: 3; 4; 3; 5; 4; 2; 2; 4; 4; 3; 5; 2; 4; 5; 4; 3; 4; 3; 3; 4; 4; 2; 2; 5; 5; 4; 5; 2; 3; 4; 4; 3; 4; 5; 2; 5; 5; 4; 3; 3; 4; 2; 4; 4; 5; 4; 3; 5; 3; 5; 4; 4; 5; 4; 4; 5; 4; 5; 5; 5.

Budur nömrə X - sinifdiskret təsadüfi dəyişəndir və nəticədə təxminlərin siyahısı belədirstatistik (müşahidə edilə bilən) məlumatlar .

    Müşahidə vahidlərini tədqiq olunan xarakterik dəyərə görə artan qaydada düzün:

2; 2; 2; 2; 2; 2; 2; 2; 3; 3; 3; 3; 3; 3; 3; 3; 3; 3; 3; 3; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5.

2) x i atributunun bütün mümkün dəyərlərini təyin edin, onları artan ardıcıllıqla sıralayın:

Bu misalda bütün təxminləri aşağıdakı qiymətlərlə dörd qrupa bölmək olar: 2; 3; 4; 5.

Müəyyən bir müşahidə məlumat qrupuna uyğun gələn təsadüfi dəyişənin qiyməti deyilir atributun dəyəri, seçim (seçim) və x təyin edin i .

Xarakteristikanın müvafiq qiymətinin bir sıra müşahidələrdə neçə dəfə baş verdiyini göstərən ədəd deyilir atribut dəyərinin tezliyi və işarə edir f i .

Bizim nümunəmiz üçün

xal 2 baş verir - 8 dəfə,

xal 3 baş verir - 12 dəfə,

xal 4 baş verir - 23 dəfə,

xal 5 baş verir - 17 dəfə.

Ümumilikdə 60 reytinq var.

4) alınan məlumatları iki sıra (sütun) cədvəlinə yazın - x i və f i.

Bu məlumatlar əsasında diskret variasiya seriyası qurmaq mümkündür

Diskret variasiya seriyası – bu, tədqiq olunan xarakteristikanın baş verən dəyərlərinin artan qaydada fərdi dəyərlər və onların tezlikləri kimi göstərildiyi cədvəldir.

  1. İnterval variasiya seriyasının qurulması

Diskret variasiya sıralarına əlavə olaraq, verilənlərin qruplaşdırılması metoduna, məsələn, interval variasiya seriyasına tez-tez rast gəlinir.

İnterval seriyası aşağıdakı hallarda qurulur:

    işarənin davamlı dəyişmə xarakteri var;

    Bir çox diskret dəyər var idi (10-dan çox)

    diskret dəyərlərin tezlikləri çox kiçikdir (nisbətən çox sayda müşahidə vahidi ilə 1-3-dən çox olmamalıdır);

    eyni tezliklərə malik bir xüsusiyyətin çoxlu diskret dəyərləri.

İnterval variasiya seriyası, məlumatları iki sütunlu bir cədvəl şəklində qruplaşdırmaq üsuludur (xarakteristikanın dəyərləri intervalı və hər intervalın tezliyi şəklində).

Diskret seriyadan fərqli olaraq, interval seriyasının xarakteristikasının dəyərləri fərdi dəyərlərlə deyil, dəyərlər intervalı ilə (“dan --ə”) təmsil olunur.

Hər seçilmiş intervala neçə müşahidə vahidinin düşdüyünü göstərən nömrə deyilir atribut dəyərinin tezliyi və işarə edir f i . Sıranın bütün tezliklərinin cəmi tədqiq olunan populyasiyada olan elementlərin (müşahidə vahidlərinin) sayına bərabərdir.

Əgər vahid intervalın yuxarı həddinə bərabər xarakterik qiymətə malikdirsə, o zaman növbəti intervala təyin edilməlidir.

Məsələn, boyu 100 sm olan uşaq birinciyə deyil, 2-ci intervala düşəcək; və boyu 130 sm olan uşaq üçüncüyə deyil, sonuncu intervala düşəcək.

Bu məlumatlara əsaslanaraq, interval dəyişikliyi seriyası qurula bilər.

Hər bir intervalın aşağı həddi (xn), yuxarı həddi (xv) və interval eni ( i).

Interval sərhədi iki intervalın sərhədində yerləşən atributun qiymətidir.

uşaq boyu (sm)

uşaq boyu (sm)

uşaqların miqdarı

130-dan çox

Əgər intervalın yuxarı və aşağı sərhədi varsa, o zaman çağırılır qapalı interval. Əgər intervalın yalnız aşağı və ya yalnız yuxarı sərhədi varsa, o zaman - açıq interval. Yalnız ilk və ya son interval açıq ola bilər. Yuxarıdakı misalda sonuncu interval açıqdır.

İnterval eni (i) – yuxarı və aşağı həddlər arasındakı fərq.

i = x n - x in

Açıq intervalın eninin bitişik qapalı intervalın eni ilə eyni olduğu qəbul edilir.

uşaq boyu (sm)

uşaqların miqdarı

Interval eni (i)

hesablamalar üçün 130+20=150

20 (çünki bitişik qapalı intervalın eni 20-dir)

Bütün interval sıraları bərabər intervallı interval sıralarına və qeyri-bərabər intervallı interval sıralarına bölünür . Bərabər intervallı sətirlərdə bütün intervalların eni eynidir. Qeyri-bərabər intervallara malik interval seriyalarında intervalların eni fərqli olur.

Baxılan nümunədə - qeyri-bərabər intervalları olan interval seriyası.

Qrupların sayı (intervallar) təxminən Sturgess düsturu ilə müəyyən edilir:

m = 1 + 3,322 × log(n)

burada n müşahidə vahidlərinin ümumi sayıdır (populyasiyadakı elementlərin ümumi sayı və s.), log(n) n-in onluq loqarifmidir.

Qəbul edildi Sturgess düsturuna görə, dəyər adətən ən yaxın tam ədədə yuvarlaqlaşdırılırədədlər, çünki qrupların sayı kəsr ədəd ola bilməz.

Bu qədər qrupdan ibarət interval seriyası bəzi meyarlar üçün qənaətbəxş deyilsə, yuvarlaqlaşdıraraq başqa bir interval seriyası qura bilərsiniz. m daha kiçik bir tam ədədə çevirin və iki cərgədən daha uyğun olanı seçin.

Qrupların sayı 15-dən çox olmamalıdır.

Onluq loqarifmi hesablamaq ümumiyyətlə mümkün deyilsə, aşağıdakı cədvəldən də istifadə edə bilərsiniz.

    Aralığın genişliyinin müəyyən edilməsi

Interval eni bərabər intervalları olan interval variasiya seriyası üçün düsturla müəyyən edilir:

burada X max x i dəyərlərinin maksimumu, X min x i dəyərlərinin minimumudur; m - qrupların sayı (intervallar).

intervalın ölçüsü (i ) adətən ən yaxın tam ədədə yuvarlaqlaşdırılır, Yalnız istisnalar, xarakteristikanın ən kiçik dalğalanmalarının öyrənildiyi hallardır (məsələn, hissələri millimetrin fraksiyaları ilə ölçülən nominal dəyərdən sapmaların ölçüsünə görə qruplaşdırarkən).

Aşağıdakı qayda tez-tez istifadə olunur:

Onluq yerlərin sayı

Vergüldən sonra bir sıra simvollar

Düsturdan istifadə edərək interval eninin nümunəsi

Hansı işarəyə yuvarlaqlaşdırırıq?

Dairəvi boşluq eni nümunəsi

    Fasilələrin sərhədlərinin müəyyən edilməsi

Aşağı hədd ilk interval atributun minimum dəyərinə bərabər götürülür (əksər hallarda o, əvvəlcə intervalın eni ilə eyni dərəcəyə malik daha kiçik tam ədədə yuvarlaqlaşdırılır). Məsələn, birinci intervalın x min = 15, i=130, x n = 10.

x n1 ≈ x dəq

Yuxarı hədd birinci interval dəyərə uyğundur (Xmin + i).

İkinci intervalın aşağı həddi həmişə birinci intervalın yuxarı həddinə bərabərdir. Sonrakı qruplar üçün sərhədlər oxşar şəkildə müəyyən edilir, yəni interval dəyəri ardıcıl olaraq əlavə olunur.

x V i = x n i +i

x n i = x V i-1

    Fasilələrin tezliklərini təyin edin.

Hər intervala neçə dəyərin düşdüyünü sayırıq. Eyni zamanda, xatırlayırıq ki, əgər vahid intervalın yuxarı həddinin qiymətinə bərabər xarakterik qiymətə malikdirsə, o zaman növbəti intervala təyin edilməlidir.

    Cədvəl şəklində bir interval seriyası qururuq.

    Fasilələrin orta nöqtələrini təyin edin.

İnterval seriyasının sonrakı təhlili üçün hər bir interval üçün xarakterik dəyər seçmək lazımdır. Bu atribut dəyəri bu intervala düşən bütün müşahidə vahidləri üçün ümumi olacaqdır. Bunlar. ayrı-ayrı elementlər fərdi atribut dəyərlərini "itirir" və bir ümumi atribut dəyəri təyin olunur. Bu ümumi mənadır intervalın ortası, işarələnmişdir x" i .

Uşaqların böyüməsi nümunəsindən istifadə edərək, bərabər intervallarla interval seriyasının necə qurulacağına baxaq.

İlkin məlumatlar mövcuddur.

90, 91, 92, 93, 94, 95, 96, 97, 98, 99 , 92, 93, 94, 95, 96, 98 , , 100, 101, 102, 103, 104, 105, 106, 107, 108, 109 , 100, 101, 102, 104 , 110, 112, 114, 116, 117, 120, 122, 123, 124, 129, 110, 111, 113, 115, 116, 117, 121, 125, 126, 127 , 110, 111, 112, 113, 114, 115, 116, 117, 118, 119, 120, 121, 122, 123, 124, 125, 126, 127, 128, 129 , 111, 113, 116, 127 , 123, 122, 130, 131, 132, 133, 134, 136, 137, 138, 139, 140, 141, 142, 143, 144, 145, 146, 147, 148, 149, 150 , 131, 133, 135, 136, 138, 139, 140, 141, 142, 143, 145, 146, 147, 148

Toplanmış statistik məlumatların qruplaşdırılmasının nəticələri adətən paylama sıraları şəklində təqdim olunur. Paylanma sırası öyrənilən xüsusiyyətə görə əhali vahidlərinin qruplara nizamlı şəkildə paylanmasıdır.

Qruplaşmanın əsasını təşkil edən xarakteristikaya görə paylanma sıraları atributiv və variasiyalıya bölünür. Əgər atribut keyfiyyətlidirsə, onda paylama seriyası atributiv adlanır. Atribut seriyasına misal olaraq müəssisə və təşkilatların mülkiyyət növləri üzrə bölgüsünü göstərmək olar (Cədvəl 3.1-ə bax).

Əgər paylanma sırasının qurulduğu xarakteristika kəmiyyətdirsə, o zaman sıra variasiya adlanır.

Paylanmanın variasiya seriyası həmişə iki hissədən ibarətdir: variant və müvafiq tezliklər (və ya tezliklər). Variant xarakteristikanın populyasiya vahidlərində ala biləcəyi qiymətdir, xarakteristikanın verilmiş dəyərinə malik müşahidə vahidlərinin sayıdır; Tezliklərin cəmi həmişə əhalinin həcminə bərabərdir. Bəzən tezliklər əvəzinə tezliklər hesablanır - bunlar ya vahidin fraksiyaları (sonra bütün tezliklərin cəmi 1-ə bərabərdir) və ya əhalinin həcminin faizi (tezliklərin cəmi) kimi ifadə olunan tezliklərdir. 100%-ə bərabər olmalıdır.

Variasiya sıraları diskret və intervaldır. Diskret seriyalar üçün (Cədvəl 3.7) variantlar xüsusi ədədlərlə, əksər hallarda tam ədədlərlə ifadə edilir.

Cədvəl 3.8. İşçilərin sığorta şirkətində işlədikləri vaxta görə bölgüsü
Şirkətdə iş vaxtı, tam illər (seçimlər) İşçilərin sayı
Adam (tezliklər) cəminin %-lə (tezlik)
bir ilə qədər 15 11,6
1 17 13,2
2 19 14,7
3 26 20,2
4 10 7,8
5 18 13,9
6 24 18,6
Ümumi 129 100,0

İnterval seriyalarında (Cədvəl 3.2-ə baxın) göstərici dəyərləri intervallar şəklində göstərilir. Intervalların iki sərhədi var: aşağı və yuxarı. Intervallar açıq və ya qapalı ola bilər. Açıq olanların sərhədlərdən biri yoxdur, buna görə də Cədvəldə. 3.2 birinci intervalın aşağı sərhədi, sonuncunun isə yuxarı sərhədi yoxdur. İnterval seriyası qurarkən atribut qiymətlərinin yayılmasının xarakterindən asılı olaraq həm bərabər, həm də qeyri-bərabər intervallardan istifadə olunur (Cədvəl 3.2-də bərabər intervallara malik variasiya seriyası göstərilir).

Xarakteristika məhdud sayda, adətən 10-dan çox olmayan qiymətlər alırsa, diskret paylama sıraları qurulur. Seçim daha böyükdürsə, diskret seriya aydınlığını itirir; bu halda variasiya seriyasının interval formasından istifadə etmək məqsədəuyğundur. Xarakteristikanın davamlı dəyişməsi ilə, müəyyən hədlər daxilində onun dəyərləri bir-birindən ixtiyari olaraq az miqdarda fərqləndikdə, interval paylama seriyası da qurulur.

3.3.1. Diskret variasiya sıralarının qurulması

Nümunədən istifadə edərək diskret variasiya sıralarının qurulması metodologiyasını nəzərdən keçirək.

Misal 3.2. 60 ailənin kəmiyyət tərkibi haqqında aşağıdakı məlumatlar mövcuddur:

Ailələrin üzvlərinin sayına görə bölgüsü haqqında fikir əldə etmək üçün variasiya seriyası qurulmalıdır. İşarə məhdud sayda tam qiymətlər qəbul etdiyi üçün biz diskret variasiya seriyası qururuq. Bunu etmək üçün əvvəlcə atributun bütün dəyərlərini (ailə üzvlərinin sayı) artan qaydada yazmaq tövsiyə olunur (yəni statistik məlumatları sıralayın):

Sonra eyni tərkibli ailələrin sayını hesablamaq lazımdır. Ailə üzvlərinin sayı (dəyişən xüsusiyyətin qiyməti) variantlardır (onları x ilə işarə edəcəyik), eyni tərkibli ailələrin sayı tezliklərdir (onları f ilə işarə edəcəyik). Qruplaşdırma nəticələrini aşağıdakı diskret variasiya paylama seriyaları şəklində təqdim edirik:

Cədvəl 3.11.
Ailə üzvlərinin sayı (x) Ailələrin sayı (y)
1 8
2 14
3 20
4 9
5 5
6 4
Ümumi 60

3.3.2. İnterval variasiya sıralarının qurulması

Aşağıdakı nümunədən istifadə edərək interval dəyişkənliyi paylama sıralarının qurulması metodologiyasını nümayiş etdirək.

Misal 3.3. Statistik müşahidə nəticəsində 50 kommersiya bankının orta faiz dərəcəsi (%) üzrə aşağıdakı məlumatlar əldə edilmişdir:

Cədvəl 3.12.
14,7 19,0 24,5 20,8 12,3 24,6 17,0 14,2 19,7 18,8
18,1 20,5 21,0 20,7 20,4 14,7 25,1 22,7 19,0 19,6
19,0 18,9 17,4 20,0 13,8 25,6 13,0 19,0 18,7 21,1
13,3 20,7 15,2 19,9 21,9 16,0 16,9 15,3 21,4 20,4
12,8 20,8 14,3 18,0 15,1 23,8 18,5 14,4 14,4 21,0

Gördüyümüz kimi, belə bir sıra məlumatlara baxmaq son dərəcə əlverişsizdir, əlavə olaraq, göstəricidə heç bir dəyişiklik nümunəsi görünmür; İnterval paylama seriyasını quraq.

  1. Fasilələrin sayını müəyyən edək.

    Təcrübədə intervalların sayı çox vaxt hər bir konkret müşahidənin məqsədlərinə əsaslanaraq tədqiqatçının özü tərəfindən müəyyən edilir. Eyni zamanda, Sturgess düsturundan istifadə edərək riyazi olaraq da hesablana bilər

    n = 1 + 3.322lgN,

    burada n intervalların sayıdır;

    N - əhalinin həcmi (müşahidə vahidlərinin sayı).

    Nümunəmiz üçün alırıq: n = 1 + 3.322lgN = 1 + 3.322lg50 = 6.6 "7.

  2. Düsturdan istifadə edərək intervalların ölçüsünü (i) təyin edək

    burada x max atributun maksimum qiymətidir;

    x min - atributun minimum dəyəri.

    Bizim nümunəmiz üçün

    Variasiya seriyasının intervalları, əgər sərhədləri “dəyirmi” qiymətlərə malikdirsə, aydındır, ona görə də gəlin intervalın qiymətini 1,9-dan 2-yə, xarakteristikanın minimum dəyərini isə 12,3-dən 12,0-a yuvarlaqlaşdıraq.

  3. Aralıqların sərhədlərini təyin edək.

    Intervallar, bir qayda olaraq, elə yazılır ki, bir intervalın yuxarı həddi həm də növbəti intervalın aşağı həddi olsun. Beləliklə, nümunəmiz üçün alırıq: 12.0-14.0; 14,0-16,0; 16,0-18,0; 18,0-20,0; 20,0-22,0; 22,0-24,0; 24.0-26.0.

    Belə bir giriş atributun davamlı olması deməkdir. Xarakteristikanın variantları ciddi şəkildə müəyyən edilmiş dəyərləri götürürsə, məsələn, yalnız tam ədədlər, lakin onların sayı diskret sıra qurmaq üçün çox böyükdürsə, onda intervalın aşağı sərhədinin yuxarı ilə üst-üstə düşməyəcəyi interval seriyası yarada bilərsiniz. növbəti intervalın sərhədi (bu, xarakteristikanın diskret olduğunu ifadə edəcək). Məsələn, müəssisə işçilərinin yaşa görə bölgüsündə aşağıdakı illər interval qruplarını yarada bilərsiniz: 18-25, 26-33, 34-41, 42-49, 50-57, 58-65, 66 və daha çox.

    Bundan əlavə, nümunəmizdə ilk və son intervalları açıq edə bilərik və s. yazmaq: 14.0-a qədər; 24.0 və yuxarı.

  4. İlkin məlumatlara əsaslanaraq, sıralanmış bir sıra quracağıq. Bunu etmək üçün işarənin qəbul etdiyi dəyərləri artan qaydada yazırıq. Nəticələri cədvəldə təqdim edirik: Cədvəl 3.13. Kommersiya banklarının faiz dərəcələrinin sıralanması
    Bank dərəcəsi % (seçimlər)
    12,3 17,0 19,9 23,8
    12,8 17,4 20,0 24,5
    13,0 18,0 20,0 24,6
    13,3 18,1 20,4 25,1
    13,8 18,5 20,4 25,6
    14,2 18,7 20,5
    14,3 18,8 20,7
    14,4 18,9 20,7
    14,7 19,0 20,8
    14,7 19,0 21,0
    15,1 19,0 21,0
    15,2 19,0 21,1
    15,3 19,0 21,4
    16,0 19,6 21,9
    16,9 19,7 22,7
  5. Tezlikləri sayaq.

    Tezlikləri hesablayarkən, xarakteristikanın qiyməti hansısa intervalın sərhəddinə düşəndə ​​vəziyyət yarana bilər. Bu vəziyyətdə, qaydanı rəhbər tuta bilərsiniz: müəyyən bir vahid onun dəyərinin yuxarı həddi olduğu intervala təyin olunur. Beləliklə, nümunəmizdəki 16.0 dəyəri ikinci intervala istinad edəcəkdir.

Nümunəmizdə əldə edilən qruplaşdırma nəticələri cədvəldə təqdim olunacaq.

Cədvəl 3.14. Kommersiya banklarının kredit faizinə görə bölgüsü
Qısa nisbət, % Bankların sayı, vahidlər (tezliklər) Yığılmış tezliklər
12,0-14,0 5 5
14,0-16,0 9 14
16,0-18,0 4 18
18,0-20,0 15 33
20,0-22,0 11 44
22,0-24,0 2 46
24,0-26,0 4 50
Ümumi 50 -

Cədvəlin sonuncu sütununda birincidən başlayaraq tezliklərin ardıcıl cəmlənməsi yolu ilə əldə edilən yığılmış tezliklər təqdim olunur (məsələn, birinci interval üçün - 5, ikinci interval üçün 5 + 9 = 14, üçüncü interval üçün 5 + 9 + 4 = 18 və s.). Yığılmış tezlik, məsələn, 33, 33 bankın 20%-i (müvafiq intervalın yuxarı həddini) keçməyən kredit dərəcəsinə malik olduğunu göstərir.

Variasiya sıralarının qurulması zamanı verilənlərin qruplaşdırılması prosesində bəzən qeyri-bərabər intervallardan istifadə olunur. Bu, xarakteristikanın qiymətlərinin arifmetik və ya həndəsi irəliləmə qaydasına tabe olduğu və ya Sturgess düsturunun tətbiqi bir müşahidə vahidi olmayan "boş" interval qruplarının yaranmasına səbəb olan hallara aiddir. Sonra intervalların hüdudları sağlam düşüncə və sorğunun məqsədlərinə əsaslanaraq və ya düsturlardan istifadə etməklə tədqiqatçının özü tərəfindən özbaşına müəyyən edilir. Beləliklə, arifmetik irəliləyişdə dəyişən məlumatlar üçün intervalların ölçüsü aşağıdakı kimi hesablanır.

1 nömrəli laboratoriya işi. Statistik məlumatların ilkin emalı

Dağıtım seriyasının qurulması

Əhali vahidlərinin hər hansı bir xüsusiyyətə görə qruplara nizamlı şəkildə paylanması deyilir yaxın paylama . Bu halda xarakteristika ya kəmiyyət ola bilər, sonra sıra çağırılır variasiyalı , və keyfiyyətli, sonra sıra adlanır atributiv . Beləliklə, məsələn, bir şəhərin əhalisi variasiya seriyasında yaş qruplarına görə və ya bir atribut seriyasında peşəkar mənsubiyyətə görə bölünə bilər (təbii ki, paylama seriyalarının qurulması üçün daha çox keyfiyyət və kəmiyyət xüsusiyyətləri təklif edilə bilər; xarakteristikası statistik tədqiqatın vəzifəsi ilə müəyyən edilir).

İstənilən paylama seriyası iki elementlə xarakterizə olunur:

- seçim(x i) – bunlar nümunə populyasiyasındakı vahidlərin xarakteristikasının fərdi dəyərləridir. Variasiya seriyası üçün variant ədədi dəyərlər, atributiv sıra üçün – keyfiyyət (məsələn, x = “dövlət qulluqçusu”);

- tezlik(n i) – müəyyən bir atribut dəyərinin neçə dəfə baş verdiyini göstərən rəqəm. Tezlik nisbi ədəd kimi ifadə edilirsə (yəni populyasiyanın ümumi həcmində variantların verilmiş dəyərinə uyğun gələn populyasiya elementlərinin nisbəti), onda ona deyilir. nisbi tezlik və ya tezlik.

Variasiya seriyası ola bilər:

- diskret, tədqiq olunan xarakteristika müəyyən ədədlə (adətən tam ədəd) səciyyələndirildikdə.

- interval, “dan” və “to” sərhədləri davamlı dəyişən xüsusiyyət üçün müəyyən edildikdə. Diskret olaraq dəyişən xarakteristikanın qiymətlər dəsti böyükdürsə, interval seriyası da qurulur.

İnterval seriyası həm bərabər uzunluqlu intervallarla (bərabər intervallı seriyalar), həm də qeyri-bərabər intervallarla, əgər bu, statistik tədqiqatın şərtləri ilə diktə edilirsə, qurula bilər. Məsələn, aşağıdakı intervallarla bir sıra gəlir bölgüsü hesab edilə bilər:<5тыс р., 5-10 тыс р., 10-20 тыс.р., 20-50 тыс р., и т.д. Если цель исследования не определяет способ построения интервального ряда, то строится равноинтервальный ряд, число интервалов в котором определяется по формуле Стерджесса:



burada k intervalların sayı, n seçmə ölçüsüdür. (Əlbəttə, düstur adətən kəsr ədədi verir və nəticədə alınan ədədə ən yaxın tam ədəd intervalların sayı kimi seçilir.) Bu halda intervalın uzunluğu düsturla müəyyən edilir.

.

Qrafik olaraq variasiya seriyaları formada təqdim edilə bilər histoqramlar(interval seriyasının hər bir intervalının üstündə bu intervaldakı tezliyə uyğun hündürlük "sütun" qurulur), paylama poliqonu(nöqtələri birləşdirən qırıq xətt ( x i;n i) və ya toplanır(yığılmış tezliklər üzərində qurulmuşdur, yəni hər bir atribut dəyəri üçün atribut dəyəri veriləndən az olan obyektlər dəstində baş vermə tezliyi götürülür).

Excel-də işləyərkən variasiya seriyalarını qurmaq üçün aşağıdakı funksiyalardan istifadə edilə bilər:

YOXLAYIN( məlumat massivi) – nümunənin ölçüsünü müəyyən etmək üçün. Arqument nümunə məlumatının yerləşdiyi xanaların diapazonudur.

COUNTIF( diapazon; meyar) – atribut və ya variasiya seriyası qurmaq üçün istifadə edilə bilər. Arqumentlər atributun nümunə dəyərləri massivinin diapazonu və meyardır - atributun rəqəmli və ya mətn dəyəri və ya onun yerləşdiyi xananın sayı. Nəticə nümunədə həmin dəyərin baş vermə tezliyidir.

TEZLİK( məlumat massivi; intervallar massivi) – variasiya seriyasının qurulması üçün. Arqumentlər nümunə məlumat massivinin diapazonu və interval sütunudur. Diskret bir sıra qurmaq lazımdırsa, burada seçimlərin dəyərləri göstərilir; əgər bu, interval seriyasıdırsa, onda intervalların yuxarı sərhədləri (onlara "ciblər" də deyilir). Nəticə tezliklər sütunu olduğundan, CTRL+SHIFT+ENTER düymələrini basaraq funksiya girişini tamamlamalısınız. Qeyd edək ki, bir funksiyanı təqdim edərkən intervallar massivini təyin edərkən, onun içindəki son dəyəri göstərməyə ehtiyac yoxdur - əvvəlki "ciblərə" daxil olmayan bütün dəyərlər müvafiq "cibə" yerləşdiriləcəkdir. Bu, bəzən ən böyük nümunə dəyərini avtomatik olaraq sonuncu cibdə yerləşdirməmək səhvindən qaçmağa kömək edə bilər.

Bundan əlavə, mürəkkəb qruplaşmalar üçün (bir neçə xüsusiyyətə əsasən) "pivot cədvəllər" alətindən istifadə edin. Onlar həmçinin atribut və variasiya seriyalarını qurmaq üçün istifadə edilə bilər, lakin bu, lazımsız olaraq tapşırığı çətinləşdirir. Həmçinin, variasiya seriyası və histoqram yaratmaq üçün “Analiz paketi” əlavəsindən “histogram” proseduru mövcuddur (Excel-də əlavələrdən istifadə etmək üçün əvvəlcə onları yükləməlisiniz; onlar standart olaraq quraşdırılmayıb)

Gəlin aşağıdakı nümunələrlə ilkin məlumatların emalı prosesini təsvir edək.

Misal 1.1. 60 ailənin kəmiyyət tərkibi haqqında məlumat var.

Variasiya seriyası və paylanma poliqonunu qurun

Həll.

Excel cədvəllərini açaq. Məlumat massivini A1:L5 diapazonuna daxil edək. Bir sənədi elektron formada (məsələn, Word formatında) öyrənirsinizsə, bunun üçün məlumatların olduğu cədvəli seçin və onu mübadilə buferinə köçürün, sonra A1 xanasını seçin və məlumatları yapışdırın - onlar avtomatik olaraq yer tutacaqlar. müvafiq diapazon. Nümunə həcmini hesablayaq - bunun üçün nümunə məlumatlarının sayını B7 xanasına =COUNT(A1:L5) daxil edin; Qeyd edək ki, düstura istədiyiniz diapazonu daxil etmək üçün onun təyinatını klaviaturadan daxil etmək lazım deyil, onu seçmək kifayətdir; B8 xanasına =MIN(A1:L5), B9 xanasına isə =MAX(A1:L5) düsturunu daxil etməklə nümunədəki minimum və maksimum dəyərləri müəyyən edək.

Şəkil 1.1 Nümunə 1. Excel cədvəllərində statistik məlumatların ilkin emalı

Sonra, interval sütunu (variant dəyərləri) və tezlik sütunu üçün adlar daxil etməklə variasiya seriyasının qurulması üçün cədvəl hazırlayacağıq. Interval sütununda B12: B17 diapazonunu tutan minimumdan (1) maksimuma (6) qədər xarakterik dəyərləri daxil edin. Tezlik sütununu seçin, =FREQUENCY(A1:L5,B12:B17) düsturunu daxil edin və CTRL+SHIFT+ENTER düymələr kombinasiyasını basın.

Şəkil 1.2 Nümunə 1. Variasiya seriyasının qurulması

Nəzarət etmək üçün SUM funksiyasından istifadə edərək tezliklərin cəmini hesablayaq (“Ev” sekmesindəki “Redaktə” qrupunda funksiya simvolu S), hesablanmış məbləğ B7 xanasında əvvəlcədən hesablanmış nümunə həcmi ilə üst-üstə düşməlidir.

İndi çoxbucaqlı quraq: nəticədə yaranan tezlik diapazonunu seçdikdən sonra "Daxil et" sekmesinde "Qrafik" əmrini seçin. Varsayılan olaraq, üfüqi oxdakı dəyərlər sıra nömrələri olacaq - bizim vəziyyətimizdə 1-dən 6-a qədər, bu seçimlərin dəyərləri (tarif kateqoriyalarının sayı) ilə üst-üstə düşür.

Diaqram seriyasının “seriya 1” adı ya “Dizayn” sekmesinin eyni “məlumatları seçin” seçimindən istifadə etməklə dəyişdirilə və ya sadəcə silinə bilər.

Şəkil 1.3. Misal 1. Tezlik poliqonunun qurulması

Misal 1.2. 50 mənbədən çirkləndiricilərin emissiyaları haqqında məlumatlar var:

10,4 18,6 10,3 26,0 45,0 18,2 17,3 19,2 25,8 18,7
28,2 25,2 18,4 17,5 41,8 14,6 10,0 37,8 10,5 16,0
18,1 16,8 38,5 37,7 17,9 29,0 10,1 28,0 12,0 14,0
14,2 20,8 13,5 42,4 15,5 17,9 19, 10,8 12,1 12,4
12,9 12,6 16,8 19,7 18,3 36,8 15,0 37,0 13,0 19,5

Bərabər intervallı sıra tərtib edin, histoqram qurun

Həll

Məlumat massivini Excel vərəqinə daxil edək, o, A1:J5 diapazonunu tutacaq. Əvvəlki tapşırıqda olduğu kimi, nümunənin ölçüsünü n, nümunədəki minimum və maksimum dəyərləri təyin edəcəyik. İndi bizə diskret sıra yox, interval seriyası lazım olduğundan və məsələdə intervalların sayı göstərilmədiyindən Sturgess düsturundan istifadə edərək k intervallarının sayını hesablayırıq. Bunun üçün B10 xanasına =1+3.322*LOG10(B7) düsturunu daxil edin.

Şəkil 1.4. Misal 2. Bərabər intervallı silsilənin qurulması

Nəticədə alınan dəyər tam deyil, təxminən 6,64-dür. k=7 ilə intervalların uzunluğu tam ədəd kimi ifadə ediləcəyindən (k=6 vəziyyətindən fərqli olaraq) bu dəyəri C10 xanasına daxil edərək k=7 seçirik. B11 xanasındakı d intervalının uzunluğunu =(B9-B8)/C10 düsturu ilə hesablayırıq.

7 intervalın hər biri üçün yuxarı həddi göstərən intervallar massivini təyin edək. Bunun üçün E8 xanasına =B8+B11 düsturunu daxil etməklə birinci intervalın yuxarı həddini hesablayırıq; E9 xanasına =E8+B11 düsturunu daxil etməklə ikinci intervalın yuxarı həddi. Fasilələrin yuxarı sərhədlərinin qalan qiymətlərini hesablamaq üçün $ işarəsindən istifadə edərək daxil edilmiş düsturda B11 xanasının sayını təyin edirik ki, E9 xanasındakı düstur =E8+B$11 formasını alsın və xananı kopyalayırıq. E9 hüceyrəsinin məzmunu E10-E14 hüceyrələrinə. Alınan son dəyər B9 xanasında əvvəllər hesablanmış nümunədəki maksimum dəyərə bərabərdir.

Şəkil 1.5. Misal 2. Bərabər intervallı silsilənin qurulması


İndi 1-ci misalda olduğu kimi FREQUENCY funksiyasından istifadə edərək “ciblər” massivini dolduraq.

Şəkil 1.6. Misal 2. Bərabər intervallı silsilənin qurulması

Yaranan variasiya seriyasından istifadə edərək bir histoqram quracağıq: tezlik sütununu seçin və "Daxil et" sekmesinde "Histogram" seçin. Histoqramı aldıqdan sonra içindəki üfüqi oxun etiketlərini intervallar diapazonundaki dəyərlərə dəyişdirək, "Dizayner" sekmesinin "Məlumatları seçin" seçimini seçin; Görünən pəncərədə "Üfüqi ox etiketləri" bölməsi üçün "Dəyişdir" əmrini seçin və siçan ilə seçərək seçimlər üçün dəyərlər diapazonunu daxil edin.

Şəkil 1.7. Misal 2. Histoqramın qurulması

Şəkil 1.8. Misal 2. Histoqramın qurulması