Davamlı kəmiyyət məlumatları üçün interval dəyişkənlik sıralarının qurulması. Diskret variasiya seriyasının qurulması

Qruplaşdırma- bu, populyasiyanın hansısa xüsusiyyətə görə homojen olan qruplara bölünməsidir.

Xidmətin məqsədi. Onlayn kalkulyatordan istifadə edərək aşağıdakıları edə bilərsiniz:

  • variasiya seriyası qurun, histoqram və çoxbucaqlı qurmaq;
  • variasiya göstəricilərini tapın (orta, rejim (o cümlədən qrafik), median, variasiya diapazonu, kvartillər, desillər, kvartil diferensiallaşma əmsalı, variasiya əmsalı və digər göstəricilər);

Təlimatlar. Bir sıra qruplaşdırmaq üçün əldə edilmiş variasiya seriyasının növünü (diskret və ya interval) seçməlisiniz və məlumatların miqdarını (sətirlərin sayını) göstərməlisiniz. Nəticə həlli Word faylında saxlanılır (statistik məlumatların qruplaşdırılması nümunəsinə baxın).

Daxil edilmiş məlumatların sayı
",0);">

Əgər qruplaşdırma artıq aparılıbsa və diskret variasiya seriyası və ya interval seriyası, sonra onlayn kalkulyator Variasiya İndekslərindən istifadə etməlisiniz. Paylanma növü haqqında fərziyyənin sınaqdan keçirilməsi paylanma formasının öyrənilməsi xidmətindən istifadə etməklə həyata keçirilir.

Statistik qruplaşmaların növləri

Variasiya seriyası. Diskret təsadüfi kəmiyyətin müşahidəsi zamanı eyni qiymətə bir neçə dəfə rast gəlmək olar. Təsadüfi dəyişənin belə x i dəyərləri qeyd olunur ki, n i n müşahidədə neçə dəfə göründüyünü göstərir, bu, bu dəyərin tezliyidir.
Davamlı təsadüfi kəmiyyət halında praktikada qruplaşdırmadan istifadə edilir.
  1. Tipoloji qruplaşdırma- bu, öyrənilən keyfiyyətcə heterojen əhalinin siniflərə, sosial-iqtisadi tiplərə, vahid vahid qruplarına bölünməsidir. Bu qruplaşmanı qurmaq üçün Diskret variasiya seriyası parametrindən istifadə edin.
  2. Qruplaşmaya struktur deyilir, burada homojen populyasiya bəzi dəyişən xüsusiyyətlərə görə strukturunu xarakterizə edən qruplara bölünür. Bu qruplaşmanı qurmaq üçün Interval seriyası parametrindən istifadə edin.
  3. Öyrənilən hadisələrlə onların xüsusiyyətləri arasında əlaqələri aşkar edən qruplaşma deyilir analitik qrup(seriyaların analitik qruplaşdırılmasına baxın).

Statistik qruplaşmaların qurulması prinsipləri

Artan ardıcıllıqla düzülmüş müşahidələr silsiləsi variasiya seriyası adlanır. Qruplaşdırma xüsusiyyətiəhalinin ayrı-ayrı qruplara bölünməsi xüsusiyyətidir. Qrupun əsası adlanır. Qruplaşdırma həm kəmiyyət, həm də keyfiyyət xüsusiyyətlərinə əsaslana bilər.
Qruplaşmanın əsasını müəyyən etdikdən sonra öyrənilən əhalinin neçə qrupa bölünməli olduğu məsələsi həll edilməlidir.

Statistik məlumatların emalı üçün fərdi kompüterlərdən istifadə edilərkən obyekt vahidlərinin qruplaşdırılması standart prosedurlardan istifadə etməklə həyata keçirilir.
Belə prosedurlardan biri qrupların optimal sayını təyin etmək üçün Sturgess düsturunun istifadəsinə əsaslanır:

k = 1+3,322*log(N)

Burada k qrupların sayı, N əhali vahidlərinin sayıdır.

Qismən intervalların uzunluğu h=(x max -x min)/k kimi hesablanır

Sonra bu intervallara düşən müşahidələrin sayları sayılır və onlar tezliklər kimi qəbul edilir n i . Qiymətləri 5-dən az olan bir neçə tezlik (n i< 5), следует объединить. в этом случае надо объединить и соответствующие интервалы.
x i =(c i-1 +c i)/2 intervallarının orta qiymətləri yeni qiymətlər kimi qəbul edilir.

1 nömrəli laboratoriya işi

Riyazi statistikaya görə

Mövzu: Eksperimental məlumatların ilkin emalı

3. Xallarla hesablayın. 1

5. Test sualları.. 2

6. Laboratoriya işlərinin yerinə yetirilməsi metodikası.. 3

İşin məqsədi

Riyazi statistika metodlarından istifadə etməklə empirik məlumatların ilkin emalı üzrə bacarıqların əldə edilməsi.

Eksperimental məlumatların cəminə əsaslanaraq, aşağıdakı tapşırıqları yerinə yetirin:

Məşq 1.İnterval dəyişikliyinin paylanması seriyasını qurun.

Tapşırıq 2.İnterval variasiya seriyasının tezliklərinin histoqramını qurun.

Tapşırıq 3. Empirik paylama funksiyası yaradın və qrafiki qurun.

a) rejim və median;

b) şərti başlanğıc anları;

c) orta nümunə;

d) seçmə dispersiya, düzəldilmiş populyasiya dispersiyası, düzəldilmiş standart kənarlaşma;

e) dəyişmə əmsalı;

f) asimmetriya;

g) kurtoz;

Tapşırıq 5. Tədqiq olunan təsadüfi dəyişənin ədədi xüsusiyyətlərinin həqiqi qiymətlərinin sərhədlərini müəyyən bir etibarlılıqla təyin edin.

Tapşırıq 6. Tapşırığın şərtlərinə uyğun olaraq ilkin emal nəticələrinin məzmun əsasında şərhi.

Xallarla hesablayın

Tapşırıqlar 1-56 xal

Tapşırıq 62 xal

Laboratoriya işinin müdafiəsi(test sualları və laboratoriya işi üzrə şifahi müsahibə) - 2 xal

İş A4 vərəqlərində yazılı şəkildə təqdim edilməlidir və aşağıdakıları əhatə edir:

1) Başlıq səhifəsi (Əlavə 1)

2) İlkin məlumatlar.

3) İşin göstərilən nümunəyə uyğun təqdim edilməsi.

4) Müəyyən edilmiş qaydada hesablama nəticələri (əl ilə və/və ya MS Excel proqramından istifadə etməklə aparılır).

5) Nəticələr - problemin şərtlərinə uyğun olaraq ilkin emal nəticələrinin mənalı şərhi.

6) İş və nəzarət sualları üzrə şifahi müsahibə.



5. Test sualları


Laboratoriya işlərinin yerinə yetirilməsi metodikası

Tapşırıq 1. İntervallı variasiya paylanma sırasını qurun

Statistik məlumatları bərabər məsafəli variantlarla variasiya seriyası şəklində təqdim etmək üçün aşağıdakılar lazımdır:

1. Orijinal məlumat cədvəlində ən kiçik və ən böyük dəyərləri tapın.

2. Müəyyən edin variasiya diapazonu :

3. H intervalının uzunluğunu müəyyən edin, əgər nümunədə 1000-ə qədər məlumat varsa, düsturdan istifadə edin: , burada n – seçmə ölçüsü – nümunədəki məlumatların miqdarı; hesablamalar üçün lgn götürün).

Hesablanmış nisbət yuvarlaqlaşdırılır rahat tam dəyəri .

4. Cüt sayda intervallar üçün birinci intervalın başlanğıcını müəyyən etmək üçün qiyməti qəbul etmək tövsiyə olunur; və tək sayda intervallar üçün.

5. Qruplaşdırma intervallarını yazın və onları sərhədlərin artan ardıcıllığı ilə düzün

, ,………., ,

birinci intervalın aşağı həddi haradadır. -dən çox olmayan əlverişli nömrə götürülür, sonuncu intervalın yuxarı həddi -dən az olmamalıdır. Fasilələrin təsadüfi dəyişənin ilkin qiymətlərini ehtiva etməsi və onlardan ayrılması tövsiyə olunur 5 ilə 20 intervallar.

6. Qruplaşdırma intervalları üzrə ilkin məlumatları yazın, yəni. göstərilən intervallara düşən təsadüfi dəyişənlərin sayını hesablamaq üçün mənbə cədvəlindən istifadə edin. Bəzi dəyərlər intervalların sərhədləri ilə üst-üstə düşürsə, onda onlar ya yalnız əvvəlki, ya da yalnız sonrakı intervala aid edilirlər.

Qeyd 1. Fasilələrin uzunluğu bərabər olmamalıdır. Dəyərlərin daha sıx olduğu yerlərdə daha kiçik, qısa intervallar, daha az tez-tez olan yerlərdə isə daha böyük olanları götürmək daha rahatdır.

Qeyd 2.Əgər bəzi dəyərlər üçün “sıfır” və ya kiçik tezlik dəyərləri əldə edilirsə, o zaman intervalları genişləndirərək (addımı artıraraq) məlumatları yenidən qruplaşdırmaq lazımdır.

1 nömrəli laboratoriya işi. Statistik məlumatların ilkin emalı

Dağıtım seriyasının qurulması

Əhali vahidlərinin hər hansı bir xüsusiyyətə görə qruplara nizamlı şəkildə paylanması deyilir yaxın paylama . Bu halda xarakteristika ya kəmiyyət ola bilər, sonra sıra çağırılır variasiyalı , və keyfiyyətli, sonra sıra adlanır atributiv . Beləliklə, məsələn, bir şəhərin əhalisi variasiya seriyasında yaş qruplarına görə və ya bir atribut seriyasında peşəkar mənsubiyyətə görə bölünə bilər (təbii ki, paylama seriyalarının qurulması üçün daha çox keyfiyyət və kəmiyyət xüsusiyyətləri təklif edilə bilər; xarakteristikası statistik tədqiqatın vəzifəsi ilə müəyyən edilir).

İstənilən paylama seriyası iki elementlə xarakterizə olunur:

- seçim(x i) – bunlar nümunə populyasiyasındakı vahidlərin xarakteristikasının fərdi dəyərləridir. Variasiya seriyası üçün variant ədədi dəyərlər, atributiv sıra üçün – keyfiyyət (məsələn, x = “dövlət qulluqçusu”);

- tezlik(n i) – müəyyən bir atribut dəyərinin neçə dəfə baş verdiyini göstərən rəqəm. Tezlik nisbi ədəd kimi ifadə edilirsə (yəni, populyasiyanın ümumi həcmində variantların verilmiş dəyərinə uyğun gələn populyasiya elementlərinin nisbəti), o zaman ona deyilir. nisbi tezlik və ya tezlik.

Variasiya seriyası ola bilər:

- diskret, tədqiq olunan xarakteristika müəyyən ədədlə (adətən tam ədəd) səciyyələndirildikdə.

- interval, “dan” və “to” sərhədləri davamlı dəyişən xüsusiyyət üçün müəyyən edildikdə. Diskret olaraq dəyişən xarakteristikanın qiymətlər dəsti böyükdürsə, interval seriyası da qurulur.

İnterval seriyası həm bərabər uzunluqlu intervallarla (bərabər intervallı seriyalar), həm də qeyri-bərabər intervallarla, əgər bu, statistik tədqiqatın şərtləri ilə diktə edilirsə, qurula bilər. Məsələn, aşağıdakı intervallarla bir sıra gəlir bölgüsü hesab edilə bilər:<5тыс р., 5-10 тыс р., 10-20 тыс.р., 20-50 тыс р., и т.д. Если цель исследования не определяет способ построения интервального ряда, то строится равноинтервальный ряд, число интервалов в котором определяется по формуле Стерджесса:



burada k intervalların sayı, n seçmə ölçüsüdür. (Əlbəttə, düstur adətən kəsr ədədi verir və nəticədə alınan ədədə ən yaxın tam ədəd intervalların sayı kimi seçilir.) Bu halda intervalın uzunluğu düsturla müəyyən edilir.

.

Qrafik olaraq variasiya seriyaları formada təqdim edilə bilər histoqramlar(interval seriyasının hər bir intervalının üstündə bu intervaldakı tezliyə uyğun hündürlük "sütun" qurulur), paylama poliqonu(nöqtələri birləşdirən qırıq xətt ( x i;n i) və ya toplanır(yığılmış tezliklər üzərində qurulmuşdur, yəni hər bir atribut dəyəri üçün atribut dəyəri veriləndən az olan obyektlər dəstində baş vermə tezliyi götürülür).

Excel-də işləyərkən variasiya seriyalarını qurmaq üçün aşağıdakı funksiyalardan istifadə edilə bilər:

YOXLAYIN( məlumat massivi) – nümunənin ölçüsünü müəyyən etmək üçün. Arqument nümunə məlumatının yerləşdiyi xanaların diapazonudur.

COUNTIF( diapazon; meyar) – atribut və ya variasiya seriyası qurmaq üçün istifadə edilə bilər. Arqumentlər atributun nümunə dəyərləri massivinin diapazonu və meyardır - atributun rəqəmli və ya mətn dəyəri və ya onun yerləşdiyi xananın sayı. Nəticə nümunədə həmin dəyərin baş vermə tezliyidir.

TEZLİK( məlumat massivi; intervallar massivi) – variasiya seriyasının qurulması üçün. Arqumentlər nümunə məlumat massivinin diapazonu və interval sütunudur. Diskret bir sıra qurmaq lazımdırsa, burada seçimlərin dəyərləri göstərilir; əgər bu interval seriyasıdırsa, intervalların yuxarı sərhədləri (onlara "ciblər" də deyilir). Nəticə tezliklər sütunu olduğundan, CTRL+SHIFT+ENTER düymələrini basaraq funksiya girişini tamamlamalısınız. Qeyd edək ki, bir funksiyanı təqdim edərkən intervallar massivini təyin edərkən, onun içindəki son dəyəri göstərməyə ehtiyac yoxdur - əvvəlki "ciblərə" daxil olmayan bütün dəyərlər müvafiq "cibə" yerləşdiriləcəkdir. Bu, bəzən ən böyük nümunə dəyərini avtomatik olaraq sonuncu cibdə yerləşdirməmək səhvindən qaçmağa kömək edə bilər.

Bundan əlavə, mürəkkəb qruplaşmalar üçün (bir neçə xüsusiyyətə əsasən) "pivot cədvəllər" alətindən istifadə edin. Onlar həmçinin atribut və variasiya seriyalarını qurmaq üçün istifadə edilə bilər, lakin bu, lazımsız olaraq tapşırığı çətinləşdirir. Həmçinin, variasiya seriyası və histoqram yaratmaq üçün “Analiz paketi” əlavəsindən “histogram” proseduru mövcuddur (Excel-də əlavələrdən istifadə etmək üçün əvvəlcə onları yükləməlisiniz; onlar standart olaraq quraşdırılmayıb)

Gəlin aşağıdakı nümunələrlə ilkin məlumatların emalı prosesini təsvir edək.

Misal 1.1. 60 ailənin kəmiyyət tərkibi haqqında məlumat var.

Variasiya seriyası və paylanma poliqonunu qurun

Həll.

Excel cədvəllərini açaq. Məlumat massivini A1:L5 diapazonuna daxil edək. Bir sənədi elektron formada (məsələn, Word formatında) öyrənirsinizsə, bunu etmək üçün məlumatların olduğu cədvəli seçin və onu mübadilə buferinə köçürün, sonra A1 xanasını seçin və məlumatları yapışdırın - onlar avtomatik olaraq yer tutacaqlar. müvafiq diapazon. Nümunənin həcmini hesablayaq n - nümunə məlumatlarının sayını, bunun üçün B7 xanasına =COUNT(A1:L5) düsturunu daxil edin. Qeyd edək ki, düstura istədiyiniz diapazonu daxil etmək üçün onun təyinatını klaviaturadan daxil etmək lazım deyil, onu seçmək kifayətdir. B8 xanasına =MIN(A1:L5), B9 xanasına isə =MAX(A1:L5) düsturunu daxil etməklə nümunədəki minimum və maksimum dəyərləri müəyyən edək.

Şəkil 1.1 Nümunə 1. Excel cədvəllərində statistik məlumatların ilkin emalı

Sonra, interval sütunu (variant dəyərləri) və tezlik sütunu üçün adlar daxil etməklə variasiya seriyasının qurulması üçün cədvəl hazırlayacağıq. Interval sütununda B12: B17 diapazonunu tutan minimumdan (1) maksimuma (6) qədər xarakterik dəyərləri daxil edin. Tezlik sütununu seçin, =FREQUENCY(A1:L5,B12:B17) düsturunu daxil edin və CTRL+SHIFT+ENTER düymələr kombinasiyasını basın.

Şəkil 1.2 Nümunə 1. Variasiya seriyasının qurulması

Nəzarət etmək üçün SUM funksiyasından istifadə edərək tezliklərin cəmini hesablayaq (“Ev” sekmesindəki “Redaktə” qrupunda funksiya simvolu S), hesablanmış məbləğ B7 xanasında əvvəlcədən hesablanmış nümunə həcmi ilə üst-üstə düşməlidir.

İndi çoxbucaqlı quraq: nəticədə yaranan tezlik diapazonunu seçdikdən sonra "Daxil et" sekmesinde "Qrafik" əmrini seçin. Varsayılan olaraq, üfüqi oxdakı dəyərlər sıra nömrələri olacaq - bizim vəziyyətimizdə 1-dən 6-a qədər, bu seçimlərin dəyərləri (tarif kateqoriyalarının sayı) ilə üst-üstə düşür.

Diaqram seriyasının “seriya 1” adı ya “Dizayn” sekmesinin eyni “məlumatları seçin” seçimindən istifadə etməklə dəyişdirilə və ya sadəcə silinə bilər.

Şəkil 1.3. Misal 1. Tezlik poliqonunun qurulması

Misal 1.2. 50 mənbədən çirkləndiricilərin emissiyaları haqqında məlumatlar var:

10,4 18,6 10,3 26,0 45,0 18,2 17,3 19,2 25,8 18,7
28,2 25,2 18,4 17,5 41,8 14,6 10,0 37,8 10,5 16,0
18,1 16,8 38,5 37,7 17,9 29,0 10,1 28,0 12,0 14,0
14,2 20,8 13,5 42,4 15,5 17,9 19, 10,8 12,1 12,4
12,9 12,6 16,8 19,7 18,3 36,8 15,0 37,0 13,0 19,5

Bərabər intervallı sıra tərtib edin, histoqram qurun

Həll

Məlumat massivini Excel vərəqinə daxil edək, o, A1:J5 diapazonunu tutacaq. Əvvəlki tapşırıqda olduğu kimi, nümunənin ölçüsünü n, nümunədəki minimum və maksimum dəyərləri təyin edəcəyik. İndi bizə diskret sıra yox, interval seriyası lazım olduğundan və məsələdə intervalların sayı göstərilmədiyindən Sturgess düsturundan istifadə edərək k intervallarının sayını hesablayırıq. Bunun üçün B10 xanasına =1+3.322*LOG10(B7) düsturunu daxil edin.

Şəkil 1.4. Misal 2. Bərabər intervallı silsilənin qurulması

Nəticədə alınan dəyər tam deyil, təxminən 6,64-dür. k=7 ilə intervalların uzunluğu tam ədəd kimi ifadə ediləcəyindən (k=6 vəziyyətindən fərqli olaraq) bu dəyəri C10 xanasına daxil edərək k=7 seçirik. B11 xanasındakı d intervalının uzunluğunu =(B9-B8)/C10 düsturunu daxil etməklə hesablayırıq.

7 intervalın hər biri üçün yuxarı həddi göstərən intervallar massivini təyin edək. Bunun üçün E8 xanasına =B8+B11 düsturunu daxil etməklə birinci intervalın yuxarı həddini hesablayırıq; E9 xanasına =E8+B11 düsturunu daxil etməklə ikinci intervalın yuxarı həddi. Fasilələrin yuxarı sərhədlərinin qalan qiymətlərini hesablamaq üçün $ işarəsindən istifadə edərək daxil edilmiş düsturda B11 xanasının sayını təyin edirik ki, E9 xanasındakı düstur =E8+B$11 formasını alsın və xananı kopyalayırıq. E9 hüceyrəsinin məzmunu E10-E14 hüceyrələrinə. Alınan son dəyər B9 xanasında əvvəllər hesablanmış nümunədəki maksimum dəyərə bərabərdir.

Şəkil 1.5. Misal 2. Bərabər intervallı silsilənin qurulması


İndi 1-ci misalda olduğu kimi FREQUENCY funksiyasından istifadə edərək “ciblər” massivini dolduraq.

Şəkil 1.6. Misal 2. Bərabər intervallı silsilənin qurulması

Yaranan variasiya seriyasından istifadə edərək bir histoqram quracağıq: tezlik sütununu seçin və "Daxil et" sekmesinde "Histogram" seçin. Histoqramı aldıqdan sonra içindəki üfüqi oxun etiketlərini intervallar diapazonundaki dəyərlərə dəyişdirək, bunu etmək üçün "Dizayner" sekmesinin "Məlumat seçin" seçimini seçin. Görünən pəncərədə "Üfüqi ox etiketləri" bölməsi üçün "Dəyişdir" əmrini seçin və siçan ilə seçərək seçimlər üçün dəyərlər diapazonunu daxil edin.

Şəkil 1.7. Misal 2. Histoqramın qurulması

Şəkil 1.8. Misal 2. Histoqramın qurulması

Diskret xüsusiyyətlər üçün diskret variasiya seriyası qurulur.

Diskret variasiya silsiləsi qurmaq üçün aşağıdakı addımları yerinə yetirmək lazımdır: 1) müşahidə vahidlərini xarakteristikanın öyrənilən dəyərinin artan ardıcıllığı ilə düzün;

2) x i atributunun bütün mümkün dəyərlərini təyin edin, onları artan qaydada düzün,

atributun dəyəri, i .

atribut dəyərinin tezliyi və işarə edir f i . Bir sıranın bütün tezliklərinin cəmi tədqiq olunan populyasiyadakı elementlərin sayına bərabərdir.

Misal 1 .

Şagirdlərin imtahanlarda aldıqları qiymətlərin siyahısı: 3; 4; 3; 5; 4; 2; 2; 4; 4; 3; 5; 2; 4; 5; 4; 3; 4; 3; 3; 4; 4; 2; 2; 5; 5; 4; 5; 2; 3; 4; 4; 3; 4; 5; 2; 5; 5; 4; 3; 3; 4; 2; 4; 4; 5; 4; 3; 5; 3; 5; 4; 4; 5; 4; 4; 5; 4; 5; 5; 5.

Budur nömrə X - sinifdiskret təsadüfi dəyişəndir və nəticədə təxminlərin siyahısı belədirstatistik (müşahidə edilə bilən) məlumatlar .

    Müşahidə vahidlərini tədqiq olunan xarakterik dəyərə görə artan qaydada düzün:

2; 2; 2; 2; 2; 2; 2; 2; 3; 3; 3; 3; 3; 3; 3; 3; 3; 3; 3; 3; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5.

2) x i atributunun bütün mümkün dəyərlərini təyin edin, onları artan ardıcıllıqla sıralayın:

Bu misalda bütün təxminləri aşağıdakı qiymətlərlə dörd qrupa bölmək olar: 2; 3; 4; 5.

Müəyyən bir müşahidə məlumat qrupuna uyğun gələn təsadüfi dəyişənin qiyməti deyilir atributun dəyəri, seçim (seçim) və x təyin edin i .

Xarakteristikanın müvafiq qiymətinin bir sıra müşahidələrdə neçə dəfə baş verdiyini göstərən ədəd deyilir atribut dəyərinin tezliyi və işarə edir f i .

Bizim nümunəmiz üçün

xal 2 baş verir - 8 dəfə,

xal 3 baş verir - 12 dəfə,

xal 4 baş verir - 23 dəfə,

xal 5 baş verir - 17 dəfə.

Ümumilikdə 60 reytinq var.

4) alınan məlumatları iki sıra (sütun) cədvəlinə yazın - x i və f i.

Bu məlumatlar əsasında diskret variasiya seriyası qurmaq mümkündür

Diskret variasiya seriyası – bu, tədqiq olunan xarakteristikanın baş verən dəyərlərinin artan qaydada fərdi dəyərlər və onların tezlikləri kimi göstərildiyi cədvəldir.

  1. İnterval variasiya seriyasının qurulması

Diskret variasiya sıralarına əlavə olaraq, verilənlərin qruplaşdırılması metoduna, məsələn, interval variasiya seriyasına tez-tez rast gəlinir.

İnterval seriyası aşağıdakı hallarda qurulur:

    işarənin davamlı dəyişmə xarakteri var;

    Bir çox diskret dəyər var idi (10-dan çox)

    diskret dəyərlərin tezlikləri çox kiçikdir (nisbətən çox sayda müşahidə vahidi ilə 1-3-dən çox olmamalıdır);

    eyni tezliklərə malik bir xüsusiyyətin çoxlu diskret dəyərləri.

İnterval variasiya seriyası, məlumatları iki sütunlu bir cədvəl şəklində qruplaşdırmaq üsuludur (xarakteristikanın dəyərləri intervalı və hər intervalın tezliyi şəklində).

Diskret seriyadan fərqli olaraq, interval seriyasının xarakteristikasının dəyərləri fərdi dəyərlərlə deyil, dəyərlər intervalı ilə (“dan --ə”) təmsil olunur.

Hər seçilmiş intervala neçə müşahidə vahidinin düşdüyünü göstərən nömrə deyilir atribut dəyərinin tezliyi və işarə edir f i . Sıranın bütün tezliklərinin cəmi tədqiq olunan populyasiyada olan elementlərin (müşahidə vahidlərinin) sayına bərabərdir.

Əgər vahid intervalın yuxarı həddinə bərabər xarakterik qiymətə malikdirsə, o zaman növbəti intervala təyin edilməlidir.

Məsələn, boyu 100 sm olan uşaq birinciyə deyil, 2-ci intervala düşəcək; və boyu 130 sm olan uşaq üçüncüyə deyil, sonuncu intervala düşəcək.

Bu məlumatlara əsaslanaraq, interval dəyişikliyi seriyası qurmaq olar.

Hər bir intervalın aşağı həddi (xn), yuxarı həddi (xw) və interval eni ( i).

Interval sərhədi iki intervalın sərhədində yerləşən atributun qiymətidir.

uşaq boyu (sm)

uşaq boyu (sm)

uşaqların miqdarı

130-dan çox

Əgər intervalın yuxarı və aşağı sərhədi varsa, o zaman çağırılır qapalı interval. Əgər intervalın yalnız aşağı və ya yalnız yuxarı sərhədi varsa, o zaman - açıq interval. Yalnız ilk və ya son interval açıq ola bilər. Yuxarıdakı nümunədə sonuncu interval açıqdır.

İnterval eni (i) – yuxarı və aşağı həddlər arasındakı fərq.

i = x n - x in

Açıq intervalın eninin bitişik qapalı intervalın eni ilə eyni olduğu qəbul edilir.

uşaq boyu (sm)

uşaqların miqdarı

Interval eni (i)

hesablamalar üçün 130+20=150

20 (çünki bitişik qapalı intervalın eni 20-dir)

Bütün interval sıraları bərabər intervallı interval sıralarına və qeyri-bərabər intervallı interval sıralarına bölünür . Bərabər intervallı sətirlərdə bütün intervalların eni eynidir. Qeyri-bərabər intervallara malik interval seriyalarında intervalların eni fərqli olur.

Baxılan nümunədə - qeyri-bərabər intervalları olan interval seriyası.

Bir çox hallarda, statistik populyasiyaya böyük və ya daha çox, sonsuz sayda variant daxil olduqda və bu, ən çox davamlı dəyişmə ilə baş verir, hər bir variant üçün vahidlər qrupunu yaratmaq praktiki olaraq qeyri-mümkün və qeyri-mümkündür. Belə hallarda statistik vahidlərin qruplara birləşdirilməsi yalnız interval əsasında mümkündür, yəni. dəyişən bir xüsusiyyətin dəyərləri üçün müəyyən məhdudiyyətləri olan belə bir qrup. Bu limitlər hər qrupun yuxarı və aşağı sərhədlərini göstərən iki rəqəmlə göstərilir. Intervalların istifadəsi intervalın paylanması seriyasının formalaşmasına gətirib çıxarır.

Interval rad variantları intervallar şəklində təqdim olunan variasiya seriyasıdır.

İnterval seriyası bərabər və qeyri-bərabər intervallarla yaradıla bilər, halbuki bu silsilənin qurulması prinsipinin seçimi əsasən statistik kütlənin reprezentativlik dərəcəsindən və rahatlığından asılıdır. Əgər populyasiya vahidlərin sayına görə kifayət qədər böyükdürsə (nümayəndəli) və tərkibində tam bircinslidirsə, o zaman interval silsilənin formalaşmasında intervalların bərabərliyinə əsaslanmaq məqsədəuyğundur. Adətən, bu prinsipdən istifadə edərək, variasiya diapazonunun nisbətən kiçik olduğu populyasiyalar üçün interval seriyası yaradılır, yəni. maksimum və minimum seçimlər adətən bir-birindən bir neçə dəfə fərqlənir. Bu zaman bərabər intervalların qiyməti xarakteristikanın dəyişmə diapazonunun formalaşmış intervalların verilmiş sayına nisbəti ilə hesablanır. bərabər müəyyən etmək interval, Sturgess düsturu istifadə edilə bilər (adətən interval xarakteristikalarının kiçik dəyişməsi və statistik populyasiyada çox sayda vahid ilə):

harada x i - bərabər interval dəyəri; X max, X min - statistik məcmuda maksimum və minimum variantlar; n . - aqreqatdakı vahidlərin sayı.

Misal. Sezium ilə radioaktiv çirklənmənin sıxlığına görə bərabər intervalın ölçüsünü hesablamaq məqsədəuyğundur - Mogilev vilayətinin Krasnopolski rayonunun 100 yaşayış məntəqəsində 137, ilkin (minimum) variantın I km-ə bərabər olduğu məlumdursa. / km 2, final ( maksimum) - 65 ki/km 2. 5.1 düsturundan istifadə etməklə. alırıq:

Nəticə etibarı ilə, sezium çirklənməsinin sıxlığı baxımından bərabər intervallarla interval silsiləsi yaratmaq üçün - Krasnopolski bölgəsində 137 yaşayış məntəqəsi, bərabər intervalın ölçüsü 8 ki/km 2 ola bilər.

Qeyri-bərabər paylanma şəraitində, yəni. maksimum və minimum variantları yüzlərlə dəfə olduqda, interval seriyası təşkil edərkən, prinsipi tətbiq edə bilərsiniz qeyri-bərabər intervallar. Xarakteristikanın daha böyük dəyərlərinə keçdikcə qeyri-bərabər intervallar adətən artır.

Intervalların forması qapalı və ya açıq ola bilər. Bağlı Həm aşağı, həm də yuxarı sərhədləri olan intervalları çağırmaq adətdir. Açıq intervalların yalnız bir sərhədi var: birinci intervalda yuxarı sərhəd, sonuncuda isə aşağı sərhəd var.

Xüsusilə qeyri-bərabər intervallarla interval seriyalarını nəzərə alaraq qiymətləndirmək məqsədəuyğundur paylanma sıxlığı, yerli tezliyin (və ya tezliyin) intervalın ölçüsünə nisbəti olduğunu hesablamağın ən sadə yolu.

Praktik olaraq bir interval seriyası yaratmaq üçün cədvəl tərtibatından istifadə edə bilərsiniz. 5.3.

Cədvəl 5.3. Sezium ilə radioaktiv çirklənmənin sıxlığına görə Krasnopolski bölgəsində yaşayış məntəqələrinin interval silsiləsinin formalaşdırılması qaydası -137

İnterval seriyasının əsas üstünlüyü maksimumdur kompaktlıq. eyni zamanda interval paylanma sıralarında xarakteristikanın ayrı-ayrı variantları müvafiq intervallarda gizlədilir

Düzbucaqlı koordinatlar sistemində interval silsiləsi qrafik şəkildə təsvir edilərkən, intervalların yuxarı sərhədləri absis oxunda, sıraların yerli tezlikləri isə ordinat oxunda çəkilir. İnterval seriyasının qrafik quruluşu paylama poliqonunun qurulmasından onunla fərqlənir ki, hər bir interval aşağı və yuxarı sərhədlərə malikdir və iki absis bir ordinat qiymətinə uyğun gəlir. Buna görə də, interval seriyasının qrafikində çoxbucaqlıdakı kimi nöqtə deyil, iki nöqtəni birləşdirən xətt qeyd olunur. Bu üfüqi xətlər bir-biri ilə şaquli xətlərlə birləşdirilir və pilləli çoxbucaqlının fiquru alınır ki, bu da adətən adlanır. histoqram paylanması (Şəkil 5.3).

Kifayət qədər böyük statistik əhali üçün interval seriyasını qrafik şəkildə qurarkən histoqram yaxınlaşır simmetrik paylanma forması. Statistik əhalinin kiçik olduğu hallarda, bir qayda olaraq, asimmetrik bar diaqramı.

Bəzi hallarda bir sıra yığılmış tezliklər yaratmaq məsləhətdir, yəni. məcmu sıra. Kumulyativ sıra diskret və ya interval paylanma seriyası əsasında yaradıla bilər. Dördbucaqlı koordinatlar sistemində məcmu silsilənin qrafik təsviri zamanı variantlar absis oxunda, yığılmış tezliklər (tezliklər) isə ordinat oxunda çəkilir. Yaranan əyri xətt adətən adlanır məcmu paylanması (Şəkil 5.4).

Müxtəlif növ variasiya seriyalarının formalaşması və qrafik təsviri 6-cı mövzuda ətraflı müzakirə olunan əsas statistik xüsusiyyətlərin sadələşdirilmiş hesablanmasına kömək edir və statistik əhalinin paylanma qanunlarının mahiyyətini daha yaxşı başa düşməyə kömək edir. Variasiya seriyasının təhlili seçimlər və tezliklər (tezliklər) arasındakı əlaqəni müəyyən etmək və izləmək lazım olduğu hallarda xüsusi əhəmiyyət kəsb edir. Bu asılılıq onda özünü göstərir ki, bir variant üzrə halların sayı müəyyən şəkildə bu variantın ölçüsü ilə bağlıdır, yəni. dəyişən xarakteristikanın artan dəyərləri ilə bu dəyərlərin tezlikləri (tezlikləri) müəyyən, sistematik dəyişikliklər yaşayır. Bu o deməkdir ki, tezlik (tezlik) sütunundakı rəqəmlər xaotik tərəddüd etmir, müəyyən istiqamətdə, müəyyən ardıcıllıqla və ardıcıllıqla dəyişir.

Əgər tezliklər öz dəyişikliklərində müəyyən sistematiklik nümayiş etdirirlərsə, bu o deməkdir ki, biz nümunəni müəyyənləşdirmək yolundayıq. Tezliklərin dəyişməsində sistem, nizam, ardıcıllıq bütün əhali üçün xarakterik olan ümumi səbəblərin, ümumi şərtlərin əksidir.

Paylanma sxeminin həmişə hazır formada verildiyini düşünmək olmaz. Tezliklərin qəribə şəkildə sıçradığı, bəzən artan, bəzən azaldığı bir çox variasiya seriyası var. Belə hallarda tədqiqatçının hansı paylanma ilə məşğul olduğunu öyrənmək məqsədəuyğundur: ya bu paylanmanın heç bir xas qanunauyğunluqları yoxdur, ya da onun mahiyyəti hələ açıqlanmayıb: Birinci hal nadirdir, ikincisi hal kifayət qədər ümumi və çox geniş yayılmış bir hadisədir.

Beləliklə, interval silsiləsi formalaşdırarkən statistik vahidlərin ümumi sayı kiçik ola bilər və hər intervalda az sayda variant (məsələn, 1-3 vahid) olur. Belə hallarda heç bir nümunənin təzahürünə ümid etmək olmaz. Təsadüfi müşahidələr əsasında təbii nəticə əldə etmək üçün böyük ədədlər qanunu qüvvəyə minməlidir, yəni. belə ki, hər interval üçün bir neçə yox, onlarla və yüzlərlə statistik vahidlər olsun. Bu məqsədlə mümkün qədər müşahidələrin sayını artırmağa çalışmalıyıq. Bu, kütləvi proseslərdə nümunələri aşkar etməyin ən etibarlı yoludur. Müşahidələrin sayını artırmaq üçün real imkan yoxdursa, paylama seriyasında intervalların sayını azaltmaqla nümunənin müəyyən edilməsinə nail olmaq olar. Variasiya seriyasındakı intervalların sayını azaltmaqla, hər bir intervaldakı tezliklərin sayı artır. Bu o deməkdir ki, hər bir statistik vahidin təsadüfi dalğalanmaları bir-birinin üzərinə qoyulur, “hamarlanır” və bir nümunəyə çevrilir.

Variasiya sıralarının formalaşması və qurulması statistik əhalinin paylanmasının yalnız ümumi, təxmini mənzərəsini əldə etməyə imkan verir. Məsələn, histoqram yalnız kobud formada xarakteristikanın qiymətləri ilə onun tezlikləri (tezlikləri) arasındakı əlaqəni ifadə edir.Ona görə də variasiya sıraları mahiyyətcə yalnız statikin daxili qanunauyğunluğunun sonrakı, dərindən öyrənilməsi üçün əsasdır. paylanması.

MÖVZU 5 ÜÇÜN TEST SUALLARI

1. Variasiya nədir? Statistik populyasiyada xüsusiyyətin dəyişməsinə nə səbəb olur?

2. Statistikada dəyişən xüsusiyyətlərin hansı növləri baş verə bilər?

3. Variasiya seriyası nədir? Variasiya seriyalarının hansı növləri ola bilər?

4. Reytinq sırası nədir? Onun üstünlükləri və mənfi cəhətləri nələrdir?

5. Diskret sıra nədir və onun üstünlükləri və çatışmazlıqları hansılardır?

6. İnterval seriyasının formalaşdırılması proseduru hansıdır, onun üstünlükləri və çatışmazlıqları hansılardır?

7. Reytinqli, diskret, intervallı paylanma sıralarının qrafik təsviri nədir?

8. Paylanma kumulyasiyası nədir və o, nəyi xarakterizə edir?