Pagbuo ng isang serye ng pagkakaiba-iba ng pagitan para sa tuluy-tuloy na dami ng data. Pagbuo ng isang discrete variational series

pagpapangkat- ito ay ang paghahati ng populasyon sa mga pangkat na homogenous sa ilang paraan.

Pagtatalaga ng serbisyo. Gamit ang online na calculator maaari kang:

  • bumuo ng serye ng variation, bumuo ng histogram at polygon;
  • maghanap ng mga indicator ng variation (mean, mode (kabilang ang graphically), median, range of variation, quartiles, deciles, quartile coefficient of differentiation, coefficient of variation at iba pang indicator);

Pagtuturo. Upang pagpangkatin ang isang serye, dapat mong piliin ang uri ng nagreresultang serye ng variation (discrete o interval) at tukuyin ang dami ng data (bilang ng mga row). Ang resultang solusyon ay nai-save sa isang Word file (tingnan ang halimbawa ng pagpapangkat ng istatistikal na data).

Bilang ng data ng input
",0);">

Kung nagawa na ang pagpapangkat at ang discrete variation series o serye ng pagitan, pagkatapos ay kailangan mong gamitin ang online na calculator Variation indicator. Pagsubok sa hypothesis tungkol sa uri ng pamamahagi ginawa gamit ang serbisyo Pag-aaral ng anyo ng pamamahagi.

Mga uri ng istatistikal na pagpapangkat

Serye ng pagkakaiba-iba. Sa kaso ng mga obserbasyon ng isang discrete random variable, ang parehong halaga ay maaaring makatagpo ng ilang beses. Ang ganitong mga halaga ng isang random na variable x i ay naitala na nagpapahiwatig n i ang bilang ng beses na ito ay lumilitaw sa n obserbasyon, ito ang dalas ng halagang ito.
Sa kaso ng isang tuluy-tuloy na random na variable, ang pagpapangkat ay ginagamit sa pagsasanay.
  1. Typological grouping- ito ang paghahati ng pinag-aralan na qualitatively heterogenous na populasyon sa mga klase, socio-economic na uri, homogenous na grupo ng mga yunit. Upang buuin ang pagpapangkat na ito, gamitin ang parameter ng Discrete variational series.
  2. Structural grouping ang tawag, kung saan ang isang homogenous na populasyon ay nahahati sa mga pangkat na nagpapakilala sa istraktura nito ayon sa ilang magkakaibang katangian. Upang buuin ang pagpapangkat na ito, gamitin ang parameter ng Interval series.
  3. Ang isang pagpapangkat na nagpapakita ng kaugnayan sa pagitan ng mga pinag-aralan na phenomena at ang kanilang mga tampok ay tinatawag pangkat ng pagsusuri(tingnan ang analytical grouping ng mga serye).

Mga prinsipyo ng pagbuo ng mga istatistikal na pagpapangkat

Ang isang serye ng mga obserbasyon na inayos sa pataas na pagkakasunud-sunod ay tinatawag na serye ng pagkakaiba-iba. tanda ng pagpapangkat ay ang palatandaan kung saan ang populasyon ay nahahati sa magkakahiwalay na grupo. Ito ay tinatawag na base ng grupo. Ang pagpapangkat ay maaaring batay sa parehong quantitative at qualitative na mga katangian.
Matapos matukoy ang batayan ng pagpapangkat, ang tanong ng bilang ng mga pangkat kung saan dapat hatiin ang populasyon ng pag-aaral ay dapat na mapagpasyahan.

Kapag gumagamit ng mga personal na computer para sa pagproseso ng data ng istatistika, ang pagpapangkat ng mga yunit ng isang bagay ay isinasagawa gamit ang mga karaniwang pamamaraan.
Ang isang naturang pamamaraan ay batay sa paggamit ng Sturgess formula upang matukoy ang pinakamainam na bilang ng mga grupo:

k = 1+3.322*lg(N)

Kung saan ang k ay ang bilang ng mga pangkat, ang N ay ang bilang ng mga yunit ng populasyon.

Ang haba ng mga bahagyang pagitan ay kinakalkula bilang h=(x max -x min)/k

Pagkatapos ay bilangin ang bilang ng mga hit ng mga obserbasyon sa mga pagitan na ito, na kinukuha bilang mga frequency n i . Ilang mga frequency, ang mga halaga ay mas mababa sa 5 (n i< 5), следует объединить. в этом случае надо объединить и соответствующие интервалы.
Ang mga midpoint ng mga pagitan x i =(c i-1 +c i)/2 ay kinuha bilang mga bagong halaga.

Lab #1

Ayon sa mathematical statistics

Paksa: Pangunahing pagproseso ng pang-eksperimentong data

3. Pagsusuri sa mga puntos. isa

5. Mga tanong sa seguridad.. 2

6. Pamamaraan para sa pagsasagawa ng gawaing laboratoryo .. 3

Layunin

Pagkuha ng mga kasanayan sa pangunahing pagproseso ng empirical na data sa pamamagitan ng mga pamamaraan ng mga istatistika ng matematika.

Sa batayan ng isang set ng pang-eksperimentong data, gawin ang mga sumusunod na gawain:

Ehersisyo 1. Bumuo ng isang serye ng pagkakaiba-iba ng pagitan ng pamamahagi.

Gawain 2. Bumuo ng histogram ng mga frequency ng serye ng pagkakaiba-iba ng pagitan.

Gawain 3. Bumuo ng isang empirical distribution function at plot.

a) mode at median;

b) kondisyonal na mga panimulang sandali;

c) sample ibig sabihin;

d) sample na pagkakaiba-iba, naitama ang pagkakaiba-iba ng populasyon, naitama ang karaniwang paglihis;

e) koepisyent ng pagkakaiba-iba;

e) kawalaan ng simetrya;

g) kurtosis;

Gawain 5. Tukuyin ang mga hangganan ng mga tunay na halaga ng mga numerical na katangian ng random na variable sa ilalim ng pag-aaral na may ibinigay na pagiging maaasahan.

Gawain 6. Makabuluhang interpretasyon ng mga resulta ng pangunahing pagproseso ayon sa kondisyon ng problema.

Puntos sa mga puntos

Gawain 1-56 na puntos

Gawain 62 puntos

Proteksyon sa Lab(oral interview sa control questions at laboratory work) - 2 puntos

Ang gawain ay isinumite sa pamamagitan ng pagsulat sa A4 sheet at kasama ang:

1) Pahina ng pamagat (Appendix 1)

2) Paunang data.

3) Pagtatanghal ng trabaho ayon sa tinukoy na sample.

4) Mga resulta ng pagkalkula (manu-manong ginawa at/o gamit ang MS Excel) sa tinukoy na pagkakasunud-sunod.

5) Konklusyon - isang makabuluhang interpretasyon ng mga resulta ng pangunahing pagproseso ayon sa kondisyon ng problema.

6) Oral na panayam sa trabaho at mga tanong sa pagkontrol.



5. Mga tanong sa seguridad


Pamamaraan para sa pagsasagawa ng gawaing laboratoryo

Gawain 1. Bumuo ng isang interval variation series ng distribution

Upang maipakita ang istatistikal na data sa anyo ng isang variational na serye na may pantay na pagitan ng mga variant, kinakailangan:

1. Sa orihinal na talahanayan ng data, hanapin ang pinakamaliit at pinakamalaking halaga.

2. Tukuyin saklaw ng pagkakaiba-iba :

3. Tukuyin ang haba ng interval h, kung mayroong hanggang 1000 data sa sample, gamitin ang formula: , kung saan n - laki ng sample - ang dami ng data sa sample; Ang lgn ay kinuha para sa mga kalkulasyon).

Ang kinakalkula na ratio ay bilugan hanggang maginhawang halaga ng integer .

4. Upang matukoy ang simula ng unang agwat para sa pantay na bilang ng mga agwat, inirerekomendang kunin ang halaga ; at para sa isang kakaibang bilang ng mga pagitan.

5. Itala ang mga pagitan ng pagpapangkat at ayusin ang mga ito sa pataas na pagkakasunud-sunod ng mga hangganan

, ,………., ,

kung saan ang lower bound ng unang interval. Ang isang maginhawang numero ay kinuha para sa hindi hihigit sa , ang pinakamataas na limitasyon ng huling pagitan ay dapat na hindi bababa sa . Inirerekomenda na ang mga agwat ay naglalaman ng mga paunang halaga ng random na variable at ihiwalay mula sa 5 hanggang 20 mga pagitan.

6. Isulat ang paunang data sa pagitan ng mga pagpapangkat, i.e. kalkulahin mula sa orihinal na talahanayan ang bilang ng mga halaga ng isang random na variable na nasa loob ng tinukoy na mga agwat. Kung ang ilang mga halaga ay nag-tutugma sa mga hangganan ng mga pagitan, pagkatapos ay iuugnay ang mga ito sa nauna o sa kasunod na agwat lamang.

Puna 1. Ang mga agwat ay hindi kailangang pantay-pantay ang haba. Sa mga lugar kung saan ang mga halaga ay mas siksik, mas maginhawang kumuha ng mas maliit na maikling pagitan, at kung saan mas madalas - mas malaki.

Puna 2.Kung para sa ilang mga halaga ay nakuha ang "zero" o maliit na mga halaga ng mga frequency, pagkatapos ay kinakailangan upang muling pagsamahin ang data, pagpapalaki ng mga pagitan (pagtaas ng hakbang ).

Gawain sa laboratoryo №1. Pangunahing pagproseso ng istatistikal na data

Konstruksyon ng serye ng pamamahagi

Ang nakaayos na pamamahagi ng mga yunit ng populasyon sa mga pangkat ayon sa alinmang katangian ay tinatawag malapit sa pamamahagi . Sa kasong ito, ang pag-sign ay maaaring parehong dami, pagkatapos ay tinawag ang serye pagkakaiba-iba , at husay, pagkatapos ay tinatawag ang serye katangian . Kaya, halimbawa, ang populasyon ng isang lungsod ay maaaring ipamahagi ayon sa mga pangkat ng edad sa isang serye ng pagkakaiba-iba, o ayon sa propesyonal na kaugnayan sa isang serye ng katangian (siyempre, marami pang mga katangian ng husay at dami ang maaaring imungkahi para sa pagbuo ng serye ng pamamahagi, ang ang pagpili ng tampok ay tinutukoy ng gawain ng istatistikal na pananaliksik).

Ang anumang serye ng pamamahagi ay nailalarawan sa pamamagitan ng dalawang elemento:

- opsyon(x i) - ito ay mga indibidwal na halaga ng katangian ng mga yunit ng sample na populasyon. Para sa isang variational series, ang variant ay kumukuha ng mga numerical value, para sa isang attribute na serye - mga qualitative (halimbawa, x = "civil servant");

- dalas(n i) ay isang numero na nagpapakita kung gaano karaming beses nangyayari ito o ang halaga ng tampok na iyon. Kung ang dalas ay ipinahayag bilang isang kamag-anak na numero (i.e., ang proporsyon ng mga elemento ng populasyon na tumutugma sa isang ibinigay na halaga ng mga opsyon sa kabuuang dami ng populasyon), kung gayon ito ay tinatawag relatibong dalas o dalas.

Ang serye ng pagkakaiba-iba ay maaaring:

- discrete kapag ang katangiang pinag-aaralan ay nailalarawan ng isang tiyak na numero (karaniwan ay isang integer).

- pagitan kapag ang mga hangganan "mula sa" at "sa" ay tinukoy para sa isang patuloy na variable na tampok. Ang isang serye ng pagitan ay binuo din kung ang hanay ng mga halaga ng isang discretely variable na tampok ay malaki.

Ang isang serye ng agwat ay maaaring mabuo kapwa na may mga pagitan ng pantay na haba (katumbas na serye ng agwat) at may hindi pantay na mga agwat, kung ito ay idinidikta ng mga kondisyon ng istatistikal na pag-aaral. Halimbawa, maaaring isaalang-alang ang isang serye ng pamamahagi ng kita ng populasyon na may mga sumusunod na pagitan:<5тыс р., 5-10 тыс р., 10-20 тыс.р., 20-50 тыс р., и т.д. Если цель исследования не определяет способ построения интервального ряда, то строится равноинтервальный ряд, число интервалов в котором определяется по формуле Стерджесса:



kung saan ang k ay ang bilang ng mga pagitan, n ang laki ng sample. (Siyempre, ang formula ay karaniwang nagbibigay ng fractional na numero, at ang pinakamalapit na integer sa resultang numero ay pipiliin bilang bilang ng mga pagitan.) Ang haba ng pagitan sa kasong ito ay tinutukoy ng formula

.

Sa graphically, ang variational series ay maaaring katawanin bilang histograms(isang "column" ng taas na tumutugma sa frequency sa interval na ito ay binuo sa itaas ng bawat interval ng interval series), lugar ng pamamahagi(putol na linya sa pagkonekta ng mga punto ( x i;n i) o nag-iipon(itinayo ayon sa mga naipon na frequency, ibig sabihin, para sa bawat halaga ng katangian, ang dalas ng paglitaw sa hanay ng mga bagay na may halaga ng katangian na mas mababa kaysa sa ibinigay na isa ay kinuha).

Kapag nagtatrabaho sa Excel, ang mga sumusunod na function ay maaaring gamitin upang bumuo ng variational series:

SURIIN( hanay ng data) – upang matukoy ang laki ng sample. Ang argument ay ang hanay ng mga cell na naglalaman ng sample na data.

COUNTIF( saklaw; pamantayan) - maaaring gamitin upang bumuo ng isang katangian o serye ng variation. Ang mga argumento ay ang hanay ng array ng sample values ​​ng attribute at ang criterion - ang numeric o text value ng attribute o ang numero ng cell kung saan ito matatagpuan. Ang resulta ay ang dalas ng paglitaw ng halagang iyon sa sample.

DALAS( hanay ng data; hanay ng pagitan) – upang bumuo ng isang variational series. Ang mga argumento ay ang hanay ng sample na array ng data at ang column ng mga agwat. Kung kinakailangan upang bumuo ng isang discrete na serye, kung gayon ang mga halaga ng mga pagpipilian ay ipinahiwatig dito, kung ito ay agwat, pagkatapos ay ang itaas na mga hangganan ng mga agwat (tinatawag din silang "mga bulsa"). Dahil ang resulta ay isang column ng mga frequency, ang pagpapakilala ng function ay dapat kumpletuhin sa pamamagitan ng pagpindot sa CTRL+SHIFT+ENTER key combination. Tandaan na kapag nagtatakda ng isang hanay ng mga agwat kapag nagpapakilala ng isang function, ang huling halaga dito ay maaaring tanggalin - lahat ng mga halaga na hindi nahulog sa nakaraang "bulsa" ay ilalagay sa kaukulang "bulsa". Minsan nakakatulong ito upang maiwasan ang error na ang pinakamalaking sample na halaga ay hindi awtomatikong inilalagay sa huling "bulsa".

Bilang karagdagan, para sa mga kumplikadong pagpapangkat (ayon sa ilang pamantayan), ang tool na "pivot tables" ay ginagamit. Magagamit din ang mga ito upang bumuo ng mga katangian at serye ng variation, ngunit hindi naman nito kailangang kumplikado ang gawain. Gayundin, upang makabuo ng serye ng variation at histogram, mayroong "histogram" na pamamaraan mula sa add-in na "Analysis Package" (upang gumamit ng mga add-in sa Excel, kailangan mo munang i-download ang mga ito, hindi sila naka-install bilang default)

Inilalarawan namin ang proseso ng pangunahing pagproseso ng data sa mga sumusunod na halimbawa.

Halimbawa 1.1. may mga datos sa quantitative composition ng 60 pamilya.

Bumuo ng serye ng variation at polygon ng pamamahagi

Solusyon.

Buksan natin ang mga spreadsheet ng Excel. Maglagay tayo ng array ng data sa range A1:L5. Kung nag-aaral ka ng isang dokumento sa electronic form (sa Word format, halimbawa), ang kailangan mo lang gawin ay pumili ng isang talahanayan na may data at kopyahin ito sa clipboard, pagkatapos ay piliin ang cell A1 at i-paste ang data - awtomatiko nilang sasakupin ang naaangkop na saklaw. Kalkulahin natin ang sample size n - ang bilang ng sample data, para dito, sa cell B7, ipasok ang formula = COUNT (A1: L5). Tandaan na upang maipasok ang nais na hanay sa formula, hindi kinakailangan na ipasok ang pagtatalaga nito mula sa keyboard, sapat na upang piliin ito. Tukuyin natin ang minimum at maximum na mga halaga sa sample sa pamamagitan ng pagpasok ng formula =MIN(A1:L5) sa cell B8, at sa cell B9: =MAX(A1:L5).

Fig.1.1 Halimbawa 1. Pangunahing pagproseso ng istatistikal na data sa mga talahanayan ng Excel

Susunod, maghanda tayo ng talahanayan para sa pagbuo ng serye ng variation sa pamamagitan ng paglalagay ng mga pangalan para sa column ng interval (mga variant na value) at ng column ng frequency. Sa hanay ng mga agwat, ipasok ang mga halaga ng katangian mula sa minimum (1) hanggang sa maximum (6), na sumasakop sa hanay na B12:B17. Piliin ang column ng frequency, ipasok ang formula =FREQUENCY(A1:L5;B12:B17) at pindutin ang key combination CTRL+SHIFT+ENTER

Fig.1.2 Halimbawa 1. Pagbuo ng serye ng variation

Para sa kontrol, kinakalkula namin ang kabuuan ng mga frequency gamit ang SUM function (ang icon ng S function sa pangkat ng Pag-edit sa tab na Home), ang kinakalkula na kabuuan ay dapat tumugma sa dating nakalkulang laki ng sample sa cell B7.

Ngayon, bumuo tayo ng isang polygon: na napili ang resultang hanay ng dalas, piliin ang "Graph" na utos sa tab na "Ipasok". Bilang default, ang mga halaga sa pahalang na axis ay mga ordinal na numero - sa aming kaso, mula 1 hanggang 6, na tumutugma sa mga halaga ng mga pagpipilian (mga bilang ng mga kategorya ng taripa).

Ang pangalan ng serye ng chart na "serye 1" ay maaaring baguhin gamit ang parehong opsyon na "piliin ang data" sa tab na "Designer", o i-delete lang.

Fig.1.3. Halimbawa 1. Pagbuo ng frequency polygon

Halimbawa 1.2. Available ang data sa mga pollutant emissions mula sa 50 source:

10,4 18,6 10,3 26,0 45,0 18,2 17,3 19,2 25,8 18,7
28,2 25,2 18,4 17,5 41,8 14,6 10,0 37,8 10,5 16,0
18,1 16,8 38,5 37,7 17,9 29,0 10,1 28,0 12,0 14,0
14,2 20,8 13,5 42,4 15,5 17,9 19, 10,8 12,1 12,4
12,9 12,6 16,8 19,7 18,3 36,8 15,0 37,0 13,0 19,5

Mag-compile ng pantay na serye ng pagitan, bumuo ng histogram

Solusyon

Magdagdag tayo ng isang array ng data sa isang Excel sheet, sasakupin nito ang hanay na A1:J5 Tulad ng sa nakaraang gawain, tutukuyin natin ang laki ng sample n, ang minimum at maximum na mga halaga sa sample. Dahil ngayon hindi namin kailangan ng isang discrete, ngunit isang serye ng pagitan, at ang bilang ng mga agwat sa problema ay hindi tinukoy, kinakalkula namin ang bilang ng mga pagitan k gamit ang Sturgess formula. Upang gawin ito, sa cell B10, ilagay ang formula =1+3.322*LOG10(B7).

Fig.1.4. Halimbawa 2. Konstruksyon ng isang pantay na serye ng pagitan

Ang resultang halaga ay hindi isang integer, ito ay humigit-kumulang 6.64. Dahil para sa k=7 ang haba ng mga pagitan ay ipapahayag bilang isang integer (sa kaibahan sa kaso ng k=6), pipiliin namin ang k=7 sa pamamagitan ng paglalagay ng halagang ito sa cell C10. Kinakalkula namin ang haba ng interval d sa cell B11 sa pamamagitan ng pagpasok ng formula = (B9-B8) / C10.

Tukuyin natin ang isang hanay ng mga agwat, na tumutukoy sa itaas na hangganan para sa bawat isa sa 7 agwat. Upang gawin ito, sa cell E8, kalkulahin ang itaas na limitasyon ng unang pagitan sa pamamagitan ng pagpasok ng formula =B8+B11; sa cell E9 ang itaas na limitasyon ng ikalawang pagitan sa pamamagitan ng pagpasok ng formula =E8+B11. Upang kalkulahin ang natitirang mga halaga ng itaas na mga limitasyon ng mga agwat, inaayos namin ang bilang ng cell B11 sa inilagay na formula gamit ang $ sign, upang ang formula sa cell E9 ay maging =E8+B$11, at kopyahin ang mga nilalaman ng cell E9 hanggang sa mga cell E10-E14. Ang huling halaga na nakuha ay katumbas ng pinakamataas na halaga sa sample na kinakalkula kanina sa cell B9.

Fig.1.5. Halimbawa 2. Konstruksyon ng isang pantay na serye ng pagitan


Ngayon punan natin ang hanay ng "mga bulsa" gamit ang FREQUENCY function, tulad ng ginawa sa halimbawa 1.

Fig.1.6. Halimbawa 2. Konstruksyon ng isang pantay na serye ng pagitan

Batay sa resultang variational series, bubuo kami ng histogram: piliin ang frequency column at piliin ang "Histogram" sa tab na "Insert". Matapos matanggap ang histogram, babaguhin namin ang mga label ng pahalang na axis sa loob nito sa mga halaga sa hanay ng mga agwat, para dito pipiliin namin ang pagpipiliang "Pumili ng data" ng tab na "Designer". Sa window na lilitaw, piliin ang command na "Baguhin" para sa seksyong "Mga label ng horizontal axis" at ipasok ang hanay ng mga halaga ng mga variant sa pamamagitan ng pagpili nito gamit ang "mouse".

Fig.1.7. Halimbawa 2. Pagbuo ng histogram

Fig.1.8. Halimbawa 2. Pagbuo ng histogram

Ang isang discrete variational series ay binuo para sa discrete features.

Upang makabuo ng isang discrete variation series, kailangan mong gawin ang mga sumusunod: 1) i-order ang mga unit ng observation sa pataas na pagkakasunud-sunod ng pinag-aralan na value ng attribute,

2) tukuyin ang lahat ng posibleng mga halaga ng katangian x i , ayusin ang mga ito sa pataas na pagkakasunud-sunod,

halaga ng tanda, i .

dalas ng halaga ng tampok at magpakilala f i . Ang kabuuan ng lahat ng frequency ng serye ay katumbas ng bilang ng mga elemento sa pinag-aralan na populasyon.

Halimbawa 1 .

Listahan ng mga markang nakuha ng mga mag-aaral sa pagsusulit: 3; apat; 3; 5; apat; 2; 2; apat; apat; 3; 5; 2; apat; 5; apat; 3; apat; 3; 3; apat; apat; 2; 2; 5; 5; apat; 5; 2; 3; apat; apat; 3; apat; 5; 2; 5; 5; apat; 3; 3; apat; 2; apat; apat; 5; apat; 3; 5; 3; 5; apat; apat; 5; apat; apat; 5; apat; 5; 5; 5.

Narito ang numero X - gradoay isang discrete random variable, at ang resultang listahan ng mga pagtatantya ayistatistikal (naobserbahan) na datos .

    ayusin ang mga yunit ng pagmamasid sa pataas na pagkakasunud-sunod ng pinag-aralan na halaga ng tampok:

2; 2; 2; 2; 2; 2; 2; 2; 3; 3; 3; 3; 3; 3; 3; 3; 3; 3; 3; 3; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5.

2) matukoy ang lahat ng posibleng mga halaga ng katangian x i , ayusin ang mga ito sa pataas na pagkakasunud-sunod:

Sa halimbawang ito, ang lahat ng mga marka ay maaaring hatiin sa apat na grupo na may mga sumusunod na halaga: 2; 3; apat; 5.

Ang halaga ng isang random na variable na tumutugma sa isang hiwalay na pangkat ng mga naobserbahang data ay tinatawag halaga ng tanda, variant (opsyon) at italaga ang x i .

Ang bilang na nagpapakita kung gaano karaming beses naganap ang katumbas na halaga ng tampok sa isang serye ng mga obserbasyon ay tinatawag dalas ng halaga ng tampok at magpakilala f i .

Para sa ating halimbawa

score 2 ay nangyayari - 8 beses,

score 3 ay nangyayari - 12 beses,

score 4 ay nangyayari - 23 beses,

score 5 ay nangyayari - 17 beses.

Mayroong 60 rating sa kabuuan.

4) isulat ang natanggap na data sa isang talahanayan ng dalawang hanay (mga haligi) - x i at f i .

Batay sa mga datos na ito, posibleng bumuo ng discrete variational series

Discrete variation series - ito ay isang talahanayan kung saan ang mga nagaganap na halaga ng pinag-aralan na katangian ay ipinahiwatig bilang hiwalay na mga halaga sa pataas na pagkakasunud-sunod at ang kanilang mga frequency

  1. Pagbuo ng isang serye ng pagkakaiba-iba ng pagitan

Bilang karagdagan sa isang discrete variational series, madalas mayroong ganitong paraan ng pagpapangkat ng data bilang isang interval variational series.

Ang isang serye ng pagitan ay binuo kung:

    ang tanda ay may patuloy na katangian ng pagbabago;

    mayroong maraming mga discrete value (higit sa 10)

    ang mga frequency ng discrete value ay napakaliit (hindi hihigit sa 1-3 na may medyo malaking bilang ng mga yunit ng pagmamasid);

    maraming discrete value ng isang feature na may parehong frequency.

Ang isang serye ng pagkakaiba-iba ng agwat ay isang paraan ng pagpapangkat ng data sa anyo ng isang talahanayan na may dalawang hanay (mga tampok na halaga sa anyo ng isang pagitan ng mga halaga at ang dalas ng bawat agwat).

Hindi tulad ng isang discrete na serye, ang mga halaga ng katangian ng isang serye ng pagitan ay hindi kinakatawan ng mga indibidwal na halaga, ngunit sa pamamagitan ng isang pagitan ng mga halaga ("mula - hanggang").

Ang bilang na nagpapakita kung gaano karaming mga yunit ng pagmamasid ang nahulog sa bawat napiling pagitan ay tinatawag dalas ng halaga ng tampok at magpakilala f i . Ang kabuuan ng lahat ng mga frequency ng serye ay katumbas ng bilang ng mga elemento (mga yunit ng pagmamasid) sa pinag-aralan na populasyon.

Kung ang isang unit ay may feature value na katumbas ng value ng upper limit ng interval, dapat itong i-refer sa susunod na interval.

Halimbawa, ang isang bata na may taas na 100 cm ay mahuhulog sa 2nd interval, at hindi sa una; at ang isang bata na may taas na 130 cm ay mahuhulog sa huling pagitan, at hindi sa pangatlo.

Batay sa mga datos na ito, posibleng makabuo ng serye ng pagkakaiba-iba ng pagitan.

Ang bawat pagitan ay may mas mababang limitasyon (x n), isang itaas na limitasyon (x in) at isang lapad ng pagitan ( i).

Ang hangganan ng pagitan ay isang halaga ng tampok na nasa hangganan ng dalawang pagitan.

taas ng mga bata (cm)

taas ng mga bata (cm)

dami ng bata

mahigit 130

Kung ang isang pagitan ay may upper at lower bound, kung gayon ito ay tinatawag saradong pagitan. Kung ang pagitan ay may mas mababa o itaas lamang na hangganan, kung gayon ito ay - bukas na pagitan. Ang pinaka una o ang pinakahuling agwat lamang ang maaaring buksan. Sa halimbawa sa itaas, bukas ang huling agwat.

Lapad ng pagitan (i) ay ang pagkakaiba sa pagitan ng upper at lower bounds.

i = x n - x sa

Ang lapad ng isang bukas na pagitan ay ipinapalagay na kapareho ng lapad ng isang katabing closed interval.

taas ng mga bata (cm)

dami ng bata

Lapad ng pagitan (i)

para sa mga kalkulasyon 130+20=150

20 (dahil ang lapad ng katabing closed interval ay 20)

Ang lahat ng serye ng agwat ay nahahati sa serye ng agwat na may pantay na agwat at serye ng agwat na may hindi pantay na agwat. . Sa mga hanay ng pagitan na may pantay na pagitan, ang lapad ng lahat ng mga pagitan ay pareho. Sa serye ng agwat na may hindi pantay na agwat, iba ang lapad ng mga agwat.

Sa halimbawang ito, isang serye ng pagitan na may hindi pantay na pagitan.

Sa maraming mga kaso, kung ang istatistikal na populasyon ay may kasamang malaki o, higit pa, isang walang katapusang bilang ng mga opsyon, na kadalasang nahaharap sa patuloy na pagkakaiba-iba, halos imposible at hindi praktikal na bumuo ng isang pangkat ng mga yunit para sa bawat opsyon. Sa ganitong mga kaso, ang pagsasama-sama ng mga yunit ng istatistika sa mga grupo ay posible lamang sa batayan ng agwat, i.e. tulad ng isang pangkat na may ilang mga limitasyon ng mga halaga ng iba't ibang katangian. Ang mga limitasyong ito ay ipinahiwatig ng dalawang numero na nagsasaad ng itaas at mas mababang mga limitasyon ng bawat pangkat. Ang paggamit ng mga agwat ay humahantong sa pagbuo ng isang serye ng pamamahagi ng agwat.

interval rad ay isang variational na serye, ang mga variant nito ay ipinakita bilang mga pagitan.

Ang serye ng pagitan ay maaaring mabuo na may pantay at hindi pantay na pagitan, habang ang pagpili ng prinsipyo para sa pagbuo ng seryeng ito ay higit na nakasalalay sa antas ng pagiging kinatawan at kaginhawahan ng istatistikal na populasyon. Kung ang hanay ay sapat na malaki (kinatawan) sa mga tuntunin ng bilang ng mga yunit at medyo homogenous sa komposisyon, pagkatapos ay ipinapayong ibase ang pagbuo ng serye ng pagitan sa pantay na pagitan. Karaniwan, ayon sa prinsipyong ito, ang isang serye ng pagitan ay nabuo para sa mga populasyon kung saan ang hanay ng pagkakaiba-iba ay medyo maliit, i.e. ang maximum at minimum na mga variant ay karaniwang nag-iiba sa bawat isa nang ilang beses. Sa kasong ito, ang halaga ng pantay na pagitan ay kinakalkula sa pamamagitan ng ratio ng hanay ng pagkakaiba-iba ng katangian sa ibinigay na bilang ng mga nabuong pagitan. Upang matukoy ang pantay at interval, maaaring gamitin ang formula ng Sturgess (karaniwan ay may maliit na pagkakaiba-iba sa mga feature ng interval at malaking bilang ng mga unit sa istatistikal na populasyon):

kung saan x i - ang halaga ng isang pantay na pagitan; X max, X min - maximum at minimum na mga opsyon sa istatistikal na populasyon; n . - ang bilang ng mga yunit sa populasyon.

Halimbawa. Maipapayo na kalkulahin ang laki ng isang pantay na agwat ayon sa density ng radioactive contamination na may cesium - 137 sa 100 mga pamayanan ng distrito ng Krasnopolsky ng rehiyon ng Mogilev, kung alam na ang paunang (minimum) na variant ay katumbas ng I km / km 2, ang pangwakas ( maximum) - 65 ki / km 2. Gamit ang formula 5.1. makuha namin:

Samakatuwid, upang makabuo ng isang serye ng agwat na may pantay na agwat para sa density ng polusyon ng cesium - 137 mga pamayanan ng distrito ng Krasnopolsky, ang laki ng isang pantay na agwat ay maaaring 8 ki/km 2 .

Sa mga kondisyon ng hindi pantay na pamamahagi i.e. kapag ang maximum at minimum na mga pagpipilian ay daan-daang beses, kapag bumubuo ng serye ng pagitan, maaari mong ilapat ang prinsipyo hindi pantay mga pagitan. Karaniwang tumataas ang hindi pantay na pagitan habang lumilipat ka sa mas malalaking halaga ng feature.

Ang hugis ng mga pagitan ay maaaring sarado at bukas. sarado Nakaugalian na ang pangalan ng mga agwat kung saan ang parehong ibaba at itaas na mga hangganan ay ipinahiwatig. bukas ang mga pagitan ay may isang hangganan lamang: sa unang pagitan - ang itaas, sa huli - ang mas mababang hangganan.

Maipapayo na suriin ang mga serye ng agwat, lalo na ang mga may hindi pantay na agwat, na isinasaalang-alang density ng pamamahagi, ang pinakasimpleng paraan upang kalkulahin kung alin ang ratio ng lokal na dalas (o dalas) sa laki ng pagitan.

Para sa praktikal na pagbuo ng serye ng pagitan, maaari mong gamitin ang layout ng talahanayan. 5.3.

T a b l e 5.3. Ang pamamaraan para sa pagbuo ng isang serye ng pagitan ng mga pag-aayos sa distrito ng Krasnopolsky ayon sa density ng radioactive contamination na may cesium -137

Ang pangunahing bentahe ng serye ng pagitan ay ang limitasyon nito pagiging compactness. sa parehong oras, sa pagitan ng serye ng pamamahagi, ang mga indibidwal na variant ng katangian ay nakatago sa kaukulang mga pagitan

Kapag ang isang graphical na representasyon ng isang serye ng agwat sa isang sistema ng mga parihabang coordinate, ang itaas na mga hangganan ng mga pagitan ay naka-plot sa abscissa axis, at ang mga lokal na frequency ng serye ay nasa ordinate axis. Ang graphical na konstruksyon ng isang serye ng agwat ay naiiba sa pagbuo ng isang polygon ng pamamahagi dahil ang bawat agwat ay may mas mababa at itaas na hangganan, at dalawang abscissas ay tumutugma sa anumang halaga ng ordinate. Samakatuwid, sa graph ng serye ng pagitan, hindi isang punto ang minarkahan, tulad ng sa isang polygon, ngunit isang linya na nagkokonekta sa dalawang puntos. Ang mga pahalang na linyang ito ay konektado sa isa't isa sa pamamagitan ng mga patayong linya at isang pigura ng isang stepped polygon ay nakuha, na karaniwang tinatawag histogram mga pamamahagi (Larawan 5.3).

Sa graphical na pagtatayo ng isang serye ng pagitan para sa isang sapat na malaking istatistikal na populasyon, ang histogram ay lumalapit simetriko form ng pamamahagi. Sa mga kasong iyon kung saan maliit ang istatistikal na populasyon, bilang panuntunan, ito ay nabuo walang simetriko bar chart.

Sa ilang mga kaso, mayroong kahusayan sa pagbuo ng isang bilang ng mga naipon na frequency, i.e. pinagsama-samang hilera. Maaaring mabuo ang pinagsama-samang serye batay sa isang discrete o interval distribution series. Kapag ang isang pinagsama-samang serye ay graphic na ipinapakita sa isang sistema ng mga rectangular na coordinate, ang mga opsyon ay naka-plot sa abscissa axis, at ang mga naipon na frequency (frequencies) ay naka-plot sa ordinate axis. Ang nagresultang hubog na linya ay tinatawag pinagsama-samang mga pamamahagi (Larawan 5.4).

Ang pagbuo at graphical na representasyon ng iba't ibang uri ng variational series ay nag-aambag sa isang pinasimple na pagkalkula ng mga pangunahing istatistikal na katangian, na tinalakay nang detalyado sa paksa 6, ay tumutulong upang mas maunawaan ang kakanyahan ng mga batas ng pamamahagi ng isang istatistikal na populasyon. Ang pagsusuri ng serye ng variation ay partikular na kahalagahan sa mga kaso kung saan kinakailangan upang matukoy at masubaybayan ang kaugnayan sa pagitan ng mga variant at frequency (mga frequency). Ang pag-asa na ito ay ipinakita sa katotohanan na ang bilang ng mga kaso para sa bawat variant ay sa isang tiyak na paraan na nauugnay sa halaga ng variant na ito, i.e. na may pagtaas sa mga halaga ng iba't ibang tanda ng dalas (dalas) ng mga halagang ito, nakakaranas sila ng tiyak, sistematikong mga pagbabago. Nangangahulugan ito na ang mga numero sa column ng mga frequency (frequencies) ay hindi napapailalim sa magulong pagbabagu-bago, ngunit nagbabago sa isang tiyak na direksyon, sa isang tiyak na pagkakasunud-sunod at pagkakasunud-sunod.

Kung ang mga frequency sa kanilang mga pagbabago ay nagpapakita ng isang tiyak na sistematiko, nangangahulugan ito na tayo ay patungo sa pagtukoy ng mga pattern. Ang sistema, pagkakasunud-sunod, pagkakasunud-sunod sa pagbabago ng mga frequency ay isang salamin ng mga karaniwang sanhi, pangkalahatang mga kondisyon na katangian ng buong populasyon.

Hindi dapat ipagpalagay na ang pattern ng pamamahagi ay palaging ibinibigay na handa. Napakaraming serye ng variational kung saan kakaibang tumalon ang mga frequency, tumataas man o bumababa. Sa ganitong mga kaso, ipinapayong alamin kung anong uri ng pamamahagi ang kinakaharap ng mananaliksik: alinman sa pamamahagi na ito ay hindi likas sa mga pattern, o ang kalikasan nito ay hindi pa natukoy: Ang unang kaso ay bihira, habang ang pangalawa, ang pangalawang kaso ay medyo madalas at napaka-pangkaraniwang pangyayari.

Kaya, kapag bumubuo ng isang serye ng agwat, ang kabuuang bilang ng mga yunit ng istatistika ay maaaring maliit, at ang isang maliit na bilang ng mga pagpipilian ay nahuhulog sa bawat agwat (halimbawa, 1-3 mga yunit). Sa ganitong mga kaso, hindi kinakailangang umasa sa pagpapakita ng anumang regularidad. Upang makakuha ng isang regular na resulta batay sa mga random na obserbasyon, ang batas ng malalaking numero ay dapat na magkabisa, i.e. upang sa bawat pagitan ay hindi magkakaroon ng ilan, ngunit sampu at daan-daang mga yunit ng istatistika. Sa layuning ito, dapat nating subukang dagdagan ang bilang ng mga obserbasyon hangga't maaari. Ito ang pinakatiyak na paraan upang makita ang mga pattern sa mga proseso ng masa. Kung walang tunay na pagkakataon upang madagdagan ang bilang ng mga obserbasyon, kung gayon ang pagkakakilanlan ng mga pattern ay maaaring makamit sa pamamagitan ng pagbabawas ng bilang ng mga agwat sa serye ng pamamahagi. Binabawasan ang bilang ng mga agwat sa serye ng variation, sa gayon ay nadaragdagan ang bilang ng mga frequency sa bawat agwat. Nangangahulugan ito na ang mga random na pagbabagu-bago ng bawat yunit ng istatistika ay nakapatong sa bawat isa, "pinakinis", nagiging isang pattern.

Ang pagbuo at pagbuo ng variational series ay nagbibigay-daan sa iyo upang makakuha lamang ng pangkalahatan, tinatayang larawan ng distribusyon ng istatistikal na populasyon. Halimbawa, ang isang histogram ay halos nagpapahayag lamang ng kaugnayan sa pagitan ng mga halaga ng isang tampok at ng mga frequency nito (mga frequency). Samakatuwid, ang mga variational series ay mahalagang batayan lamang para sa karagdagang, malalim na pag-aaral ng panloob na regularidad ng isang static na pamamahagi.

PAKSA 5 MGA TANONG

1. Ano ang pagkakaiba-iba? Ano ang sanhi ng pagkakaiba-iba ng isang katangian sa isang istatistikal na populasyon?

2. Anong mga uri ng mga variable na palatandaan ang maaaring maganap sa mga istatistika?

3. Ano ang variation series? Ano ang mga uri ng variation series?

4. Ano ang isang ranggo na serye? Ano ang mga pakinabang at disadvantage nito?

5. Ano ang isang discrete series at ano ang mga pakinabang at disadvantage nito?

6. Ano ang pagkakasunud-sunod ng pagbuo ng serye ng pagitan, ano ang mga pakinabang at disadvantage nito?

7. Ano ang isang graphical na representasyon ng isang ranggo, discrete, interval distribution series?

8. Ano ang distribution cumulate at ano ang katangian nito?