Kuinka muodostaa intervallivaihtelusarja. Intervallijakaumasarjan rakentaminen

Lähetä hyvä työsi tietokanta on yksinkertainen. Käytä alla olevaa lomaketta

Opiskelijat, jatko-opiskelijat, nuoret tutkijat, jotka käyttävät tietopohjaa opinnoissaan ja työssään, ovat sinulle erittäin kiitollisia.

Lähetetty http://www.allbest.ru/

TEHTÄVÄ1

Yrityksen työntekijöiden palkoista on saatavilla seuraavat tiedot:

Taulukko 1.1

Palkkojen määrä tavanomaisin ehdoin. den. yksiköitä

On konstruoitava intervallijakaumasarja, jonka avulla voidaan löytää;

1) keskipalkka;

2) keskimääräinen lineaarinen poikkeama;

4) keskihajonta;

5) vaihteluväli;

6) värähtelykerroin;

7) lineaarinen variaatiokerroin;

8) yksinkertainen variaatiokerroin;

10) mediaani;

11) epäsymmetriakerroin;

12) Pearsonin epäsymmetriaindeksi;

13) kurtoosikerroin.

Ratkaisu

Kuten tiedät, vaihtoehdot (tunnistetut arvot) on järjestetty nousevaan muotoon diskreetti variaatiosarja. Suurella määrällä vaihtoehto (yli 10), jopa diskreetin vaihtelun tapauksessa muodostetaan intervallisarjat.

Jos intervallisarja käännetään parillisilla aikaväleillä, vaihteluväli jaetaan määritetyllä määrällä intervalleja. Lisäksi, jos tuloksena oleva arvo on kokonaisluku ja yksiselitteinen (mikä on harvinaista), välin pituuden oletetaan olevan yhtä suuri kuin tämä luku. Muissa tapauksissa tuotettu pyöristäminen Välttämättä V puolella lisääntyä, Niin to viimeinen numero oli parillinen. Ilmeisesti, kun intervallin pituus kasvaa, vaihteluväli määrällä, joka on yhtä suuri kuin intervallien lukumäärän tulo: intervallin lasketun ja alkuperäisen pituuden erolla

A) Jos vaihtelualueen laajenemisen suuruus on merkityksetön, se joko lisätään ominaisuuden suurimpaan arvoon tai vähennetään pienimmästä arvosta;

b) Jos vaihtelualueen laajenemisen suuruus on havaittavissa, niin alueen keskipisteen sekaannusten välttämiseksi se jaetaan karkeasti puoliksi lisäämällä samanaikaisesti suurimpaan ja vähentämällä pienimmistä ominaisuus.

Jos kootaan intervallisarja, jossa on epätasainen väli, prosessi yksinkertaistuu, mutta silti välien pituus on ilmaistava numerona, jossa on viimeinen parillinen numero, mikä yksinkertaistaa suuresti myöhempiä numeeristen ominaisuuksien laskelmia.

30 on otoskoko.

Luodaan välijakaumasarja Sturgesin kaavalla:

K = 1 + 3,32*log n,

K - ryhmien lukumäärä;

K = 1 + 3,32 * lg 30 = 5,91 = 6

Löydämme määritteen vaihteluvälin - yrityksen työntekijöiden palkat - (x) kaavalla

R = xmax - xmin ja jaa 6:lla; R = 195-112 = 83

Sitten välin pituus on l kaista = 83:6 = 13,83

Ensimmäisen välin alku on 112. Lisätään 112:een l ras = 13,83, saamme sen lopullisen arvon 125,83, joka on myös toisen intervallin alku jne. viidennen intervallin loppu - 195.

Taajuuksia haettaessa tulee noudattaa sääntöä: "jos ominaisuuden arvo osuu sisäisen intervallin rajaan, niin se tulee liittää edelliseen väliin."

Saamme intervallisarjan taajuuksia ja kumulatiivisia taajuuksia.

Taulukko 1.2

Siksi kolmella työntekijällä on palkka. maksu 112:sta 125,83:een tavanomaiseen rahayksikköön. Korkein palkka maksu 181,15:stä 195:een tavanomaiseen rahayksikköön. vain 6 työntekijää.

Numeeristen ominaisuuksien laskemiseksi muunnamme intervallisarjat diskreetiksi sarjaksi ottamalla vaihtoehtona välien keskikohdan:

Taulukko 1.3

14131,83

Painotetun aritmeettisen keskiarvon kaavan käyttäminen

tavanomaiset rahayksiköt

Keskimääräinen lineaarinen poikkeama:

missä xi on tutkittavan ominaisuuden arvo perusjoukon i:nnelle yksikölle,

Tutkitun ominaisuuden keskiarvo.

Lähetetty http://www.allbest.ru/

Llähetetty http://www.allbest.ru/

Perinteiset rahayksiköt

Vakiopoikkeama:

Dispersio:

Suhteellinen vaihteluväli (värähtelykerroin): c= R:,

Suhteellinen lineaarinen poikkeama: q = L:

Variaatiokerroin: V = y:

Värähtelykerroin osoittaa ominaisuuden ääriarvojen suhteellisen vaihtelun aritmeettisen keskiarvon ympärillä, ja variaatiokerroin kuvaa populaation astetta ja homogeenisuutta.

c = R: = 83 / 159,485 * 100 % = 52,043 %

Ero ääriarvojen välillä on siis 5,16 % (=94,84%-100 %) pienempi kuin yrityksen työntekijöiden keskipalkka.

q = L: = 17,765 / 159,485 * 100 % = 11,139 %

V = y: = 21,704/ 159,485*100 % = 13,609 %

Variaatiokerroin on alle 33 %, mikä kertoo yrityksen työntekijöiden palkkojen heikosta vaihtelusta, ts. että keskiarvo on tyypillinen työntekijöiden palkkojen ominaisuus (väestö on homogeeninen).

Intervallijakaumasarjoissa muoti määräytyy kaavalla -

Modaalivälin taajuus, ts. aikaväli, joka sisältää suurimman määrän vaihtoehtoja;

Modaalia edeltävän intervallin taajuus;

Modaalia seuraavan intervallin taajuus;

Modaalivälin pituus;

Modaalivälin alaraja.

Määrittämistä varten mediaanit intervallisarjassa käytämme kaavaa

missä on mediaania edeltävän aikavälin kumulatiivinen (kertynyt) taajuus;

Mediaanivälin alaraja;

Mediaanivälitaajuus;

Mediaanivälin pituus.

Mediaaniväli- intervalli, jonka kumulatiivinen taajuus (=3+3+5+7) ylittää puolet taajuuksien summasta - (153,49; 167,32).

Lasketaan epäsymmetria ja kurtoosi, jota varten luomme uuden laskentataulukon:

Taulukko 1.4

Faktatietoa

Laskentatiedot

Lasketaan kolmannen kertaluvun momentti

Siksi epäsymmetria on yhtä suuri kuin

Koska 0,3553 0,25, epäsymmetriaa pidetään merkittävänä.

Lasketaan neljännen kertaluvun momentti

Siksi kurtoosi on yhtä suuri kuin

Koska< 0, то эксцесс является плосковершинным.

Epäsymmetrian aste voidaan määrittää käyttämällä Pearsonin epäsymmetriakerrointa (As): oskillaationäytteen arvon vaihtuvuus

missä on jakaumasarjan aritmeettinen keskiarvo; -- muoti; -- keskihajonta.

Symmetrisellä (normaali)jakaumalla = Mo, epäsymmetriakerroin on siis nolla. Jos As > 0, moodia on enemmän, joten kyseessä on oikeanpuoleinen epäsymmetria.

Jos As< 0, то меньше моды, следовательно, имеется левосторонняя асимметрия. Коэффициент асимметрии может изменяться от -3 до +3.

Jakauma ei ole symmetrinen, mutta siinä on vasemmanpuoleinen epäsymmetria.

TEHTÄVÄ 2

Mikä pitäisi olla otoskoko, jotta otosvirhe todennäköisyydellä 0,954 ei ylitä arvoa 0,04, jos aikaisempien tutkimusten perusteella tiedetään, että varianssi on 0,24?

Ratkaisu

Otoskoko ei-toistuvaa otantaa varten lasketaan kaavalla:

t - luottamuskerroin (todennäköisyydellä 0,954 se on 2,0; määritetty todennäköisyysintegraalien taulukoista),

y2=0,24 - standardipoikkeama;

10 000 ihmistä - otoskoko;

Dx =0,04 - näytekeskiarvon maksimivirhe.

Todennäköisyydellä 95,4 % voidaan todeta, että otoskoon, joka varmistaa enintään 0,04:n suhteellisen virheen, tulisi olla vähintään 566 perhettä.

TEHTÄVÄ3

Seuraavat tiedot ovat saatavilla yrityksen päätoimintojen tuloista, miljoonia ruplaa.

Määritä seuraavat indikaattorit analysoidaksesi sarjan dynamiikkaa:

1) ketju ja perus:

Absoluuttiset lisäykset;

Kasvunopeudet;

Kasvuvauhti;

2) keskimäärin

Dynaaminen rivitaso;

Absoluuttinen lisäys;

Kasvuvauhti;

Kasvunopeus;

3) 1 %:n lisäyksen itseisarvo.

Ratkaisu

1. Absoluuttinen lisäys (Dy)- tämä on ero sarjan seuraavan tason ja edellisen (tai perustason) välillä:

ketju: DN = yi - yi-1,

perus: DN = yi - y0,

уi - rivitaso,

i - rivitason numero,

y0 - perusvuoden taso.

2. Kasvunopeus (tu) on sarjan seuraavan tason ja edellisen (tai perusvuoden 2001) suhde:

ketju: Tu = ;

perus: Tu =

3. Kasvuvauhti (TD) on absoluuttisen kasvun suhde edelliseen tasoon prosentteina ilmaistuna.

ketju: Tu = ;

perus: Tu =

4. 1 %:n lisäyksen absoluuttinen arvo (A)- tämä on ketjun absoluuttisen kasvun suhde kasvunopeuteen prosentteina ilmaistuna.

A =

Keskimääräinen rivitaso lasketaan aritmeettisen keskiarvon kaavalla.

Keskimääräinen tulotaso ydintoiminnasta 4 vuoden ajalta:

Keskimääräinen absoluuttinen nousu lasketaan kaavalla:

missä n on sarjan tasojen lukumäärä.

Keskimäärin vuoden tuotot ydintoiminnoista kasvoivat 3,333 miljoonaa ruplaa.

Keskimääräinen vuotuinen kasvuvauhti lasketaan geometrisen keskiarvon kaavalla:

уn on rivin viimeinen taso,

y0 on sarjan alkutaso.

Tu = 100 % = 102,174 %

Keskimääräinen vuotuinen kasvuvauhti lasketaan kaavalla:

T? = Tu - 100 % = 102,74 % - 100 % = 2,74 %.

Siten yrityksen päätoimialan tuotot kasvoivat keskimäärin vuoden aikana 2,74 %.

TEHTÄVÄTA4

Laskea:

1. Yksittäiset hintaindeksit;

2. Yleinen kaupan vaihtuvuusindeksi;

3. Kokonaishintaindeksi;

4. Tavaroiden fyysisen myynnin kokonaisindeksi;

5. Erittele kaupan liikevaihdon arvon absoluuttinen nousu tekijöiden mukaan (hintojen ja myytyjen tavaroiden määrän muutoksista johtuen);

6. Tee lyhyet johtopäätökset kaikista saaduista indikaattoreista.

Ratkaisu

1. Ehdon mukaan tuotteiden A, B, C yksittäiset hintaindeksit olivat -

ipA = 1,20; iрБ = 1,15; iрВ = 1,00.

2. Laskemme yleisen kaupan vaihtuvuusindeksin kaavalla:

I w = = 1470/1045*100 % = 140,67 %

Vaihdon liikevaihto kasvoi 40,67 % (140,67%-100 %).

Keskimäärin hyödykkeiden hinnat nousivat 10,24 %.

Ostajille hinnankorotuksista aiheutuvien lisäkustannusten määrä:

w(p) = ? p1q1 - ? p0q1 = 1470 - 1333,478 = 136,522 miljoonaa ruplaa.

Hintojen nousun seurauksena ostajat joutuivat kuluttamaan lisää 136 522 miljoonaa ruplaa.

4. Liikevaihdon fyysisen määrän yleinen indeksi:

Liikevaihdon fyysinen volyymi kasvoi 27,61 %.

5. Määritetään kaupan liikevaihdon kokonaismuutos toisella jaksolla ensimmäiseen ajanjaksoon verrattuna:

w = 1470-1045 = 425 miljoonaa ruplaa.

hintamuutosten vuoksi:

W(p) = 1470 - 1333,478 = 136,522 miljoonaa ruplaa.

fyysisen tilavuuden muutoksista johtuen:

w(q) = 1333,478 - 1045 = 288,478 miljoonaa ruplaa.

Tavaroiden liikevaihto kasvoi 40,67 %. Keskimäärin kolmen tuotteen hinnat nousivat 10,24 %. Liikevaihdon fyysinen volyymi kasvoi 27,61 %.

Yleisesti myyntimäärä kasvoi 425 miljoonalla ruplalla, mukaan lukien hintojen nousun vuoksi 136,522 miljoonalla ruplasta ja myyntimäärien kasvusta johtuen 288,478 miljoonalla ruplasta.

TEHTÄVÄ5

Seuraavat tiedot ovat saatavilla 10 tehtaalta yhdellä toimialalla.

Kasvin numero

Tuotetuotanto, tuhat kpl. (X)

Annettujen tietojen perusteella:

I) vahvistaa loogisen analyysin edellytykset tekijän ominaiskäyrän (tuotteen tilavuus) ja tuloksena olevan ominaisuuden (sähkönkulutus) välisen lineaarisen korrelaation olemassaolosta, piirtää lähtötiedot korrelaatiokentän kuvaajalle ja tehdä johtopäätökset muodosta. suhteesta, ilmoita sen kaava;

2) määrittää yhteysyhtälön parametrit ja piirtää tuloksena oleva teoreettinen suora korrelaatiokentän kuvaajalle;

3) laskea lineaarinen korrelaatiokerroin,

4) selittää kohdissa 2 ja 3 saatujen tunnuslukujen merkitys;

5) tehdä tuloksena olevan mallin avulla ennuste mahdollisesta energiankulutuksesta laitoksessa, jonka tuotantomäärä on 4,5 tuhatta yksikköä.

Ratkaisu

Attribuutin tiedot - tuotannon määrä (tekijä), merkitään xi:llä; merkki - sähkönkulutus (tulos) yi:n kautta; pisteet, joissa on koordinaatit (x, y), piirretään korrelaatiokenttään OXY.

Korrelaatiokentän pisteet sijaitsevat tiettyä suoraa pitkin. Siksi suhde on lineaarinen, etsimme regressioyhtälöä suoran Уx=ax+b muodossa. Sen löytämiseksi käytämme normaaliyhtälöjärjestelmää:

Luodaan laskentataulukko.

Löytyneiden keskiarvojen avulla muodostamme järjestelmän ja ratkaisemme sen parametrien a ja b suhteen:

Joten saamme regressioyhtälön y:lle x:llä: = 3,57692 x + 3,19231

Rakennamme korrelaatiokenttään regressioviivan.

Korvaamalla x-arvot sarakkeesta 2 regressioyhtälöön, saadaan lasketut arvot (sarake 7) ja verrataan niitä y-tietoihin, jotka näkyvät sarakkeessa 8. Muuten, laskelmien oikeellisuuden vahvistaa y:n ja keskiarvojen yhteensopivuus.

Kerroinlineaarinen korrelaatio arvioi ominaisuuksien x ja y välisen suhteen läheisyyden ja lasketaan kaavalla

Suoran regression kulmakerroin a (pisteessä x) kuvaa tunnistetun suunnanriippuvuuksiamerkit: a>0:lle ne ovat samat, a:lle<0- противоположны. Sen ehdoton arvo - tuloksen ominaisuuden muutoksen mitta, kun tekijän ominaisuus muuttuu mittayksikön verran.

Suoran regression vapaa termi paljastaa suunnan, ja sen absoluuttinen arvo on kvantitatiivinen mitta kaikkien muiden tekijöiden vaikutuksesta tuloksena olevaan ominaisuuteen.

Jos< 0, silloin yksittäiselle objektille ominaisen tekijän resurssia käytetään vähemmällä ja milloin>0 Kanssasuurempi tehokkuus kuin koko objektijoukon keskiarvo.

Suoritetaan jälkiregressioanalyysi.

Suoran regression kerroin kohdassa x on yhtä suuri kuin 3,57692 >0, joten tuotantotuotannon kasvaessa (vähentyessä) sähkön kulutus kasvaa (vähenee). Tuotantomäärän kasvu 1 tuhannella yksiköllä. lisää sähkönkulutusta keskimäärin 3,57692 tuhatta kWh.

2. Suoran regression vapaa termi on 3,19231, joten muiden tekijöiden vaikutus lisää tuotetuotannon vaikutusta sähkönkulutukseen absoluuttisesti 3,19231 tuhatta kWh.

3. Korrelaatiokerroin 0,8235 paljastaa sähkönkulutuksen hyvin suuren riippuvuuden tuotteen tuotannosta.

Ennusteiden tekeminen regressiomalliyhtälön avulla on helppoa. Tätä varten regressioyhtälöön korvataan x:n - tuotannon volyymin - arvot ja ennustetaan sähkön kulutus. Tässä tapauksessa x:n arvot voidaan ottaa paitsi tietyn alueen sisällä, myös sen ulkopuolella.

Tehdään ennuste mahdollisesta energiankulutuksesta tehtaalla, jonka tuotantomäärä on 4,5 tuhatta yksikköä.

3,57692*4,5 + 3,19231= 19,288 45 tuhatta kWh.

LUETTELO KÄYTETYT LÄHTEET

1. Zakharenkov S.N. Sosioekonomiset tilastot: Oppikirja ja käytännön opas. -Mn.: BSEU, 2002.

2. Efimova M.R., Petrova E.V., Rumjantsev V.N. Yleinen tilastoteoria. - M.: INFRA - M., 2000.

3. Eliseeva I.I. Tilastot. - M.: Prospekt, 2002.

4. Yleinen tilastoteoria / Under general. toim. O.E. Bashina, A.A. Spirina. - M.: Rahoitus ja tilastot, 2000.

5. Sosioekonomiset tilastot: Koulutuksellinen ja käytännön. lisä / Zakharenkov S.N. ja muut - Mn.: Jerevan State University, 2004.

6. Sosioekonomiset tilastot: Oppikirja. korvaus. /Toim. Nesterovich S.R. - Mn.: BSEU, 2003.

7. Teslyuk I.E., Tarlovskaya V.A., Terlizhenko N. Tilastot. - Minsk, 2000.

8. Kharchenko L.P. Tilastot. - M.: INFRA - M, 2002.

9. Kharchenko L.P., Dolzhenkova V.G., Ionin V.G. Tilastot. - M.: INFRA - M, 1999.

10. Taloustilastot / Toim. Yu.N. Ivanova - M., 2000.

Lähetetty osoitteessa Allbest.ru

...

Samanlaisia ​​asiakirjoja

    Välijakauman sarjan aritmeettisen keskiarvon laskeminen. Kaupan liikevaihdon fyysisen volyymin yleisindeksin määrittäminen. Tuotannon kokonaiskustannusten absoluuttisen muutoksen analyysi fyysisen volyymin muutoksista. Variaatiokertoimen laskeminen.

    testi, lisätty 19.7.2010

    Tukku-, vähittäis- ja julkisen kaupan ydin. Yksittäisten ja kokonaisliikevaihtoindeksien laskentakaavat. Intervallijakauman sarjan ominaisuuksien laskenta - aritmeettinen keskiarvo, moodi ja mediaani, variaatiokerroin.

    kurssityö, lisätty 10.5.2013

    Suunnitellun ja toteutuneen myyntivolyymin laskeminen, suunnitelman toteutumisprosentti, absoluuttinen liikevaihdon muutos. Absoluuttisen kasvun, keskimääräisen kasvun ja kassatulon kasvun määrittäminen. Rakenteellisten keskiarvojen laskeminen: moodit, mediaanit, kvartiilit.

    testi, lisätty 24.2.2012

    Pankkien jakauman intervallisarja voittovolyymin mukaan. Tuloksena olevan intervallijakauman sarjan moodin ja mediaanin löytäminen graafisella menetelmällä ja laskelmilla. Intervallijakauman sarjan ominaisuuksien laskenta. Aritmeettisen keskiarvon laskeminen.

    testi, lisätty 15.12.2010

    Kaavat intervallisarjan keskiarvojen määrittämiseksi - moodit, mediaanit, hajonta. Dynaamisten sarjojen analyyttisten indikaattoreiden laskenta ketju- ja peruskaavioita, kasvunopeuksia ja lisäyksiä käyttäen. Kustannusten, hintojen, kulujen ja liikevaihdon konsolidoidun indeksin käsite.

    kurssityö, lisätty 27.2.2011

    Konsepti ja tarkoitus, järjestys ja säännöt variaatiosarjan rakentamiseen. Tietojen homogeenisuuden analyysi ryhmissä. Ominaisuuden vaihtelun (fluktuation) indikaattorit. Keskimääräisen lineaarisen ja neliöpoikkeaman, värähtely- ja variaatiokertoimen määritys.

    testi, lisätty 26.4.2010

    Moodin ja mediaanin käsite tyypillisinä ominaisuuksina, niiden määrittelyjärjestys ja -kriteerit. Moodin ja mediaanin löytäminen diskreetistä ja intervallivaihtelusarjasta. Kvartiilit ja desiilit vaihtelutilastosarjan lisäominaisuuksina.

    testi, lisätty 11.9.2010

    Intervallijakaumasarjan rakentaminen ryhmittelyominaisuuksien perusteella. Taajuusjakauman poikkeaman symmetrisestä muodosta ominaisuudet, kurtoosi- ja epäsymmetriaindikaattoreiden laskenta. Taseen tai tuloslaskelman tunnuslukujen analyysi.

    testi, lisätty 19.10.2014

    Empiiristen sarjojen muuntaminen diskreeteiksi ja intervallisarjoiksi. Diskreetin sarjan keskiarvon määrittäminen sen ominaisuuksien perusteella. Laskenta diskreetillä moodi-, mediaani- ja variaatioindikaattoreiden sarjalla (dispersio, poikkeama, värähtelykerroin).

    testi, lisätty 17.4.2011

    Organisaatioiden jakautumisen tilastollisen sarjan rakentaminen. Moodin ja mediaaniarvojen graafinen määritys. Korrelaation läheisyys käyttämällä determinaatiokerrointa. Keskimääräisen työntekijöiden lukumäärän otantavirheen määrittäminen.

Suuria tietomääriä käsiteltäessä, mikä on erityisen tärkeää nykyaikaista tieteellistä kehitystä tehtäessä, tutkijalla on edessään vakava tehtävä lähdetietojen oikea ryhmittely. Jos tiedot ovat luonteeltaan erillisiä, niin, kuten olemme nähneet, ongelmia ei synny - sinun on vain laskettava kunkin ominaisuuden taajuus. Jos tutkittavalla ominaisuudella on jatkuva luonne (mikä on käytännössä yleisempää), niin optimaalisen ominaisuuksien ryhmittelyvälien lukumäärän valitseminen ei ole mitenkään triviaali tehtävä.

Jatkuvien satunnaismuuttujien ryhmittelyä varten ominaisuuden koko vaihteluväli jaetaan tiettyyn määrään intervalleja Vastaanottaja.

Ryhmitetty aikaväli (jatkuva) variaatiosarja kutsutaan intervalleiksi, jotka on luokiteltu attribuutin () arvon mukaan, missä r":nnelle välille osuvien havaintojen määrät tai suhteelliset taajuudet () ilmoitetaan yhdessä vastaavien frekvenssien kanssa ():

Tunnusomaiset arvovälit

mi taajuus

pylväsdiagrammi Ja kumuloitua (ogiva), jotka olemme jo käsitelleet yksityiskohtaisesti, ovat erinomainen tapa visualisoida tietoja, joiden avulla voit saada ensisijaisen käsityksen tietorakenteesta. Tällaiset graafit (kuva 1.15) muodostetaan jatkuvalle datalle samalla tavalla kuin diskreetille datalle, vain ottaen huomioon, että jatkuva data täyttää täysin mahdollisten arvojensa alueen, ottamalla mitkä tahansa arvot.

Riisi. 1.15.

Siksi histogrammin ja kumulaatin sarakkeiden tulee koskettaa toisiaan, eikä niissä saa olla alueita, joissa attribuuttiarvot eivät sijoitu kaikkiin mahdollisiin(ts. histogrammissa ja kumulaateissa ei saa olla abskissa-akselilla "reikiä", jotka eivät sisällä tutkittavan muuttujan arvoja, kuten kuvassa 1.16). Palkin korkeus vastaa taajuutta – tiettyyn aikaväliin kuuluvien havaintojen lukumäärää tai suhteellista tiheyttä – havaintojen osuutta. Intervallit ei saa risteä ja ovat yleensä yhtä leveitä.

Riisi. 1.16.

Histogrammi ja polygoni ovat todennäköisyystiheyskäyrän likiarvoja (differentiaalifunktio) f(x) teoreettinen jakauma, joka otetaan huomioon todennäköisyysteorian aikana. Siksi niiden rakentaminen on niin tärkeää kvantitatiivisen jatkuvan datan primaarisessa tilastollisessa käsittelyssä - niiden ulkonäön perusteella voidaan päätellä hypoteettinen jakautumislaki.

Cumulate – intervallivaihtelusarjan kumuloituneiden taajuuksien (taajuuksien) käyrä. Kumulatiivisen jakaumafunktion kuvaajaa verrataan kumulaattiin F(x), jota käsitellään myös todennäköisyyslaskentakurssilla.

Periaatteessa histogrammin ja kumuloitumisen käsitteet liittyvät nimenomaan jatkuvaan dataan ja niiden intervallivaihtelusarjoihin, koska niiden graafit ovat empiirisiä arvioita todennäköisyystiheysfunktiosta ja jakaumafunktiosta.

Intervallivaihtelusarjan rakentaminen alkaa intervallien lukumäärän määrittämisellä k. Ja tämä tehtävä on ehkä vaikein, tärkein ja kiistanalaisin tutkittavassa asiassa.

Välien lukumäärä ei saa olla liian pieni, koska tämä tekee histogrammista liian tasaisen ( ylitasoitettu), menettää kaikki alkuperäisen datan vaihtelevuuden ominaisuudet - kuvassa 2. 1.17 näet kuinka samat tiedot, joihin kuvan kaaviot. 1.15, jota käytetään pienemmällä määrällä intervalleja sisältävän histogrammin rakentamiseen (vasen kaavio).

Samalla intervallien lukumäärä ei saa olla liian suuri - muuten emme pysty arvioimaan tutkitun datan jakautumistiheyttä numeerisella akselilla: histogrammi alitasoitettu (alitasoitettu), tyhjillä väleillä, epätasainen (ks. kuva 1.17, oikea käyrä).

Riisi. 1.17.

Kuinka määrittää edullisin välien lukumäärä?

Vuonna 1926 Herbert Sturges ehdotti kaavaa niiden välien lukumäärän laskemiseksi, joihin on tarpeen jakaa tutkittavan ominaisuuden alkuperäinen arvosarja. Tämä kaava on todellakin tullut erittäin suosituksi - useimmat tilastolliset oppikirjat tarjoavat sitä, ja monet tilastopaketit käyttävät sitä oletuksena. Kuinka perusteltua tämä on, ja kaikissa tapauksissa, on erittäin vakava kysymys.

Joten, mihin Sturges-kaava perustuu?

Harkitse binomijakaumaa)