Tilastollinen jakaumasarja. Muodostetaan tilastollinen jakaumasarja

Ryhmittely- tämä on populaation jakamista ryhmiin, jotka ovat homogeenisia jonkin ominaisuuden mukaan.

Palvelun tarkoitus. Verkkolaskimen avulla voit:

  • rakentaa variaatiosarja, rakentaa histogrammi ja monikulmio;
  • löytää variaatioindikaattoreita (keskiarvo, moodi (mukaan lukien graafinen), mediaani, vaihteluväli, kvartiilit, desiilit, kvartiilien differentiaatiokerroin, variaatiokerroin ja muut indikaattorit);

Ohjeet. Sarjan ryhmittelemiseksi sinun on valittava saadun variaatiosarjan tyyppi (diskreetti tai intervalli) ja ilmoitettava datan määrä (rivien lukumäärä). Saatu ratkaisu tallennetaan Word-tiedostoon (katso esimerkki tilastotietojen ryhmittelystä).

Syötetietojen määrä
",0);">

Jos ryhmittely on jo suoritettu ja diskreetti variaatiosarja tai intervallisarja, sinun on käytettävä online-laskinta Variation Indeksit. Jakauman tyyppiä koskevan hypoteesin testaaminen suoritetaan Jakelulomakkeen tutkiminen -palvelun avulla.

Tilastollisten ryhmittelyjen tyypit

Variaatiosarja. Diskreetin satunnaismuuttujan havainnoissa sama arvo voi kohdata useita kertoja. Tällaiset satunnaismuuttujan arvot x i tallennetaan osoittaen n i, kuinka monta kertaa se esiintyy n havainnossa, tämä on tämän arvon taajuus.
Jatkuvan satunnaismuuttujan tapauksessa käytetään käytännössä ryhmittelyä.
  1. Typologinen ryhmittely- tämä on tutkittavan laadullisesti heterogeenisen väestön jako luokkiin, sosioekonomisiin tyyppeihin, homogeenisiin yksikköryhmiin. Luo tämä ryhmittely käyttämällä Discrete variation series -parametria.
  2. Ryhmää kutsutaan rakenteelliseksi, jossa homogeeninen populaatio jaetaan ryhmiin, jotka kuvaavat sen rakennetta jonkin vaihtelevan ominaisuuden mukaan. Luo tämä ryhmittely käyttämällä Interval series -parametria.
  3. Ryhmittelyä, joka paljastaa tutkittavien ilmiöiden ja niiden ominaisuuksien väliset suhteet, kutsutaan analyyttinen ryhmä(katso sarjan analyyttinen ryhmittely).

Tilastollisten ryhmittelyjen muodostamisen periaatteet

Nousevaan järjestykseen järjestettyä havaintojen sarjaa kutsutaan variaatiosarjaksi. Ryhmittelyominaisuus on ominaisuus, jolla populaatio jaetaan erillisiin ryhmiin. Sitä kutsutaan ryhmän perustaksi. Ryhmittely voi perustua sekä määrällisiin että laadullisiin ominaisuuksiin.
Ryhmittelyperusteen selvittämisen jälkeen tulee ratkaista kysymys ryhmien lukumäärästä, joihin tutkittava populaatio tulisi jakaa.

Kun tilastotietojen käsittelyyn käytetään henkilökohtaisia ​​tietokoneita, objektiyksiköiden ryhmittely suoritetaan vakiomenettelyjä käyttäen.
Yksi tällainen menettely perustuu Sturgess-kaavan käyttöön optimaalisen ryhmien lukumäärän määrittämiseksi:

k = 1+3,322*log(N)

Missä k on ryhmien lukumäärä, N on väestöyksiköiden lukumäärä.

Osavälien pituus lasketaan kaavalla h=(x max -x min)/k

Sitten lasketaan näille intervalleille osuvien havaintojen määrät, jotka otetaan taajuuksiksi n i . Harvat taajuudet, joiden arvot ovat alle 5 (n i< 5), следует объединить. в этом случае надо объединить и соответствующие интервалы.
Välien x i =(c i-1 +c i)/2 keskiarvot otetaan uusiksi arvoiksi.

Ne esitetään jakelusarjojen muodossa ja esitetään muodossa.

Jakelusarja on yksi ryhmittelytyypeistä.

Jakelualue— edustaa tutkittavan populaation yksiköiden järjestettyä jakautumista ryhmiin tietyn vaihtelevan ominaisuuden mukaan.

Jakelusarjan muodostumisen taustalla olevan ominaisuuden mukaan ne erotetaan toisistaan attribuutio ja variaatio jakelurivit:

  • Attributiivinen- kutsutaan jakaumasarjoiksi, jotka on muodostettu laadullisten ominaisuuksien mukaan.
  • Jakaumasarjoja, jotka on muodostettu määrällisen ominaisuuden arvojen nousevassa tai laskevassa järjestyksessä, kutsutaan vaihtelevaa.
Jakauman variaatiosarja koostuu kahdesta sarakkeesta:

Ensimmäinen sarake tarjoaa muuttuvan ominaisuuden kvantitatiiviset arvot, joita kutsutaan vaihtoehtoja ja on nimetty. Diskreetti vaihtoehto - ilmaistaan ​​kokonaislukuna. Intervallivaihtoehto vaihtelee välillä ja -. Vaihtoehtojen tyypistä riippuen voit muodostaa diskreetin tai intervallivaihtelusarjan.
Toinen sarake sisältää tietyn vaihtoehdon määrä, ilmaistuna taajuuksina tai taajuuksina:

Taajuudet- Nämä ovat absoluuttisia lukuja, jotka osoittavat, kuinka monta kertaa tietty ominaisuuden arvo esiintyy aggregaatissa, mikä tarkoittaa . Kaikkien taajuuksien summan tulee olla yhtä suuri kuin yksiköiden lukumäärä koko populaatiossa.

Taajuudet() ovat taajuuksia ilmaistuna prosentteina kokonaismäärästä. Kaikkien taajuuksien summan prosentteina ilmaistuna on oltava 100 % ykkösen murto-osina.

Graafinen esitys jakelusarjoista

Jakelusarjat esitetään visuaalisesti graafisten kuvien avulla.

Jakelusarjat on kuvattu seuraavasti:
  • Monikulmio
  • Histogrammit
  • Kumuloituu
  • Ogives

Monikulmio

Monikulmiota rakennettaessa muuttuvan ominaisuuden arvot piirretään vaaka-akselille (x-akseli) ja taajuudet tai taajuudet piirretään pystyakselille (y-akseli).

Kuvan monikulmio. 6.1 perustuu Venäjän vuoden 1994 mikrolaskennan tietoihin.

6.1. Kotitalouksien kokojakauma

Kunto: Tiedot toimitetaan yhden yrityksen 25 työntekijän jakautumisesta tariffiluokkien mukaan:
4; 2; 4; 6; 5; 6; 4; 1; 3; 1; 2; 5; 2; 6; 3; 1; 2; 3; 4; 5; 4; 6; 2; 3; 4
Tehtävä: Muodosta diskreetti variaatiosarja ja kuvaa se graafisesti jakelupolygonina.
Ratkaisu:
Tässä esimerkissä vaihtoehdot ovat työntekijän palkkaluokka. Taajuuksien määrittämiseksi on tarpeen laskea työntekijöiden määrä vastaavalla tariffiluokalla.

Monikulmiota käytetään diskreeteille variaatiosarjoille.

Jakaumapolygonin (kuva 1) muodostamiseksi piirrämme vaihtelevan ominaisuuden kvantitatiiviset arvot - variantit - abskissa (X) -akselia pitkin ja taajuudet tai taajuudet ordinaattiselle akselille.

Jos ominaisuuden arvot ilmaistaan ​​intervalleina, niin tällaista sarjaa kutsutaan intervalliksi.
Intervalli sarja jakaumat on kuvattu graafisesti histogrammin, kumulaation tai ogive-muodossa.

Tilastotaulukko

Kunto: Tiedot toimitetaan 20 henkilön talletusten koosta yhdessä pankissa (tuhatta ruplaa) 60; 25; 12; 10; 68; 35; 2; 17; 51; 9; 3; 130; 24; 85; 100; 152; 6; 18; 7; 42.
Tehtävä: Muodosta intervallivaihtelusarja yhtäläisin välein.
Ratkaisu:

  1. Alkupopulaatio koostuu 20 yksiköstä (N = 20).
  2. Sturgessin kaavalla määritetään tarvittava määrä käytettyjä ryhmiä: n=1+3.322*lg20=5
  3. Lasketaan yhtäläisen välin arvo: i=(152 - 2) /5 = 30 tuhatta ruplaa
  4. Jaetaan alkuperäinen väestö 5 ryhmään 30 tuhannen ruplan välein.
  5. Esitämme ryhmittelytulokset taulukossa:

Tällaisella jatkuvan ominaiskäyrän tallennuksella, kun sama arvo esiintyy kahdesti (yhden intervallin ylärajana ja toisen intervallin alarajana), tämä arvo kuuluu ryhmään, jossa tämä arvo toimii ylärajana.

pylväsdiagrammi

Histogrammin muodostamiseksi välien rajojen arvot osoitetaan abskissa-akselia pitkin ja niiden perusteella muodostetaan suorakulmioita, joiden korkeus on verrannollinen taajuuksiin (tai taajuuksiin).

Kuvassa 6.2. esittää histogrammin Venäjän väestön jakautumisesta vuonna 1997 ikäryhmittäin.

Riisi. 6.2. Venäjän väestön jakautuminen ikäryhmittäin

Kunto: Yrityksen 30 työntekijän kuukausipalkkajakauma on annettu

Tehtävä: Näytä intervallivaihtelusarjat graafisesti histogrammin muodossa ja kumuloi.
Ratkaisu:

  1. Avoimen (ensimmäisen) välin tuntematon raja määräytyy toisen intervallin arvon perusteella: 7000 - 5000 = 2000 ruplaa. Samalla arvolla löydämme ensimmäisen intervallin alarajan: 5000 - 2000 = 3000 ruplaa.
  2. Histogrammin rakentamiseksi suorakaiteen muotoiseen koordinaattijärjestelmään piirrämme abskissa-akselia pitkin segmentit, joiden arvot vastaavat suonikohjujen sarjan välejä.
    Nämä segmentit toimivat alempana pohjana ja vastaava taajuus (taajuus) toimii muodostettujen suorakulmioiden korkeutena.
  3. Rakennetaan histogrammi:

Kumulaattien muodostamiseksi on tarpeen laskea kertyneet taajuudet (taajuudet). Ne määritetään summaamalla peräkkäin aikaisempien intervallien taajuudet (taajuudet) ja merkitään S:llä. Kertyneet taajuudet osoittavat, kuinka monella populaation yksiköllä on ominaisarvo, joka ei ole suurempi kuin tarkasteltavana oleva.

Kumuloituu

Variaatiosarjan ominaisuuden jakautuminen kumuloituneille taajuuksille (taajuuksille) on kuvattu käyttämällä kumulaatiota.

Kumuloituu tai kumulatiivinen käyrä, toisin kuin monikulmio, muodostetaan kertyneistä taajuuksista tai taajuuksista. Tässä tapauksessa ominaisuuden arvot sijoitetaan abskissa-akselille ja kumuloituneet taajuudet tai taajuudet asetetaan ordinaatta-akselille (kuva 6.3).

Riisi. 6.3. Kotitalouden kokojakauman kumulat

4. Lasketaan kertyneet taajuudet:
Ensimmäisen aikavälin kumulatiivinen taajuus lasketaan seuraavasti: 0 + 4 = 4, toiselle: 4 + 12 = 16; kolmannelle: 4 + 12 + 8 = 24 jne.

Kumulaattia muodostettaessa vastaavan intervallin kertynyt taajuus (taajuus) määrätään sen ylärajaan:

Ogiva

Ogiva on rakennettu samalla tavalla kuin kumulaatti, sillä ainoa ero on, että kertyneet taajuudet sijoitetaan abskissa-akselille ja ominaisarvot ordinaattiselle akselille.

Eräs kumulaatin tyyppi on pitoisuuskäyrä tai Lorentzin käyrä. Konsentraatiokäyrän muodostamiseksi piirretään suorakaiteen muotoisen koordinaatiston molemmille akseleille asteikko prosentteina 0-100. Samalla abskissa-akselilla näytetään kertyneet taajuudet ja osuuden kumuloituneet arvot. (prosentteina) ominaisuuden tilavuudesta on merkitty ordinaatta-akselilla.

Ominaisuuden tasainen jakautuminen vastaa kaavion neliön diagonaalia (kuva 6.4). Epätasaisella jakautumisella kaavio edustaa koveraa käyrää piirteen pitoisuustasosta riippuen.

6.4 Pitoisuuskäyrä

2. Jakelusarjan käsite. Diskreetti ja intervallijakaumasarjat

Jakelu rivit Niitä kutsutaan erityistyyppisiksi ryhmiksi, joissa jokaiselle ominaisuudelle, ominaisuusryhmälle tai ominaisuusluokalle tiedetään ryhmän yksiköiden lukumäärä tai tämän luvun osuus kokonaismäärästä. Nuo. jakelusarja– järjestetty joukko attribuuttiarvoja, jotka on järjestetty nousevaan tai laskevaan järjestykseen niitä vastaavien painojen kanssa. Jakaumasarjat voidaan muodostaa joko kvantitatiivisten tai attribuuttiominaisuuksien perusteella.

Jakaumasarjoja, jotka on muodostettu kvantitatiivisesti, kutsutaan variaatiosarjoiksi. He ovat diskreetti ja intervalli. Jakaumasarja voidaan muodostaa jatkuvasti muuttuvan ominaisuuden perusteella (kun ominaisuus voi saada mitä tahansa arvoa millä tahansa aikavälillä) ja diskreetti vaihtelevan ominaisuuden perusteella (se vaatii tiukasti määriteltyjä kokonaislukuarvoja).

Diskreetti Jakauman variaatiosarja on järjestynyt joukko vaihtoehtoja ja niitä vastaavia taajuuksia tai tietoja. Diskreetin sarjan muunnelmat ovat diskreetti jatkuvasti muuttuvia ominaisuuden arvoja, yleensä laskun tulosta.

Diskreetti

Variaatiosarjat muodostetaan yleensä, jos tutkittavan ominaisuuden arvot voivat poiketa toisistaan ​​vähintään tietyn rajallisen määrän. Diskreetissä sarjassa määritetään ominaisuuden pistearvot. Esimerkki : Liikkeiden myymien miesten pukujen jakauma kuukaudessa koon mukaan.

Intervalli

Variaatiosarja on järjestetty sarja satunnaismuuttujan arvojen vaihteluväliä siten, että muuttujan vastaavat taajuudet tai arvotaajuudet kuuluvat kuhunkin niistä. Intervallisarjat on suunniteltu analysoimaan jatkuvasti muuttuvan ominaisuuden jakautumista, jonka arvo useimmiten tallennetaan mittaamalla tai punnitsemalla. Tällaisen sarjan muunnelmat ovat ryhmittelyjä.

Esimerkki : Ruokakaupan ostosten jakautuminen summien mukaan.

Jos diskreetissä vaihtelusarjassa taajuusvaste liittyy suoraan sarjan muunnelmaan, niin intervallisarjassa se viittaa muunnelmien ryhmään.

Jakauman sarjoja on kätevä analysoida niiden graafisen esityksen avulla, jonka avulla voidaan arvioida jakauman muotoa ja kuvioita. Diskreetti sarja on kuvattu kaaviossa katkoviivana - jakelupolygoni. Sen rakentamiseksi suorakaiteen muotoisessa koordinaattijärjestelmässä vaihtelevan ominaisuuden järjestetyt (järjestetyt) arvot piirretään pitkin abskissa-akselia samalla asteikolla ja taajuuksien ilmaisemiseen tarkoitettu asteikko piirretään ordinaatta-akselia pitkin.

Intervallisarjat on kuvattu muodossa jakauman histogrammit(eli pylväskaaviot).

Histogrammia rakennettaessa intervallien arvot piirretään abskissa-akselille ja taajuudet on kuvattu vastaaville intervalleille rakennetuilla suorakulmioilla. Pylväiden korkeuden tulee tasaväleissä olla verrannollinen taajuuksiin.

Mikä tahansa histogrammi voidaan muuntaa jakelupolygoniksi; tätä varten on tarpeen yhdistää sen suorakulmioiden kärjet suoriin segmentteihin.

2. Indeksimenetelmä, jolla analysoidaan keskimääräisen tuotannon ja keskimääräisen henkilöstömäärän vaikutusta tuotantovolyymin muutoksiin

Indeksimenetelmä Käytetään analysoimaan dynamiikkaa ja vertailemaan yleisiä indikaattoreita sekä näiden indikaattoreiden tasojen muutoksiin vaikuttavia tekijöitä. Indeksien avulla voidaan tunnistaa keskituotannon ja keskimääräisen henkilöstömäärän vaikutus tuotantovolyymin muutoksiin. Tämä ongelma ratkaistaan ​​rakentamalla analyyttisten indeksien järjestelmä.

Tuotantovolyymiindeksi liittyy keskimääräiseen työntekijöiden lukumäärään ja keskimääräinen tuotantoindeksi samalla tavalla kuin tuotantovolyymi (Q) liittyy tuotantoon ( w) ja numerot ( r) .

Voimme päätellä, että tuotannon määrä on yhtä suuri kuin keskimääräisen tuotannon ja keskimääräisen henkilöstön tulo:

Q = w r, missä Q on tuotantomäärä,

w - keskimääräinen tuotanto,

r – keskimääräinen työntekijöiden lukumäärä.

Kuten näette, puhumme ilmiöiden suhteesta staattisuudessa: kahden tekijän tulo antaa tuloksena olevan ilmiön kokonaistilavuuden. On myös selvää, että tämä yhteys on toimiva, joten tämän yhteyden dynamiikkaa tutkitaan indeksien avulla. Annetussa esimerkissä tämä on seuraava järjestelmä:

Jw × Jr = Jwr.

Esimerkiksi tuotantovolyymiindeksi Jwr tuotantoilmiön indeksinä voidaan jakaa kahteen tekijäindeksiin: keskimääräiseen tuotantoindeksiin (Jw) ja keskimääräiseen henkilöstöindeksiin (Jr):

Hakemisto Hakemistoindeksi

keskimääräisen palkkasumman määrä

tuotannon tuotantonumero

Missä J w- Laspeyresin kaavalla laskettu työn tuottavuusindeksi;

J r- Paaschen kaavalla laskettu työntekijöiden lukumäärän indeksi.

Indeksijärjestelmiä käytetään määrittämään yksittäisten tekijöiden vaikutus suoritusindikaattorin tason muodostumiseen, ne mahdollistavat tuntemattoman arvon määrittämisen kahdesta tunnetusta indeksiarvosta.

Yllä olevan indeksijärjestelmän perusteella voidaan löytää myös absoluuttinen tuotantovolyymin kasvu tekijöiden vaikutuksiksi jaettuna.

1. Tuotantovolyymin yleinen kasvu:

∆wr = ∑w 1 r 1 - ∑w 0 r 0.

2. Keskimääräisen tuoton indikaattorin vaikutuksesta johtuva lisäys:

∆wr/w = ∑w 1 r1 - ∑w 0 r1.

3. Lisäys keskimääräisen henkilöstön osoittimen vaikutuksesta:

∆wr/r = ∑w 0 r 1 - ∑w 0 r 0

∆wr = ∆wr/w + ∆wr/r.

Esimerkki. Seuraavat tiedot tunnetaan

Voimme määrittää, kuinka tuotantomäärät ovat muuttuneet suhteellisesti ja absoluuttisesti ja miten yksittäiset tekijät ovat vaikuttaneet tähän muutokseen.

Tuotantomäärä oli:

peruskaudella

w 0 * r 0 = 2000 * 90 = 180 000,

ja raportoinnissa

w 1 * r 1 = 2100 * 100 = 210 000.

Tämän seurauksena tuotannon määrä kasvoi 30 000 eli 1,16 %.

∆wr=∑w 1 r 1 - ∑w 0 r 0= (210000-180000)=30000

tai (210000:180000)*100%=1,16%.

Tämä tuotantomäärän muutos johtui:

1) keskimääräisen henkilöstön kasvu 10 henkilöllä eli 111,1 %

r1/r0 = 100/90 = 1,11 tai 111,1 %.

Absoluuttisesti mitattuna tämän tekijän ansiosta tuotannon määrä kasvoi 20 000:lla:

w 0 r 1 – w 0 r 0 = w 0 (r 1 - r 0) = 2000 (100-90) = 20 000.

2) keskimääräisen tuotannon kasvu 105 % tai 10 000:

w 1 r 1 / w 0 r 1 = 2100*100/2000*100 = 1,05 tai 105 %.

Absoluuttisesti mitattuna kasvu on:

w 1 r 1 – w 0 r 1 = (w 1 - 0) r 1 = (2100-2000)*100 = 10000.

Siksi tekijöiden yhteisvaikutus oli:

1. Absoluuttisesti

10000 + 20000 = 30000

2. Suhteellisesti

1,11 * 1,05 = 1,16 (116%)

Kasvua on siis 1,16 prosenttia. Molemmat tulokset saatiin aiemmin.

Sana "indeksi" tarkoittaa käännöksessä osoitinta, indikaattoria. Tilastoissa indeksi tulkitaan suhteelliseksi indikaattoriksi, joka kuvaa ilmiön muutosta ajassa, tilassa tai verrattuna suunnitelmaan. Koska indeksi on suhteellinen arvo, indeksien nimet ovat sopusoinnussa suhteellisten arvojen nimien kanssa.

Tapauksissa, joissa analysoimme ajan mittaan muutoksia vertailutuotteissa, voimme esittää kysymyksen siitä, kuinka indeksin komponentit (hinta, fyysinen määrä, tuotannon tai myynnin rakenne yksittäisten tuotetyyppien) muuttuvat eri olosuhteissa (eri alueilla) . Tässä suhteessa muodostetaan vakiokoostumuksen, muuttuvan koostumuksen ja rakenteellisten muutosten indeksit.

Pysyvän (kiinteän) koostumuksen indeksi – Tämä on indeksi, joka kuvaa saman kiinteän rakenteen keskiarvon dynamiikkaa.

Vakiokoostumuksen indeksin muodostamisen periaate on eliminoida painojen rakenteen muutosten vaikutus indeksoituun arvoon laskemalla indeksoidun indikaattorin painotettu keskitaso samoilla painoilla.

Vakiokoostumusindeksi on muodoltaan identtinen kokonaisindeksin kanssa. Aggregaattimuoto on yleisin.

Vakion koostumuksen indeksi lasketaan yhden jakson tasolle kiinnitetyillä painoilla ja näyttää muutoksen vain indeksoidussa arvossa. Vakiokoostumuksen indeksi eliminoi painojen rakenteen muutosten vaikutuksen indeksoituun arvoon laskemalla indeksoidun indikaattorin painotetun keskiarvon samoilla painoilla. Vakion koostumuksen indeksit vertaavat muuttumattoman ilmiörakenteen perusteella laskettuja indikaattoreita.

Sosioekonomisten ilmiöiden ja prosessien tutkimuksen tärkein vaihe on perustiedon systematisointi ja sen pohjalta koko objektin ominaispiirteen saaminen yleisindikaattorein, mikä saavutetaan tiivistämällä ja ryhmittelemällä ensisijaista tilastoaineistoa.

Tilastollinen yhteenveto - Tämä on sarja peräkkäisiä operaatioita, joilla yleistetään tiettyjä yksittäisiä tosiasioita, jotka muodostavat joukon, jotta voidaan tunnistaa tyypilliset piirteet ja mallit, jotka ovat luontaisia ​​tutkittavalle ilmiölle kokonaisuutena. Tilastollisen yhteenvedon tekeminen sisältää seuraavat vaiheet :

  • ryhmittelyominaisuuksien valinta;
  • ryhmän muodostusjärjestyksen määrittäminen;
  • tilastollisten indikaattorien järjestelmän kehittäminen ryhmien ja kohteen karakterisoimiseksi kokonaisuutena;
  • tilastotaulukoiden asettelujen kehittäminen yhteenvetotulosten esittämiseksi.

Tilastollinen ryhmittely Sitä kutsutaan tutkittavan populaation yksiköiden jakamiseksi homogeenisiin ryhmiin tiettyjen niille olennaisten ominaisuuksien mukaan. Ryhmittelyt ovat tärkein tilastollinen tilastotietojen yhteenvetomenetelmä, perusta tilastollisten tunnuslukujen oikealle laskennalle.

Seuraavat ryhmittelytyypit erotellaan: typologinen, rakenteellinen, analyyttinen. Kaikkia näitä ryhmittelyjä yhdistää se, että kohteen yksiköt on jaettu ryhmiin jonkin ominaisuuden mukaan.

Ryhmittelyominaisuus on ominaisuus, jolla populaation yksiköt jaetaan erillisiin ryhmiin. Tilastollisen tutkimuksen päätelmät riippuvat ryhmittelyominaisuuden oikeasta valinnasta. Ryhmittelyn perustana on käytettävä merkittäviä, teoreettisesti perustuvia ominaisuuksia (kvantitatiivisia tai laadullisia).

Ryhmittelyn määrälliset ominaisuudet niillä on numeerinen lauseke (kaupankäyntimäärä, henkilön ikä, perheen tulot jne.) ja laadullisia ryhmittymisen merkkejä heijastavat väestöyksikön tilaa (sukupuoli, siviilisääty, yrityksen toimiala, sen omistusmuoto jne.).

Kun ryhmittelyn perusteet on selvitetty, on ratkaistava kysymys ryhmien lukumäärästä, joihin tutkittava populaatio tulisi jakaa. Ryhmien lukumäärä riippuu tutkimuksen tavoitteista ja ryhmittelyn taustalla olevan indikaattorin tyypistä, populaation määrästä ja ominaisuuden vaihteluasteesta.

Esimerkiksi yritysten ryhmittelyssä omistustyypin mukaan otetaan huomioon kuntien, liittovaltion ja liittovaltion subjektiomaisuus. Jos ryhmittely suoritetaan määrällisen kriteerin mukaan, on tarpeen kiinnittää erityistä huomiota tutkittavan kohteen yksikkömäärään ja ryhmittelyominaisuuden vaihteluasteeseen.

Kun ryhmien lukumäärä on määritetty, on määritettävä ryhmittelyvälit. Intervalli - nämä ovat vaihtelevan ominaisuuden arvoja, jotka sijaitsevat tietyissä rajoissa. Jokaisella intervallilla on oma arvonsa, ylä- ja alaraja tai ainakin yksi niistä.

Intervallin alaraja kutsutaan ominaisuuden pienimmäksi arvoksi välissä, ja yläraja - ominaisuuden suurin arvo välissä. Välin arvo on ylä- ja alarajan välinen ero.

Ryhmittelyvälit koostaan ​​riippuen ovat: yhtäläiset ja eriarvoiset. Jos ominaisuuden vaihtelu ilmenee suhteellisen kapeissa rajoissa ja jakauma on tasainen, niin ryhmä rakennetaan tasavälein. Samanvälin arvo määritetään seuraavalla kaavalla :

missä Xmax, Xmin ovat ominaisuuden enimmäis- ja vähimmäisarvot aggregaatissa; n - ryhmien lukumäärä.

Yksinkertaisin ryhmittely, jossa jokaiselle valitulle ryhmälle on tunnusomaista yksi indikaattori, edustaa jakaumasarjaa.

Tilastollinen jakaumasarja - tämä on väestöyksiköiden järjestynyt jakautuminen ryhmiin tietyn ominaisuuden mukaan. Jakaumasarjan muodostumisen taustalla olevasta ominaispiirteestä riippuen erotetaan attribuutio- ja variaatiojakaumasarjat.

Attributiivinen kutsutaan jakautumissarjoiksi, jotka on rakennettu laadullisten ominaisuuksien mukaan, eli ominaisuuksilla, joilla ei ole numeerista ilmaisua (jakauma työn tyypin, sukupuolen, ammatin mukaan jne.). Attribuutiojakaumasarjat kuvaavat väestön koostumusta tiettyjen olennaisten ominaisuuksien mukaan. Useiden ajanjaksojen aikana nämä tiedot mahdollistavat rakenteen muutosten tutkimisen.

Variaatiosarja kutsutaan jakauman sarjoiksi, jotka on konstruoitu kvantitatiivisesti. Mikä tahansa variaatiosarja koostuu kahdesta elementistä: vaihtoehdoista ja taajuuksista. Vaihtoehdot kutsutaan ominaisuuden yksittäisiä arvoja, jotka se ottaa vaihtelusarjassa, eli muuttuvan ominaisuuden ominaisarvoksi.

Taajuudet kutsutaan yksittäisten varianttien tai variaatiosarjan ryhmien numeroita, eli nämä ovat numeroita, jotka osoittavat, kuinka usein tietyt variantit esiintyvät jakautumissarjoissa. Kaikkien taajuuksien summa määrittää koko populaation koon, sen tilavuuden. Taajuudet Niitä kutsutaan taajuuksiksi, jotka ilmaistaan ​​yksikön murto-osina tai prosentteina kokonaismäärästä. Vastaavasti taajuuksien summa on 1 tai 100 %.

Ominaisuuden vaihtelun luonteesta riippuen erotetaan kolme vaihtelusarjan muotoa: rankattu sarja, diskreettisarja ja intervallisarja.

Sijoitettu variaatiosarja - tämä on populaation yksittäisten yksiköiden jakautuminen tutkittavan ominaisuuden nousevassa tai laskevassa järjestyksessä. Järjestyksen avulla voit helposti jakaa kvantitatiiviset tiedot ryhmiin, havaita välittömästi ominaisuuden pienimmät ja suurimmat arvot ja korostaa useimmin toistuvia arvoja.

Diskreetti variaatiosarja luonnehtii populaatioyksiköiden jakautumista diskreetin ominaisuuden mukaan, joka ottaa vain kokonaislukuja. Esimerkiksi tariffiluokka, lasten lukumäärä perheessä, työntekijöiden määrä yrityksessä jne.

Jos ominaisuudella on jatkuva muutos, joka tietyissä rajoissa voi saada mitä tahansa arvoa (" - -"), niin tälle ominaisuudelle on tarpeen rakentaa intervallivaihtelusarja . Esimerkiksi tulojen määrä, palvelusaika, yrityksen käyttöomaisuuden kustannukset jne.

Esimerkkejä ongelmien ratkaisemisesta aiheesta "Tilastollinen yhteenveto ja ryhmittely"

Ongelma 1 . Siellä on tietoa opiskelijoiden tilausten kautta saamien kirjojen määrästä kuluneen lukuvuoden aikana.

Muodosta rankattu ja diskreetti variaatiojakaumasarja, joka määrittelee sarjan elementit.

Ratkaisu

Tämä sarja edustaa monia vaihtoehtoja opiskelijoiden saamien kirjojen määrälle. Lasketaan tällaisten vaihtoehtojen määrä ja järjestellään ne variaatiojärjestetyiksi jaksi.

Ongelma 2 . Tietoja käyttöomaisuuden kustannuksista on 50 yritykseltä, tuhatta ruplaa.

Muodosta jakelusarja, jossa korostetaan 5 yritysryhmää (tasaisin väliajoin).

Ratkaisu

Ratkaisua varten valitsemme yritysten käyttöomaisuuden arvon suurimmat ja pienimmät arvot. Nämä ovat 30,0 ja 10,2 tuhatta ruplaa.

Etsitään välin koko: h = (30,0-10,2):5 = 3,96 tuhatta ruplaa.

Sitten ensimmäiseen ryhmään kuuluvat yritykset, joiden käyttöomaisuus on 10,2 tuhatta ruplaa. jopa 10,2+3,96=14,16 tuhatta ruplaa. Tällaisia ​​yrityksiä tulee olemaan 9. Toiseen ryhmään kuuluvat yritykset, joiden käyttöomaisuus on alkaen 14,16 tuhatta ruplaa. 14,16 + 3,96 = 18,12 tuhatta ruplaa asti. Tällaisia ​​yrityksiä tulee olemaan 16. Vastaavasti löydämme kolmanteen, neljänteen ja viidenteen ryhmään kuuluvien yritysten lukumäärän.

Sijoitamme tuloksena saadut jakaumasarjat taulukkoon.

Ongelma 3 . Seuraavat tiedot saatiin useista kevyen teollisuuden yrityksistä:

Ryhmittele yritykset työntekijöiden lukumäärän mukaan muodostaen 6 ryhmää tasavälein. Laske jokaiselle ryhmälle:

1. yritysten lukumäärä
2. työntekijöiden lukumäärä
3. tuotettujen tuotteiden määrä vuodessa
4. keskimääräinen todellinen tuotanto työntekijää kohti
5. käyttöomaisuuden määrä
6. yhden yrityksen käyttöomaisuuden keskimääräinen koko
7. yhden yrityksen tuottamien tuotteiden keskiarvo

Esitä laskennan tulokset taulukoina. Tehdä johtopäätös.

Ratkaisu

Ratkaisua varten valitsemme suurimmat ja pienimmät arvot yrityksen keskimääräisestä työntekijöiden lukumäärästä. Nämä ovat 43 ja 256.

Selvitetään välin koko: h = (256-43):6 = 35,5

Tällöin ensimmäiseen ryhmään kuuluvat yritykset, joiden keskimääräinen työntekijämäärä on 43-43 + 35,5 = 78,5 henkilöä. Tällaisia ​​yrityksiä tulee olemaan 5. Toiseen ryhmään kuuluvat yritykset, joiden keskimääräinen työntekijämäärä on 78,5-78,5+35,5=114 henkilöä. Tällaisia ​​yrityksiä tulee olemaan 12. Vastaavasti löydämme kolmanteen, neljänteen, viidenteen ja kuudenteen ryhmään kuuluvien yritysten lukumäärän.

Sijoitamme tuloksena saadut jakautumissarjat taulukkoon ja laskemme tarvittavat indikaattorit jokaiselle ryhmälle:

Johtopäätös : Kuten taulukosta voidaan nähdä, toinen ryhmä yrityksiä on lukuisin. Siihen kuuluu 12 yritystä. Pienimmät ryhmät ovat viides ja kuudes ryhmä (kaksi yritystä kummassakin). Nämä ovat suurimmat yritykset (työntekijöiden lukumäärällä mitattuna).

Koska toinen ryhmä on suurin, tämän ryhmän yritysten vuotuiset tuotemäärät ja käyttöomaisuuden volyymit ovat huomattavasti muita suurempia. Samanaikaisesti tämän ryhmän yritysten keskimääräinen todellinen tuotanto työntekijää kohti ei ole suurin. Neljännen ryhmän yritykset johtavat täällä. Tähän ryhmään kuuluu myös melko suuri määrä käyttöomaisuutta.

Yhteenvetona voidaan todeta, että kiinteän omaisuuden keskikoko ja yhden yrityksen tuottaman tuotannon keskimääräinen määrä ovat suoraan verrannollisia yrityksen kokoon (työntekijöiden lukumäärällä mitattuna).

Tilastollinen jakaumasarja– tämä on väestöyksiköiden järjestynyt jakautuminen ryhmiin tietyn vaihtelevan ominaisuuden mukaan.
Jakelusarjan muodostumisen taustalla olevista ominaisuuksista riippuen niitä on attribuutio- ja variaatiojakaumasarjat.

Yhteisen ominaisuuden olemassaolo on perusta tilastollisen populaation muodostamiselle, joka edustaa tutkimuskohteiden yleisten ominaisuuksien kuvauksen tai mittauksen tuloksia.

Tilastojen tutkimuksen aiheena ovat muuttuvat (vaihtelevat) ominaisuudet tai tilastolliset ominaisuudet.

Tilastollisten ominaisuuksien tyypit.

Jakaumasarjoja kutsutaan attribuutioiksi rakennettu laatukriteerien mukaan. Attributiivinen– tämä on kyltti, jolla on nimi (esimerkiksi ammatti: ompelija, opettaja jne.).
Jakelusarjat esitetään yleensä taulukoiden muodossa. Taulukossa 2.8 näyttää attribuuttien jakaumasarjan.
Taulukko 2.8 - Lakimiesten antaman oikeusavun jakautuminen jonkin Venäjän federaation alueen kansalaisille.

Variaatiosarja– nämä ovat ominaisuuden (tai arvovälien) arvoja ja niiden taajuuksia.
Variaatiosarjat ovat jakelusarjoja, rakennettu määrällisesti. Mikä tahansa variaatiosarja koostuu kahdesta elementistä: vaihtoehdoista ja taajuuksista.
Variantteja pidetään ominaisuuden yksittäisinä arvoina, jotka se ottaa vaihtelusarjassa.
Taajuudet ovat yksittäisten varianttien tai variaatiosarjan kunkin ryhmän lukumäärää, ts. Nämä ovat numeroita, jotka osoittavat, kuinka usein tietyt vaihtoehdot esiintyvät jakelusarjassa. Kaikkien taajuuksien summa määrittää koko populaation koon, sen tilavuuden.
Taajuudet ovat taajuuksia, jotka ilmaistaan ​​yksikön murto-osina tai prosentteina kokonaismäärästä. Vastaavasti taajuuksien summa on 1 tai 100 %. Variaatiosarjan avulla voidaan arvioida jakaumalain muotoa todellisten tietojen perusteella.

Ominaisuuden vaihtelun luonteesta riippuen niitä on diskreetit ja intervallivaihtelusarjat.
Esimerkki diskreetistä variaatiosarjasta on taulukossa. 2.9.
Taulukko 2.9 - Perheiden jakautuminen yksittäisten asuntojen asuttujen huoneiden lukumäärän mukaan vuonna 1989 Venäjän federaatiossa.

Taulukon ensimmäisessä sarakkeessa on esitetty diskreetin variaatiosarjan vaihtoehdot, toisessa sarakkeessa variaatiosarjan taajuudet ja kolmannessa taajuusilmaisimet.

Variaatiosarja

Yleisessä populaatiossa tutkitaan tiettyä määrällistä ominaisuutta. Siitä otetaan satunnaisesti tilavuusnäyte n, eli näyteelementtien lukumäärä on yhtä suuri kuin n. Tilastollisen käsittelyn ensimmäisessä vaiheessa vaihtelevat näytteitä, ts. numeroiden tilaaminen x 1 , x 2 , …, x n Nouseva. Jokainen havaittu arvo x i nimeltään vaihtoehto. Taajuus m i on arvon havaintojen lukumäärä x i näytteessä. Suhteellinen esiintymistiheys (taajuus) w i on taajuussuhde m i näytteen kokoon n: .
Variaatiosarjoja tutkittaessa käytetään myös kumuloituneen taajuuden ja kumulatiivisen taajuuden käsitteitä. Antaa x joku numero. Sitten vaihtoehtojen määrä , joiden arvot ovat pienemmät x, kutsutaan kumuloituneeksi taajuudeksi: for x i n kutsutaan kumulatiiviseksi taajuudeksi w i max.
Ominaisuutta kutsutaan diskreetiksi muuttujaksi, jos sen yksittäiset arvot (muunnelmat) eroavat toisistaan ​​tietyn äärellisen arvon (yleensä kokonaisluvun) verran. Tällaisen ominaisuuden variaatiosarjaa kutsutaan diskreetiksi variaatiosarjaksi.

Taulukko 1. Yleisnäkymä diskreetistä vaihtelutaajuussarjasta

Tunnusomaiset arvotx i x 1 x 2 x n
Taajuudetm i m 1 m 2 m n

Ominaisuutta kutsutaan jatkuvasti muuttuvaksi, jos sen arvot eroavat toisistaan ​​mielivaltaisen vähän, ts. merkki voi ottaa minkä tahansa arvon tietyllä aikavälillä. Jatkuvaa vaihtelusarjaa sellaiselle ominaisuudelle kutsutaan intervalliksi.

Taulukko 2. Yleisnäkymä taajuuksien intervallivaihtelusarjasta

Taulukko 3. Variaatiosarjan graafiset kuvat

RiviMonikulmio tai histogrammiEmpiirinen jakaumafunktio
Diskreetti
Intervalli
Tarkastelemalla havaintojen tuloksia selvitetään, kuinka monta varianttiarvoa kuuluu kuhunkin tiettyyn väliin. Oletetaan, että jokainen intervalli kuuluu johonkin päistään: joko kaikissa tapauksissa vasemmalle (useammin) tai kaikissa tapauksissa oikealle, ja taajuudet tai taajuudet osoittavat määritettyjen rajojen sisällä olevien vaihtoehtojen lukumäärän. Erot a i – a i +1 kutsutaan osittaisiksi intervalleiksi. Myöhempien laskelmien yksinkertaistamiseksi intervallivaihtelusarja voidaan korvata ehdollisesti diskreetillä. Tässä tapauksessa keskiarvo i-intervalli otetaan vaihtoehtona x i, ja vastaava intervallitaajuus m i– tämän aikavälin taajuudelle.
Variaatiosarjojen graafisessa esittämisessä yleisimmin käytettyjä ovat polygoni, histogrammi, kumulatiivinen käyrä ja empiirinen jakaumafunktio.

Taulukossa 2.3 (Venäjän väestön ryhmittely asukasta kohti lasketun keskitulon mukaan huhtikuussa 1994) esitetään intervallivaihtelusarja.
Jakelusarjoja on kätevä analysoida graafisen kuvan avulla, jonka avulla voidaan arvioida jakauman muotoa. Visuaalisen esityksen vaihtelusarjan taajuuksien muutosten luonteesta antaa monikulmio ja histogrammi.
Monikulmiota käytetään diskreettien variaatiosarjojen kuvaamiseen.
Kuvataanpa esimerkiksi graafisesti asuntokannan jakautuminen asuntotyypeittäin (taulukko 2.10).
Taulukko 2.10 - Kaupunkialueen asuntokannan jakautuminen asuntotyypeittäin (ehdolliset luvut).


Riisi. Asuntojen jakelualue


Ei vain taajuusarvot, vaan myös variaatiosarjojen taajuudet voidaan piirtää ordinaatakseleille.
Histogrammia käytetään kuvaamaan intervallivaihtelusarjaa. Histogrammia rakennettaessa intervallien arvot piirretään abskissa-akselille ja taajuudet on kuvattu vastaaville intervalleille rakennetuilla suorakulmioilla. Pylväiden korkeuden tulee tasaväleissä olla verrannollinen taajuuksiin. Histogrammi on kaavio, jossa sarja on kuvattu vierekkäisinä pylväinä.
Kuvataan graafisesti taulukossa annettu intervallijakaumasarja. 2.11.
Taulukko 2.11 - Perheiden jakautuminen asuintilan koon mukaan henkilöä kohti (ehdolliset luvut).
N p/p Perheryhmät asuintilan koon mukaan henkilöä kohti Niiden perheiden lukumäärä, joilla on tietyn kokoinen asuintila Perheiden kumulatiivinen lukumäärä
1 3 – 5 10 10
2 5 – 7 20 30
3 7 – 9 40 70
4 9 – 11 30 100
5 11 – 13 15 115
KAIKKI YHTEENSÄ 115 ----


Riisi. 2.2. Histogrammi perheiden jakautumisesta asuintilan koon mukaan henkilöä kohti


Muodostamme akkumuloitujen sarjojen (taulukko 2.11) tietoja käyttäen kumulatiivinen jakautuminen.


Riisi. 2.3. Perheiden kumulatiivinen jakautuminen asuintilan koon mukaan henkilöä kohti


Variaatiosarjan esitys kumulaattina on erityisen tehokas variaatiosarjoille, joiden taajuudet ilmaistaan ​​murto-osina tai prosentteina sarjan taajuuksien summasta.
Jos muutamme akseleita kuvattaessa graafisesti variaatiosarjaa kumulaattien muodossa, saamme ogiva. Kuvassa 2.4 esittää taulukon tietojen perusteella muodostettua ovea. 2.11.
Histogrammi voidaan muuntaa jakautumispolygoniksi etsimällä suorakulmioiden sivujen keskipisteet ja yhdistämällä nämä pisteet suorilla viivoilla. Tuloksena oleva jakautumispolygoni on esitetty kuvassa. 2.2 katkoviivalla.
Kun rakennetaan histogrammi vaihtelusarjan jakaumasta, jossa on epätasainen väli, ordinaatta-akselille ei piirretä taajuuksia, vaan ominaisuuden jakauman tiheys vastaavissa intervalleissa.
Jakaumatiheys on taajuus, joka on laskettu yksikkövälileveydelle, ts. kuinka monta yksikköä kussakin ryhmässä on intervalliarvon yksikköä kohden. Esimerkki jakautumistiheyden laskemisesta on esitetty taulukossa. 2.12.
Taulukko 2.12 - Yritysten jakautuminen työntekijöiden lukumäärän mukaan (ehdolliset luvut)
N p/p Yritysryhmät työntekijöiden lukumäärän, henkilöiden mukaan. Yritysten lukumäärä Intervallikoko, ihmiset. Jakauman tiheys
A 1 2 3=1/2
1 Jopa 20 15 20 0,75
2 20 – 80 27 60 0,25
3 80 – 150 35 70 0,5
4 150 – 300 60 150 0,4
5 300 – 500 10 200 0,05
KAIKKI YHTEENSÄ 147 ---- ----

Voidaan käyttää myös variaatiosarjojen graafiseen esittämiseen kumulatiivinen käyrä. Kumulaatin (summakäyrän) avulla kuvataan sarja kumuloituneita taajuuksia. Kumulatiiviset taajuudet määritetään laskemalla peräkkäin yhteen ryhmien väliset taajuudet ja osoittavat, kuinka monella populaation yksiköllä on attribuuttiarvot, jotka eivät ole suurempia kuin tarkasteltavana oleva arvo.


Riisi. 2.4. Perheiden jakautuminen asuintilan koon mukaan henkilöä kohti

Kun muodostetaan intervallivaihtelusarjan kumulaatteja, sarjan variantit piirretään pitkin abskissa-akselia ja kumuloituneet taajuudet piirretään ordinaattiselle akselille.