Painotettu varianssi. Diskreetin satunnaismuuttujan dispersio

DispersioSatunnaismuuttuja- annetun dispersion mitta Satunnaismuuttuja, eli häntä poikkeamat matemaattisista odotuksista. Tilastoissa merkintää (sigma-neliö) käytetään usein merkitsemään varianssia. Varianssin neliöjuurta kutsutaan keskihajonta tai tavallinen levitys. Keskihajonta mitataan samoissa yksiköissä kuin itse satunnaismuuttuja, ja varianssi mitataan tämän yksikön neliöillä.

Vaikka on erittäin kätevää käyttää vain yhtä arvoa (kuten keskiarvoa tai moodia ja mediaania) koko otoksen arvioimiseen, tämä lähestymistapa voi helposti johtaa vääriin johtopäätöksiin. Syy tähän tilanteeseen ei ole itse arvossa, vaan siinä, että yksi arvo ei millään tavalla kuvasta data-arvojen leviämistä.

Esimerkiksi näytteessä:

keskiarvo on 5.

Itse otoksessa ei kuitenkaan ole elementtiä, jonka arvo on 5. Sinun on ehkä tiedettävä, kuinka lähellä otoksen kukin elementti on keskiarvoaan. Tai toisin sanoen sinun on tiedettävä arvojen varianssi. Kun tiedät, missä määrin tiedot ovat muuttuneet, voit tulkita paremmin keskiarvo, mediaani Ja muoti. Näytearvojen muutoksen aste määritetään laskemalla niiden varianssi ja keskihajonta.



Varianssi ja varianssin neliöjuuri, jota kutsutaan standardipoikkeamaksi, kuvaavat keskipoikkeamaa otoskeskiarvosta. Näistä kahdesta määrästä tärkein on keskihajonta. Tämä arvo voidaan esittää keskimääräisenä etäisyydenä, jolla elementit ovat näytteen keskielementistä.

Dispersiota on vaikea tulkita mielekkäästi. Tämän arvon neliöjuuri on kuitenkin keskihajonta ja se soveltuu hyvin tulkintaan.

Keskihajonta lasketaan määrittämällä ensin varianssi ja laskemalla sitten varianssin neliöjuuri.

Esimerkiksi kuvassa esitetylle tietojoukolle saadaan seuraavat arvot:

Kuva 1

Tässä neliöityjen erojen keskiarvo on 717,43. Keskihajonnan saamiseksi on vain otettava tämän luvun neliöjuuri.

Tuloksena on noin 26,78.

On muistettava, että keskihajonna tulkitaan keskimääräiseksi etäisyydeksi, jolla alkiot ovat näytteen keskiarvosta.

Keskihajonta osoittaa, kuinka hyvin keskiarvo kuvaa koko näytettä.

Oletetaan, että olet PC:n kokoamisosaston johtaja. Neljännesvuosittaisen raportin mukaan viimeisen vuosineljänneksen tuotanto oli 2500 PC:tä. Onko se huono vai hyvä? Pyysit (tai tämä sarake on jo raportissa) näyttämään näiden tietojen keskihajonnan raportissa. Keskihajonnan luku on esimerkiksi 2000. Sinulle osaston johtajana käy selväksi, että tuotantolinja tarvitsee parempaa ohjausta (liian suuria poikkeamia koottavien PC:iden määrässä).

Muista, että kun keskihajonta on suuri, data on laajalti hajallaan keskiarvon ympärillä, ja kun keskihajonta on pieni, se klusteroituu lähelle keskiarvoa.

Neljä tilastollista funktiota VARP(), VARP(), STDEV() ja STDEV() on suunniteltu laskemaan lukujen varianssia ja keskihajontaa solualueella. Ennen kuin voit laskea tietojoukon varianssin ja keskihajonnan, sinun on määritettävä, edustavatko tiedot populaatiota vai otosta populaatiosta. Jos kyseessä on otos yleisestä perusjoukosta, tulee käyttää VARP()- ja STDEV()-funktioita, ja yleisjoukon tapauksessa VARP()- ja STDEV()-funktioita:

Väestö Toiminto

VARP()

STDLONG()
Näyte

VARI()

STDEV()

Varianssi (samoin kuin keskihajonta), kuten totesimme, osoittaa, missä määrin tietojoukon sisältämät arvot ovat hajallaan aritmeettisen keskiarvon ympärillä.

Pieni varianssin tai keskihajonnan arvo osoittaa, että kaikki tiedot on keskitetty aritmeettisen keskiarvon ympärille, ja näiden arvojen suuri arvo osoittaa, että data on hajallaan laajalle arvoalueelle.

Varianssia on melko vaikea tulkita mielekkäästi (mitä pieni arvo tarkoittaa, suuri arvo?). Esitys Tehtävät 3 voit näyttää visuaalisesti kaaviossa tietojoukon varianssin merkityksen.

Tehtävät

· Harjoitus 1.

· 2.1. Esitä käsitteet: varianssi ja keskihajonta; niiden symbolinen nimitys tilastotietojen käsittelyssä.

· 2.2. Piirrä laskentataulukko kuvan 1 mukaisesti ja tee tarvittavat laskelmat.

· 2.3. Esitä laskelmissa käytetyt peruskaavat

· 2.4. Selitä kaikki merkinnät ( , , )

· 2.5. Selitä varianssin ja keskihajonnan käsitteiden käytännön merkitys.

Tehtävä 2.

1.1. Esitä käsitteet: yleinen populaatio ja otos; niiden symbolisen merkinnän matemaattinen odotus ja aritmeettinen keskiarvo tilastotietojen käsittelyssä.

1.2. Piirrä laskentataulukko kuvan 2 mukaisesti ja tee laskelmat.

1.3. Esitä laskelmissa käytetyt peruskaavat (yleisjoukolle ja otokselle).

Kuva 2

1.4. Selitä, miksi on mahdollista saada sellaiset aritmeettiset keskiarvot näytteistä kuin 46,43 ja 48,78 (katso liitetiedosto). Tehdä johtopäätös.

Tehtävä 3.

On kaksi näytettä, joilla on eri tietojoukko, mutta niiden keskiarvo on sama:

Kuva 3

3.1. Piirrä laskentataulukko kuvan 3 mukaisesti ja tee tarvittavat laskelmat.

3.2. Anna peruslaskentakaavat.

3.3. Rakenna kaavioita kuvien 4, 5 mukaisesti.

3.4. Selitä tuloksena olevat riippuvuudet.

3.5. Suorita samanlaiset laskelmat näille kahdelle näytteelle.

Ensimmäinen näyte 11119999

Valitse toisen näytteen arvot siten, että toisen näytteen aritmeettinen keskiarvo on sama, esimerkiksi:

Valitse itse arvot toiselle näytteelle. Järjestä laskelmat ja piirrä kuten kuvat 3, 4, 5. Esitä laskelmissa käytetyt pääkaavat.

Tee oikeat johtopäätökset.

Kaikki tehtävät tulee esittää raportin muodossa, jossa on kaikki tarvittavat kuviot, kaaviot, kaavat ja lyhyet selitykset.

Huomaa: kaavioiden rakenne on selitettävä kuvilla ja lyhyillä selityksillä.

Satunnaismuuttujan hajonta on tämän muuttujan arvojen leviämisen mitta. Pieni varianssi tarkoittaa, että arvot on ryhmitelty lähelle toisiaan. Suuri varianssi osoittaa voimakasta arvojen hajontaa. Tilastoissa käytetään käsitettä satunnaismuuttujan hajonta. Esimerkiksi, jos vertaat kahden suuren arvojen varianssia (kuten mies- ja naispotilaiden havaintojen tuloksia), voit testata jonkin muuttujan merkitystä. Varianssia käytetään myös tilastollisten mallien rakentamisessa, koska pieni varianssi voi olla merkki siitä, että arvot sovitetaan liikaa.

Askeleet

Näytevarianssin laskenta

  1. Kirjaa näytearvot muistiin. Useimmissa tapauksissa tilastotieteilijöiden käytettävissä on vain otoksia tietyistä populaatioista. Esimerkiksi tilastotieteilijät eivät yleensä analysoi kaikkien Venäjän autojen väestön ylläpitokustannuksia - he analysoivat useiden tuhansien autojen satunnaisen otoksen. Tällainen näyte auttaa määrittämään keskimääräiset kustannukset autoa kohden, mutta todennäköisimmin tuloksena oleva arvo on kaukana todellisesta.

    • Analysoidaan esimerkiksi kahvilassa myytyjen pullojen määrää satunnaisessa järjestyksessä kuudessa päivässä. Näytteen muoto on seuraava: 17, 15, 23, 7, 9, 13. Tämä on näyte, ei populaatio, koska meillä ei ole tietoa myydyistä pulloista jokaiselta kahvilan aukiolopäivältä.
    • Jos sinulle annetaan populaatio eikä otos arvoista, siirry seuraavaan osaan.
  2. Kirjoita muistiin otosvarianssin laskentakaava. Dispersio on jonkin suuren arvojen leviämisen mitta. Mitä lähempänä dispersion arvo on nollaa, sitä lähempänä arvot ryhmitellään. Kun työskentelet arvonäytteen kanssa, käytä seuraavaa kaavaa varianssin laskemiseen:

    • s 2 (\displaystyle s^(2)) = ∑[(x i (\displaystyle x_(i))-x̅) 2 (\displaystyle ^(2))] / (n - 1)
    • s 2 (\displaystyle s^(2)) on dispersio. Dispersio mitataan neliöyksiköissä.
    • x i (\displaystyle x_(i))- jokainen näytteen arvo.
    • x i (\displaystyle x_(i)) sinun on vähennettävä x̅, neliöitettävä ja sitten lisättävä tulokset.
    • x̅ – näytekeskiarvo (näytteen keskiarvo).
    • n on näytteen arvojen lukumäärä.
  3. Laske näytteen keskiarvo. Sitä merkitään x̅. Otoskeskiarvo lasketaan kuten normaali aritmeettinen keskiarvo: laske yhteen kaikki näytteen arvot ja jaa sitten tulos näytteen arvojen lukumäärällä.

    • Lisää esimerkissämme näytteen arvot: 15 + 17 + 23 + 7 + 9 + 13 = 84
      Jaa tulos nyt näytteen arvojen lukumäärällä (esimerkissämme on 6): 84 ÷ 6 = 14.
      Otoskeskiarvo x̅ = 14.
    • Otoskeskiarvo on keskiarvo, jonka ympärille näytteen arvot jakautuvat. Jos näyteklusterin arvot otoksen ympärillä ovat keskiarvoja, niin varianssi on pieni; muuten hajonta on suuri.
  4. Vähennä näytteen keskiarvo kustakin näytteen arvosta. Laske nyt ero x i (\displaystyle x_(i))- x̅, missä x i (\displaystyle x_(i))- jokainen näytteen arvo. Jokainen saatu tulos osoittaa, missä määrin tietty arvo poikkeaa näytteen keskiarvosta, eli kuinka kaukana tämä arvo on näytteen keskiarvosta.

    • Esimerkissämme:
      x 1 (\displaystyle x_(1))- x̅ = 17 - 14 = 3
      x 2 (\displaystyle x_(2))- x̅ = 15 - 14 = 1
      x 3 (\displaystyle x_(3))- x̅ = 23 - 14 = 9
      x 4 (\displaystyle x_(4))- x̅ = 7 - 14 = -7
      x 5 (\displaystyle x_(5))- x̅ = 9 - 14 = -5
      x 6 (\displaystyle x_(6))- x̅ = 13 - 14 = -1
    • Saatujen tulosten oikeellisuus on helppo tarkistaa, koska niiden summan on oltava nolla. Tämä liittyy keskiarvon määrittämiseen, koska negatiiviset arvot (etäisyydet keskiarvosta pienempiin arvoihin) korvataan täysin positiivisilla arvoilla (etäisyydet keskiarvosta suurempiin arvoihin).
  5. Kuten edellä todettiin, erojen summa x i (\displaystyle x_(i))- x̅ on oltava yhtä suuri kuin nolla. Tämä tarkoittaa, että keskivarianssi on aina nolla, mikä ei anna minkäänlaista käsitystä jonkin suuren arvojen leviämisestä. Ratkaise tämä ongelma neliöimällä jokainen ero x i (\displaystyle x_(i))- x̅. Tämä johtaa siihen, että saat vain positiivisia lukuja, jotka yhteen laskettuina eivät koskaan muodosta nollaa.

    • Esimerkissämme:
      (x 1 (\displaystyle x_(1))-x̅) 2 = 3 2 = 9 (\displaystyle ^(2)=3^(2)=9)
      (x 2 (\displaystyle (x_(2)))-x̅) 2 = 1 2 = 1 (\displaystyle ^(2)=1^(2)=1)
      9 2 = 81
      (-7) 2 = 49
      (-5) 2 = 25
      (-1) 2 = 1
    • Olet löytänyt eron neliön - x̅) 2 (\displaystyle ^(2)) jokaiselle näytteen arvolle.
  6. Laske erojen neliösumma. Eli etsi se osa kaavasta, joka on kirjoitettu näin: ∑[( x i (\displaystyle x_(i))-x̅) 2 (\displaystyle ^(2))]. Tässä merkki Σ tarkoittaa kunkin arvon neliöityjen erojen summaa x i (\displaystyle x_(i)) näytteessä. Olet jo löytänyt neliöerot (x i (\displaystyle (x_(i)))-x̅) 2 (\displaystyle ^(2)) jokaiselle arvolle x i (\displaystyle x_(i)) näytteessä; lisää nyt vain nämä neliöt.

    • Esimerkissämme: 9 + 1 + 81 + 49 + 25 + 1 = 166 .
  7. Jaa tulos n - 1:llä, missä n on näytteen arvojen lukumäärä. Jokin aika sitten tilastotieteilijät yksinkertaisesti jakoivat tuloksen n:llä laskeakseen otosvarianssin; tässä tapauksessa saat neliöidyn varianssin keskiarvon, joka on ihanteellinen tietyn otoksen varianssin kuvaamiseen. Muista kuitenkin, että mikä tahansa otos on vain pieni osa yleisestä arvojoukosta. Jos otat eri näytteen ja teet samat laskelmat, saat erilaisen tuloksen. Kuten käy ilmi, jakaminen luvulla n - 1 (eikä vain n:llä) antaa paremman arvion populaation varianssista, jota haet. Jakamisesta n - 1 on tullut yleistä, joten se sisältyy otosvarianssin laskentakaavaan.

    • Esimerkissämme otos sisältää 6 arvoa, eli n = 6.
      Otosvarianssi = s 2 = 166 6 − 1 = (\displaystyle s^(2)=(\frac (166)(6-1))=) 33,2
  8. Varianssin ja keskihajonnan välinen ero. Huomaa, että kaava sisältää eksponentin, joten varianssi mitataan analysoidun arvon neliöyksiköissä. Joskus tällaista arvoa on melko vaikea käyttää; tällaisissa tapauksissa käytetään keskihajontaa, joka on yhtä suuri kuin varianssin neliöjuuri. Tästä syystä otosvarianssia merkitään nimellä s 2 (\displaystyle s^(2)), ja näytteen keskihajonta as s (\displaystyle s).

    • Esimerkissämme otoksen keskihajonta on: s = √33,2 = 5,76.

    Populaatiovarianssin laskenta

    1. Analysoi joitain arvoja. Sarja sisältää kaikki tarkasteltavan määrän arvot. Jos esimerkiksi tutkit Leningradin alueen asukkaiden ikää, väestö sisältää kaikkien tämän alueen asukkaiden iän. Jos työskentelet aggregaatin kanssa, on suositeltavaa luoda taulukko ja syöttää siihen aggregaatin arvot. Harkitse seuraavaa esimerkkiä:

      • Tietyssä huoneessa on 6 akvaariota. Jokainen akvaario sisältää seuraavan määrän kaloja:
        x 1 = 5 (\displaystyle x_(1)=5)
        x 2 = 5 (\displaystyle x_(2)=5)
        x 3 = 8 (\displaystyle x_(3)=8)
        x 4 = 12 (\displaystyle x_(4)=12)
        x 5 = 15 (\displaystyle x_(5)=15)
        x 6 = 18 (\displaystyle x_(6)=18)
    2. Kirjoita muistiin populaatiovarianssin laskentakaava. Koska populaatio sisältää kaikki tietyn suuren arvot, seuraava kaava antaa sinun saada populaation varianssin tarkan arvon. Erottaakseen populaation varianssin otosvarianssista (joka on vain arvio) tilastotieteilijät käyttävät erilaisia ​​muuttujia:

      • σ 2 (\displaystyle ^(2)) = (∑(x i (\displaystyle x_(i)) - μ) 2 (\displaystyle ^(2))) / n
      • σ 2 (\displaystyle ^(2))- populaatiovarianssi (luetaan "sigman neliönä"). Dispersio mitataan neliöyksiköissä.
      • x i (\displaystyle x_(i))- jokainen arvo aggregaatissa.
      • Σ on summan merkki. Eli jokaiselle arvolle x i (\displaystyle x_(i)) vähennä μ, neliöi se ja lisää sitten tulokset.
      • μ on väestön keskiarvo.
      • n on arvojen lukumäärä yleisessä populaatiossa.
    3. Laske väestön keskiarvo. Yleisen väestön kanssa työskennellessä sen keskiarvo merkitään μ (mu). Perusjoukon keskiarvo lasketaan tavallisena aritmeettisena keskiarvona: laske yhteen kaikki perusjoukon arvot ja jaa sitten tulos perusjoukon arvojen lukumäärällä.

      • Muista, että keskiarvoja ei aina lasketa aritmeettisena keskiarvona.
      • Esimerkissämme populaatio tarkoittaa: μ = 5 + 5 + 8 + 12 + 15 + 18 6 (\displaystyle (\frac (5+5+8+12+15+18)(6))) = 10,5
    4. Vähennä perusjoukon kustakin arvosta perusjoukon keskiarvo. Mitä lähempänä erotusarvo on nollaa, sitä lähempänä tietty arvo on perusjoukon keskiarvoa. Etsi ero perusjoukon kunkin arvon ja sen keskiarvon välillä, niin saat ensimmäisen katsauksen arvojen jakautumiseen.

      • Esimerkissämme:
        x 1 (\displaystyle x_(1))- μ = 5 - 10,5 = -5,5
        x 2 (\displaystyle x_(2))- μ = 5 - 10,5 = -5,5
        x 3 (\displaystyle x_(3))- μ = 8 - 10,5 = -2,5
        x 4 (\displaystyle x_(4))- μ = 12 - 10,5 = 1,5
        x 5 (\displaystyle x_(5))- μ = 15 - 10,5 = 4,5
        x 6 (\displaystyle x_(6))- μ = 18 - 10,5 = 7,5
    5. Neliöi jokainen saamasi tulos. Erotusarvot ovat sekä positiivisia että negatiivisia; jos laitat nämä arvot numeroriville, ne sijaitsevat oikealla ja vasemmalla väestön keskiarvosta. Tämä ei ole hyvä varianssin laskemiseen, koska positiiviset ja negatiiviset luvut kumoavat toisensa. Siksi neliöi jokainen ero saadaksesi yksinomaan positiivisia lukuja.

      • Esimerkissämme:
        (x i (\displaystyle x_(i)) - μ) 2 (\displaystyle ^(2)) kullekin populaatioarvolle (i = 1 - i = 6):
        (-5,5)2 (\displaystyle ^(2)) = 30,25
        (-5,5)2 (\displaystyle ^(2)), Missä x n (\displaystyle x_(n)) on viimeinen arvo väestössä.
      • Saatujen tulosten keskiarvon laskemiseksi sinun on löydettävä niiden summa ja jaettava se n:llä: (( x 1 (\displaystyle x_(1)) - μ) 2 (\displaystyle ^(2)) + (x 2 (\displaystyle x_(2)) - μ) 2 (\displaystyle ^(2)) + ... + (x n (\displaystyle x_(n)) - μ) 2 (\displaystyle ^(2))) / n
      • Nyt kirjoitetaan yllä oleva selitys käyttämällä muuttujia: (∑( x i (\displaystyle x_(i)) - μ) 2 (\displaystyle ^(2))) / n ja hanki kaava populaation varianssin laskemiseksi.

Dispersio on dispersion mitta, joka kuvaa suhteellista poikkeamaa data-arvojen ja keskiarvon välillä. Se on tilastoissa yleisimmin käytetty hajontamitta, joka lasketaan summaamalla, neliöimällä kunkin data-arvon poikkeama keskiarvosta. Varianssin laskentakaava on esitetty alla:

s2 - näytevarianssi;

x cf on näytteen keskiarvo;

n näytekoko (tietoarvojen lukumäärä),

(x i – x cf) on poikkeama tietojoukon kunkin arvon keskiarvosta.

Kaavan ymmärtämiseksi paremmin katsotaanpa esimerkkiä. En pidä ruoanlaitosta, joten teen sitä harvoin. Kuitenkin, jotta en kuolisi nälkään, minun on aika ajoin mennä liesille toteuttamaan suunnitelmaa kyllästää kehoni proteiineilla, rasvoilla ja hiilihydraateilla. Alla oleva tietojoukko näyttää kuinka monta kertaa Renat valmistaa ruokaa kuukaudessa:

Ensimmäinen vaihe varianssin laskennassa on määrittää otoskeskiarvo, joka esimerkissämme on 7,8 kertaa kuukaudessa. Loput laskelmat voidaan helpottaa seuraavan taulukon avulla.

Varianssin laskennan viimeinen vaihe näyttää tältä:

Niille, jotka haluavat tehdä kaikki laskelmat yhdellä kertaa, yhtälö näyttää tältä:

Raakalaskentamenetelmän käyttäminen (esimerkki ruoanlaitosta)

On olemassa tehokkaampi tapa laskea varianssi, joka tunnetaan nimellä "raakalaskenta". Vaikka yhtälö saattaa ensi silmäyksellä tuntua melko hankalalta, se ei itse asiassa ole niin pelottava. Voit tarkistaa tämän ja päättää sitten, mistä menetelmästä pidät eniten.

on kunkin data-arvon summa neliöinnin jälkeen,

on kaikkien data-arvojen summan neliö.

Älä menetä mieltäsi nyt. Laitetaan se kaikki taulukon muotoon, niin näet, että tässä on vähemmän laskelmia kuin edellisessä esimerkissä.

Kuten näet, tulos on sama kuin edellistä menetelmää käytettäessä. Tämän menetelmän edut tulevat ilmeisiksi näytteen koon (n) kasvaessa.

Varianssin laskeminen Excelissä

Kuten luultavasti jo arvasit, Excelissä on kaava, jonka avulla voit laskea varianssin. Lisäksi Excel 2010:stä alkaen voit löytää 4 erilaista dispersiokaavaa:

1) VAR.V - Palauttaa otoksen varianssin. Boolen arvot ja teksti ohitetaan.

2) VAR.G - Palauttaa populaation varianssin. Boolen arvot ja teksti ohitetaan.

3) VASP - Palauttaa otosvarianssin ottaen huomioon loogiset ja tekstiarvot.

4) VARP - Palauttaa perusjoukon varianssin ottaen huomioon loogiset ja tekstiarvot.

Tarkastellaan ensin otoksen ja populaation välistä eroa. Kuvaavien tilastojen tarkoitus on tiivistää tai näyttää tietoja siten, että saadaan nopeasti kokonaiskuva, niin sanotusti yleiskuva. Tilastollisen päättelyn avulla voit tehdä johtopäätöksiä populaatiosta tämän populaation dataotoksen perusteella. Yleisö edustaa kaikkia mahdollisia tuloksia tai mittauksia, jotka kiinnostavat meitä. Otos on populaation osajoukko.

Olemme esimerkiksi kiinnostuneita Venäjän yliopiston opiskelijaryhmän kokonaisuudesta ja meidän on määritettävä ryhmän keskimääräinen pistemäärä. Voimme laskea opiskelijoiden keskimääräisen suorituksen, ja sitten tuloksena oleva luku on parametri, koska koko väestö on mukana laskelmissamme. Jos kuitenkin haluamme laskea kaikkien maamme opiskelijoiden GPA, tämä ryhmä on otoksemme.

Ero otoksen ja perusjoukon välisen varianssin laskentakaavassa on nimittäjässä. Jos otokselle se on yhtä suuri kuin (n-1), ja yleiselle perusjoukolle vain n.

Käsitellään nyt varianssin laskentafunktioita päätteillä A, jonka kuvauksessa sanotaan, että laskennassa otetaan huomioon teksti- ja loogiset arvot. Tässä tapauksessa, kun lasketaan tietyn tietojoukon varianssia, jossa esiintyy ei-numeerisia arvoja, Excel tulkitsee tekstin ja väärät loogiset arvot 0:ksi ja todelliset loogiset arvot 1:ksi.

Joten jos sinulla on joukko tietoja, sen varianssin laskeminen yhdellä yllä luetelluista Excel-toiminnoista ei ole vaikeaa.

Usein tilastoissa ilmiötä tai prosessia analysoitaessa on otettava huomioon paitsi tiedot tutkittujen indikaattoreiden keskimääräisistä tasoista, myös yksittäisten yksiköiden arvojen hajonta tai vaihtelu , joka on tärkeä ominaisuus tutkitussa populaatiossa.

Osakkeiden hinnat, kysynnän ja tarjonnan määrät, korot eri ajanjaksoina ja eri paikoissa vaihtelevat eniten.

Tärkeimmät vaihtelua kuvaavat indikaattorit , ovat vaihteluväli, varianssi, keskihajonta ja variaatiokerroin.

Alueen vaihtelu on attribuutin enimmäis- ja vähimmäisarvojen välinen ero: R = Xmax – Xmin. Tämän indikaattorin haittana on, että se arvioi vain piirteen vaihtelun rajoja eikä heijasta sen vaihtelua näiden rajojen sisällä.

Dispersio vailla tätä puutetta. Se lasketaan attribuuttiarvojen keskiarvosta poikkeamien keskimääräisenä neliönä:

Yksinkertaistettu tapa laskea varianssi suoritetaan seuraavilla kaavoilla (yksinkertainen ja painotettu):

Esimerkkejä näiden kaavojen soveltamisesta on esitetty tehtävissä 1 ja 2.

Käytännössä laajalti käytetty indikaattori on keskihajonta :

Keskihajonta määritellään varianssin neliöjuureksi ja sillä on sama ulottuvuus kuin tutkittavalla ominaisuudella.

Tarkastetuilla indikaattoreilla on mahdollista saada vaihtelun itseisarvo, ts. arvioi sitä tutkittavan ominaisuuden mittayksiköissä. Toisin kuin he, variaatiokerroin mittaa vaihtelua suhteellisesti - suhteessa keskimääräiseen tasoon, mikä monissa tapauksissa on parempi.

Kaava variaatiokertoimen laskemiseksi.

Esimerkkejä ongelmien ratkaisemisesta aiheesta "Tilaston vaihteluindikaattorit"

Tehtävä 1 . Tutkittaessa mainonnan vaikutusta alueen pankkien keskimääräisen kuukausitalletuksen suuruuteen, tutkittiin 2 pankkia. Saadaan seuraavat tulokset:

Määritellä:
1) kunkin pankin osalta: a) keskimääräinen kuukausitalletus; b) osuuden jakautuminen;
2) kahden pankin keskimääräinen kuukausitalletus yhdessä;
3) Talletuksen jakaminen 2 pankille mainonnasta riippuen;
4) Talletuksen jakautuminen 2 pankille, riippuen kaikista tekijöistä paitsi mainonnasta;
5) Kokonaisvarianssi summaussääntöä käyttäen;
6) Determinaatiokerroin;
7) Korrelaatiosuhde.

Ratkaisu

1) Tehdään pankille laskentataulukko mainoksilla . Keskimääräisen kuukausitalletuksen määrittämiseksi löydämme välien keskipisteet. Tässä tapauksessa avoimen intervallin arvo (ensimmäinen) rinnastetaan ehdollisesti sen vieressä olevan välin arvoon (toinen).

Löydämme panoksen keskimääräisen koon painotetun aritmeettisen keskiarvon kaavan avulla:

29 000/50 = 580 ruplaa

Osuuden hajonta saadaan kaavasta:

23 400/50 = 468

Suoritamme samanlaisia ​​toimia pankille ilman mainoksia :

2) Etsi kahden pankin keskimääräinen talletus yhdessä. Xav \u003d (580 × 50 + 542,8 × 50) / 100 \u003d 561,4 ruplaa.

3) Talletuksen varianssi kahdelle pankille, mainonnasta riippuen, selviää kaavasta: σ 2 =pq (vaihtoehtoisen merkin varianssin kaava). Tässä p=0,5 on mainonnasta riippuvien tekijöiden osuus; q = 1 - 0,5, sitten σ 2 = 0,5 * 0,5 = 0,25.

4) Koska muiden tekijöiden osuus on 0,5, niin kahden pankin talletuksen varianssi, joka riippuu kaikista tekijöistä paitsi mainonnasta, on myös 0,25.

5) Määritä kokonaisvarianssi summaussäännön avulla.

= (468*50+636,16*50)/100=552,08

= [(580-561,4)250+(542,8-561,4)250] / 100= 34 596/ 100=345,96

σ 2 \u003d σ 2 tosiasia + σ 2 lepo \u003d 552,08 + 345,96 \u003d 898,04

6) Determinaatiokerroin η 2 = σ 2 tosiasia / σ 2 = 345,96/898,04 = 0,39 = 39 % - panoksen suuruus riippuu mainonnasta 39 %.

7) Empiirinen korrelaatiosuhde η = √η 2 = √0,39 = 0,62 - suhde on melko läheinen.

Tehtävä 2 . Yritykset on ryhmitelty markkinakelpoisten tuotteiden arvon mukaan:

Määritä: 1) markkinoitavien tuotteiden arvon hajonta; 2) keskihajonta; 3) variaatiokerroin.

Ratkaisu

1) Ehdolla esitetään intervallijakaumasarja. Se on ilmaistava diskreetti, eli etsi välin keskikohta (x "). Suljettujen välien ryhmistä löydämme keskikohdan yksinkertaisella aritmeettisella keskiarvolla. Ryhmissä, joissa on yläraja, erotuksena tämän ylärajan välillä ja puolet sitä seuraavan välin koosta (200-(400 -200):2=100).

Ryhmissä, joissa on alaraja - tämän alarajan summa ja puolet edellisen välin koosta (800+(800-600):2=900).

Markkinoitavien tuotteiden keskimääräinen arvo lasketaan kaavan mukaan:

Хср = k×((Σ((x"-a):k)×f):Σf)+a. Tässä a=500 on muunnelman koko korkeimmalla taajuudella, k=600-400=200 on intervallin koko korkeimmalla taajuudella Laitetaan tulos taulukkoon:

Joten markkinakelpoisen tuotannon keskiarvo koko tutkittavalla ajanjaksolla on Xav = (-5:37) × 200 + 500 = 472,97 tuhatta ruplaa.

2) Löydämme dispersion seuraavan kaavan avulla:

σ 2 \u003d (33/37) * 2002-(472,97-500) 2 = 35 675,67-730,62 \u003d 34 945,05

3) keskihajonta: σ = ±√σ 2 = ±√34 945,05 ≈ ±186,94 tuhatta ruplaa.

4) variaatiokerroin: V \u003d (σ / Xav) * 100 \u003d (186,94 / 472,97) * 100 \u003d 39,52 %

Tämä ominaisuus ei kuitenkaan vielä riitä satunnaismuuttujan tutkimiseen. Kuvittele kaksi ampujaa, jotka ampuvat maaliin. Toinen ampuu tarkasti ja osuu lähelle keskustaa ja toinen ... pitää vain hauskaa eikä edes tähtää. Mutta se on hassua keskiverto tulos on täsmälleen sama kuin ensimmäisellä ampujalla! Tätä tilannetta kuvaavat ehdollisesti seuraavat satunnaismuuttujat:

"Sniper" matemaattinen odotus on kuitenkin yhtä suuri kuin "mielenkiintoiselle henkilölle": - se on myös nolla!

Siksi on tarpeen arvioida, kuinka pitkälle hajallaan luodit (satunnaismuuttujan arvot) suhteessa kohteen keskustaan ​​(odotus). hyvin ja hajoaminen käännetty latinasta vain nimellä dispersio .

Katsotaanpa, kuinka tämä numeerinen ominaisuus määritetään yhdessä oppitunnin 1. osan esimerkeistä:

Sieltä löysimme pettymyksen matemaattisen odotuksen tälle pelille, ja nyt meidän on laskettava sen varianssi, mikä merkitty kautta .

Selvitetään kuinka pitkälle voitot/tappiot ovat "hajallaan" suhteessa keskiarvoon. On selvää, että tätä varten meidän on laskettava eroja välillä satunnaismuuttujan arvot ja hän matemaattinen odotus:

–5 – (–0,5) = –4,5
2,5 – (–0,5) = 3
10 – (–0,5) = 10,5

Nyt näyttää siltä, ​​että tulokset on laskettava yhteen, mutta tämä tapa ei ole hyvä - siitä syystä, että värähtelyt vasemmalle kumoavat toisensa oikeanpuoleisilla värähtelyillä. Joten esimerkiksi "amatööri"-ampuja (esimerkki yllä) erot tulevat olemaan , ja kun ne lisätään, ne antavat nollan, joten emme saa arviota hänen ammuskelun hajoamisesta.

Voit kiertää tämän ärsytyksen harkitsemalla moduulit eroja, mutta teknisistä syistä lähestymistapa on juurtunut, kun ne on neliöity. On helpompi järjestää ratkaisu taulukkoon:

Ja tässä alkaa laskea painotettu keskiarvo neliöityjen poikkeamien arvo. Mikä se on? Se on heidän odotettu arvo, joka on sironnan mitta:

määritelmä dispersio. Se käy heti selväksi määritelmästä varianssi ei voi olla negatiivinen- huomioi harjoittelua varten!

Muistetaan kuinka löytää odotus. Kerro neliöerot vastaavilla todennäköisyyksillä (taulukon jatko):
- kuvainnollisesti tämä on "vetovoima",
ja tiivistää tulokset:

Etkö usko, että voittojen taustalla tulos osoittautui liian suureksi? Se on oikein - olimme neliöissä, ja palataksemme pelimme ulottuvuuteen meidän on otettava neliöjuuri. Tätä arvoa kutsutaan keskihajonta ja sitä merkitään kreikkalaisella kirjaimella "sigma":

Joskus tätä merkitystä kutsutaan keskihajonta .

Mikä sen merkitys on? Jos poikkeamme matemaattisesta odotuksesta vasemmalle ja oikealle keskihajonnan verran:

– silloin satunnaismuuttujan todennäköisimmät arvot "keskittyvät" tälle välille. Mitä todella näemme:

Kuitenkin kävi niin, että sironta-analyysissä toimi lähes aina dispersion käsitteen kanssa. Katsotaan mitä se tarkoittaa pelien suhteen. Jos ampujien tapauksessa puhumme osumien "tarkkuudesta" suhteessa kohteen keskustaan, niin tässä hajonta luonnehtii kahta asiaa:

Ensinnäkin on selvää, että kun korot nousevat, myös varianssi kasvaa. Joten jos esimerkiksi kasvatamme 10 kertaa, niin matemaattinen odotus kasvaa 10 kertaa ja varianssi kasvaa 100 kertaa (niin heti kun se on neliöllinen arvo). Mutta huomioi, että pelin säännöt eivät ole muuttuneet! Vain hinnat ovat muuttuneet, karkeasti ottaen panostimme 10 ruplaa, nyt 100.

Toinen, mielenkiintoisempi kohta on, että varianssi luonnehtii pelityyliä. Korjaa pelihinnat henkisesti jollain tietyllä tasolla, ja katso mitä täältä löytyy:

Pienen varianssin peli on varovainen peli. Pelaajalla on taipumus valita luotettavimmat pelit, joissa hän ei häviä/voita liikaa kerralla. Esimerkiksi punainen/musta järjestelmä ruletissa (katso artikkelin esimerkki 4 satunnaismuuttujia) .

Korkean varianssin peli. Häntä kutsutaan usein dispersio peli. Tämä on seikkailunhaluinen tai aggressiivinen pelityyli, jossa pelaaja valitsee "adrenaliinin" suunnitelmat. Muistetaan ainakin "Martingaali", jossa panoksena olevat summat ovat suuruusluokkaa suurempia kuin edellisen kappaleen "hiljainen" peli.

Tilanne pokerissa on suuntaa antava: on ns tiukka pelaajia, jotka ovat yleensä varovaisia ​​ja "ravistelevat" pelivarojaan (bankroll). Ei ole yllättävää, että heidän pelikassansa ei vaihtele paljon (pieni varianssi). Toisaalta, jos pelaajalla on suuri varianssi, hän on hyökkääjä. Hän ottaa usein riskejä, tekee suuria vetoja ja voi sekä rikkoa valtavan pankin että mennä palasiksi.

Sama tapahtuu Forexissä ja niin edelleen - esimerkkejä on paljon.

Lisäksi kaikissa tapauksissa ei ole väliä, onko peli penniäkään vai tuhansia dollareita. Jokaisella tasolla on matalan ja korkean varianssin pelaajat. No, keskimääräisestä voitosta, kuten muistamme, "vastuullinen" odotettu arvo.

Olet todennäköisesti huomannut, että varianssin löytäminen on pitkä ja vaivalloinen prosessi. Mutta matematiikka on antelias:

Kaava varianssin löytämiseksi

Tämä kaava on johdettu suoraan varianssin määritelmästä, ja laitamme sen välittömästi liikkeeseen. Kopion lautasen pelimme kanssa ylhäältä:

ja löydetty odotus.

Laskemme varianssin toisella tavalla. Etsitään ensin matemaattinen odotus - satunnaismuuttujan neliö. Tekijä: matemaattisen odotuksen määritelmä:

Tässä tapauksessa:

Eli kaavan mukaan:

Kuten sanotaan, tunne ero. Ja käytännössä on tietysti parempi soveltaa kaavaa (ellei ehto toisin vaadi).

Hallitsemme ratkaisu- ja suunnittelutekniikan:

Esimerkki 6

Etsi sen matemaattinen odotusarvo, varianssi ja keskihajonta.

Tämä tehtävä löytyy kaikkialta, ja sillä ei yleensä ole mielekästä merkitystä.
Voit kuvitella useita hehkulamppuja numeroilla, jotka syttyvät hullunhuoneessa tietyin todennäköisyksin :)

Ratkaisu: On kätevää tehdä yhteenveto tärkeimmistä laskelmista taulukkoon. Ensin kirjoitamme alkutiedot kahdelle ylimmälle riville. Sitten lasketaan tuotteet, sitten ja lopuksi summat oikeaan sarakkeeseen:

Itse asiassa melkein kaikki on valmista. Kolmannelle riville piirrettiin valmis matemaattinen odotus: .

Dispersio lasketaan kaavalla:

Ja lopuksi keskihajonta:
- henkilökohtaisesti pyöristän yleensä 2 desimaalin tarkkuudella.

Kaikki laskelmat voidaan suorittaa laskimella ja vielä paremmin - Excelissä:

Tässä on vaikea mennä pieleen :)

Vastaus:

Ne, jotka haluavat, voivat yksinkertaistaa elämäänsä entisestään ja hyödyntää minun laskin (demo), joka ei vain ratkaise tätä ongelmaa välittömästi, vaan myös rakentaa temaattinen grafiikka (tulevat pian). Ohjelma voi lataa kirjastosta– jos olet ladannut tai vastaanottanut vähintään yhden oppimateriaalin toinen tapa. Kiitos projektin tukemisesta!

Pari tehtävää itsenäiseen ratkaisuun:

Esimerkki 7

Laske edellisen esimerkin satunnaismuuttujan varianssi määritelmän mukaan.

Ja samanlainen esimerkki:

Esimerkki 8

Diskreetti satunnaismuuttuja annetaan omalla jakautumislakillaan:

Kyllä, satunnaismuuttujan arvot ovat melko suuria (esimerkki oikeasta työstä), ja tässä, jos mahdollista, käytä Exceliä. Kuten muuten esimerkissä 7 - se on nopeampi, luotettavampi ja miellyttävämpi.

Ratkaisut ja vastaukset sivun alalaidassa.

Oppitunnin 2. osan lopuksi analysoimme vielä yhtä tyypillistä tehtävää, voisi jopa sanoa, että pieni rebussi:

Esimerkki 9

Diskreetti satunnaismuuttuja voi ottaa vain kaksi arvoa: ja , ja . Todennäköisyys, matemaattinen odotus ja varianssi tunnetaan.

Ratkaisu: Aloitetaan tuntemattomalla todennäköisyydellä. Koska satunnaismuuttuja voi saada vain kaksi arvoa, niin vastaavien tapahtumien todennäköisyyksien summa:

ja siitä lähtien.

Vielä on löydettävä..., helppo sanoa :) Mutta no, se alkoi. Matemaattisen odotuksen määritelmän mukaan:
- korvaa tunnetut arvot:

- eikä tästä yhtälöstä voi puristaa mitään muuta, paitsi että voit kirjoittaa sen uudelleen tavalliseen suuntaan:

tai:

Uskon, että voit arvata lisätoimista. Luodaan ja ratkaistaan ​​järjestelmä:

Desimaalit ovat tietysti täydellinen häpeä; kerro molemmat yhtälöt 10:llä:

ja jaa kahdella:

Tuo on parempi. Ensimmäisestä yhtälöstä ilmaisemme:
(tämä on helpoin tapa)- korvaa 2. yhtälö:


Rakennamme neliöity ja tehdä yksinkertaistuksia:

Kerromme:

Tuloksena, toisen asteen yhtälö, löydä sen erottaja:
- Loistava!

ja saamme kaksi ratkaisua:

1) jos , Tuo ;

2) jos , Tuo.

Ensimmäinen arvopari täyttää ehdon. Suurella todennäköisyydellä kaikki on oikein, mutta kirjoitamme kuitenkin jakelulain:

ja suorita tarkistus, nimittäin etsi odotus: