Príklad odchýlky. Matematické očakávanie diskrétnej náhodnej premennej

Matematické očakávanie (priemerná hodnota) náhodnej premennej X , dané na diskrétnom pravdepodobnostnom priestore, je číslo m =M[X]=∑x i p i , ak rad absolútne konverguje.

Pridelenie služby. S online službou vypočítajú sa matematické očakávania, rozptyl a smerodajná odchýlka(pozri príklad). Okrem toho sa vykreslí graf distribučnej funkcie F(X).

Vlastnosti matematického očakávania náhodnej premennej

  1. Matematické očakávanie konštantnej hodnoty sa rovná sebe samej: M[C]=C , C je konštanta;
  2. M=C M[X]
  3. Matematické očakávanie súčtu náhodných premenných sa rovná súčtu ich matematických očakávaní: M=M[X]+M[Y]
  4. Matematické očakávanie súčinu nezávislých náhodných premenných sa rovná súčinu ich matematických očakávaní: M=M[X] M[Y], ak sú X a Y nezávislé.

Vlastnosti disperzie

  1. Disperzia konštantnej hodnoty sa rovná nule: D(c)=0.
  2. Konštantný faktor možno vybrať spod znamienka rozptylu jeho umocnením: D(k*X)= k 2 D(X).
  3. Ak sú náhodné premenné X a Y nezávislé, potom sa rozptyl súčtu rovná súčtu rozptylov: D(X+Y)=D(X)+D(Y).
  4. Ak sú náhodné premenné X a Y závislé: D(X+Y)=DX+DY+2(X-M[X])(Y-M[Y])
  5. Pre rozptyl platí výpočtový vzorec:
    D(X)=M(X2)-(M(X)) 2

Príklad. Matematické očakávania a rozptyly dvoch nezávislých náhodných premenných X a Y sú známe: M(x)=8, M(Y)=7, D(X)=9, D(Y)=6. Nájdite matematické očakávanie a rozptyl náhodnej premennej Z=9X-8Y+7 .
Riešenie. Na základe vlastností matematického očakávania: M(Z) = M(9X-8Y+7) = 9*M(X) - 8*M(Y) + M(7) = 9*8 - 8*7 + 7 = 23.
Na základe disperzných vlastností: D(Z) = D(9X-8Y+7) = D(9X) - D(8Y) + D(7) = 9^2D(X) - 8^2D(Y) + 0 = 81*9 - 64*6 = 345

Algoritmus na výpočet matematického očakávania

Vlastnosti diskrétnych náhodných premenných: všetky ich hodnoty možno prečíslovať prirodzenými číslami; Každej hodnote priraďte nenulovú pravdepodobnosť.
  1. Vynásobte dvojice jeden po druhom: x i x p i .
  2. Pripočítame súčin každej dvojice x i p i .
    Napríklad pre n = 4: m = ∑x i p i = x 1 p 1 + x 2 p 2 + x 3 p 3 + x 4 p 4
Distribučná funkcia diskrétnej náhodnej premennej postupne sa prudko zvyšuje v tých bodoch, ktorých pravdepodobnosti sú kladné.

Príklad č. 1.

x i 1 3 4 7 9
pi 0.1 0.2 0.1 0.3 0.3

Matematické očakávanie nájdeme podľa vzorca m = ∑x i p i .
Matematické očakávanie M[X].
M[x] = 1 x 0,1 + 3 x 0,2 + 4 x 0,1 + 7 x 0,3 + 9 x 0,3 = 5,9
Disperzia sa zistí podľa vzorca d = ∑x 2 i p i - M[x] 2 .
Rozptyl D[X].
D[X] = 1 2 * 0,1 + 3 2 * 0,2 + 4 2 * 0,1 + 7 2 * 0,3 + 9 2 * 0,3 - 5,9 2 = 7,69
Smerodajná odchýlka σ(x).
σ = sqrt(D[X]) = sqrt(7,69) = 2,78

Príklad č. 2. Diskrétna náhodná premenná má nasledujúce distribučné rady:

X -10 -5 0 5 10
R a 0,32 2a 0,41 0,03
Nájdite hodnotu a, matematické očakávanie a smerodajnú odchýlku tejto náhodnej premennej.

Riešenie. Hodnota a sa zistí zo vzťahu: Σp i = 1
Σp i = a + 0,32 + 2 a + 0,41 + 0,03 = 0,76 + 3 a = 1
0,76 + 3 a = 1 alebo 0,24 = 3 a , odkiaľ a = 0,08

Príklad č. 3. Určte distribučný zákon diskrétnej náhodnej premennej, ak je známy jej rozptyl a x 1 x 1 = 6; x2=9; x3=x; x4=15
p1 = 0,3; p2 = 0,3; p3 = 0,1; p 4 \u003d 0,3
d(x) = 12,96

Riešenie.
Tu musíte vytvoriť vzorec na nájdenie rozptylu d (x):
d(x) = x 1 2 p 1 +x 2 2 p 2 +x 3 2 p 3 +x 4 2 p 4 -m(x) 2
kde očakávanie m(x)=x 1 p 1 +x 2 p 2 +x 3 p 3 +x 4 p 4
Pre naše údaje
m(x)=6*0,3+9*0,3+x3 *0,1+15*0,3=9+0,1x3
12,96 = 6 2 0,3+9 2 0,3+x 3 2 0,1+15 2 0,3-(9+0,1x 3) 2
alebo -9/100 (x 2 -20x+96)=0
Preto je potrebné nájsť korene rovnice a budú dva.
x 3 \u003d 8, x 3 \u003d 12
Vyberieme ten, ktorý spĺňa podmienku x 1 x3=12

Distribučný zákon diskrétnej náhodnej premennej
x 1 = 6; x2=9; x 3 \u003d 12; x4=15
p1 = 0,3; p2 = 0,3; p3 = 0,1; p 4 \u003d 0,3

Hlavnými zovšeobecňujúcimi ukazovateľmi odchýlky v štatistike sú rozptyl a štandardná odchýlka.

Disperzia to aritmetický priemer štvorcové odchýlky každej hodnoty znaku od celkového priemeru. Rozptyl sa zvyčajne nazýva stredná štvorec odchýlok a označuje sa  2 . V závislosti od počiatočných údajov možno rozptyl vypočítať z aritmetického priemeru, jednoduchého alebo váženého:

 nevážená (jednoduchá) disperzia;

 vážený rozptyl.

Smerodajná odchýlka je zovšeobecňujúca charakteristika absolútnych rozmerov variácie črta v súhrne. Vyjadruje sa v rovnakých jednotkách ako znamienko (v metroch, tonách, percentách, hektároch atď.).

Smerodajná odchýlka je druhá odmocnina rozptylu a označuje sa :

 nevážená štandardná odchýlka;

 vážená štandardná odchýlka.

Smerodajná odchýlka je mierou spoľahlivosti priemeru. Čím menšia je štandardná odchýlka, tým lepšie aritmetický priemer odráža celú reprezentovanú populáciu.

Výpočtu smerodajnej odchýlky predchádza výpočet rozptylu.

Postup výpočtu váženého rozptylu je nasledujúci:

1) určte aritmetický vážený priemer:

2) vypočítajte odchýlky možností od priemeru:

3) druhá mocnina odchýlky každej možnosti od priemeru:

4) vynásobte druhé mocniny odchýlok váhami (frekvenciami):

5) zhrňte prijaté práce:

6) výsledná suma sa vydelí súčtom váh:

Príklad 2.1

Vypočítajte aritmetický vážený priemer:

Hodnoty odchýlok od priemeru a ich štvorcov sú uvedené v tabuľke. Definujme rozptyl:

Štandardná odchýlka sa bude rovnať:

Ak sú zdrojové údaje prezentované ako interval distribučná séria , potom musíte najprv určiť diskrétnu hodnotu prvku a potom použiť opísanú metódu.

Príklad 2.2

Ukážme výpočet rozptylu pre intervalový rad na údajoch o rozdelení osiatej plochy JZD podľa výnosu pšenice.

Aritmetický priemer je:

Vypočítajme rozptyl:

6.3. Výpočet rozptylu podľa vzorca pre jednotlivé údaje

Technika výpočtu disperzia zložité a pre veľké hodnoty možností a frekvencií môžu byť ťažkopádne. Výpočty je možné zjednodušiť pomocou disperzných vlastností.

Disperzia má nasledujúce vlastnosti.

1. Zníženie alebo zvýšenie váh (frekvencií) premenného znaku o určitý počet krát nemení rozptyl.

2. Zníženie alebo zvýšenie hodnoty každej funkcie o rovnakú konštantnú hodnotu ALE rozptyl sa nemení.

3. Zníženie alebo zvýšenie hodnoty každej funkcie o určitý počet krát k respektíve znižuje alebo zvyšuje rozptyl v k 2 krát smerodajná odchýlka  v k raz.

4. Rozptyl znaku vo vzťahu k ľubovoľnej hodnote je vždy väčší ako rozptyl vo vzťahu k aritmetickému priemeru o druhú mocninu rozdielu medzi priemernými a ľubovoľnými hodnotami:

Ak ALE 0, potom dospejeme k nasledujúcej rovnosti:

t.j. rozptyl znaku sa rovná rozdielu medzi strednou druhou mocninou hodnôt funkcie a druhou mocninou priemeru.

Každá vlastnosť môže byť použitá samostatne alebo v kombinácii s inými pri výpočte rozptylu.

Postup výpočtu rozptylu je jednoduchý:

1) určiť aritmetický priemer :

2) odmocnina aritmetického priemeru:

3) druhá mocnina odchýlky každého variantu série:

X i 2 .

4) nájdite súčet štvorcov možností:

5) vydeľte súčet štvorcov možností ich počtom, t. j. určte priemerný štvorec:

6) určte rozdiel medzi strednou druhou mocninou znaku a druhou mocninou priemeru:

Príklad 3.1 Máme nasledujúce údaje o produktivite pracovníkov:

Urobme nasledujúce výpočty:

Poďme počítať vPANIEXCELrozptyl a štandardná odchýlka vzorky. Vypočítame aj rozptyl náhodnej premennej, ak je známe jej rozdelenie.

Najprv zvážte disperzia, potom smerodajná odchýlka.

Ukážkový rozptyl

Ukážkový rozptyl (vzorový rozptyl,vzorkarozptyl) charakterizuje rozšírenie hodnôt v poli vzhľadom na .

Všetky 3 vzorce sú matematicky ekvivalentné.

Z prvého vzorca je vidieť, že rozptyl vzorky je súčet štvorcových odchýlok každej hodnoty v poli od priemeru delené veľkosťou vzorky mínus 1.

disperzia vzorky používa sa funkcia DISP(), inž. názov VAR, t.j. VARIance. Od MS EXCEL 2010 sa odporúča používať jeho analóg DISP.V() , eng. názov VARS, t.j. Vzorový rozptyl. Okrem toho je od verzie MS EXCEL 2010 k dispozícii funkcia DISP.G (), eng. Názov VARP, t.j. VARIANTA populácie, ktorá počíta disperzia pre populácia. Celý rozdiel spočíva v menovateli: namiesto n-1 ako DISP.V() má DISP.G() v menovateli len n. Pred MS EXCEL 2010 sa na výpočet rozptylu populácie používala funkcia VARP().

Ukážkový rozptyl
=SQUARE(Ukážka)/(POČET(Vzorka)-1)
=(SUMSQ(vzorka)-POCET(vzorka)*priemer (vzorka)^2)/ (POCET(vzorka)-1)- obvyklý vzorec
=SUM((Vzorka -PREMERNÝ(Vzorka))^2)/ (POČET(Vzorka)-1) –

Ukážkový rozptyl sa rovná 0 iba vtedy, ak sú všetky hodnoty navzájom rovnaké, a preto sú rovnaké stredná hodnota. Zvyčajne platí, že čím je hodnota väčšia disperzia, tým väčšie je rozšírenie hodnôt v poli.

Ukážkový rozptyl je bodový odhad disperzia rozdelenie náhodnej premennej, z ktorej vzorka. O budovaní intervaly spoľahlivosti pri hodnotení disperzia si môžete prečítať v článku.

Rozptyl náhodnej premennej

Kalkulovať disperzia náhodná premenná, musíte to vedieť.

Pre disperzia náhodná premenná X často používa označenie Var(X). Disperzia sa rovná štvorcu odchýlky od priemeru E(X): Var(X)=E[(X-E(X)) 2 ]

disperzia vypočítané podľa vzorca:

kde x i je hodnota, ktorú môže mať náhodná premenná a μ je priemerná hodnota (), р(x) je pravdepodobnosť, že náhodná premenná nadobudne hodnotu x.

Ak má náhodná premenná , potom disperzia vypočítané podľa vzorca:

Rozmer disperzia zodpovedá druhej mocnine mernej jednotky pôvodných hodnôt. Napríklad, ak sú hodnoty vo vzorke merania hmotnosti dielu (v kg), potom rozmer rozptylu bude kg 2 . To môže byť ťažké interpretovať, a preto charakterizovať šírenie hodnôt, hodnotu rovnajúcu sa druhej odmocnine z disperziasmerodajná odchýlka.

Niektoré vlastnosti disperzia:

Var(X+a)=Var(X), kde X je náhodná premenná a a je konštanta.

Var(aХ)=a 2 Var(X)

Var(X)=E[(X-E(X))2]=E=E(X2)-E(2*X*E(X))+(E(X))2=E(X2)- 2*E(X)*E(X)+(E(X))2 =E(X2)-(E(X))2

Táto disperzná vlastnosť sa využíva v článok o lineárnej regresii.

Var(X+Y)=Var(X) + Var(Y) + 2*Cov(X;Y), kde X a Y sú náhodné premenné, Cov(X;Y) je kovariancia týchto náhodných premenných.

Ak sú náhodné premenné nezávislé, potom ich kovariancia je 0, a teda Var(X+Y)=Var(X)+Var(Y). Táto vlastnosť rozptylu sa používa vo výstupe.

Ukážme, že pre nezávislé veličiny Var(X-Y)=Var(X+Y). Skutočne, Var(X-Y)= Var(X-Y)= Var(X+(-Y))= Var(X)+Var(-Y)= Var(X)+Var(-Y)= Var(X)+(- 1) 2 Var(Y)= Var(X)+Var(Y)= Var(X+Y). Táto vlastnosť rozptylu sa používa na vykreslenie .

Štandardná odchýlka vzorky

Štandardná odchýlka vzorky je mierou toho, do akej miery sú hodnoty vo vzorke rozptýlené vzhľadom na ich .

Podľa definície, smerodajná odchýlka sa rovná druhej odmocnine z disperzia:

Smerodajná odchýlka nezohľadňuje veľkosť hodnôt v vzorkovanie, ale iba stupeň rozptylu hodnôt okolo nich stredná. Na ilustráciu si uveďme príklad.

Vypočítajme smerodajnú odchýlku pre 2 vzorky: (1; 5; 9) a (1001; 1005; 1009). V oboch prípadoch s=4. Je zrejmé, že pomer štandardnej odchýlky k hodnotám poľa je pre vzorky výrazne odlišný. Pre takéto prípady použite Variačný koeficient(Variačný koeficient, CV) - pomer smerodajná odchýlka k priemeru aritmetika, vyjadrené v percentách.

V MS EXCEL 2007 a starších verziách na výpočet Štandardná odchýlka vzorky používa sa funkcia =STDEV(), inž. názov STDEV, t.j. smerodajná odchýlka. Od MS EXCEL 2010 sa odporúča používať jeho analóg = STDEV.B () , eng. názov STDEV.S, t.j. Ukážka štandardnej odchýlky.

Okrem toho je od verzie MS EXCEL 2010 k dispozícii funkcia STDEV.G () , eng. názov STDEV.P, t.j. Populácia štandardná odchýlka, ktorá počíta smerodajná odchýlka pre populácia. Celý rozdiel spočíva v menovateli: namiesto n-1 ako STDEV.V() má STDEV.G() v menovateli len n.

Smerodajná odchýlka možno vypočítať aj priamo zo vzorcov nižšie (pozri súbor s príkladom)
=SQRT(SQUADROTIV(Vzorka)/(POČET(Vzorka)-1))
=SQRT((SUMSQ(vzorka)-POČET(vzorka)*PREMERNÝ(vzorka)^2)/(POČET (vzorka)-1))

Iné rozptylové opatrenia

Funkcia SQUADRIVE() počíta s umm štvorcových odchýlok hodnôt od ich hodnôt stredná. Táto funkcia vráti rovnaký výsledok ako vzorec =VAR.G( Ukážka)*SKONTROLOVAŤ( Ukážka) , kde Ukážka- odkaz na rozsah obsahujúci pole vzorových hodnôt (). Výpočty vo funkcii QUADROTIV() sa vykonávajú podľa vzorca:

Funkcia SROOT() je tiež mierou rozptylu množiny údajov. Funkcia SIROTL() vypočítava priemer absolútnych hodnôt odchýlok hodnôt od stredná. Táto funkcia vráti rovnaký výsledok ako vzorec =SÚČETNÝ PRODUKT(ABS(vzorka-priemer (vzorka)))/POČET (vzorka), kde Ukážka- odkaz na rozsah obsahujúci pole vzorových hodnôt.

Výpočty vo funkcii SROOTKL () sa vykonávajú podľa vzorca:

Táto stránka popisuje štandardný príklad hľadania odchýlky, môžete sa pozrieť aj na ďalšie úlohy na jej nájdenie

Príklad 1. Určenie skupiny, priemeru skupiny, medziskupiny a celkového rozptylu

Príklad 2. Nájdenie rozptylu a variačného koeficientu v zoskupovacej tabuľke

Príklad 3. Nájdenie rozptylu v diskrétnom rade

Príklad 4. Máme nasledujúce údaje pre skupinu 20 korešpondenčných študentov. Je potrebné zostaviť intervalový rad distribúcie prvkov, vypočítať strednú hodnotu prvku a študovať jeho rozptyl

Zostavme intervalové zoskupenie. Určme rozsah intervalu podľa vzorca:

kde X max je maximálna hodnota funkcie zoskupenia;
X min je minimálna hodnota funkcie zoskupenia;
n je počet intervalov:

Akceptujeme n=5. Krok je: h \u003d (192 - 159) / 5 \u003d 6,6

Urobme intervalové zoskupenie

Pre ďalšie výpočty vytvoríme pomocnú tabuľku:

X "i - stred intervalu. (napríklad stred intervalu 159 - 165,6 \u003d 162,3)

Priemerný rast študentov je určený vzorcom aritmetického váženého priemeru:

Disperziu určíme podľa vzorca:

Vzorec je možné previesť takto:

Z tohto vzorca to vyplýva rozptyl je rozdiel medzi priemerom druhých mocnín možností a druhou mocninou a priemerom.

Rozptyl vo variačných sériách s rovnakými intervalmi podľa metódy momentov možno vypočítať nasledujúcim spôsobom pomocou druhej vlastnosti disperzie (vydelením všetkých možností hodnotou intervalu). Definícia rozptylu, vypočítaná metódou momentov, podľa nasledujúceho vzorca je časovo menej náročná:

kde i je hodnota intervalu;
A - podmienená nula, pre ktorú je vhodné použiť stred intervalu s najvyššou frekvenciou;
m1 je druhá mocnina okamihu prvého rádu;
m2 - moment druhého rádu

Rozptyl vlastností (ak sa v štatistickej populácii atribút zmení tak, že existujú iba dve vzájomne sa vylučujúce možnosti, potom sa takáto variabilita nazýva alternatívna) možno vypočítať podľa vzorca:

Dosadením do tohto disperzného vzorca q = 1- p dostaneme:

Typy disperzie

Celkový rozptyl meria variáciu vlastnosti v celej populácii ako celku pod vplyvom všetkých faktorov, ktoré túto variáciu spôsobujú. Rovná sa strednej štvorci odchýlok jednotlivých hodnôt atribútu x od celkovej priemernej hodnoty x a možno ju definovať ako jednoduchý rozptyl alebo vážený rozptyl.

Vnútroskupinový rozptyl charakterizuje náhodnú variáciu, t.j. časť variácie, ktorá je spôsobená vplyvom nezohľadnených faktorov a nezávisí od znakového faktora, ktorý je základom zoskupenia. Tento rozptyl sa rovná strednej štvorci odchýlok jednotlivých hodnôt atribútu v rámci skupiny X od aritmetického priemeru skupiny a možno ho vypočítať ako jednoduchý rozptyl alebo ako vážený rozptyl.



Touto cestou, merania rozptylu v rámci skupiny variácia vlastnosti v rámci skupiny a je určená vzorcom:

kde xi - priemer skupiny;
ni je počet jednotiek v skupine.

Napríklad vnútroskupinové odchýlky, ktoré je potrebné určiť pri úlohe študovať vplyv kvalifikácie pracovníkov na úroveň produktivity práce v obchode, vykazujú odchýlky vo výkone v každej skupine spôsobené všetkými možnými faktormi (technický stav zariadení, dostupnosť nástrojov a materiálov, vek pracovníkov, pracovná náročnosť a pod.), okrem rozdielov v kvalifikačnej kategórii (v rámci skupiny majú všetci pracovníci rovnakú kvalifikáciu).

Pre zoskupené údaje zvyšková disperzia- priemer vnútroskupinových disperzií:

Kde σ 2 j je vnútroskupinový rozptyl j -tej skupiny.

Pre nezoskupené údaje zvyšková disperzia je mierou presnosti aproximácie, t.j. aproximácia regresnej priamky k pôvodným údajom:
kde y(t) je predpoveď podľa trendovej rovnice; y t – počiatočný rad dynamiky; n je počet bodov; p je počet koeficientov regresnej rovnice (počet vysvetľujúcich premenných).
V tomto príklade je to tzv nestranný odhad rozptylu.

Príklad č. 1. Rozdelenie pracovníkov troch podnikov jedného združenia podľa tarifných kategórií charakterizujú tieto údaje:

Kategória mzdy pracovníkaPočet pracovníkov v podniku
podnik 1podnik 2podnik 3
1 50 20 40
2 100 80 60
3 150 150 200
4 350 300 400
5 200 150 250
6 150 100 150

Definuj:
1. rozptyl pre každý podnik (vnútroskupinový rozptyl);
2. priemer vnútroskupinových disperzií;
3. medziskupinová disperzia;
4. celkový rozptyl.

Riešenie.
Pred pokračovaním v riešení problému je potrebné zistiť, ktorá funkcia je efektívna a ktorá je faktoriálna. V uvažovanom príklade je efektívnym atribútom „Kategória tarify“ a atribútom faktora je „Číslo (názov) podniku“.
Potom máme tri skupiny (podniky), pre ktoré je potrebné vypočítať skupinový priemer a vnútroskupinové rozptyly:


Spoločnosťpriemer skupiny,rozptyl v rámci skupiny,
1 4 1,8

Priemer vnútroskupinových rozptylov ( zvyšková disperzia) vypočítané podľa vzorca:


kde si môžete vypočítať:
alebo:


potom:
Celková disperzia sa bude rovnať: s 2 \u003d 1,6 + 0 \u003d 1,6.
Celkový rozptyl možno vypočítať aj pomocou jedného z nasledujúcich dvoch vzorcov:

Pri riešení praktických problémov sa človek často musí zaoberať znakom, ktorý má len dve alternatívne hodnoty. V tomto prípade nehovoria o váhe tej či onej hodnoty atribútu, ale o jeho podiele na súhrne. Ak je podiel jednotiek populácie, ktoré majú študovaný znak, označený ako „ R"a nie vlastniť - cez" q“, potom sa disperzia môže vypočítať podľa vzorca:
s2 = p×q

Príklad č. 2. Na základe údajov o výkone šiestich pracovníkov brigády určte medziskupinový rozptyl a zhodnoťte vplyv pracovnej zmeny na ich produktivitu práce, ak je celkový rozptyl 12,2.

č pracovnej brigádyPracovný výkon, ks.
v prvej zmenev 2. zmene
1 18 13
2 19 14
3 22 15
4 20 17
5 24 16
6 23 15

Riešenie. Počiatočné údaje

Xf1f2f 3f4f5f6Celkom
1 18 19 22 20 24 23 126
2 13 14 15 17 16 15 90
Celkom 31 33 37 37 40 38

Potom máme 6 skupín, pre ktoré je potrebné vypočítať skupinový priemer a vnútroskupinové rozptyly.
1. Nájdite priemerné hodnoty každej skupiny.







2. Nájdite stredný štvorec každej skupiny.







Výsledky výpočtu zhrnieme do tabuľky:
Číslo skupinyPriemer skupinyVnútroskupinový rozptyl
1 1.42 0.24
2 1.42 0.24
3 1.41 0.24
4 1.46 0.25
5 1.4 0.24
6 1.39 0.24

3. Vnútroskupinový rozptyl charakterizuje zmenu (variáciu) študovaného (výsledného) znaku v rámci skupiny pod vplyvom všetkých faktorov, okrem faktora, ktorý je základom zoskupenia:
Priemer vnútroskupinových disperzií vypočítame pomocou vzorca:


4. Medziskupinový rozptyl charakterizuje zmenu (variáciu) študovaného (výsledného) znaku pod vplyvom faktora (faktoriálneho znaku), ktorý je základom zoskupenia.
Medziskupinová disperzia je definovaná ako:

kde


Potom

Celkový rozptyl charakterizuje zmenu (variáciu) skúmaného (výsledného) znaku pod vplyvom všetkých faktorov (faktorových znakov) bez výnimky. Podľa stavu problému sa rovná 12,2.
Empirický korelačný vzťah meria, koľko z celkového kolísania výsledného atribútu je spôsobené skúmaným faktorom. Toto je pomer faktoriálneho rozptylu k celkovému rozptylu:

Určíme empirický korelačný vzťah:

Vzťahy medzi vlastnosťami môžu byť slabé alebo silné (úzke). Ich kritériá sa hodnotia na Chaddockovej stupnici:
0,1 0,3 0,5 0,7 0,9 V našom príklade je vzťah medzi prvkom Y faktor X slabý
Koeficient determinácie.

Definujme koeficient determinácie:

Teda 0,67 % variácie je spôsobených rozdielmi medzi vlastnosťami a 99,37 % je spôsobených inými faktormi.
Záver: v tomto prípade výkon pracovníkov nezávisí od práce v konkrétnej zmene, t.j. vplyv pracovnej zmeny na ich produktivitu nie je významný a je spôsobený inými faktormi.

Príklad č. 3. Na základe údajov o priemernej mzde a kvadratických odchýlok od jej hodnoty pre dve skupiny pracovníkov nájdite celkový rozptyl použitím pravidla sčítania rozptylu:

Riešenie:
Priemer odchýlok v rámci skupiny

Medziskupinová disperzia je definovaná ako:


Celkový rozptyl bude: 480 + 13824 = 14304