Kritické hodnoty korelácie podľa Spearmana. Aplikácia Spearmanovej a Pearsonovej korelácie

37. Spearmanov koeficient poradovej korelácie.

S. 56 (64) 063.JPG

http://psystat.at.ua/publ/1-1-0-33

Spearmanov koeficient poradovej korelácie sa používa v prípadoch, keď:
- premenné majú hodnotiacej stupnici merania;
- distribúcia údajov je príliš odlišná od normálne alebo vôbec neznáme;
- vzorky majú malý objem (N< 30).

Interpretácia Spearmanovho koeficientu poradovej korelácie sa nelíši od Pearsonovho koeficientu, ale jeho význam je trochu odlišný. Aby sme pochopili rozdiel medzi týmito metódami a logicky zdôvodnili ich oblasti použitia, porovnajme ich vzorce.

Pearsonov korelačný koeficient:

Spearmanov korelačný koeficient:

Ako vidíte, vzorce sa výrazne líšia. Porovnajme vzorce

Pearsonov korelačný vzorec používa aritmetický priemer a štandardnú odchýlku korelovaného radu, ale Spearmanov vzorec nie. Na získanie adekvátneho výsledku pomocou Pearsonovho vzorca je teda potrebné, aby korelovaný rad bol blízko normálnemu rozdeleniu (priemer a štandardná odchýlka sú normálne distribučné parametre). Toto nie je relevantné pre Spearmanov vzorec.

Prvkom Pearsonovho vzorca je štandardizácia každej série v z-škála.

Ako vidíte, vo vzorci pre Pearsonov korelačný koeficient je prítomná konverzia premenných na Z-škálu. V súlade s tým pre Pearsonov koeficient vôbec nezáleží na mierke údajov: môžeme napríklad korelovať dve premenné, z ktorých jedna má min. = 0 a max. = 1 a druhá min. = 100 a max. = 1000. Bez ohľadu na to, aký rozdielny je rozsah hodnôt, všetky sa skonvertujú na štandardné hodnoty z, ktoré sú v mierke rovnaké.

Takáto normalizácia sa preto v Spearmanovom koeficiente nevyskytuje

POVINNOU PODMIENKOU POUŽITIA KOEFICIENTU SPEARMAN JE ROVNOSŤ ROZSAHU DVOCH PREMENNÝCH.

Pred použitím Spearmanovho koeficientu pre dátové série s rôznymi rozsahmi je potrebné hodnosť. Výsledkom hodnotenia je, že hodnoty týchto sérií získajú rovnaké minimum = 1 (minimálne poradie) a maximum rovné počtu hodnôt (maximum, posledné poradie = N, t.j. maximálny počet prípadov vo vzorke) .

V akých prípadoch sa zaobídete bez hodnotenia?

Toto sú prípady, keď sú dáta na začiatku hodnotiacej stupnici. Napríklad Rokeachov test hodnotových orientácií.

Tiež ide o prípady, keď je počet možností hodnôt malý a vzorka obsahuje pevne stanovené minimum a maximum. Napríklad v sémantickom diferenciáli je minimum = 1, maximum = 7.

Príklad výpočtu Spearmanovho koeficientu poradovej korelácie

Rokeachov test hodnotových orientácií sa uskutočnil na dvoch vzorkách X a Y. Cieľ: zistiť, ako blízko sú hierarchie hodnôt týchto vzoriek (doslova, nakoľko sú si podobné).

Výsledná hodnota r=0,747 je kontrolovaná pomocou tabuľka kritických hodnôt. Podľa tabuľky pri N=18 je získaná hodnota významná na úrovni p<=0,005

Spearman a Kendal hodnotia korelačné koeficienty

Pre premenné patriace do ordinálnej stupnice alebo pre premenné nepodliehajúce normálnemu rozdeleniu, ako aj pre premenné patriace do intervalovej stupnice sa namiesto Pearsonovho koeficientu vypočíta Spearmanova poradová korelácia. Na tento účel sú jednotlivým hodnotám premenných priradené poradia, ktoré sa následne spracúvajú pomocou vhodných vzorcov. Ak chcete zistiť koreláciu hodnotenia, zrušte začiarknutie políčka predvolená korelácia Pearson v dialógovom okne Bivariačné korelácie.... Namiesto toho aktivujte výpočet Spearmanovej korelácie. Tento výpočet poskytne nasledujúce výsledky. Koeficienty poradovej korelácie sú veľmi blízke zodpovedajúcim hodnotám Pearsonových koeficientov (pôvodné premenné majú normálne rozdelenie).

titkova-matmetody.pdf str. 45

Spearmanova metóda poradovej korelácie umožňuje určiť tesnosť (pevnosť) a smer

korelácia medzi dve znamenia alebo dva profily (hierarchie) znamenia.

Na výpočet poradovej korelácie je potrebné mať dva riadky hodnôt,

ktoré možno zoradiť. Takéto série hodnôt môžu byť:

1) dve znamenia merané v tom istom skupina predmety;

2) dve individuálne hierarchie charakteristík, identifikované v dvoch predmetoch pomocou toho istého

súbor funkcií;

3) dva skupinové hierarchie charakteristík,

4) individuálne a skupinové hierarchia funkcií.

Po prvé, ukazovatele sú zoradené samostatne pre každú z charakteristík.

Spravidla sa nižšej hodnote atribútu priraďuje nižšia hodnosť.

V prvom prípade (dve charakteristiky) sú jednotlivé hodnoty zoradené podľa prvého

charakteristika získaná rôznymi subjektmi a potom individuálne hodnoty pre druhú

znamenie.

Ak sú dve charakteristiky v pozitívnom vzťahu, ide o subjekty s nízkym hodnotením

jeden z nich bude mať nízke hodnosti v druhom a subjekty, ktoré majú vysoké hodnosti v

jedna z charakteristík bude mať vysoké hodnotenie aj pre druhú charakteristiku. Na výpočet rs

rozdiely je potrebné určiť (d) medzi hodnosťami získanými daným subjektom v oboch

znamenia. Potom sa tieto ukazovatele d určitým spôsobom transformujú a odpočítajú od 1. Než

Čím menší je rozdiel medzi hodnotami, tým väčšie bude rs, tým bližšie bude k +1.

Ak neexistuje žiadna korelácia, všetky poradia budú zmiešané a nebude žiadna

žiadna korešpondencia. Vzorec je navrhnutý tak, že v tomto prípade bude rs blízko 0.

V prípade negatívnej korelácie nízky počet subjektov na jednom základe

vysoké hodnosti na inom základe budú zodpovedať a naopak. Čím väčší je rozpor

medzi radmi subjektov na dvoch premenných, čím bližšie je rs k -1.

V druhom prípade (dva individuálne profily), jednotlivé sú zoradené

hodnoty získané každým z 2 subjektov podľa určitého (to istého pre nich

obaja) súbor funkcií. Prvé hodnotenie bude udelené objektu s najnižšou hodnotou; druhé miesto -

znak s vyššou hodnotou a pod. Je zrejmé, že všetky charakteristiky musia byť zmerané

rovnaké jednotky, inak nie je možné klasifikovať. Napríklad je to nemožné

zoraďte ukazovatele na Cattell Personality Inventory (16PF), ak sú vyjadrené v

„surové“ body, pretože rozsahy hodnôt sa líšia pre rôzne faktory: od 0 do 13, od 0 do

20 a od 0 do 26. Nevieme povedať, ktorý faktor bude na prvom mieste

výraz, kým neprivedieme všetky hodnoty do jednej stupnice (najčastejšie je to nástenná stupnica).

Ak spolu jednotlivé hierarchie dvoch subjektov kladne súvisia, potom znamenia

mať nízke hodnosti v jednom z nich bude mať nízke hodnosti v druhom a naopak.

Napríklad, ak faktor E (dominancia) jedného subjektu má najnižšie hodnotenie, potom

iný testovaný subjekt, mal by mať nízke hodnotenie, ak jeden testovaný subjekt má faktor C

(emocionálna stabilita) má najvyššiu hodnosť, potom ju musí mať aj druhý subjekt

tento faktor má vysoké hodnotenie atď.

V treťom prípade (dva skupinové profily) sú zoradené priemerné hodnoty skupiny,

získané v 2 skupinách predmetov podľa konkrétneho súboru, identické pre obe skupiny

znamenia. V nasledujúcom je spôsob uvažovania rovnaký ako v predchádzajúcich dvoch prípadoch.

V prípade 4 (individuálne a skupinové profily) sú zoradené samostatne

individuálne hodnoty subjektu a priemerné hodnoty skupiny pre rovnaký súbor

znaky, ktoré sa získavajú spravidla vylúčením tohto jednotlivého subjektu – on

nezúčastňuje sa na priemernom skupinovom profile, s ktorým sa bude porovnávať jeho individuálny profil

profilu. Ranková korelácia vám umožní skontrolovať, ako konzistentný jednotlivec a

skupinové profily.

Vo všetkých štyroch prípadoch sa zisťuje významnosť výsledného korelačného koeficientu

podľa počtu hodnotených hodnôt N. V prvom prípade sa toto množstvo zhoduje s

veľkosť vzorky n. V druhom prípade bude počet pozorovaní počtom funkcií,

tvoriaci hierarchiu. V treťom a štvrtom prípade je N tiež porovnávaným číslom

charakteristiky, a nie počet predmetov v skupinách. Podrobné vysvetlenia sú uvedené v príkladoch. Ak

absolútna hodnota rs dosahuje alebo prekračuje kritickú hodnotu, koreláciu

spoľahlivý.

Hypotézy.

Existujú dve možné hypotézy. Prvý platí pre prípad 1, druhý pre ďalšie tri

Prvá verzia hypotéz

H0: Korelácia medzi premennými A a B sa nelíši od nuly.

H2: Korelácia medzi premennými A a B je výrazne odlišná od nuly.

Druhá verzia hypotéz

H0: Korelácia medzi hierarchiami A a B sa nelíši od nuly.

H2: Korelácia medzi hierarchiami A a B je výrazne odlišná od nuly.

Obmedzenia koeficientu poradovej korelácie

1. Pre každú premennú sa musí predložiť aspoň 5 pozorovaní. Horná

hranica odberu vzoriek je určená dostupnými tabuľkami kritických hodnôt .

2. Spearmanov koeficient poradovej korelácie rs pre veľký počet identických

poradie pre jednu alebo obe porovnávané premenné dáva hrubé hodnoty. V ideálnom prípade

obe korelované série musia predstavovať dve odlišné sekvencie

hodnoty. Ak táto podmienka nie je splnená, je potrebné vykonať zmenu

rovnaké hodnosti.

Spearmanov koeficient poradovej korelácie sa vypočíta podľa vzorca:

Ak oba porovnávané radové rady obsahujú skupiny rovnakých radov,

pred výpočtom koeficientu poradovej korelácie je potrebné vykonať korekcie

Hodnotenie Ta a TV:

Ta = Σ (a3 – a)/12,

Тв = Σ (в3 – в)/12,

Kde A - objem každej skupiny rovnakých radov v riadku A, v objem každého

skupiny identických hodností v radovej sérii B.

Na výpočet empirickej hodnoty rs použite vzorec:

38. Bodovo-dvojsériový korelačný koeficient.

O korelácii vo všeobecnosti pozri otázku č.36 s. 56 (64) 063.JPG

harchenko-korranaliz.pdf

Nech sa premenná X meria na silnej škále a premenná Y na dichotomickej škále. Bodový biseriálny korelačný koeficient rpb sa vypočíta podľa vzorca:

Tu x 1 je priemerná hodnota za X objektov s hodnotou „jedna“ za Y;

x 0 – priemerná hodnota za X objektov s hodnotou „nula“ za Y;

s x – štandardná odchýlka všetkých hodnôt pozdĺž X;

n 1 – počet objektov „jedna“ v Y, n 0 – počet objektov „nula“ v Y;

n = n 1 + n 0 – veľkosť vzorky.

Bodový biseriálny korelačný koeficient možno vypočítať aj pomocou iných ekvivalentných výrazov:

Tu x– celková priemerná hodnota premennej X.

Bodový biseriálny korelačný koeficient rpb sa pohybuje od –1 do +1. Jeho hodnota je nula, ak sú premenné s jednotkou Y mať priemer Y rovná priemeru premenných s nulou nad Y.

Vyšetrenie hypotézy významnosti bodový biseriálny korelačný koeficient je potrebné skontrolovať nulová hypotézah 0 o rovnosti všeobecného korelačného koeficientu k nule: ρ = 0, ktorý sa vykonáva pomocou Studentovho t-testu. Empirický význam

v porovnaní s kritickými hodnotami t a (df) pre počet stupňov voľnosti df = n– 2

Ak je podmienka | t| ≤ ta(df), nulová hypotéza ρ = 0 nie je zamietnutá. Bodový biseriálny korelačný koeficient sa výrazne líši od nuly, ak je empirická hodnota | t| spadá do kritickej oblasti, to znamená, ak je podmienka | t| > ta(n– 2). Spoľahlivosť vzťahu vypočítaná pomocou bodového biseriálneho korelačného koeficientu rpb, možno určiť aj pomocou kritéria χ 2 pre počet stupňov voľnosti df= 2.

Bodová biseriálna korelácia

Následná úprava korelačného koeficientu súčinu momentov sa premietla do bodového biseriálu r. Táto štatistika. ukazuje vzťah medzi dvoma premennými, z ktorých jedna je údajne spojitá a normálne rozdelená a druhá je diskrétna v užšom zmysle slova. Bodový biseriálny korelačný koeficient označujeme r pbis Keďže v r r pbis dichotómia odráža skutočnú povahu diskrétnej premennej a nie je umelá, ako v tomto prípade r bis, jeho znamienko je určené ľubovoľne. Preto na všetky praktické účely. Ciele r pbis uvažované v rozsahu od 0,00 do +1,00.

Existuje aj prípad, keď sa predpokladá, že dve premenné sú spojité a normálne rozdelené, ale obe sú umelo dichotomizované, ako v prípade biserálnej korelácie. Na posúdenie vzťahu medzi takýmito premennými sa používa tetrachorický korelačný koeficient r tet, ktorú vyšľachtil aj Pearson. Základné (presné) vzorce a postupy výpočtu r tet dosť zložité. Preto s praktickým Táto metóda používa aproximácie r tet,získané na základe skrátených postupov a tabuliek.

/on-line/dictionary/dictionary.php?term=511

BODOVÝ BISERIÁLNY KOEFICIENT je korelačný koeficient medzi dvoma premennými, pričom jedna sa meria na dichotomickej škále a druhá na intervalovej stupnici. Používa sa v klasickom i modernom testovaní ako indikátor kvality testovacej úlohy – spoľahlivosť a súlad s celkovým skóre testu.

Na koreláciu premenných meraných v dichotomická a intervalová stupnica použitie bodovo-dvojsériový korelačný koeficient.
Bod-biseriálny korelačný koeficient je metóda korelačnej analýzy vzťahu premenných, z ktorých jedna sa meria na stupnici mien a má iba 2 hodnoty (napríklad muži/ženy, správna odpoveď/nesprávna odpoveď, vlastnosť prítomný/neprítomný) a druhý na mierkových pomeroch alebo intervalovej stupnici. Vzorec na výpočet bodovo-biserického korelačného koeficientu:

Kde:
m1 a m0 sú priemerné hodnoty X s hodnotou 1 alebo 0 v Y.
σx – štandardná odchýlka všetkých hodnôt o X
n1,n0 – počet hodnôt X od 1 alebo 0 do Y.
n – celkový počet párov hodnôt

Najčastejšie sa tento typ korelačného koeficientu používa na výpočet vzťahu medzi testovanými položkami a celkovou škálou. Toto je jeden typ kontroly platnosti.

39. Hodnotovo-dvojsériový korelačný koeficient.

O korelácii vo všeobecnosti pozri otázku č.36 s. 56 (64) 063.JPG

harchenko-korranaliz.pdf str. 28

Hodnotový biseriálny korelačný koeficient, ktorý sa používa v prípadoch, keď jedna z premenných ( X) sa uvádza v poradovej mierke a druhý ( Y) – dichotomický, vypočítaný podľa vzorca

.

Tu je priemerný počet objektov s jedným in Y; – priemerné poradie objektov od nuly do Y, n- veľkosť vzorky.

Vyšetrenie hypotézy významnosti Koeficient poradovo-dvojsériovej korelácie sa vykonáva podobne ako bodový dvojsériový korelačný koeficient pomocou Studentovho testu s náhradou vo vzorcoch rpb na rrb.

V prípadoch, keď sa jedna premenná meria na dichotomickej škále (premenná X), a druhý na stupnici poradia (premenná Y), použije sa dvojsériový korelačný koeficient poradia. Pamätáme si, že premenná X, meraný na dichotomickej škále, nadobúda iba dve hodnoty (kódy) 0 a 1. Zvlášť zdôrazňujeme: napriek tomu, že tento koeficient sa pohybuje v rozmedzí od –1 do +1, jeho znamienko nezáleží na interpretácii výsledky. Toto je ďalšia výnimka zo všeobecného pravidla.

Tento koeficient sa vypočíta podľa vzorca:

kde ' X 1 priemerné poradie pre tieto prvky premennej Y, čo zodpovedá kódu (znaku) 1 v premennej X;

„X 0 – priemerné poradie pre tie prvky premennej Y,čo zodpovedá kódu (znaku) 0 v premennej X\

N – celkový počet prvkov v premennej X.

Na uplatnenie koeficientu hodnostnej dvojsériovej korelácie musia byť splnené tieto podmienky:

1. Porovnávané premenné sa musia merať na rôznych mierkach: jedna X - v dichotomickom meradle; iné Y– na rebríčku.

2. Počet rôznych charakteristík v porovnávaných premenných X A Y by mala byť rovnaká.

3. Na posúdenie úrovne spoľahlivosti koeficientu hodnostnej dvojsériovej korelácie by ste mali použiť vzorec (11.9) a tabuľku kritických hodnôt pre študentský test k = n – 2.

http://psystat.at.ua/publ/drugie_vidy_koehfficienta_korreljacii/1-1-0-38

Prípady, keď je jedna z premenných zastúpená v dichotomická stupnica, a druhý v hodnosť (ordinálna), vyžadujú aplikáciu poradovo-dvojsériový korelačný koeficient:

rpb=2 / n * (m1 - m0)

Kde:
n – počet meraných objektov
m1 a m0 - priemerné poradie objektov s 1 alebo 0 na druhej premennej.
Tento koeficient sa používa aj pri kontrole platnosti testov.

40. Lineárny korelačný koeficient.

Koreláciu vo všeobecnosti (a lineárnu koreláciu zvlášť) pozri v otázke č.36 s. 56 (64) 063.JPG

KOEFICIENT pána PEARSONA

r-Pearson (Pearson r) sa používa na štúdium vzťahu medzi dvoma metrikamirôznych premenných meraných na tej istej vzorke. Existuje veľa situácií, v ktorých je jeho použitie vhodné. Ovplyvňuje inteligencia akademický výkon vo vyšších ročníkoch univerzity? Súvisí výška platu zamestnanca s jeho ústretovosťou voči kolegom? Ovplyvňuje nálada študenta úspešnosť riešenia zložitého aritmetického problému? Na zodpovedanie takýchto otázok musí výskumník zmerať dva ukazovatele záujmu pre každého člena vzorky. Údaje na štúdium vzťahu sú potom tabuľkové, ako v príklade nižšie.

PRÍKLAD 6.1

V tabuľke je uvedený príklad počiatočných údajov na meranie dvoch ukazovateľov inteligencie (verbálnej a neverbálnej) pre 20 žiakov 8. ročníka.

Vzťah medzi týmito premennými je možné znázorniť pomocou bodového grafu (pozri obrázok 6.3). Diagram ukazuje, že medzi meranými ukazovateľmi existuje určitý vzťah: čím väčšia je hodnota verbálnej inteligencie, tým (väčšinou) je väčšia hodnota neverbálnej inteligencie.

Pred uvedením vzorca pre korelačný koeficient sa pokúsme vysledovať logiku jeho výskytu pomocou údajov z príkladu 6.1. Pozíciu každého /-bodu (predmet s číslom /) na rozptylovom diagrame vzhľadom na ostatné body (obr. 6.3) je možné špecifikovať hodnotami a znakmi odchýlok zodpovedajúcich hodnôt premenných od ich priemerných hodnôt. : (xj - MJ A (myseľ pri ). Ak sa znaky týchto odchýlok zhodujú, znamená to pozitívny vzťah (väčšie hodnoty pre X zodpovedajú veľké hodnoty pri alebo nižšie hodnoty X zodpovedajú menšie hodnoty y).

U predmetu č.1 odchýlka od priemeru X a podľa pri pozitívne a pre subjekt č. 3 sú obe odchýlky negatívne. V dôsledku toho údaje z oboch naznačujú pozitívny vzťah medzi študovanými znakmi. Naopak, ak známky odchýlok od priemeru X a podľa pri sa líšia, bude to indikovať negatívny vzťah medzi charakteristikami. Teda u predmetu č.4 odchýlka od priemeru X je negatívny, tým y - pozitívne a pre predmet č. 9 - naopak.

Ak teda súčin odchýlok (x,- M X ) X (myseľ pri ) pozitívny, potom údaje /-subjektu naznačujú priamy (pozitívny) vzťah a ak negatívny, potom reverzný (negatívny) vzťah. V súlade s tým, ak Xwy y sú vo všeobecnosti spojené priamo úmerne, potom väčšina súčinov odchýlok bude kladná, a ak súvisia inverzným vzťahom, potom väčšina súčinov bude negatívna. Preto všeobecným ukazovateľom sily a smeru vzťahu môže byť súčet všetkých produktov odchýlok pre danú vzorku:

Pri priamo úmernom vzťahu medzi premennými je táto hodnota veľká a pozitívna - pre väčšinu subjektov sa odchýlky zhodujú v znamienkach (veľké hodnoty jednej premennej zodpovedajú veľkým hodnotám inej premennej a naopak). Ak X A pri mať spätnú väzbu, potom pre väčšinu subjektov budú väčšie hodnoty jednej premennej zodpovedať menším hodnotám inej premennej, t.j. znamienka produktov budú záporné a súčet produktov ako celku bude tiež veľký v absolútnej hodnote, ale v zápornom znamienku. Ak medzi premennými neexistuje systematická súvislosť, kladné členy (produkty odchýlok) budú vyvážené zápornými členmi a súčet všetkých produktov odchýlok bude blízky nule.

Aby sa zabezpečilo, že súčet produktov nezávisí od veľkosti vzorky, stačí ju spriemerovať. Nás však nezaujíma miera prepojenia ako všeobecný parameter, ale ako jeho vypočítaný odhad – štatistika. Preto, pokiaľ ide o vzorec rozptylu, v tomto prípade urobíme to isté, vydelíme súčet súčinov odchýlok nie N, a v TV - 1. Výsledkom je miera spojenia, široko používaná vo fyzike a technických vedách, ktorá sa nazýva kovariancia (Covahance):


IN V psychológii, na rozdiel od fyziky, sa väčšina premenných meria na ľubovoľných mierkach, pretože psychológov nezaujíma absolútna hodnota znaku, ale relatívne postavenie subjektov v skupine. Okrem toho je kovariancia veľmi citlivá na škálu škály (variancie), na ktorej sa vlastnosti merajú. Aby bola miera spojenia nezávislá od jednotiek merania oboch charakteristík, stačí rozdeliť kovarianciu na zodpovedajúce štandardné odchýlky. Tak sa to získalo pre-Mule korelačného koeficientu K. Pearsona:

alebo po nahradení výrazov za o x a


Ak boli hodnoty oboch premenných prevedené na r-hodnoty pomocou vzorca


potom vzorec pre r-Pearsonov korelačný koeficient vyzerá jednoduchšie (071.JPG):

/dikt/sociológia/článok/soc/soc-0525.htm

KORELAČNÁ LINEÁRNA- štatistický lineárny vzťah nekauzálnej povahy medzi dvoma kvantitatívnymi premennými X A pri. Merané pomocou "koeficientu K.L." Pearson, ktorý je výsledkom delenia kovariancie štandardnými odchýlkami oboch premenných:

,

Kde s xy- kovariancia medzi premennými X A pri;

s X , s r- štandardné odchýlky pre premenné X A pri;

X i , r i- premenlivé hodnoty X A pri pre objekt s číslom i;

X, r- aritmetické priemery premenných X A pri.

Pearsonov koeficient r môže nadobúdať hodnoty z intervalu [-1; +1]. Význam r = 0 znamená, že medzi premennými neexistuje lineárny vzťah X A pri(ale nevylučuje nelineárny štatistický vzťah). Kladné hodnoty koeficientu ( r> 0) označujú priame lineárne spojenie; čím je jeho hodnota bližšie k +1, tým silnejší je vzťah štatistickej čiary. Záporné hodnoty koeficientu ( r < 0) свидетельствуют об обратной линейной связи; чем ближе его значение к -1, тем сильнее обратная связь. Значения r= ±1 znamená prítomnosť úplného lineárneho spojenia, priameho alebo reverzného. V prípade úplného spojenia, všetky body so súradnicami ( X i , r i) ležať na priamke r = a + bx.

"Koeficient K.L." Pearson sa tiež používa na meranie sily spojenia v lineárnom párovom regresnom modeli.

41. Korelačná matica a korelačný graf.

O korelácii vo všeobecnosti pozri otázku č.36 s. 56 (64) 063.JPG

Korelačná matica. Korelačná analýza často zahŕňa štúdium vzťahov medzi nie dvoma, ale mnohými premennými meranými na kvantitatívnom meradle v jednej vzorke. V tomto prípade sú korelácie vypočítané pre každý pár tohto súboru premenných. Výpočty sa zvyčajne vykonávajú na počítači a výsledkom je korelačná matica.

Korelačná matica(Korelácia Matrix) je výsledkom výpočtu korelácií jedného typu pre každý pár z množiny R premenné merané na kvantitatívnom meradle v jednej vzorke.

PRÍKLAD

Predpokladajme, že študujeme vzťahy medzi 5 premennými (vl, v2,..., v5; P= 5), merané na vzorke N=30Ľudské. Nižšie je uvedená tabuľka zdrojových údajov a korelačná matica.

A
podobné údaje:

Korelačná matica:

Je ľahké si všimnúť, že korelačná matica je štvorcová, symetrická vzhľadom na hlavnú uhlopriečku (takkak,y = /) y), s jednotkami na hlavnej uhlopriečke (od r. G A = Gu = 1).

Korelačná matica je námestie: počet riadkov a stĺpcov sa rovná počtu premenných. Ona symetrické vzhľadom na hlavnú uhlopriečku, keďže korelácia X s pri rovná korelácii pri s X. Jednotky sú umiestnené na jeho hlavnej uhlopriečke, pretože korelácia prvku so sebou samým je rovná jednej. V dôsledku toho nie sú predmetom analýzy všetky prvky korelačnej matice, ale tie, ktoré sa nachádzajú nad alebo pod hlavnou diagonálou.

počet korelačných koeficientov, Vlastnosti, ktoré sa majú analyzovať pri štúdiu vzťahov, sú určené vzorcom: P(P- 1)/2. Vo vyššie uvedenom príklade je počet takýchto korelačných koeficientov 5(5 - 1)/2 = 10.

Hlavnou úlohou analýzy korelačnej matice je identifikácia štruktúry vzťahov medzi mnohými znakmi. V tomto prípade je možná vizuálna analýza korelačné galaxie- grafický obrázok štruktúry štatistickyzmysluplné spojenia, ak takýchto spojení nie je veľmi veľa (do 10-15). Ďalším spôsobom je použitie viacrozmerných metód: viacnásobná regresia, faktorová alebo zhluková analýza (pozri časť „Multivariačné metódy...“). Pomocou faktorovej alebo zhlukovej analýzy je možné identifikovať zoskupenia premenných, ktoré sú navzájom prepojené viac ako s inými premennými. Veľmi účinná je aj kombinácia týchto metód, napríklad ak je znakov veľa a nie sú homogénne.

Porovnanie korelácií - dodatočná úloha analýzy korelačnej matice, ktorá má dve možnosti. Ak je potrebné porovnať korelácie v jednom z riadkov korelačnej matice (pre jednu z premenných), použije sa porovnávacia metóda pre závislé vzorky (s. 148-149). Pri porovnávaní rovnomenných korelácií vypočítaných pre rôzne vzorky sa používa porovnávacia metóda pre nezávislé vzorky (s. 147-148).

Porovnávacie metódy korelácie v uhlopriečkach korelačná matica (na posúdenie stacionárnosti náhodného procesu) a porovnanie niekoľko korelačné matice získané pre rôzne vzorky (pre ich homogenitu) sú náročné na prácu a presahujú rámec tejto knihy. S týmito metódami sa môžete zoznámiť z knihy G.V. Suchodolského 1.

Problém štatistickej významnosti korelácií. Problém je, že postup pri testovaní štatistických hypotéz predpokladá jeden-viacnásobný test vykonaný na jednej vzorke. Ak sa použije rovnaká metóda opakovane, aj keď vo vzťahu k rôznym premenným sa zvyšuje pravdepodobnosť získania výsledku čisto náhodou. Vo všeobecnosti, ak zopakujeme rovnakú metódu testovania hypotéz raz vo vzťahu k rôznym premenným alebo vzorkám, potom so stanovenou hodnotou a zaručene dostaneme potvrdenie hypotézy v ahk počet prípadov.

Predpokladajme, že korelačná matica sa analyzuje pre 15 premenných, to znamená, že sa vypočíta 15(15-1)/2 = 105 korelačných koeficientov. Na testovanie hypotéz je nastavená úroveň a = 0,05 105-krát zaškrtnutím hypotézy dostaneme jej potvrdenie päťkrát (!) bez ohľadu na to, či spojenie skutočne existuje. Keď to vieme a máme povedzme 15 „štatisticky významných“ korelačných koeficientov, vieme povedať, ktoré z nich boli získané náhodou a ktoré odrážajú skutočný vzťah?

Presne povedané, na prijatie štatistického rozhodnutia je potrebné znížiť úroveň a toľkokrát, ako je počet testovaných hypotéz. To sa však sotva odporúča, pretože pravdepodobnosť ignorovania skutočne existujúceho spojenia (vykonanie chyby typu II) sa zvyšuje nepredvídateľným spôsobom.

Samotná korelačná matica nie je dostatočným základompre štatistické závery týkajúce sa jednotlivých koeficientov v ňom zahrnutýchkorelácie!

Existuje len jeden skutočne presvedčivý spôsob, ako vyriešiť tento problém: rozdeliť vzorku náhodne na dve časti a vziať do úvahy len tie korelácie, ktoré sú štatisticky významné v oboch častiach vzorky. Alternatívou môže byť použitie viacrozmerných metód (faktorová, zhluková alebo viacnásobná regresná analýza) na identifikáciu a následnú interpretáciu skupín štatisticky významne súvisiacich premenných.

Problém s chýbajúcimi hodnotami. Ak v údajoch chýbajú hodnoty, potom sú možné dve možnosti na výpočet korelačnej matice: a) odstránenie hodnôt riadok po riadku (Vylúčiťprípadyzoznamovo); b) párové vymazanie hodnôt (Vylúčiťprípadypárovo). O vymazanie riadok po riadku pozorovania s chýbajúcimi hodnotami sa vymaže celý riadok pre objekt (predmet), ktorý má aspoň jednu chýbajúcu hodnotu pre jednu z premenných. Táto metóda vedie k „správnej“ korelačnej matici v tom zmysle, že všetky koeficienty sú vypočítané z rovnakej množiny objektov. Ak sú však chýbajúce hodnoty v premenných distribuované náhodne, potom táto metóda môže viesť k tomu, že v uvažovanom súbore údajov nezostane jediný objekt (v každom riadku bude chýbať aspoň jedna hodnota) . Aby ste sa vyhli tejto situácii, použite inú metódu tzv párové odstránenie. Táto metóda zohľadňuje iba medzery v každom vybranom páre stĺpec-premenná a ignoruje medzery v iných premenných. Korelácia pre pár premenných sa vypočíta pre tie objekty, kde nie sú žiadne medzery. V mnohých situáciách, najmä keď je počet medzier relatívne malý, povedzme 10 %, a medzery sú rozdelené celkom náhodne, táto metóda nevedie k závažným chybám. Niekedy to však tak nie je. Napríklad systematická odchýlka (posun) v hodnotení môže „skryť“ systematické usporiadanie vynechaní, čo je dôvodom rozdielu v korelačných koeficientoch vytvorených pre rôzne podmnožiny (napríklad pre rôzne podskupiny objektov). Ďalší problém spojený s vypočítanou korelačnou maticou párovo k odstráneniu medzier dochádza pri použití tejto matice v iných typoch analýzy (napríklad pri viacnásobnej regresii alebo faktorovej analýze). Predpokladajú, že „správna“ korelačná matica sa používa s určitou úrovňou konzistencie a „súladu“ rôznych koeficientov. Použitie matice so „zlými“ (skreslenými) odhadmi vedie k tomu, že program buď nedokáže takúto maticu analyzovať, alebo výsledky budú chybné. Preto, ak sa použije párová metóda vylúčenia chýbajúcich údajov, je potrebné skontrolovať, či v distribúcii chýbajúcich údajov existujú systematické vzorce.

Ak párové vymazanie chýbajúcich údajov nevedie k žiadnemu systematickému posunu v priemeroch a rozptyloch (štandardné odchýlky), potom budú tieto štatistiky podobné tým, ktoré sa vypočítali pomocou metódy vymazania chýbajúcich údajov riadok po riadku. Ak je pozorovaný významný rozdiel, potom existuje dôvod predpokladať, že došlo k posunu v odhadoch. Napríklad, ak je priemer (alebo štandardná odchýlka) hodnôt premennej A, ktorý sa použil pri výpočte jeho korelácie s premennou IN, oveľa menej ako priemer (alebo štandardná odchýlka) rovnakých hodnôt premennej A, ktoré boli použité pri výpočte jej korelácie s premennou C, potom je dôvod očakávať, že tieto dve korelácie (A-Bnás) na základe rôznych podmnožín údajov. Bude existovať skreslenie v koreláciách spôsobené nenáhodným umiestnením medzier v hodnotách premenných.

Analýza korelačných galaxií. Po vyriešení problému štatistickej významnosti prvkov korelačnej matice možno štatisticky významné korelácie znázorniť graficky vo forme korelačnej galaxie alebo galaxie. Korelačná galaxia - Toto je obrazec pozostávajúci z vrcholov a čiar, ktoré ich spájajú. Vrcholy zodpovedajú charakteristikám a sú zvyčajne označené číslami - premennými číslami. Čiary zodpovedajú štatisticky významným spojeniam a graficky vyjadrujú znamienko a niekedy aj j-úroveň významnosti spojenia.

Korelačná galaxia môže odrážať Všetkyštatisticky významné súvislosti korelačnej matice (niekedy tzv korelačný graf ) alebo len ich zmysluplne vybranú časť (napr. zodpovedajúcu jednému faktoru podľa výsledkov faktorovej analýzy).

PRÍKLAD KONŠTRUKCIE KORELAČNEJ PLEJÁDY


Príprava na štátnu (záverečnú) certifikáciu absolventov: vytvorenie databázy jednotných štátnych skúšok (všeobecný zoznam účastníkov jednotných štátnych skúšok všetkých kategórií s uvedením predmetov) - zohľadnenie rezervných dní v prípade rovnakých predmetov;

  • Pracovný plán (27)

    Riešenie

    2. Činnosť vzdelávacej inštitúcie na zlepšenie obsahu a hodnotenie kvality v predmetoch prírodovedné a matematické vzdelávanie Mestská vzdelávacia inštitúcia stredná škola č. 4, Litvinovská, Čapajevskaja,

  • V prípadoch, keď sa merania študovaných charakteristík uskutočňujú na rádovej škále alebo sa forma vzťahu líši od lineárneho, štúdium vzťahu medzi dvoma náhodnými premennými sa vykonáva pomocou koeficientov poradovej korelácie. Zvážte Spearmanov koeficient poradovej korelácie. Pri jej výpočte je potrebné zoradiť (objednať) vzorové možnosti. Hodnotenie je zoskupenie experimentálnych údajov v určitom poradí, buď vzostupne alebo zostupne.

    Operácia klasifikácie sa vykonáva podľa nasledujúceho algoritmu:

    1. Nižšia hodnota je priradená nižšej hodnosti. Najvyššej hodnote je priradené poradie zodpovedajúce počtu zoradených hodnôt. Najmenšej hodnote je priradené poradie 1. Napríklad, ak n=7, potom najväčšia hodnota dostane poradie 7, s výnimkou prípadov uvedených v druhom pravidle.

    2. Ak je niekoľko hodnôt rovnakých, priradí sa im poradie, ktoré je priemerom hodností, ktoré by dostali, keby si neboli rovnaké. Ako príklad uvažujme vzostupne usporiadanú vzorku pozostávajúcu zo 7 prvkov: 22, 23, 25, 25, 25, 28, 30. Hodnoty 22 a 23 sa objavia raz, takže ich poradie je R22=1 a R23=2. Hodnota 25 sa zobrazí 3-krát. Ak by sa tieto hodnoty neopakovali, ich poradie by bolo 3, 4, 5. Preto sa ich poradie R25 rovná aritmetickému priemeru 3, 4 a 5: . Hodnoty 28 a 30 sa neopakujú, takže ich poradie je R28=6 a R30=7. Nakoniec máme nasledujúcu korešpondenciu:

    3. Celkový súčet poradí sa musí zhodovať s vypočítaným, ktorý je určený vzorcom:

    kde n je celkový počet hodnotených hodnôt.

    Nezrovnalosť medzi skutočným a vypočítaným súčtom poradí bude indikovať chybu pri výpočte poradí alebo ich sčítaní. V tomto prípade musíte nájsť a opraviť chybu.

    Spearmanov koeficient poradovej korelácie je metóda, ktorá umožňuje určiť silu a smer vzťahu medzi dvoma vlastnosťami alebo dvoma hierarchiami vlastností. Použitie koeficientu hodnostnej korelácie má niekoľko obmedzení:

    • a) Predpokladaná korelačná závislosť musí byť monotónna.
    • b) Objem každej vzorky musí byť väčší alebo rovný 5. Na určenie hornej hranice vzorky použite tabuľky kritických hodnôt (tabuľka 3 v prílohe). Maximálna hodnota n v tabuľke je 40.
    • c) Počas analýzy je pravdepodobné, že môže vzniknúť veľký počet identických hodností. V tomto prípade je potrebné vykonať zmenu. Najpriaznivejší prípad je, keď obe skúmané vzorky predstavujú dve sekvencie divergentných hodnôt.

    Na vykonanie korelačnej analýzy musí mať výskumník dve vzorky, ktoré možno zoradiť, napríklad:

    • - dve charakteristiky merané v rovnakej skupine subjektov;
    • - dve individuálne hierarchie vlastností identifikované u dvoch subjektov s použitím rovnakého súboru vlastností;
    • - dve skupinové hierarchie charakteristík;
    • - individuálne a skupinové hierarchie vlastností.

    Výpočet začneme zoradením študovaných ukazovateľov samostatne pre každú z charakteristík.

    Analyzujme prípad s dvoma znakmi nameranými v rovnakej skupine subjektov. Najprv sa jednotlivé hodnoty získané rôznymi subjektmi zoradia podľa prvej charakteristiky a potom sa jednotlivé hodnoty zoradia podľa druhej charakteristiky. Ak nižšie úrovne jedného ukazovateľa zodpovedajú nižším hodnotám iného ukazovateľa a vyššie úrovne jedného ukazovateľa zodpovedajú vyšším hodnotám iného ukazovateľa, potom tieto dve charakteristiky spolu pozitívne súvisia. Ak vyššie úrovne jedného ukazovateľa zodpovedajú nižším hodnotám iného ukazovateľa, potom tieto dve charakteristiky spolu negatívne súvisia. Aby sme našli rs, určíme rozdiely medzi poradím (d) pre každý subjekt. Čím menší je rozdiel medzi hodnoteniami, tým bližšie bude koeficient poradovej korelácie rs k „+1“. Ak neexistuje žiadny vzťah, potom medzi nimi nebude žiadna korešpondencia, takže rs bude blízko nule. Čím väčší je rozdiel medzi hodnoteniami subjektov v dvoch premenných, tým bližšie k „-1“ bude hodnota koeficientu rs. Spearmanov koeficient poradovej korelácie je teda mierou akéhokoľvek monotónneho vzťahu medzi dvoma skúmanými charakteristikami.

    Uvažujme o prípade dvoch individuálnych hierarchií vlastností identifikovaných v dvoch subjektoch pomocou rovnakého súboru vlastností. V tejto situácii sú jednotlivé hodnoty získané každým z dvoch subjektov zoradené podľa určitého súboru charakteristík. Objektu s najnižšou hodnotou musí byť priradené prvé miesto; charakteristika s vyššou hodnotou je druhá pozícia atď. Osobitná pozornosť by sa mala venovať tomu, aby sa všetky atribúty merali v rovnakých jednotkách. Napríklad nie je možné zoradiť ukazovatele, ak sú vyjadrené v rôznych „cenových“ bodoch, pretože nie je možné určiť, ktorý z faktorov bude na prvom mieste, pokiaľ ide o závažnosť, kým sa všetky hodnoty nedostanú do jednej stupnice. Ak vlastnosti, ktoré majú nízke hodnosti v jednom z predmetov, majú nízke hodnosti aj v inom a naopak, tak jednotlivé hierarchie spolu pozitívne súvisia.

    V prípade dvoch skupinových hierarchií charakteristík sú priemerné skupinové hodnoty získané v dvoch skupinách subjektov zoradené podľa rovnakého súboru charakteristík pre študované skupiny. Ďalej postupujeme podľa algoritmu uvedeného v predchádzajúcich prípadoch.

    Analyzujme prípad s individuálnou a skupinovou hierarchiou charakteristík. Začínajú oddeleným zoradením individuálnych hodnôt subjektu a priemerných skupinových hodnôt podľa rovnakého súboru charakteristík, ktoré boli získané, s výnimkou subjektu, ktorý sa nezúčastňuje na priemernej hierarchii skupiny, pretože jeho individuálna hierarchia bude v porovnaní s ním. Ranková korelácia nám umožňuje posúdiť mieru konzistentnosti individuálnej a skupinovej hierarchie vlastností.

    Uvažujme, ako sa určuje významnosť korelačného koeficientu vo vyššie uvedených prípadoch. V prípade dvoch charakteristík to bude určené veľkosťou vzorky. V prípade dvoch individuálnych hierarchií prvkov závisí významnosť od počtu prvkov zahrnutých v hierarchii. V posledných dvoch prípadoch je významnosť určená počtom sledovaných charakteristík a nie počtom skupín. Význam r je teda vo všetkých prípadoch určený počtom hodnotených hodnôt n.

    Pri kontrole štatistickej významnosti rs sa používajú tabuľky kritických hodnôt koeficientu poradovej korelácie zostavené pre rôzne počty hodnotených hodnôt a rôzne úrovne významnosti. Ak absolútna hodnota rs dosiahne alebo prekročí kritickú hodnotu, potom je korelácia spoľahlivá.

    Pri zvažovaní prvej možnosti (prípad s dvoma znakmi nameranými v rovnakej skupine subjektov) sú možné nasledujúce hypotézy.

    H0: Korelácia medzi premennými x a y sa nelíši od nuly.

    H1: Korelácia medzi premennými x a y je výrazne odlišná od nuly.

    Ak pracujeme s ktorýmkoľvek z troch zostávajúcich prípadov, potom je potrebné predložiť ďalšiu dvojicu hypotéz:

    H0: Korelácia medzi hierarchiami x a y sa nelíši od nuly.

    H1: Korelácia medzi hierarchiami x a y je výrazne odlišná od nuly.

    Postupnosť akcií pri výpočte Spearmanovho koeficientu rank korelácie rs je nasledovná.

    • - Určite, ktoré dva znaky alebo dve hierarchie znakov sa zúčastnia porovnávania ako premenné x a y.
    • - Zoraďte hodnoty premennej x, pričom poradie 1 priraďte najmenšej hodnote, v súlade s pravidlami poradia. Umiestnite poradie do prvého stĺpca tabuľky v poradí podľa testovaných subjektov alebo charakteristík.
    • - Zoraďte hodnoty premennej y. Umiestnite poradie do druhého stĺpca tabuľky v poradí podľa testovaných subjektov alebo charakteristík.
    • - Vypočítajte rozdiely d medzi hodnotami x a y pre každý riadok tabuľky. Výsledky umiestnite do ďalšieho stĺpca tabuľky.
    • - Vypočítajte druhú mocninu rozdielov (d2). Výsledné hodnoty umiestnite do štvrtého stĺpca tabuľky.
    • - Vypočítajte súčet druhých mocnín rozdielov? d2.
    • - Ak sa vyskytnú rovnaké poradia, vypočítajte opravy:

    kde tx je objem každej skupiny identických radov vo vzorke x;

    ty je objem každej skupiny rovnakých radov vo vzorke y.

    Vypočítajte koeficient poradovej korelácie v závislosti od prítomnosti alebo neprítomnosti identických hodností. Ak neexistujú žiadne rovnaké poradia, vypočítajte koeficient poradovej korelácie rs pomocou vzorca:

    Ak existujú rovnaké poradia, vypočítajte koeficient poradovej korelácie rs pomocou vzorca:

    kde? d2 je súčet druhých mocnín rozdielov medzi hodnotami;

    Tx a Ty - opravy pre rovnaké hodnosti;

    n je počet predmetov alebo funkcií, ktoré sa zúčastňujú na hodnotení.

    Určte kritické hodnoty rs z prílohy Tabuľka 3 pre daný počet subjektov n. Významný rozdiel od nuly korelačného koeficientu bude pozorovaný za predpokladu, že rs nie je menšie ako kritická hodnota.

    je kvantitatívne hodnotenie štatistického štúdia vzťahu medzi javmi, používané v neparametrických metódach.

    Indikátor ukazuje, ako sa súčet druhých mocnín rozdielov medzi pozíciami získanými počas pozorovania líši od prípadu žiadneho spojenia.

    Účel služby. Pomocou tejto online kalkulačky môžete:

    • výpočet Spearmanovho koeficientu hodnostnej korelácie;
    • výpočet intervalu spoľahlivosti pre koeficient a posúdenie jeho významnosti;

    Spearmanov koeficient poradovej korelácie odkazuje na ukazovatele na hodnotenie blízkosti komunikácie. Kvalitatívnu charakteristiku tesnej súvislosti koeficientu poradovej korelácie, ako aj iných korelačných koeficientov, možno posúdiť pomocou Chaddockovej škály.

    Výpočet koeficientu pozostáva z nasledujúcich krokov:

    Vlastnosti Spearmanovho koeficientu poradovej korelácie

    Oblasť použitia. Koeficient poradovej korelácie používa sa na hodnotenie kvality komunikácie medzi dvoma populáciami. Okrem toho sa jeho štatistická významnosť používa pri analýze údajov na heteroskedasticitu.

    Príklad. Na základe vzorky pozorovaných premenných X a Y:

    1. vytvoriť tabuľku hodnotenia;
    2. nájdite Spearmanov koeficient poradovej korelácie a skontrolujte jeho významnosť na úrovni 2a
    3. posúdiť povahu závislosti
    Riešenie. Priraďme hodnosti k prvku Y a faktoru X.
    XYporadie X, d xporadie Y, d y
    28 21 1 1
    30 25 2 2
    36 29 4 3
    40 31 5 4
    30 32 3 5
    46 34 6 6
    56 35 8 7
    54 38 7 8
    60 39 10 9
    56 41 9 10
    60 42 11 11
    68 44 12 12
    70 46 13 13
    76 50 14 14

    Poradová matica.
    poradie X, d xporadie Y, d y(d x - d y) 2
    1 1 0
    2 2 0
    4 3 1
    5 4 1
    3 5 4
    6 6 0
    8 7 1
    7 8 1
    10 9 1
    9 10 1
    11 11 0
    12 12 0
    13 13 0
    14 14 0
    105 105 10

    Kontrola správnosti matice na základe výpočtu kontrolného súčtu:

    Súčet stĺpcov matice sa rovná navzájom a kontrolnému súčtu, čo znamená, že matica je zložená správne.
    Pomocou vzorca vypočítame Spearmanov koeficient poradovej korelácie.


    Vzťah medzi znakom Y a faktorom X je silný a priamy
    Význam Spearmanovho koeficientu poradovej korelácie
    Aby sme otestovali nulovú hypotézu na hladine významnosti α, že všeobecný Spearmanov koeficient poradovej korelácie je rovný nule pri konkurenčnej hypotéze Hi. p ≠ 0, musíme vypočítať kritický bod:

    kde n je veľkosť vzorky; ρ je vzorový Spearmanov koeficient poradovej korelácie: t(α, k) je kritický bod obojstrannej kritickej oblasti, ktorý sa zistí z tabuľky kritických bodov Studentovho rozdelenia podľa hladiny významnosti α a počtu stupňov voľnosti k = n-2.
    Ak |p|< Т kp - нет оснований отвергнуть нулевую гипотезу. Ранговая корреляционная связь между качественными признаками не значима. Если |p| >T kp - nulová hypotéza sa zamieta. Medzi kvalitatívnymi charakteristikami existuje významná korelácia poradia.
    Pomocou Študentovej tabuľky zistíme t(α/2, k) = (0,1/2;12) = 1,782

    Keďže T kp< ρ , то отклоняем гипотезу о равенстве 0 коэффициента ранговой корреляции Спирмена. Другими словами, коэффициент ранговой корреляции статистически - значим и ранговая корреляционная связь между оценками по двум тестам значимая.

    Táto kalkulačka nižšie počíta Spearmanov koeficient poradovej korelácie medzi dvoma náhodnými premennými.Teoretická časť je tradične pod kalkulačkou.

    pridať import_export mode_edit vymazať

    Zmeny náhodných premenných

    šípka_nahoršípka_nadol šípka_nahoršípka_nadol
    Položiek na stranu: 5 10 20 50 100 chevron_left chevron_right

    Zmeny náhodných premenných

    Import údajov Chyba importu

    "Na oddelenie dátových polí sa používa jeden z nasledujúcich znakov: tabulátor, bodkočiarka (;) alebo čiarka(,)" Vzor: -50,5;-50,5

    Import Späť Zrušiť

    Číslice za desatinnou čiarkou: 4

    Vypočítajte

    Spearmanov korelačný koeficient

    Uložiť zdieľam rozšírenie

    Metóda výpočtu Spearmanovho koeficientu hodnostnej korelácie je v skutočnosti pomerne jednoduchá. Je to ako navrhnutý Pearsonov korelačný koeficient , ale nie len na merania náhodných premenných, ale na ne hodnotiace rebríčky.

    Musíme len pochopiť, čo je hodnota hodnosti a prečo je to všetko potrebné.

    Ak sú prvky variačného radu usporiadané vo vzostupnom alebo zostupnom poradí, to hodnosť prvku bude jeho číslo v usporiadanej sérii.

    Napríklad máme rôzne série (17,26,5,14,21). Zoraďme jej prvky v zostupnom poradí (26,21,17,14,5). 26 má poradie 1, 21 - poradie 2 atď., Variačné série hodnotiacich poradie budú vyzerať takto (3,1,5,4,2).

    T.j. pri výpočte Spearmanovho koeficientu sa počiatočné série variácií prevedú na variačné série hodnotiacich hodnôt a potom sa na ne použije Pearsonov vzorec.
    .
    Existuje jedna jemnosť - poradie opakujúcich sa hodnôt sa berie ako priemer poradí. To znamená, že pre sériu (17, 15, 14, 15) bude poradová séria vyzerať ako (1, 2,5, 4, 2,5), keďže prvý prvok je 15 má poradie 2 a druhý - poradie 3, a.

    Ak nemáte opakujúce sa hodnoty, teda všetky hodnoty hodnotiacich sérií – čísla medzi 1 a n, Pearsonov vzorec možno zjednodušiť na

    Mimochodom, tento vzorec sa často uvádza ako vzorec na výpočet Spearmanovho koeficientu.

    Aká je podstata prechodu od samotných hodnôt k ich hodnotovej hodnote?
    Pri skúmaní korelácie hodnotiacich hodnôt môžete zistiť, ako dobre je závislosť dvoch premenných opísaná monotónnou funkciou.

    Znamienko koeficientu udáva smer vzťahu medzi premennými. Ak je znamienko kladné, hodnoty Y majú tendenciu rásť so zvyšovaním X. Ak je znamienko záporné, hodnoty Y majú tendenciu klesať so zvyšovaním X. Ak je koeficient 0 potom nie je tendencia. Ak sa koeficient rovná 1 alebo -1, vzťah medzi X a Y má vzhľad monotónnej funkcie, t.j. s nárastom X sa zvyšuje aj Y a naopak.

    To znamená, že na rozdiel od Pearsonovho korelačného koeficientu, ktorý dokáže detekovať iba lineárny vzťah jednej premennej od druhej, Spearmanov korelačný koeficient dokáže odhaliť monotónnu závislosť, kde priamy lineárny vzťah nemožno odhaliť.

    Tu je príklad.
    Vysvetlím to na príklade. Predpokladajme, že skúmame funkciu y=10/x.
    Máme nasledujúce merania X a Y
    {{1,10}, {5,2}, {10,1}, {20,0.5}, {100,0.1}}
    Pre tieto údaje je Pearsonov korelačný koeficient rovný -0,4686, t.j. vzťah je slabý alebo chýba. A Spearmanov korelačný koeficient je striktne rovný -1, ako keby to výskumníkovi naznačovalo, že Y má silne negatívnu monotónnu závislosť od X.

    Koeficient poradovej korelácie, navrhnutý K. Spearmanom, sa týka neparametrickej miery vzťahu medzi premennými meranými na stupnici poradia. Pri výpočte tohto koeficientu nie sú potrebné žiadne predpoklady o charaktere rozdelenia charakteristík v populácii. Tento koeficient určuje mieru tesnej súvislosti medzi ordinálnymi charakteristikami, ktoré v tomto prípade predstavujú rady porovnávaných veličín.

    Spearmanov korelačný koeficient tiež leží v rozmedzí +1 a -1. Rovnako ako Pearsonov koeficient môže byť pozitívny a negatívny, charakterizujúci smer vzťahu medzi dvoma charakteristikami meranými na hodnotovej stupnici.

    V zásade môže byť počet hodnotených vlastností (kvality, vlastnosti atď.) ľubovoľný, ale proces hodnotenia viac ako 20 vlastností je náročný. Je možné, že práve preto bola tabuľka kritických hodnôt koeficientu poradovej korelácie vypočítaná len pre štyridsať hodnotených prvkov (n< 40, табл. 20 приложения 6).

    Spearmanov koeficient poradovej korelácie sa vypočíta podľa vzorca:

    kde n je počet hodnotených prvkov (ukazovateľov, predmetov);

    D je rozdiel medzi hodnoteniami dvoch premenných pre každý subjekt;

    Súčet štvorcových rozdielov v poradí.

    Pomocou koeficientu korelácie poradia zvážte nasledujúci príklad.

    Príklad: Psychológ zisťuje, ako súvisia jednotlivé ukazovatele školskej pripravenosti, získané pred nástupom do školy u 11 prvákov, medzi sebou a ich priemerným prospechom na konci školského roka.

    Aby sme tento problém vyriešili, zoradili sme v prvom rade hodnoty ukazovateľov školskej pripravenosti získané pri prijatí do školy a v druhom rade konečné ukazovatele študijného výkonu na konci roka u tých istých študentov v priemere. Výsledky uvádzame v tabuľke. 13.

    Tabuľka 13

    Študent č.

    Rebríček ukazovateľov školskej pripravenosti

    Priemerný ročný výkon

    Získané údaje dosadíme do vzorca a vykonáme výpočet. Dostaneme:

    Ak chcete zistiť úroveň významnosti, pozrite si tabuľku. 20 dodatku 6, kde sú uvedené kritické hodnoty pre koeficienty poradovej korelácie.

    Zdôrazňujeme to v tabuľke. 20 v prílohe 6, rovnako ako v tabuľke pre lineárnu Pearsonovu koreláciu, všetky hodnoty korelačných koeficientov sú uvedené v absolútnej hodnote. Znamienko korelačného koeficientu sa preto berie do úvahy len pri jeho interpretácii.

    Hľadanie hladín významnosti v tejto tabuľke sa vykonáva podľa čísla n, teda podľa počtu subjektov. V našom prípade n = 11. Pre toto číslo nájdeme:

    0,61 pre P 0,05

    0,76 pre P 0,01

    Zostrojíme zodpovedajúcu „os významnosti“:

    Výsledný korelačný koeficient sa zhodoval s kritickou hodnotou pre hladinu významnosti 1 %. Následne možno tvrdiť, že ukazovatele školskej zrelosti a konečných známok prvákov spája pozitívna korelácia – inými slovami, čím vyšší je ukazovateľ školskej pripravenosti, tým lepšie sa prvák študuje. Z hľadiska štatistických hypotéz musí psychológ zamietnuť nulovú hypotézu podobnosti a prijať alternatívnu hypotézu rozdielov, ktorá naznačuje, že vzťah medzi ukazovateľmi školskej pripravenosti a priemerným študijným výkonom je odlišný od nuly.

    Prípad identických (rovnakých) hodností

    Ak existujú rovnaké poradia, vzorec na výpočet Spearmanovho lineárneho korelačného koeficientu sa bude mierne líšiť. V tomto prípade sa do vzorca na výpočet korelačných koeficientov pridajú dva nové výrazy, pričom sa zohľadnia rovnaké poradia. Nazývajú sa korekcie rovnakého poradia a pridávajú sa do čitateľa výpočtového vzorca.

    kde n je počet rovnakých poradí v prvom stĺpci,

    k je počet rovnakých poradí v druhom stĺpci.

    Ak sú v ktoromkoľvek stĺpci dve skupiny rovnakých pozícií, potom sa opravný vzorec trochu skomplikuje:

    kde n je počet rovnakých poradí v prvej skupine zoradeného stĺpca,

    k je počet rovnakých poradí v druhej skupine hodnoteného stĺpca. Úprava vzorca vo všeobecnom prípade je nasledovná:

    Príklad: Psychológ pomocou testu duševného rozvoja (MDT) vykonáva štúdiu inteligencie u 12 žiakov 9. ročníka. Zároveň žiada učiteľov literatúry a matematiky, aby tých istých žiakov zoradili podľa ukazovateľov duševného rozvoja. Úlohou je zistiť, ako spolu súvisia objektívne ukazovatele duševného rozvoja (údaje SHTUR) a odborné hodnotenia učiteľov.

    Experimentálne údaje tohto problému a ďalšie stĺpce potrebné na výpočet Spearmanovho korelačného koeficientu uvádzame vo forme tabuľky. 14.

    Tabuľka 14

    Študent č.

    Hodnoty testovania pomocou SHTURA

    Odborné hodnotenia učiteľov v matematike

    Odborné posudky učiteľov na literatúru

    D (druhý a tretí stĺpec)

    D (druhý a štvrtý stĺpec)

    (druhý a tretí stĺpec)

    (druhý a štvrtý stĺpec)

    Keďže v poradí boli použité rovnaké poradia, je potrebné skontrolovať správnosť poradia v druhom, treťom a štvrtom stĺpci tabuľky. Súčet každého z týchto stĺpcov dáva rovnaký súčet - 78.

    Kontrolujeme pomocou kalkulačného vzorca. Kontrola dáva:

    V piatom a šiestom stĺpci tabuľky sú uvedené hodnoty rozdielu v poradí medzi odbornými hodnoteniami psychológa v teste SHTUR pre každého študenta a hodnotami odborných hodnotení učiteľov v matematike a literatúre. Súčet hodnôt rozdielu v poradí sa musí rovnať nule. Súčet hodnôt D v piatom a šiestom stĺpci poskytol požadovaný výsledok. Preto bolo odčítanie hodností vykonané správne. Podobná kontrola sa musí vykonať vždy pri vykonávaní komplexných typov hodnotenia.

    Pred začatím výpočtu pomocou vzorca je potrebné vypočítať opravy pre rovnaké poradie pre druhý, tretí a štvrtý stĺpec tabuľky.

    V našom prípade sú v druhom stĺpci tabuľky dve rovnaké poradia, preto podľa vzorca bude hodnota korekcie D1:

    Tretí stĺpec obsahuje tri rovnaké poradia, preto podľa vzorca bude hodnota korekcie D2:

    Vo štvrtom stĺpci tabuľky sú dve skupiny po troch rovnakých radoch, preto podľa vzorca bude hodnota korekcie D3:

    Predtým, ako pristúpime k riešeniu problému, pripomeňme, že psychológ objasňuje dve otázky - ako súvisia hodnoty hodnotení v teste SHTUR s odbornými hodnoteniami v matematike a literatúre. Preto sa výpočet vykonáva dvakrát.

    Prvý koeficient poradia vypočítame s prihliadnutím na prísady podľa vzorca. Dostaneme:

    Poďme vypočítať bez zohľadnenia aditíva:

    Ako vidíme, rozdiel v hodnotách korelačných koeficientov sa ukázal ako veľmi nevýznamný.

    Koeficient druhého poradia vypočítame s prihliadnutím na prísady podľa vzorca. Dostaneme:

    Poďme vypočítať bez zohľadnenia aditíva:

    Rozdiely boli opäť veľmi malé. Keďže počet žiakov je v oboch prípadoch rovnaký, podľa tab. 20 Prílohy 6 nájdeme kritické hodnoty pri n = 12 pre oba korelačné koeficienty naraz.

    0,58 pre P 0,05

    0,73 pre P 0,01

    Prvú hodnotu vynesieme na „osi významnosti“:

    V prvom prípade je získaný koeficient poradovej korelácie v pásme významnosti. Preto musí psychológ zamietnuť nulovú hypotézu, že korelačný koeficient je podobný nule a prijať alternatívnu hypotézu, že korelačný koeficient je výrazne odlišný od nuly. Inými slovami, získaný výsledok naznačuje, že čím vyššie majú študenti odborné hodnotenia v teste SHTUR, tým vyššie sú ich odborné hodnotenia v matematike.

    Druhú hodnotu vynesieme na „osi významnosti“:

    V druhom prípade je koeficient poradovej korelácie v pásme neistoty. Preto psychológ môže prijať nulovú hypotézu, že korelačný koeficient je podobný nule a zamietnuť alternatívnu hypotézu, že korelačný koeficient je výrazne odlišný od nuly. V tomto prípade získaný výsledok naznačuje, že odborné hodnotenia študentov v teste SHTUR nesúvisia s odbornými hodnoteniami literatúry.

    Ak chcete použiť Spearmanov korelačný koeficient, musia byť splnené tieto podmienky:

    1. Porovnávané premenné musia byť získané na ordinálnej (hodnotovej) stupnici, ale môžu sa merať aj na intervalovej a pomerovej stupnici.

    2. Na charaktere rozdelenia korelovaných veličín nezáleží.

    3. Počet rôznych charakteristík v porovnávaných premenných X a Y musí byť rovnaký.

    Tabuľky na určenie kritických hodnôt Spearmanovho korelačného koeficientu (tabuľka 20, príloha 6) sú vypočítané z počtu charakteristík rovnajúcich sa n = 5 až n = 40 a pri väčšom počte porovnávaných premenných sa použije tabuľka pre Mal by sa použiť Pearsonov korelačný koeficient (tabuľka 19, príloha 6). Zisťovanie kritických hodnôt sa vykonáva pri k = n.