Spearmans stikprøve rang korrelationskoefficient. Spearman korrelationsanalyse

Denne lommeregner nedenfor beregner Spearmans rangkorrelationskoefficient mellem to stokastiske variable. Den teoretiske del er traditionel under lommeregneren.

tilføje import Eksport mode_edit slette

Ændringer af stokastiske variable

arrow_upwardarrow_downward arrow_upwardarrow_downward
Elementer pr. side: 5 10 20 50 100 chevron_venstre chevron_right

Ændringer af stokastiske variable

Import af data Importfejl

"Et af følgende tegn bruges til at adskille datafelter: tabulator, semikolon (;) eller komma(,)" Eksempel: -50.5;-50.5

Import tilbage Annuller

Cifre efter decimaltegnet: 4

Beregn

Spearmans korrelationskoefficient

Gemme del udvidelse

Metoden til beregning af Spearmans rangkorrelationskoefficient er faktisk ret simpel. Den er ligesom Pearson-korrelationskoefficienten, men designet ikke kun til målinger af tilfældige variabler, men til deres rangordnede værdier.

Vi skal kun forstå, hvad rangværdien er, og hvorfor alt dette er nødvendigt.

Hvis elementerne i en variationsrække er arrangeret i stigende eller faldende rækkefølge, at rang af elementet vil være hans nummer i ordnede serier.

For eksempel har vi en variationsserie (17,26,5,14,21). Lad "s sortere det" s elementer i en faldende rækkefølge (26,21,17,14,5). 26 har en rang på 1, 21 - rang på 2 og så videre, Variationsrækker af rangeringsværdier vil se sådan ud (3,1,5,4,2).

dvs. ved beregning af Spearmans koefficient konverteres indledende variationsserier til variationsrækker af rangeringsværdier, og derefter anvendes Pearsons formel på dem.
.
Der er en subtilitet - rangen af ​​de gentagne værdier tages som gennemsnittet af rækkerne. Det vil sige, for en serie (17, 15, 14, 15) vil rangeringsserie se ud som (1, 2,5, 4, 2,5), da det første element er 15 har en rang på 2, og det andet - rang på 3, og.

Hvis du ikke har de gentagne værdier, det vil sige alle værdierne af rangeringsserier - tallene mellem 1 og n, kan Pearsons formel forenkles til

Forresten er denne formel ofte givet som formlen til beregning af Spearman's koefficient.

Hvad er essensen af ​​overgangen fra selve værdierne til deres rangværdi?
Når du undersøger korrelationen mellem rangeringsværdier, kan du finde ud af, hvor godt afhængigheden af ​​de to variable er beskrevet af en monoton funktion.

Koefficientens fortegn angiver retningen af ​​forholdet mellem variable. Hvis tegnet er positivt, har værdierne af Y en tendens til at stige med stigningen af ​​X. Hvis tegnet er negativt, har værdierne af Y en tendens til at falde med stigningen af ​​X. Hvis koefficienten er 0 er da ingen tendens. Hvis koefficienten er lig med 1 eller -1, har forholdet mellem X og Y et udseende af monoton funktion, dvs. med stigningen af ​​X, øges Y også og omvendt.

Det vil sige, i modsætning til Pearsons korrelationskoefficient, som kun kan detektere den lineære sammenhæng mellem en variabel fra en anden, kan Spearmans korrelationskoefficient detektere monoton afhængighed, hvor den direkte lineære sammenhæng ikke kan afsløres.

Her er et eksempel.
Lad mig forklare med et eksempel. Lad os antage, at vi undersøger funktionen y=10/x.
Vi har følgende målinger af X og Y
{{1,10}, {5,2}, {10,1}, {20,0.5}, {100,0.1}}
For disse data er Pearsons korrelationskoefficient lig med -0,4686, dvs. forholdet er svagt eller fraværende. Og Spearmans korrelationskoefficient er strengt taget lig med -1, som om det er antydninger til forskeren om, at Y har stærkt negativ monoton afhængighed af X.

37. Spearmans rangkorrelationskoefficient.

S. 56 (64) 063.JPG

http://psystat.at.ua/publ/1-1-0-33

Spearmans rangkorrelationskoefficient bruges når:
- variabler har rangeringsskala målinger;
- datadistribution er for forskellig fra normal eller slet ikke kendt
- prøverne er små (N< 30).

Fortolkningen af ​​Spearmans rangkorrelationskoefficient adskiller sig ikke fra Pearsons koefficient, men dens betydning er noget anderledes. For at forstå forskellen mellem disse metoder og logisk underbygge deres anvendelsesområde, lad os sammenligne deres formler.

Pearsons korrelationskoefficient:

Spearmans korrelationskoefficient:

Som du kan se, er formlerne meget forskellige. Sammenlign formler

Pearson-korrelationsformlen bruger det aritmetiske middelværdi og standardafvigelse af den korrelerede serie, mens Spearman-formlen ikke gør det. For at opnå et tilstrækkeligt resultat ifølge Pearson-formlen er det således nødvendigt, at den korrelerede serie er tæt på normalfordelingen (middelværdien og standardafvigelsen er normale fordelingsparametre). For Spearman-formlen er dette ikke relevant.

Et element i Pearsons formel er standardiseringen af ​​hver serie i z-score.

Som du kan se, er konverteringen af ​​variable til Z-skalaen til stede i Pearson-korrelationskoefficientformlen. For Pearson-koefficienten er skalaen af ​​dataene derfor absolut irrelevant: for eksempel kan vi korrelere to variable, hvoraf den ene har en min. = 0 og max. = 1, og det andet min. = 100 og max. = 1000. Uanset hvor forskellige værdiintervallet er, vil de alle blive konverteret til standard z-værdier med samme skala.

Der er ingen sådan normalisering i Spearman-koefficienten, så

EN OBLIGATORISK BETINGELSE FOR ANVENDELSE AF SPEERMAN-KOEFFICIENTEN ER LIGELIGHED I UDVALGET AF TO VARIABLER.

Før du bruger Spearman-koefficienten til dataserier med forskellige intervaller, er det nødvendigt at rang. Rangordning fører til, at værdierne i disse serier opnår det samme minimum = 1 (minimum rang) og et maksimum svarende til antallet af værdier (maksimum, sidste rang = N, dvs. det maksimale antal tilfælde i prøve).

I hvilke tilfælde er det muligt at gøre uden rangering

Det er tilfælde, hvor dataene er oprindeligt rangeringsskala. For eksempel Rokeach-værdiorienteringstesten.

Det er også tilfælde, hvor antallet af værdiindstillinger er lille, og der er faste minimum og maksimum i stikprøven. For eksempel, i den semantiske differentiale, minimum = 1, maksimum = 7.

Et eksempel på beregning af Spearman-rangkorrelationskoefficienten

Rokeachs værdiorienteringstest blev udført på to prøver X og Y. Opgave: at finde ud af, hvor tæt værdihierarkiet af disse prøver er (bogstaveligt talt, hvor ens de er).

Den resulterende værdi r=0,747 kontrolleres mod kritisk værdi tabel. Ifølge tabellen, ved N=18, er den opnåede værdi pålidelig på niveauet p<=0,005

Rank korrelationskoefficienter ifølge Spearman og Kendal

For variable, der hører til ordinalskalaen eller for variable, der ikke følger en normalfordeling, samt for variable, der hører til intervalskalaen, beregnes Spearmans rangkorrelation i stedet for Pearson-koefficienten. For at gøre dette tildeles individuelle værdier af variabler rangeringssteder, som efterfølgende behandles ved hjælp af de passende formler. For at afsløre rangkorrelation skal du fjerne markeringen i afkrydsningsfeltet for standard Pearson-korrelation i dialogboksen Bivariate Correlations.... Aktiver i stedet Spearman-korrelationsberegningen. Denne beregning vil give følgende resultater. Rangkorrelationskoefficienterne er meget tæt på de tilsvarende værdier af Pearson-koefficienterne (de oprindelige variable har en normalfordeling).

titkova-matmetody.pdf s. 45

Spearmans rangkorrelationsmetode giver dig mulighed for at bestemme tætheden (styrken) og retningen

sammenhæng mellem to tegn eller to profiler (hierarkier) tegn.

For at beregne rangkorrelationen er det nødvendigt at have to rækker af værdier,

som kan rangeres. Disse værdiintervaller kan være:

1) to tegn målt i samme gruppe forsøgspersoner;

2) to individuelle funktionshierarkier, identificeret i to emner for det samme

et sæt funktioner;

3) to gruppehierarkier af funktioner,

4) individuel og gruppe funktionshierarki.

Først rangeres indikatorerne separat for hver af funktionerne.

Som regel tildeles en lavere værdi af en funktion en lavere rang.

I det første tilfælde (to funktioner) rangeres individuelle værdier i henhold til den første

egenskab opnået af forskellige emner, og derefter individuelle værdier for den anden

skilt.

Hvis to tegn er positivt beslægtede, rangerer emnerne med lavt

en af ​​dem vil have lave ranger i den anden, og fagene med høje rangerer i

en af ​​attributterne vil også have høje rangeringer på den anden attribut. For at tælle kr

det er nødvendigt at bestemme forskellene (d) mellem rækkerne opnået af disse fag på begge

tegn. Så transformeres disse indikatorer d på en bestemt måde og trækkes fra 1. End

jo mindre forskellen mellem rækkerne er, jo større r vil være, jo tættere vil den være på +1.

Hvis der ikke er nogen sammenhæng, så vil alle rækker blive blandet, og der vil ikke være nogen

intet match. Formlen er designet således, at rs i dette tilfælde vil være tæt på 0.

I tilfælde af negativ korrelation lav rang af emner på ét grundlag

vil svare til høje rangeringer på en anden egenskab, og omvendt. Jo mere mismatch

mellem rækken af ​​forsøgspersoner i to variable, jo tættere er rs på -1.

I det andet tilfælde (to individuelle profiler), individuel

værdier opnået af hvert af de 2 emner i henhold til en bestemt (det samme for dem

begge) et sæt funktioner. Den første rang vil modtage den egenskab med den laveste værdi; anden rang -

et skilt med en højere værdi osv. Det er klart, at alle funktioner skal måles ind

de samme enheder, ellers er rangering umulig. For eksempel er det umuligt

rangordne indikatorerne i henhold til Cattell Personality Questionnaire (16PF), hvis de er udtrykt i

"rå" score, da værdiintervallerne er forskellige for forskellige faktorer: fra 0 til 13, fra 0 til

20 og fra 0 til 26. Vi kan ikke sige, hvilken af ​​faktorerne der kommer på førstepladsen mht

sværhedsgrad, indtil vi bringer alle værdierne til en enkelt skala (oftest er dette skalaen af ​​væggene).

Hvis de individuelle hierarkier af to emner er positivt relaterede, så tegnene

at have lave rang i en af ​​dem vil have lave ranger i den anden, og omvendt.

For eksempel, hvis faktoren E (dominans) for et emne har den laveste rang, så for

et andet emne, bør det have en lav rang, hvis et emne har faktor C

(følelsesmæssig stabilitet) har den højeste rang, så skal det andet emne også have

denne faktor har en høj rang, og så videre.

I det tredje tilfælde (to gruppeprofiler) rangeres de gennemsnitlige gruppeværdier,

modtaget i 2 grupper af emner i henhold til et bestemt, identisk for to grupper, sæt

tegn. I det følgende er ræsonnementet det samme som i de to foregående sager.

I tilfældet med den 4. (individuelle og gruppeprofiler) rangeres de separat

individuelle værdier for emnet og gennemsnitlige gruppeværdier for samme sæt

tegn, der er opnået, som regel, med udelukkelse af dette individuelle emne - han

deltager ikke i den gennemsnitlige gruppeprofil, som hans individ vil blive sammenlignet med

profil. Rank korrelation vil tillade dig at kontrollere, hvor konsekvent den enkelte og

gruppe profiler.

I alle fire tilfælde bestemmes betydningen af ​​den opnåede korrelationskoefficient af

efter antal rangerede værdier N. I det første tilfælde vil dette tal falde sammen med

prøvestørrelse n. I det andet tilfælde vil antallet af observationer være antallet af funktioner,

udgør et hierarki. I tredje og fjerde tilfælde er N også antallet af matchede

tegn, ikke antallet af fag i grupper. Detaljerede forklaringer er givet i eksemplerne. Hvis en

den absolutte værdi af rs når en kritisk værdi eller overskrider den, korrelationen

pålidelig.

Hypoteser.

Der er to mulige hypoteser. Den første henviser til tilfælde 1, den anden til de tre andre

Den første version af hypoteser

H0: Korrelationen mellem variable A og B er ikke forskellig fra nul.

H2: Korrelationen mellem variable A og B er signifikant forskellig fra nul.

Den anden version af hypoteserne

H0: Korrelation mellem hierarki A og B er ikke forskellig fra nul.

H2: Korrelationen mellem hierarki A og B er signifikant forskellig fra nul.

Begrænsninger af rangkorrelationskoefficienten

1. Der skal indsendes mindst 5 observationer for hver variabel. Øverst

prøveudtagningsgrænsen bestemmes af de tilgængelige tabeller over kritiske værdier .

2. Spearmans rangkorrelationskoefficient rs med et stort antal identiske

rækker for en eller begge matchede variabler giver grove værdier. Ideelt set

begge korrelerede serier skal være to sekvenser af ikke-matchende

værdier. Hvis denne betingelse ikke er opfyldt, skal der korrigeres for

samme rækker.

Spearmans rangkorrelationskoefficient beregnes ved formlen:

Hvis der i begge sammenlignede rangeringsserier er grupper af samme rang,

før man beregner rangkorrelationskoefficienten, er det nødvendigt at korrigere for samme

rangerer Ta og Tv:

Ta \u003d Σ (a3 - a) / 12,

TV \u003d Σ (v3 - c) / 12,

hvor en - volumen af ​​hver gruppe af identiske rækker i rækkefølgen A, i volumen af ​​hver

grupper af lige rang i rangrækken B.

For at beregne den empiriske værdi af rs, brug formlen:

38. Stiplet biseriel korrelationskoefficient.

For sammenhæng generelt, se spørgsmål nr. 36 Med. 56 (64) 063.JPG

harchenko-korranaliz.pdf

Lad variabel X måles på en stærk skala og variabel Y på en dikotom skala. Punktbrpb beregnes med formlen:

Her er x 1 gennemsnitsværdien for X objekter med værdien "én" for Y;

x 0 - gennemsnitsværdien for X objekter med en værdi på "nul" for Y;

s x - standardafvigelse af alle værdier for X;

n 1 - antallet af objekter "en" i Y, n 0 - antallet af objekter "nul" i Y;

n = n 1 + n 0 er stikprøvestørrelsen.

Punktbkan også beregnes ved hjælp af andre ækvivalente udtryk:

Her x er den samlede middelværdi for variablen x.

Punkt biseriel korrelationskoefficient rpb varierer fra –1 til +1. Dens værdi er lig med nul i tilfælde af, at variabler med en enhed for Y har et gennemsnit Y, lig med middelværdien af ​​variable med nul over Y.

Undersøgelse signifikanshypoteser punkt biserial korrelationskoefficient er at kontrollere nulhypotesenh 0 om ligheden af ​​den generelle korrelationskoefficient til nul: ρ = 0, som udføres ved hjælp af Elevens kriterium. Empirisk værdi

sammenlignet med kritiske værdier t -en (df) for antallet af frihedsgrader df = n– 2

Hvis betingelsen | t| ≤ ta(df), forkastes nulhypotesen ρ = 0 ikke. Punktbafviger signifikant fra nul, hvis den empiriske værdi | t| falder ind i det kritiske område, dvs. hvis tilstanden | t| > ta(n– 2). Relationens pålidelighed beregnet ved hjælp af punktbiserial korrelationskoefficient rpb, kan også bestemmes ved hjælp af kriteriet χ 2 for antallet af frihedsgrader df= 2.

Punkt-biseriel korrelation

Den efterfølgende ændring af korrelationskoefficienten for produktet af momenter blev afspejlet i den stiplede-biserielle r. Denne stat. viser forholdet mellem to variable, hvoraf den ene angiveligt er kontinuerlig og normalfordelt, mens den anden er diskret i ordets nøjagtige betydning. Den prik-biserielle korrelationskoefficient er angivet med r pbis Fordi i r pbis dikotomien afspejler den sande natur af den diskrete variabel og er ikke kunstig, som i tilfældet r bis, er dets fortegn vilkårligt bestemt. Derfor for alle praksisser mål r pbis betragtet i området fra 0,00 til +1,00.

Der er også et sådant tilfælde, når to variable anses for at være kontinuerte og normalfordelte, men begge er kunstigt dikotomiseret, som i tilfældet med biserial korrelation. For at vurdere sammenhængen mellem sådanne variabler anvendes den tetrakoriske korrelationskoefficient r tet, som også blev opdrættet af Pearson. Hoved (nøjagtige) formler og procedurer til beregning r tet er ret komplekse. Derfor med øvelse. denne metode bruger tilnærmelserne r tet opnået på grundlag af forkortede procedurer og tabeller.

/online/dictionary/dictionary.php?term=511

PRIKKET BISERIAL KORRELATIONSKOEFICIENT er korrelationskoefficienten mellem to variable, hvoraf den ene måles på en dikotom skala og den anden på en intervalskala. Det bruges i klassisk og moderne testologi som en indikator for kvaliteten af ​​en testopgave - pålidelighed-konsistens med den samlede testscore.

At korrelere variable målt i dikotom og intervalskala brug prik-biseriel korrelationskoefficient.
Den prik-biserielle korrelationskoefficient er en metode til korrelationsanalyse af forholdet mellem variabler, hvoraf den ene måles i en navneskala og tager kun 2 værdier (for eksempel mænd / kvinder, svaret er korrekt / svaret er forkert, er der et tegn / der er intet tegn), og den anden i skalaforhold eller intervalskala. Formlen til beregning af koefficienten for punkt-biseriel korrelation:

Hvor:
m1 og m0 er gennemsnitsværdierne af X med en værdi på 1 eller 0 i Y.
σx er standardafvigelsen for alle værdier for X
n1,n0 – antal X-værdier fra 1 eller 0 til Y.
n er det samlede antal værdipar

Oftest bruges denne type korrelationskoefficient til at beregne forholdet mellem testelementer med en opsummerende skala. Dette er en type valideringstjek.

39. Rang-biseriel korrelationskoefficient.

For sammenhæng generelt, se spørgsmål nr. 36 Med. 56 (64) 063.JPG

harchenko-korranaliz.pdf s. 28

Den rang-biserielle korrelationskoefficient, der bruges, når en af ​​variablerne ( x) præsenteres i en ordensskala, og den anden ( Y) - i dikotom, beregnet ved formlen

.

Her er den gennemsnitlige rangering af objekter, der har enhed i Y; er den gennemsnitlige rangering af objekter med nul i Y, n– prøvestørrelse.

Undersøgelse signifikanshypoteser rang-biseriel korrelationskoefficient udføres på samme måde som punktbiserial korrelationskoefficienten ved hjælp af Students t-test med erstatning i formlerne rpb på den rrb.

Når en variabel måles på en dikotom skala (variabel x), og den anden i rangskalaen (variabel Y), ved brug af rang-biseriel korrelationskoefficient. Vi husker, at variablen x, målt i en dikotom skala, tager kun to værdier (koder) 0 og 1. Lad os især understrege, at på trods af at denne koefficient varierer i området fra –1 til +1, betyder dets fortegn ikke noget for fortolkningen af resultater. Dette er endnu en undtagelse fra den generelle regel.

Beregningen af ​​denne koefficient er lavet i henhold til formlen:

hvor ` x 1 gennemsnitlig rangering over disse elementer i variablen Y, som svarer til koden (feature) 1 i variablen x;

`X 0 – gennemsnitlig rangering for disse elementer i variablen Y, som svarer til koden (feature) 0 i variablen X\

N- det samlede antal elementer i variablen x.

For at anvende den rang-biserielle korrelationskoefficient skal følgende betingelser være opfyldt:

1. De variable, der sammenlignes, skal måles på forskellige skalaer: en X- i en dikotom skala; en anden Y– i rangeringsskalaen.

2. Antallet af varierende funktioner i de sammenlignede variable x og Y burde være det samme.

3. For at vurdere pålidelighedsniveauet af den rang-biserielle korrelationskoefficient, skal man bruge formlen (11.9) og tabellen over kritiske værdier for Elevens test, når k = n - 2.

http://psystat.at.ua/publ/drugie_vidy_koehfficienta_korreljacii/1-1-0-38

Tilfælde, hvor en af ​​variablerne er til stede i dikotom skala, og den anden i rang (ordinær), kræver brug rang-biseriel korrelationskoefficient:

rpb=2 / n * (m1 - m0)

hvor:
n er antallet af måleobjekter
m1 og m0 - den gennemsnitlige rangering af objekter med 1 eller 0 i den anden variabel.
Denne koefficient bruges også ved kontrol af tests validitet.

40. Lineær korrelationskoefficient.

Om korrelation generelt (og om lineær korrelation i særdeleshed), se spørgsmål nr. 36 Med. 56 (64) 063.JPG

Hr. PEARSONS KORRELATIONSKOEFFICIENT

r-Pearson (Pearson r) bruges til at studere forholdet mellem to metriskeandre variabler målt på samme stikprøve. Der er mange situationer, hvor det er hensigtsmæssigt at bruge det. Påvirker intelligens præstationer i senior universitetsår? Er størrelsen af ​​en medarbejders løn relateret til hans velvilje over for kolleger? Påvirker en elevs humør succesen med at løse et komplekst regneproblem? For at besvare sådanne spørgsmål skal forskeren måle to indikatorer af interesse for hvert medlem af prøven. Dataene til at studere sammenhængen er derefter tabuleret, som i eksemplet nedenfor.

EKSEMPEL 6.1

Tabellen viser et eksempel på de indledende måledata for to indikatorer for intelligens (verbal og non-verbal) hos 20 elever i 8. klasse.

Forholdet mellem disse variable kan afbildes ved hjælp af et punktdiagram (se figur 6.3). Diagrammet viser, at der er en vis sammenhæng mellem de målte indikatorer: Jo større værdien af ​​verbal intelligens er, jo (hovedsageligt) jo større værdi af non-verbal intelligens.

Før vi giver formlen for korrelationskoefficienten, lad os prøve at spore logikken i dens forekomst ved hjælp af dataene i eksempel 6.1. Placeringen af ​​hvert /-punkt (emne med tallet /) på spredningsdiagrammet i forhold til de andre punkter (fig. 6.3) kan gives ved størrelsen og fortegnene for afvigelserne af de tilsvarende værdier af variablerne fra deres gennemsnitsværdier: (xj - MJ og (sind ). Hvis tegnene på disse afvigelser falder sammen, indikerer dette til fordel for et positivt forhold (store værdier for x svarer til store værdier eller mindre værdier x svarer til mindre værdier y).

For fag nr. 1 er afvigelsen fra gennemsnittet x og af positive, og for emne nr. 3 er begge afvigelser negative. Dataene for begge indikerer derfor en positiv sammenhæng mellem de undersøgte egenskaber. Tværtimod, hvis tegnene på afvigelser fra gennemsnittet x og af afviger, vil dette indikere et negativt forhold mellem tegnene. For emne nr. 4 er afvigelsen fra gennemsnittet således x er negativ, iflg y - positiv, og for emne nr. 9 - omvendt.

Således, hvis produktet af afvigelser (x, - M x ) x (sind ) positiv, så indikerer /-subjektets data en direkte (positiv) sammenhæng, og hvis negativ, så en omvendt (negativ) sammenhæng. Følgelig, hvis xwy er for det meste direkte proportionale, så vil de fleste produkter af afvigelserne være positive, og hvis de er omvendt relaterede, så vil de fleste af produkterne være negative. Derfor kan summen af ​​alle produkter af afvigelser for en given prøve tjene som en generel indikator for styrken og retningen af ​​forholdet:

Med et direkte proportionalt forhold mellem variablerne er denne værdi stor og positiv - for de fleste af forsøgspersonerne falder afvigelserne sammen i fortegn (store værdier af en variabel svarer til store værdier af den anden variabel og omvendt). Hvis x og har feedback, så for de fleste fag vil store værdier af en variabel svare til mindre værdier af en anden variabel, dvs. produkternes fortegn vil være negative, og summen af ​​produkterne som helhed vil også være stor i absolut værdi, men negativ i fortegn. Hvis der ikke er nogen systematisk sammenhæng mellem variablerne, vil de positive led (produkter af afvigelser) balanceres med negative led, og summen af ​​alle produkter af afvigelser vil være tæt på nul.

For at summen af ​​produkterne ikke afhænger af prøvestørrelsen, er det nok at gennemsnittet det. Men vi er interesserede i målingen af ​​forholdet ikke som en generel parameter, men som et beregnet skøn over det - statistik. Derfor, hvad angår dispersionsformlen, vil vi i dette tilfælde gøre det samme, vi dividerer summen af ​​produkterne af afvigelser ikke med N, og på TV - 1. Det viser sig et mål for kommunikation, meget brugt i fysik og tekniske videnskaber, som kaldes kovarians (Covahance):


psykologi, i modsætning til fysik, måles de fleste variabler på vilkårlige skalaer, da psykologer ikke er interesseret i den absolutte værdi af egenskaben, men i den relative position af emnerne i gruppen. Derudover er kovarians meget følsom over for den skala (spredning), hvori funktionerne måles. For at gøre kommunikationsmålet uafhængigt af måleenhederne for begge attributter, er det nok at opdele kovariansen i de tilsvarende standardafvigelser. Således blev det opnået til-K. Pearsons korrelationskoefficient muldyr:

eller efter at have erstattet udtrykkene med o x og


Hvis værdierne af begge variabler blev konverteret til r-værdier ved hjælp af formlen


så ser r-Pearson korrelationskoefficientformlen enklere ud (071.JPG):

/dict/sociology/article/soc/soc-0525.htm

KORELATION LINEÆR- statistisk ikke-kausal lineær sammenhæng mellem to kvantitative variable x og . Målt ved hjælp af "faktor K.L." Pearson, som er resultatet af at dividere kovariansen med standardafvigelserne for begge variable:

,

hvor s xy- kovarians mellem variable x og ;

s x , s y- standardafvigelser for variable x og ;

x jeg , y jeg- variable værdier x og for objektnummer jeg;

x, y- aritmetiske gennemsnit for variable x og .

Pearsons forhold r kan tage værdier fra intervallet [-1; +1]. Betyder r = 0 betyder ingen lineær sammenhæng mellem variable x og (men udelukker ikke en ikke-lineær statistisk sammenhæng). Positive koefficientværdier ( r> 0) angiver en direkte lineær sammenhæng; jo tættere dens værdi er på +1, jo stærkere er den statistiske direkte sammenhæng. Negative koefficientværdier ( r < 0) свидетельствуют об обратной линейной связи; чем ближе его значение к -1, тем сильнее обратная связь. Значения r= ±1 betyder tilstedeværelsen af ​​en fuld lineær forbindelse, direkte eller omvendt. I tilfælde af en fuldstændig forbindelse skal alle punkter med koordinater ( x jeg , y jeg) ligge på en lige linje y = -en + bx.

"Koefficient K.L." Pearson bruges også til at måle tætheden af ​​forholdet i den lineære parregressionsmodel.

41. Korrelationsmatrix og korrelationsgraf.

For sammenhæng generelt, se spørgsmål nr. 36 Med. 56 (64) 063.JPG

korrelationsmatrix. Ofte inkluderer korrelationsanalyse studiet af forhold, ikke to, men mange variable målt i en kvantitativ skala på en prøve. I dette tilfælde beregnes korrelationer for hvert par af dette sæt af variable. Beregninger udføres normalt på en computer, og resultatet er en korrelationsmatrix.

Korrelationsmatrix(korrelation matrix) er resultatet af beregning af korrelationer af samme type for hvert par fra sættet R variabler målt i en kvantitativ skala på én prøve.

EKSEMPEL

Antag, at vi studerer sammenhænge mellem 5 variable (vl, v2,..., v5; P= 5), målt på en prøve af N=30 human. Nedenfor er en tabel med indledende data og en korrelationsmatrix.

Og
relaterede data:

Korrelationsmatrix:

Det er let at se, at korrelationsmatricen er kvadratisk, symmetrisk i forhold til hoveddiagonalen (takkakg, y = /) y), med enheder på hoveddiagonalen (da G og = Gu = 1).

Korrelationsmatricen er firkant: antallet af rækker og kolonner er lig med antallet af variable. Hun er symmetrisk i forhold til hoveddiagonalen, da korrelationen x Med er lig med korrelation Med X. Enheder er placeret på dens hoveddiagonal, da korrelationen af ​​en funktion med sig selv er lig med én. Følgelig er ikke alle elementer i korrelationsmatricen genstand for analyse, men dem, der er over eller under hoveddiagonalen.

Antal korrelationskoefficienter, Funktioner, der skal analyseres i studiet af relationer, bestemmes af formlen: P(P- 1)/2. I eksemplet ovenfor er antallet af sådanne korrelationskoefficienter 5(5 - 1)/2 = 10.

Hovedopgaven med at analysere korrelationsmatricen er afsløre strukturen af ​​indbyrdes sammenhænge af et sæt funktioner. Dette muliggør visuel analyse korrelationspleiader- grafisk billede strukturer statistiskvæsentlige forbindelser hvis der ikke er ret mange sådanne forbindelser (op til 10-15). En anden måde er at bruge multivariate metoder: multipel regression, faktoriel eller klyngeanalyse (se afsnittet "Multivariate metoder..."). Ved hjælp af faktor- eller klyngeanalyse er det muligt at identificere grupperinger af variable, der er tættere beslægtede med hinanden end til andre variable. En kombination af disse metoder er også meget effektiv, for eksempel hvis der er mange tegn, og de ikke er homogene.

Sammenligning af korrelationer - en ekstra opgave med at analysere korrelationsmatricen, som har to muligheder. Hvis det er nødvendigt at sammenligne korrelationer i en af ​​rækkerne i korrelationsmatricen (for en af ​​variablerne), anvendes sammenligningsmetoden for afhængige stikprøver (s. 148-149). Ved sammenligning af korrelationer af samme navn beregnet for forskellige stikprøver, anvendes sammenligningsmetoden for uafhængige stikprøver (s. 147-148).

Sammenligningsmetoder sammenhænge i diagonaler korrelationsmatrix (til vurdering af stationariteten af ​​en tilfældig proces) og sammenligning flere Korrelationsmatricer opnået for forskellige prøver (for deres homogenitet) er tidskrævende og ligger uden for denne bogs rammer. Du kan stifte bekendtskab med disse metoder fra bogen af ​​GV Sukhodolsky 1 .

Problemet med statistisk signifikans af korrelationer. Problemet er, at den statistiske hypotesetestprocedure involverer en-mange test udført på én prøve. Hvis samme metode anvendes mange gange, selvom i forhold til forskellige variable, så stiger sandsynligheden for at opnå et resultat rent tilfældigt. Generelt, hvis vi gentager den samme hypotesetestmetode til tider i forhold til forskellige variabler eller stikprøver, så er vi med den etablerede værdi af a garanteret at modtage bekræftelse af hypotesen i ahk antallet af sager.

Lad os antage, at korrelationsmatricen for 15 variable analyseres, det vil sige, at 15(15-1)/2 = 105 korrelationskoefficienter beregnes. For at teste hypoteserne sættes niveauet a = 0,05. Ved at teste hypotesen 105 gange får vi dens bekræftelse fem gange (!) uanset om sammenhængen rent faktisk eksisterer. Når vi ved dette og har modtaget f.eks. 15 "statistisk signifikante" korrelationskoefficienter, kan vi så se, hvilke af dem der er opnået tilfældigt, og hvilke afspejler en reel sammenhæng?

For at træffe en statistisk beslutning er det strengt taget nødvendigt at reducere niveauet a med lige så mange gange som antallet af hypoteser, der testes. Men dette er næppe tilrådeligt, da sandsynligheden for at ignorere en virkelig forbindelse (lave en type II fejl) stiger på en uforudsigelig måde.

Korrelationsmatricen alene er ikke et tilstrækkeligt grundlagfor statistiske konklusioner vedrørende de enkelte koefficienter, der indgår i densammenhænge!

Der er kun én virkelig overbevisende måde at løse dette problem på: opdel prøven tilfældigt i to dele og tag kun hensyn til de korrelationer, der er statistisk signifikante i begge dele af prøven. Et alternativ kan være brugen af ​​multivariate metoder (faktoriel, klynge eller multipel regressionsanalyse) - til udvælgelse og efterfølgende fortolkning af grupper af statistisk signifikant relaterede variable.

Problemet med manglende værdier. Hvis der mangler værdier i dataene, er to muligheder for at beregne korrelationsmatricen mulige: a) linje-for-linje sletning af værdier (udelukkesagerlistemæssigt); b) parvis sletning af værdier (udelukkesagerparvis). linje for linje sletning observationer med mellemrum, slettes hele linjen for objektet (emnet), der har mindst én manglende værdi for en af ​​variablerne. Denne metode fører til en "korrekt" korrelationsmatrix i den forstand, at alle koefficienter er beregnet ud fra det samme sæt af objekter. Men hvis de manglende værdier er tilfældigt fordelt i variablerne, kan denne metode føre til, at der ikke vil være et enkelt objekt tilbage i det betragtede datasæt (hver linje vil indeholde mindst en manglende værdi). For at undgå denne situation skal du bruge en anden metode kaldet parvis fjernelse. Denne metode tager kun højde for huller i hvert udvalgt par af variabelkolonner og ignorerer huller i andre variable. Korrelation for et par variable beregnes for de objekter, hvor der ikke er huller. I mange situationer, især når antallet af huller er relativt lille, f.eks. 10%, og hullerne er ret tilfældigt fordelt, fører denne metode ikke til alvorlige fejl. Men nogle gange er dette ikke tilfældet. For eksempel, i den systematiske bias (forskydning) af estimatet, kan den systematiske placering af hullerne "skjules", hvilket er årsagen til forskellen i korrelationskoefficienterne bygget på forskellige delmængder (for eksempel for forskellige undergrupper af objekter ). Et andet problem forbundet med korrelationsmatrixen beregnet med i par Fjernelse af mellemrum opstår, når denne matrix bruges i andre typer analyser (for eksempel i multipel regression eller faktoranalyse). De antager, at en "korrekt" korrelationsmatrix bruges med et vist niveau af konsistens og "korrespondance" af forskellige koefficienter. Brug af en matrix med "dårlige" (biased) estimater fører til, at programmet enten ikke er i stand til at analysere en sådan matrix, eller også vil resultaterne være fejlagtige. Derfor, hvis der anvendes en parvis metode til at eliminere manglende data, er det nødvendigt at kontrollere, om der er eller ikke er systematiske mønstre i fordelingen af ​​huller.

Hvis den parvise eliminering af manglende data ikke fører til et systematisk skift i middelværdier og varianser (standardafvigelser), vil disse statistikker svare til dem, der er beregnet med den linjevise metode til at fjerne huller. Hvis der er en væsentlig forskel, så er der grund til at antage, at der sker en forskydning i estimaterne. For eksempel, hvis gennemsnittet (eller standardafvigelsen) af værdierne af variablen MEN, som blev brugt til at beregne dens korrelation med variablen PÅ, meget mindre end gennemsnittet (eller standardafvigelsen) af de samme værdier af variablen MEN, som blev brugt til at beregne dens korrelation med variablen C, så er der al mulig grund til at forvente, at disse to korrelationer (A-Bos) baseret på forskellige delmængder af data. Der vil være et skift i korrelationerne forårsaget af den ikke-tilfældige placering af hullerne i variablernes værdier.

Analyse af korrelationspleiader. Efter at have løst problemet med den statistiske signifikans af elementerne i korrelationsmatricen, kan statistisk signifikante korrelationer repræsenteres grafisk i form af en eller flere korrelationspleiader. Korrelationsgalakse - det er en figur, der består af hjørner og linjer, der forbinder dem. Hjørnene svarer til funktionerne og er normalt betegnet med tal - variablenes tal. Linjerne svarer til statistisk signifikante sammenhænge og udtrykker grafisk tegnet, og nogle gange /j-signifikansniveauet af sammenhængen.

Korrelationsgalaksen kan reflektere alle statistisk signifikante sammenhænge af korrelationsmatrixen (nogle gange kaldet korrelationsgraf ) eller kun deres meningsfuldt udvalgte del (f.eks. svarende til én faktor ifølge resultaterne af faktoranalyse).

EKSEMPEL PÅ KONSTRUKTION AF EN KORRELATIONSPLAID


Forberedelse til statslig (endelig) certificering af kandidater: dannelse af USE-databasen (generel liste over USE-deltagere i alle kategorier, med angivelse af emner) - under hensyntagen til reservedage i tilfælde af sammenfald af emner;

  • Arbejdsplan (27)

    Løsning

    2. Uddannelsesinstitutionens aktiviteter for at forbedre indholdet og vurdere kvaliteten i fagene i naturlig og matematisk uddannelse MOU gymnasium nr. 4, Litvinovskaya, Chapaevskaya,

  • Disciplinen "højere matematik" forårsager afvisning blandt nogle, da virkelig ikke alle er givet til at forstå den. Men de, der er heldige nok til at studere dette emne og løse problemer ved hjælp af forskellige ligninger og koefficienter, kan prale af næsten fuldstændig viden om det. I psykologisk videnskab er der ikke kun en humanitær orientering, men også visse formler og metoder til matematisk verifikation af den hypotese, der er fremsat i løbet af forskningen. Til dette anvendes forskellige koefficienter.

    Spearmans korrelationskoefficient

    Dette er en almindelig måling til at bestemme tætheden af ​​forholdet mellem to træk. Koefficienten kaldes også den ikke-parametriske metode. Det viser forbindelsesstatistikker. Det vil sige, at vi for eksempel ved, at hos et barn hænger aggression og irritabilitet sammen, og Spearman-rangkorrelationskoefficienten viser den statistiske matematiske sammenhæng mellem disse to træk.

    Hvordan beregnes rangordningskoefficienten?

    Naturligvis har alle matematiske definitioner eller størrelser deres egne formler, som de beregnes med. Den har også Spearman-korrelationskoefficienten. Dens formel er følgende:

    Ved første øjekast er formlen ikke helt klar, men hvis du ser efter, er alt meget nemt at beregne:

    • n er antallet af funktioner eller indikatorer, der er rangeret.
    • d er forskellen mellem visse to rækker svarende til de specifikke to variable for hvert emne.
    • ∑d 2 - summen af ​​alle kvadrerede forskelle i funktionsrækkerne, hvis kvadrater beregnes separat for hver rang.

    Omfanget af det matematiske mål for forbindelse

    For at anvende rangkoefficienten er det nødvendigt, at de kvantitative data for egenskaben rangeres, det vil sige, at de blev tildelt et bestemt nummer afhængigt af det sted, hvor egenskaben er placeret og dens værdi. Det er bevist, at to rækker af tegn, udtrykt i numerisk form, er noget parallelle med hinanden. Spearmans rangkorrelationskoefficient bestemmer graden af ​​denne parallelitet, tætheden af ​​forholdet mellem funktioner.

    For at en matematisk operation kan beregne og bestemme forholdet mellem funktioner ved hjælp af den angivne koefficient, skal du udføre nogle handlinger:

    1. Hver værdi af ethvert emne eller fænomen tildeles et nummer i rækkefølge - en rang. Det kan svare til værdien af ​​fænomenet i stigende og faldende rækkefølge.
    2. Dernæst sammenlignes rækkerne af værdierne af tegnene i to kvantitative serier for at bestemme forskellen mellem dem.
    3. I en separat kolonne i tabellen, for hver opnået forskel, er dens kvadrat skrevet, og resultaterne er opsummeret nedenfor.
    4. Efter disse trin anvendes en formel, hvormed Spearman-korrelationskoefficienten beregnes.

    Korrelationskoefficientens egenskaber

    De vigtigste egenskaber ved Spearman-koefficienten omfatter følgende:

    • Måling af værdier mellem -1 og 1.
    • Tegnet på fortolkningskoefficienten har nej.
    • Forbindelsens nærhed bestemmes af princippet: Jo højere værdi, jo tættere forbindelse.

    Hvordan kontrolleres den modtagne værdi?

    For at kontrollere forholdet mellem tegn skal du udføre visse handlinger:

    1. Nulhypotesen (H0), som også er den vigtigste, fremsættes, derefter formuleres en anden, alternativ til den første (H 1). Den første hypotese ville være, at Spearman-korrelationskoefficienten er 0, hvilket betyder, at der ikke vil være nogen sammenhæng. Den anden siger tværtimod, at koefficienten ikke er lig med 0, så er der en sammenhæng.
    2. Det næste trin er at finde den observerede værdi af kriteriet. Det findes ved den grundlæggende formel for Spearman-koefficienten.
    3. Dernæst findes de kritiske værdier for det givne kriterium. Dette kan kun gøres ved hjælp af en speciel tabel, som viser forskellige værdier for de givne indikatorer: signifikansniveauet (l) og det tal, der bestemmer (n).
    4. Nu skal vi sammenligne de to modtagne værdier: den etablerede observerbare såvel som den kritiske. For at gøre dette skal du bygge en kritisk region. Det er nødvendigt at tegne en lige linje, på den markerer punkterne for den kritiske værdi af koefficienten med "-" tegnet og med "+" tegnet. Til venstre og til højre for de kritiske værdier er de kritiske områder plottet i halvcirkler fra punkterne. I midten, ved at kombinere to værdier, er det markeret med en halvcirkel af OPG.
    5. Derefter drages en konklusion om stramheden af ​​forholdet mellem de to træk.

    Hvor er det bedste sted at bruge denne værdi?

    Den allerførste videnskab, hvor denne koefficient blev aktivt brugt, var psykologi. Når alt kommer til alt, er dette en videnskab, der ikke er baseret på tal, men for at bevise vigtige hypoteser om udvikling af relationer, karaktertræk hos mennesker, elevernes viden, statistisk bekræftelse af konklusionerne er påkrævet. Det bruges også i økonomien, især i valutatransaktioner. Her vurderes funktioner uden statistik. Spearmans rangkorrelationskoefficient er meget praktisk i dette anvendelsesområde, idet vurderingen foretages uafhængigt af fordelingen af ​​variabler, da de erstattes af et rangnummer. Spearman-koefficienten bruges aktivt i bankvirksomhed. Sociologi, statskundskab, demografi og andre videnskaber bruger det også i deres forskning. Resultater opnås hurtigt og så præcist som muligt.

    Bekvemt og hurtigt brugt Spearmans korrelationskoefficient i Excel. Her er der specielle funktioner, som hjælper dig med hurtigt at få de nødvendige værdier.

    Hvilke andre korrelationskoefficienter findes der?

    Ud over det, vi lærte om Spearman-korrelationskoefficienten, er der også forskellige korrelationskoefficienter, der giver dig mulighed for at måle, evaluere kvalitative træk, forholdet mellem kvantitative træk, tætheden af ​​forholdet mellem dem, præsenteret i en rangskala. Disse er sådanne koefficienter som bis-seriel, rang-bis-seriel, indhold, associationer og så videre. Spearman-koefficienten viser tætheden af ​​forbindelsen meget nøjagtigt, i modsætning til alle andre metoder til dens matematiske bestemmelse.

    Kort teori

    Rangkorrelation er en metode til korrelationsanalyse, der afspejler forholdet mellem variable sorteret i stigende rækkefølge efter deres værdi.

    Ranger er ordenstal af befolkningsenheder i en rangeret serie. Hvis vi rangerer sættet efter to karakteristika, hvorimod forholdet mellem hvilke der studeres, betyder det fuldstændige sammenfald af rækkerne den tætteste direkte forbindelse og den fuldstændige modsatte af rækkerne - den tætteste feedback. Det er nødvendigt at rangere begge funktioner i samme rækkefølge: enten fra lavere til højere værdier af funktionen eller omvendt.

    Til praktiske formål er brugen af ​​rangkorrelation ret nyttig. For eksempel, hvis der etableres en høj rangkorrelation mellem to kvalitetsattributter for produkter, så er det tilstrækkeligt kun at kontrollere produkter for en af ​​attributterne, hvilket reducerer omkostningerne og fremskynder kontrollen.

    Korrelationskoefficienten for rækker, foreslået af K. Spearman, henviser til ikke-parametriske indikatorer for forholdet mellem variable målt på en rangskala. Ved beregning af denne koefficient kræves der ingen antagelser om arten af ​​fordelingen af ​​funktioner i den generelle befolkning. Denne koefficient bestemmer graden af ​​nærhed af forbindelsen af ​​ordinære træk, som i dette tilfælde repræsenterer rækkerne af de sammenlignede værdier.

    Værdien af ​​Spearmans korrelationskoefficient ligger i området +1 og -1. Det kan være positivt eller negativt, hvilket karakteriserer retningen af ​​forholdet mellem to træk målt i rangskalaen.

    Spearmans rangkorrelationskoefficient beregnes ved formlen:

    Forskel mellem rækker på to variable

    antal matchede par

    Det første trin i beregningen af ​​rangkorrelationskoefficienten er rangordningen af ​​rækken af ​​variable. Rangeringsproceduren begynder med arrangementet af variabler i stigende rækkefølge efter deres værdier. Forskellige værdier er tildelt rækker, angivet med naturlige tal. Hvis der er flere variable af samme værdi, tildeles de en gennemsnitlig rangering.

    Fordelen ved Spearman-rangkorrelationskoefficienten er, at det er muligt at rangere efter sådanne funktioner, der ikke kan udtrykkes numerisk: du kan rangere kandidater til en bestemt stilling efter professionelt niveau, efter evnen til at lede et hold, efter personlig charme osv. Med ekspertvurderinger kan du rangere estimaterne fra forskellige eksperter og finde deres sammenhænge med hinanden, for derefter at udelukke ekspertens estimater, der er svagt korrelerede med andre eksperters estimater, fra overvejelse. Spearmans rangkorrelationskoefficient bruges til at vurdere stabiliteten af ​​dynamikkens tendens. Ulempen ved rangkorrelationskoefficienten er, at helt forskellige forskelle i funktionsværdier kan svare til de samme rangforskelle (i tilfælde af kvantitative egenskaber). Derfor, for sidstnævnte, bør korrelationen af ​​rækker betragtes som et omtrentligt mål for tætheden af ​​forbindelsen, som har mindre informationsindhold end korrelationskoefficienten for de numeriske værdier af funktioner.

    Eksempel på problemløsning

    Opgaven

    En undersøgelse af 10 tilfældigt udvalgte studerende, der bor på et universitetskollegium, afslører en sammenhæng mellem den gennemsnitlige score baseret på resultaterne af den foregående session og det antal timer om ugen, den studerende brugte på selvstudie.

    Bestem tætheden af ​​forbindelsen ved hjælp af Spearman rangkorrelationskoefficienten.

    Hvis der er vanskeligheder med at løse problemer, giver webstedet online assistance til studerende i statistik med hjemmetests eller eksamener.

    Løsningen af ​​problemet

    Lad os beregne korrelationskoefficienten for rækker.

    Rangering Rangsammenligning Rangforskel 1 26 4.7 8 1 3.1 1 8 10 -2 4 2 22 4.4 10 2 3.6 2 7 9 -2 4 3 8 3.8 12 3 3.7 3 1 4 -3 9 4 12 3.7 15 4 3.8 4 3 3 0 0 5 15 4.2 17 5 3.9 5 4 7 -3 9 6 30 4.3 20 6 4 6 9 8 1 1 7 20 3.6 22 7 4.2 7 6 2 4 16 8 31 4 26 8 4.3 8 10 6 4 16 9 10 3.1 30 9 4.4 9 2 1 1 1 10 17 3.9 31 10 4.7 10 5 5 0 0 Sum 60

    Spearmans rangkorrelationskoefficient:

    Ved at erstatte numeriske værdier får vi:

    Konklusion på problemet

    Forholdet mellem den gennemsnitlige score baseret på resultaterne af den foregående session og antallet af timer om ugen brugt af den studerende på selvstudium, moderat stramhed.

    Hvis fristerne for at bestå prøven er ved at løbe ud, kan du altid bestille en hasteløsning på problemer i statistik på siden.

    Medium omkostningerne ved at løse kontrolarbejdet er 700 - 1200 rubler (men ikke mindre end 300 rubler for hele ordren). Prisen er stærkt påvirket af beslutningens hastende karakter (fra dage til flere timer). Omkostningerne ved online hjælp til eksamen / test - fra 1000 rubler. til billetløsningen.

    Du kan stille alle spørgsmål om omkostningerne direkte i chatten, efter at have droppet opgavernes tilstand og informeret dig om deadlines for at løse det. Svartiden er et par minutter.

    Eksempler på relaterede opgaver

    Fechner koefficient
    Der gives en kort teori og et eksempel på løsning af problemet med beregning af korrelationskoefficienten for Fechner-tegn betragtes.

    Gensidige beredskabskoefficienter for Chuprov og Pearson
    Siden indeholder information om metoder til at studere sammenhængen mellem kvalitative træk ved brug af Chuprovs og Pearsons gensidige kontingenskoefficienter.

    Spearmans rangkorrelationskoefficient er en ikke-parametrisk metode, der bruges til statistisk at studere sammenhængen mellem fænomener. I dette tilfælde bestemmes den faktiske grad af parallelitet mellem de to kvantitative serier af de undersøgte træk, og et estimat af tætheden af ​​det etablerede forhold gives ved hjælp af en kvantitativt udtrykt koefficient.

    1. Historie om udviklingen af ​​rangkorrelationskoefficienten

    Dette kriterium blev udviklet og foreslået til korrelationsanalyse i 1904 Charles Edward Spearman, engelsk psykolog, professor ved London og Chesterfield Universiteter.

    2. Hvad bruges Spearman ratioen til?

    Spearmans rangkorrelationskoefficient bruges til at identificere og evaluere tætheden af ​​forholdet mellem to serier af sammenlignede kvantitative indikatorer. I tilfælde af at rækken af ​​indikatorer, sorteret efter grad af stigning eller fald, i de fleste tilfælde falder sammen (en højere værdi af en indikator svarer til en højere værdi af en anden indikator - f.eks. når man sammenligner patientens højde og dennes kropsvægt), konkluderes det, at der lige korrelation. Hvis rækkerne af indikatorer har den modsatte retning (en højere værdi af en indikator svarer til en lavere værdi af en anden - f.eks. når man sammenligner alder og puls), så taler de om baglæns sammenhænge mellem indikatorer.

      Spearman-korrelationskoefficienten har følgende egenskaber:
    1. Korrelationskoefficienten kan tage værdier fra minus en til en, og ved rs=1 er der en strengt direkte sammenhæng, og ved rs= -1 - strengt omvendt sammenhæng.
    2. Hvis korrelationskoefficienten er negativ, så er der en omvendt sammenhæng; hvis den er positiv, så er der en direkte sammenhæng.
    3. Hvis korrelationskoefficienten er lig med nul, er forholdet mellem mængderne praktisk talt fraværende.
    4. Jo tættere modulet af korrelationskoefficienten er på enhed, jo stærkere er forholdet mellem de målte værdier.

    3. I hvilke tilfælde kan Spearman-koefficienten bruges?

    På grund af det faktum, at koefficienten er en metode ikke-parametrisk analyse, der kræves ingen kontrol for normalfordeling.

    Sammenlignelige indikatorer kan måles som i kontinuerlig skala(for eksempel antallet af røde blodlegemer i 1 µl blod), og i ordinal(f.eks. peer review-score fra 1 til 5).

    Effektiviteten og kvaliteten af ​​Spearmans estimering reduceres, hvis forskellen mellem de forskellige værdier af nogen af ​​de målte mængder er stor nok. Det anbefales ikke at bruge Spearman-koefficienten, hvis der er en ujævn fordeling af værdierne af den målte værdi.

    4. Hvordan beregner man Spearman-koefficienten?

    Beregningen af ​​Spearman-rangkorrelationskoefficienten inkluderer følgende trin:

    5. Hvordan fortolker man værdien af ​​Spearman-koefficienten?

    Når du bruger rangkorrelationskoefficienten, estimeres tætheden af ​​forbindelsen mellem tegnene betinget under hensyntagen til værdierne af koefficienten lig med 0,3 eller mindre - indikatorer for svag nærhed af forbindelsen; værdier større end 0,4 men mindre end 0,7 er indikatorer for moderat nærhed af forbindelse, og værdier på 0,7 og mere er indikatorer for høj kommunikationsnærhed.

    Den statistiske signifikans af den opnåede koefficient vurderes ved hjælp af Students t-test. Hvis den beregnede værdi af t-kriteriet er mindre end den tabulerede værdi for et givet antal frihedsgrader, mangler den statistiske signifikans af den observerede sammenhæng. Hvis mere, så anses korrelationen for statistisk signifikant.