Korrelationer i diplomværker i psykologi. Spearmans korrelationskoefficient

En studerende-psykolog (sociolog, leder, leder osv.) er ofte interesseret i, hvordan to eller flere variable er relateret til hinanden i en eller flere studiegrupper.

I matematik bruges begrebet en funktion F til at beskrive relationerne mellem variabler, som forbinder hver specifik værdi af den uafhængige variabel X med en specifik værdi af den afhængige variabel Y. Den resulterende afhængighed betegnes som Y=F(X ).

Samtidig kan typerne af korrelationer mellem de målte træk være forskellige: For eksempel kan korrelationen være lineær og ikke-lineær, positiv og negativ. Den er lineær - hvis den ene variabel X stiger eller falder, stiger eller falder den anden variabel Y i gennemsnit også. Den er ikke-lineær, hvis, med en stigning i én værdi, arten af ​​ændringen i den anden ikke er lineær, men er beskrevet af andre love.

Korrelationen vil være positiv, hvis i gennemsnit med en stigning i variablen X, variablen Y også stiger, og hvis variablen Y i gennemsnit har en tendens til at falde med en stigning i X, så siger de, at der er en negativ korrelation. En situation er mulig, når det er umuligt at fastslå nogen afhængighed mellem variabler. I dette tilfælde siger vi, at der ikke er nogen sammenhæng.

Opgaven med korrelationsanalyse er reduceret til at etablere retningen (positiv eller negativ) og formen (lineær, ikke-lineær) af forholdet mellem forskellige funktioner, måling af dens tæthed og endelig kontrol af signifikansniveauet af den opnåede korrelation koefficienter.

Rangkorrelationskoefficienten, foreslået af K. Spearman, henviser til ikke-parametriske indikatorer for forholdet mellem variable målt på en rangskala. Ved beregning af denne koefficient kræves der ingen antagelser om arten af ​​fordelingen af ​​funktioner i den almindelige befolkning. Denne koefficient bestemmer graden af ​​tæthed af forbindelsen af ​​ordinære træk, som i dette tilfælde repræsenterer rækkerne af de sammenlignede værdier.

Spearmans rangkoefficient for lineær korrelation beregnes ved formlen:

hvor n er antallet af rangerede funktioner (indikatorer, emner);
D er forskellen mellem rækkerne i to variable for hvert emne;
D2 er summen af ​​kvadraterne af rangforskellene.

De kritiske værdier af Spearman-rangkorrelationskoefficienten er præsenteret nedenfor:

Værdien af ​​Spearmans lineære korrelationskoefficient ligger i området +1 og -1. Spearmans lineære korrelationskoefficient kan være positiv eller negativ, hvilket karakteriserer retningen af ​​forholdet mellem to træk målt på en rangskala.

Hvis modulokorrelationskoefficienten er tæt på 1, så svarer dette til et højt niveau af sammenhæng mellem variablerne. Så især, når en variabel er korreleret med sig selv, vil værdien af ​​korrelationskoefficienten være lig med +1. Et sådant forhold karakteriserer et direkte proportionalt forhold. Hvis værdierne af variablen X er arrangeret i stigende rækkefølge, og de samme værdier (nu betegnet som variablen Y) er arrangeret i faldende rækkefølge, så vil korrelationen mellem variablerne X og Y i dette tilfælde være nøjagtigt -1. Denne værdi af korrelationskoefficienten karakteriserer den omvendt proportionale afhængighed.

Korrelationskoefficientens tegn er meget vigtigt for fortolkningen af ​​det resulterende forhold. Hvis tegnet for den lineære korrelationskoefficient er plus, så er forholdet mellem de korrelerede træk sådan, at en større værdi af et træk (variabel) svarer til en større værdi af et andet træk (en anden variabel). Med andre ord, hvis en indikator (variabel) stiger, så stiger den anden indikator (variabel) tilsvarende. Dette forhold kaldes et direkte proportionalt forhold.

Hvis minustegnet opnås, svarer den større værdi af den ene attribut til den mindre værdi af den anden. Med andre ord, hvis der er et minustegn, svarer en stigning i én variabel (attribut, værdi) til et fald i en anden variabel. Dette forhold kaldes et omvendt forhold. I dette tilfælde er valget af den variabel, som karakteren (tendensen) af stigningen tilskrives, vilkårligt. Dette kan enten være X-variablen eller Y-variablen. Men hvis X-variablen anses for at stige, vil Y-variablen falde tilsvarende, og omvendt.

Overvej eksemplet med Spearmans korrelation.

Psykologen finder ud af, hvordan de individuelle indikatorer for skoleparathed opnået før skolestart for 11 1. klasseelever og deres gennemsnitlige præstation ved skoleårets afslutning hænger sammen.

For at løse dette problem rangerede vi for det første værdierne af indikatorer for skoleberedskab opnået, når de gik ind i skolen, og for det andet de endelige præstationsindikatorer i slutningen af ​​året for de samme elever i gennemsnit. Resultaterne er præsenteret i tabellen:

Vi erstatter de opnåede data i ovenstående formel, og vi beregner. Vi får:

For at finde signifikansniveauet vender vi os til tabellen "Kritiske værdier af Spearman-rangkorrelationskoefficienten", som viser de kritiske værdier for rangkorrelationskoefficienterne.

Vi bygger den tilsvarende "betydningsakse":

Den resulterende korrelationskoefficient faldt sammen med den kritiske værdi for et signifikansniveau på 1 %. Derfor kan man argumentere for, at indikatorerne for skoleparathed og slutkaraktererne for førsteg'ere er positivt korrelerede - med andre ord, jo højere indikator for skoleparathed, jo bedre lærer 1. klassetrin. I forhold til statistiske hypoteser skal psykologen forkaste nulhypotesen (H0) om lighed og acceptere alternativet (H1) af forskelle, som siger, at forholdet mellem skoleparathed og gennemsnitspræstation er ikke-nul.

Spearman korrelation. Korrelationsanalyse efter Spearman-metoden. Spearman rangerer. Spearmans korrelationskoefficient. Spearmans rang korrelation

I praksis bruges Spearmans rangkorrelationskoefficient (P) ofte til at bestemme tætheden af ​​forholdet mellem to funktioner. Værdierne for hver funktion rangeres i stigende rækkefølge (fra 1 til n), hvorefter forskellen (d) mellem rækkerne svarende til én observation bestemmes.

Eksempel #1. Forholdet mellem mængden af ​​industriel produktion og investeringer i fast kapital i 10 regioner i et af de føderale distrikter i Den Russiske Føderation i 2003 er karakteriseret ved følgende data.
Beregn Spearmans rangkorrelationskoefficienter og Kendala. Tjek deres betydning ved α=0,05. Formuler en konklusion om forholdet mellem mængden af ​​industriel produktion og investeringer i anlægsaktiver i de undersøgte regioner i Den Russiske Føderation.

Tildel rækker til træk Y og faktoren X . Find summen af ​​forskellen af ​​kvadrater d 2 .
Ved hjælp af lommeregneren beregner vi Spearmans rangkorrelationskoefficient:

x Y rang X, dx rang Y, d y (dx - dy) 2
1.3 300 1 2 1
1.8 1335 2 12 100
2.4 250 3 1 4
3.4 946 4 8 16
4.8 670 5 7 4
5.1 400 6 4 4
6.3 380 7 3 16
7.5 450 8 5 9
7.8 500 9 6 9
17.5 1582 10 16 36
18.3 1216 11 9 4
22.5 1435 12 14 4
24.9 1445 13 15 4
25.8 1820 14 19 25
28.5 1246 15 10 25
33.4 1435 16 14 4
42.4 1800 17 18 1
45 1360 18 13 25
50.4 1256 19 11 64
54.8 1700 20 17 9
364

Forholdet mellem træk Y faktor X er stærkt og direkte.

Estimering af Spearmans rangkorrelationskoefficient



Ifølge Elevens tabel finder vi Ttable.
T-tabel \u003d (18; 0,05) \u003d 1,734
Da Tobs > Ttabl afviser vi hypotesen om, at rangkorrelationskoefficienten er lig med nul. Med andre ord er Spearmans rangkorrelationskoefficient statistisk signifikant.

Intervalestimat for rangkorrelationskoefficient (konfidensinterval)
Konfidensinterval for Spearmans rangkorrelationskoefficient: p(0,5431;0,9095).

Eksempel #2. Indledende data.

5 4
3 4
1 3
3 1
6 6
2 2
Da matricen har relaterede rækker (samme rangnummer) i 1. række, vil vi omforme dem. Rangerne omdannes uden at ændre rangens betydning, det vil sige, at de tilsvarende forhold (større end, mindre end eller lig med) skal bevares mellem rangnumrene. Det anbefales heller ikke at sætte rangeringen over 1 og under værdien lig med antallet af parametre (i dette tilfælde n = 6). Reformation af rækker er lavet i tabel.
Nye rækker
1 1 1
2 2 2
3 3 3.5
4 3 3.5
5 5 5
6 6 6
Da der er bundne rækker af 2. række i matrixen, vil vi omforme dem. Reformation af rækker er lavet i tabel.
Sædenumre i bestilt rækkePlacering af faktorer efter den sagkyndiges vurderingNye rækker
1 1 1
2 2 2
3 3 3
4 4 4.5
5 4 4.5
6 6 6
Rangmatrix.
rang X, dxrang Y, d y(dx - dy) 2
5 4.5 0.25
3.5 4.5 1
1 3 4
3.5 1 6.25
6 6 0
2 2 0
21 21 11.5
Da der blandt værdierne af træk x og y er flere identiske, dvs. bundne rækker dannes, så i dette tilfælde beregnes Spearman-koefficienten som:

hvor


j - antal links i rækkefølge for feature x;
Og j er antallet af identiske rækker i det j-te bundt i x;
k - antal skiver i rækkefølge for funktion y;
I k - antallet af identiske rækker i det k-te bundt i y.
A = [(23-2)]/12 = 0,5
B = [(23-2)]/12 = 0,5
D = A + B = 0,5 + 0,5 = 1

Forholdet mellem træk Y og faktor X er moderat og direkte.

I tilfælde, hvor målingerne af de undersøgte karakteristika udføres på en ordensskala, eller formen af ​​sammenhængen adskiller sig fra en lineær, udføres undersøgelsen af ​​sammenhængen mellem to stokastiske variable ved hjælp af rangkorrelationskoefficienter. Overvej Spearmans rangkorrelationskoefficient. Når du beregner det, er det nødvendigt at rangere (ordre) prøvemulighederne. Rangordning er grupperingen af ​​eksperimentelle data i en bestemt rækkefølge, enten stigende eller faldende.

Rangeringsoperationen udføres i henhold til følgende algoritme:

1. En lavere værdi tildeles en lavere rang. Den højeste værdi tildeles en rang, der svarer til antallet af rangerede værdier. Den laveste værdi tildeles en rang, der er lig med 1. For eksempel, hvis n=7, vil den højeste værdi modtage rangnummer 7, bortset fra de tilfælde, der er angivet i den anden regel.

2. Hvis flere værdier er ens, så tildeles de en rang, som er gennemsnittet af de rangeringer, som de ville have modtaget, hvis de ikke var ens. Som et eksempel kan du overveje en stigende prøve bestående af 7 elementer: 22, 23, 25, 25, 25, 28, 30. Værdierne 22 og 23 forekommer én gang, så deres rækker er henholdsvis lig med R22=1 og R23 =2. Værdien 25 forekommer 3 gange. Hvis disse værdier ikke gentog sig, så ville deres rækker være lig med 3, 4, 5. Derfor er deres rang R25 lig med det aritmetiske middelværdi af 3, 4 og 5: . Værdierne 28 og 30 gentages ikke, så deres rækker er henholdsvis R28=6 og R30=7. Endelig har vi følgende korrespondance:

3. Det samlede antal rang skal svare til den beregnede, som bestemmes af formlen:

hvor n er det samlede antal rangordnede værdier.

Uoverensstemmelsen mellem den faktiske og den beregnede mængde af rang vil indikere en fejl i beregningen af ​​ranger eller deres summering. I dette tilfælde skal du finde og rette fejlen.

Spearmans rangkorrelationskoefficient er en metode, der giver dig mulighed for at bestemme styrken og retningen af ​​forholdet mellem to funktioner eller to funktionshierarkier. Brugen af ​​rangkorrelationskoefficienten har en række begrænsninger:

  • a) Den forventede korrelation bør være monoton.
  • b) Rumfanget af hver af prøverne skal være større end eller lig med 5. For at bestemme prøvens øvre grænse anvendes tabeller med kritiske værdier (tabel 3 i tillægget). Den maksimale værdi af n i tabellen er 40.
  • c) Under analysen er det sandsynligt, at et stort antal identiske rækker vil forekomme. I dette tilfælde skal der foretages en ændring. Det mest gunstige tilfælde er, når begge undersøgte prøver repræsenterer to sekvenser af uoverensstemmende værdier.

For at udføre en korrelationsanalyse skal forskeren have to prøver, der kan rangeres, for eksempel:

  • - to tegn målt i samme gruppe af forsøgspersoner;
  • - to individuelle trækhierarkier identificeret i to emner for det samme sæt træk;
  • - to gruppehierarkier af funktioner;
  • - individuelle og gruppehierarkier af attributter.

Vi begynder beregningen med at rangere de undersøgte indikatorer separat for hvert af tegnene.

Lad os analysere en case med to træk målt i samme gruppe af forsøgspersoner. Først rangeres de individuelle værdier i henhold til den første egenskab opnået af forskellige fag, og derefter de individuelle værdier ifølge den anden egenskab. Hvis lavere rækker af en indikator svarer til lavere rækker af en anden indikator, og højere rækker af en indikator svarer til højere rækker af en anden indikator, så er de to funktioner positivt relaterede. Hvis de højere rækker af en indikator svarer til de lavere rækker af en anden indikator, er de to tegn negativt relaterede. For at finde r'er bestemmer vi forskellene mellem rækkerne (d) for hvert emne. Jo mindre forskellen er mellem rækkerne, jo tættere vil rangkorrelationskoefficienten rs være på "+1". Hvis der ikke er nogen sammenhæng, vil der ikke være nogen overensstemmelse mellem dem, derfor vil rs være tæt på nul. Jo større forskellen er mellem forsøgspersonernes rækker i to variable, jo tættere på "-1" vil værdien af ​​koefficienten rs være. Således er Spearman rangkorrelationskoefficienten et mål for ethvert monotont forhold mellem de to karakteristika, der undersøges.

Overvej tilfældet med to individuelle trækhierarkier identificeret i to emner for det samme sæt træk. I denne situation rangeres de individuelle værdier opnået af hvert af de to emner i henhold til et bestemt sæt funktioner. Funktionen med den laveste værdi bør tildeles den første rang; attributten med en højere værdi - den anden rang osv. Man skal sørge for, at alle attributter måles i de samme enheder. For eksempel er det umuligt at rangere indikatorer, hvis de er udtrykt i punkter med forskellig "pris", da det er umuligt at bestemme, hvilken af ​​faktorerne der vil tage førstepladsen med hensyn til sværhedsgrad, indtil alle værdier er bragt til en enkelt vægt. Hvis træk, der har lav rang i et af fagene, også har lav rang i det andet, og omvendt, så hænger de enkelte hierarkier positivt sammen.

I tilfælde af to gruppehierarkier af funktioner, er de gennemsnitlige gruppeværdier opnået i to grupper af emner rangeret i henhold til det samme sæt funktioner for de undersøgte grupper. Dernæst følger vi algoritmen givet i de foregående tilfælde.

Lad os analysere sagen med individuelle og gruppehierarki af funktioner. De starter med at rangordne individets individuelle værdier og de gennemsnitlige gruppeværdier i overensstemmelse med det samme sæt funktioner, som blev opnået, med undtagelse af emnet, der ikke deltager i middelgruppehierarkiet, da hans individuelle hierarki vil blive sammenlignet med det. Rangkorrelation gør det muligt at vurdere graden af ​​sammenhæng mellem individ- og gruppehierarki af funktioner.

Lad os overveje, hvordan betydningen af ​​korrelationskoefficienten bestemmes i de ovenfor anførte tilfælde. I tilfælde af to funktioner vil det blive bestemt af stikprøvestørrelsen. I tilfælde af to individuelle trækhierarkier afhænger betydningen af ​​antallet af træk, der indgår i hierarkiet. I de sidste to tilfælde er signifikansen bestemt af antallet af undersøgte egenskaber og ikke af gruppernes størrelse. Således er betydningen af ​​rs i alle tilfælde bestemt af antallet af rangordnede værdier n.

Ved test af den statistiske signifikans af rs bruges tabeller med kritiske værdier af rangkorrelationskoefficienten, kompileret for forskellige antal rangerede værdier og forskellige signifikansniveauer. Hvis den absolutte værdi af rs når en kritisk værdi eller overskrider den, så er korrelationen signifikant.

Når man overvejer den første mulighed (et tilfælde med to træk målt i samme gruppe af forsøgspersoner), er følgende hypoteser mulige.

H0: Korrelationen mellem variablene x og y er ikke forskellig fra nul.

H1: Korrelationen mellem variablene x og y er signifikant forskellig fra nul.

Hvis vi arbejder med et af de tre resterende tilfælde, skal vi fremsætte endnu et par hypoteser:

H0: Korrelationen mellem x- og y-hierarkiet er ikke-nul.

H1: Korrelationen mellem x- og y-hierarkier er signifikant forskellig fra nul.

Rækkefølgen af ​​handlinger ved beregning af Spearman-rangkorrelationskoefficienten rs er som følger.

  • - Bestem hvilke to funktioner eller to funktionshierarkier der vil deltage i matchningen som x- og y-variable.
  • - Rangér værdierne for variablen x, og tildel rang 1 til den mindste værdi i henhold til rangordningsreglerne. Placer rækkerne i den første kolonne i tabellen i rækkefølge efter numrene på emnerne eller tegnene.
  • - Rangér værdierne af variablen y. Placer rækkerne i den anden kolonne i tabellen i rækkefølge efter numrene på emnerne eller tegnene.
  • - Beregn forskellene d mellem rækkerne x og y for hver række i tabellen. Resultaterne er placeret i den næste kolonne i tabellen.
  • - Beregn de kvadratiske forskelle (d2). Placer de opnåede værdier i den fjerde kolonne i tabellen.
  • - Beregn summen af ​​kvadraterne af forskellene? d2.
  • - Hvis de samme ranger forekommer, beregn korrektionerne:

hvor tx er volumenet af hver gruppe med lige store ranger i prøven x;

ty er størrelsen af ​​hver gruppe af lige rang i stikprøve y.

Beregn rangkorrelationskoefficienten afhængigt af tilstedeværelsen eller fraværet af identiske rækker. I mangel af identiske rækker beregnes rangkorrelationskoefficienten rs ved hjælp af formlen:

I nærværelse af de samme rækker beregnes rangkorrelationskoefficienten rs ved hjælp af formlen:

hvor?d2 er summen af ​​de kvadrerede forskelle mellem rækkerne;

Tx og Ty - korrektioner for de samme rækker;

n er antallet af emner eller funktioner, der deltog i rangeringen.

Bestem de kritiske værdier af rs fra tabel 3 i tillægget, for et givet antal emner n. En signifikant forskel fra nul af korrelationskoefficienten vil blive observeret, forudsat at rs ikke er mindre end den kritiske værdi.

Pearson korrelationskoefficient

Koefficient r- Pearson bruges til at studere forholdet mellem to metriske variable målt på samme prøve. Der er mange situationer, hvor det er hensigtsmæssigt at bruge det. Påvirker intelligens præstationer på bacheloruddannelsen? Er en medarbejders løn relateret til hans velvilje over for kolleger? Påvirker en elevs humør succesen med at løse et komplekst regneproblem? For at besvare sådanne spørgsmål skal forskeren måle to indikatorer af interesse for hvert medlem af prøven.

Værdien af ​​korrelationskoefficienten påvirkes ikke af de enheder, som funktionerne præsenteres i. Derfor ændrer enhver lineær transformation af funktioner (multiplikation med en konstant, tilføjelse af en konstant) ikke værdien af ​​korrelationskoefficienten. En undtagelse er multiplikationen af ​​et af tegnene med en negativ konstant: Korrelationskoefficienten ændrer sit fortegn til det modsatte.

Anvendelse af Spearman og Pearson-korrelationen.

Pearson-korrelationen er et mål for den lineære sammenhæng mellem to variable. Det giver dig mulighed for at bestemme, hvor proportional variabiliteten af ​​to variable er. Hvis variablerne er proportionale med hinanden, kan forholdet mellem dem grafisk repræsenteres som en ret linje med en positiv (direkte proportion) eller negativ (omvendt proportion) hældning.

I praksis er forholdet mellem to variable, hvis der er nogen, sandsynligt og ser grafisk ud som en ellipseformet spredningssky. Denne ellipsoide kan dog repræsenteres (tilnærmet) som en ret linje eller en regressionslinje. Regressionslinjen er en ret linje konstrueret ved hjælp af mindste kvadraters metode: summen af ​​de kvadrerede afstande (beregnet langs y-aksen) fra hvert punkt i spredningsplottet til linjen er minimal.

Af særlig betydning for at vurdere nøjagtigheden af ​​forudsigelsen er variansen af ​​estimater af den afhængige variabel. I det væsentlige er variansen af ​​estimater af den afhængige variabel Y den del af dens totale varians, der skyldes indflydelsen af ​​den uafhængige variabel X. Med andre ord forholdet mellem variansen af ​​estimater af den afhængige variabel og dens sande varians er lig med kvadratet af korrelationskoefficienten.

Kvadraten af ​​korrelationskoefficienten for de afhængige og uafhængige variable repræsenterer andelen af ​​variansen af ​​den afhængige variabel på grund af indflydelsen af ​​den uafhængige variabel, og kaldes bestemmelseskoefficienten. Bestemmelseskoefficienten viser derfor, i hvilket omfang variabiliteten af ​​en variabel skyldes (bestemt) af indflydelsen fra en anden variabel.

Bestemmelseskoefficienten har en vigtig fordel i forhold til korrelationskoefficienten. Korrelation er ikke en lineær funktion af forholdet mellem to variable. Derfor falder det aritmetiske gennemsnit af korrelationskoefficienterne for flere prøver ikke sammen med den korrelation, der umiddelbart er beregnet for alle forsøgspersoner fra disse prøver (dvs. korrelationskoefficienten er ikke additiv). Tværtimod afspejler bestemmelseskoefficienten sammenhængen lineært og er derfor additiv: den kan sættes i gennemsnit over flere prøver.

Yderligere information om styrken af ​​forbindelsen er givet af værdien af ​​korrelationskoefficienten kvadreret - bestemmelseskoefficienten: dette er den del af variansen af ​​en variabel, der kan forklares ved indflydelsen af ​​en anden variabel. I modsætning til korrelationskoefficienten stiger bestemmelseskoefficienten lineært med en stigning i forbindelsens styrke.

Spearmans korrelationskoefficienter og τ - Kendall ( rang-korrelationer )

Hvis begge variabler, som forholdet undersøges mellem, præsenteres på en ordinalskala, eller en af ​​dem er på en ordinalskala, og den anden er på en metrisk skala, så anvendes rangkorrelationskoefficienterne: Spearman eller τ - Kendell. Begge koefficienter kræver forudgående rangering af begge variabler for deres anvendelse.

Spearmans rangkorrelationskoefficient er en ikke-parametrisk metode, der bruges til statistisk at studere sammenhængen mellem fænomener. I dette tilfælde bestemmes den faktiske grad af parallelitet mellem de to kvantitative serier af de undersøgte træk, og et estimat af tætheden af ​​det etablerede forhold gives ved hjælp af en kvantitativt udtrykt koefficient.

Hvis medlemmerne af gruppen blev rangeret først efter x-variablen, derefter efter y-variablen, så kan korrelationen mellem x- og y-variablerne opnås ved blot at beregne Pearson-koefficienten for de to rangrækker. Forudsat at der ikke er nogen links i rækkerne (dvs. ingen gentagne rækker) for nogen af ​​variablene, kan formlen for Pearson forenkles væsentligt beregningsmæssigt og konverteres til formlen kendt som Spearman.

Styrken af ​​Spearman rangkorrelationskoefficienten er noget ringere end styrken af ​​den parametriske korrelationskoefficient.

Det er tilrådeligt at bruge rangkorrelationskoefficienten i nærværelse af et lille antal observationer. Denne metode kan bruges ikke kun til kvantificerede data, men også i tilfælde, hvor de registrerede værdier bestemmes af beskrivende træk af varierende intensitet.

Spearmans rangkorrelationskoefficient med et stort antal identiske rækker for den ene eller begge af de sammenlignede variable giver grove værdier. Ideelt set bør begge korrelerede serier være to sekvenser af uoverensstemmende værdier

Et alternativ til Spearman-korrelationen for rækker er korrelationen τ - Kendall. Korrelationen foreslået af M. Kendall er baseret på ideen om, at retningen af ​​forbindelsen kan bedømmes ved at sammenligne forsøgspersonerne i par: hvis et par af emner har en ændring i x, der falder sammen i retning med en ændring i y, så indikerer et positivt forhold, hvis det ikke passer - noget om et negativt forhold.

Korrelationskoefficienter er blevet specifikt designet til numerisk at bestemme styrken og retningen af ​​et forhold mellem to egenskaber målt på numeriske skalaer (metrisk eller rang). Som allerede nævnt svarer korrelationsværdierne +1 (strengt direkte eller direkte proportionalt forhold) og -1 (strengt omvendt eller omvendt proportionalt forhold) til den maksimale styrke af forholdet, korrelationen lig med nul svarer til fraværet af forhold. Yderligere information om styrken af ​​forbindelsen er givet af værdien af ​​bestemmelseskoefficienten: det er den del af variansen af ​​en variabel, der kan forklares ved indflydelsen af ​​en anden variabel.

9. Parametriske metoder til datasammenligning

Parametriske sammenligningsmetoder gælder, hvis dine variabler blev målt på en metrisk skala.

Sammenligning af varianser 2- x prøver ved Fishers test .


Denne metode giver dig mulighed for at teste hypotesen om, at varianserne af 2 generelle populationer, hvorfra de sammenlignede prøver er udtrukket, adskiller sig fra hinanden. Metodens begrænsninger - fordelingen af ​​funktionen i begge prøver bør ikke afvige fra normalen.

Et alternativ til at sammenligne varianser er Lieven-testen, hvor der ikke er behov for at teste for normalfordeling. Denne metode kan bruges til at teste antagelsen om lighed (homogenitet) af varianser, før man kontrollerer pålideligheden af ​​forskellen i gennemsnittet ved Students t-test for uafhængige stikprøver af forskellig størrelse.

Disciplinen "højere matematik" forårsager afvisning blandt nogle, da virkelig ikke alle er givet til at forstå det. Men de, der er heldige nok til at studere dette emne og løse problemer ved hjælp af forskellige ligninger og koefficienter, kan prale af næsten fuldstændig viden om det. I psykologisk videnskab er der ikke kun en humanitær orientering, men også visse formler og metoder til matematisk verifikation af den hypotese, der er fremsat i løbet af forskningen. Til dette anvendes forskellige koefficienter.

Spearmans korrelationskoefficient

Dette er en almindelig måling til at bestemme tætheden af ​​forholdet mellem to træk. Koefficienten kaldes også den ikke-parametriske metode. Det viser forbindelsesstatistikker. Det vil sige, at vi for eksempel ved, at hos et barn hænger aggression og irritabilitet sammen, og Spearman-rangkorrelationskoefficienten viser den statistiske matematiske sammenhæng mellem disse to træk.

Hvordan beregnes rangordningskoefficienten?

Naturligvis har alle matematiske definitioner eller størrelser deres egne formler, som de beregnes med. Den har også Spearman-korrelationskoefficienten. Dens formel er følgende:

Ved første øjekast er formlen ikke helt klar, men hvis du ser efter, er alt meget nemt at beregne:

  • n er antallet af funktioner eller indikatorer, der er rangeret.
  • d er forskellen mellem visse to rækker svarende til de specifikke to variable for hvert emne.
  • ∑d 2 er summen af ​​alle kvadrerede forskelle i funktionsrækkerne, hvis kvadrater beregnes separat for hver række.

Omfanget af den matematiske måling af forbindelse

For at anvende rangkoefficienten er det nødvendigt, at de kvantitative data for egenskaben rangeres, det vil sige, at de blev tildelt et bestemt nummer afhængigt af det sted, hvor egenskaben er placeret og på dens værdi. Det er bevist, at to rækker af tegn, udtrykt i numerisk form, er noget parallelle med hinanden. Spearmans rangkorrelationskoefficient bestemmer graden af ​​denne parallelitet, tætheden af ​​forholdet mellem funktioner.

For at en matematisk operation kan beregne og bestemme forholdet mellem funktioner ved hjælp af den angivne koefficient, skal du udføre nogle handlinger:

  1. Hver værdi af ethvert emne eller fænomen tildeles et nummer i rækkefølge - en rang. Det kan svare til værdien af ​​fænomenet i stigende og faldende rækkefølge.
  2. Dernæst sammenlignes rækkerne af værdierne af tegnene i to kvantitative serier for at bestemme forskellen mellem dem.
  3. I en separat kolonne i tabellen, for hver opnået forskel, er dens kvadrat skrevet, og resultaterne er opsummeret nedenfor.
  4. Efter disse trin anvendes en formel, hvormed Spearman-korrelationskoefficienten beregnes.

Korrelationskoefficientens egenskaber

De vigtigste egenskaber ved Spearman-koefficienten omfatter følgende:

  • Måling af værdier mellem -1 og 1.
  • Tegnet på fortolkningskoefficienten har nej.
  • Forbindelsens nærhed bestemmes af princippet: Jo højere værdi, jo tættere forbindelse.

Hvordan kontrolleres den modtagne værdi?

For at kontrollere forholdet mellem tegn skal du udføre visse handlinger:

  1. Nulhypotesen (H0), som også er den vigtigste, fremsættes, derefter formuleres en anden, alternativ til den første (H 1). Den første hypotese ville være, at Spearman-korrelationskoefficienten er 0, hvilket betyder, at der ikke vil være nogen sammenhæng. Den anden siger tværtimod, at koefficienten ikke er lig med 0, så er der en sammenhæng.
  2. Det næste trin er at finde den observerede værdi af kriteriet. Det findes ved den grundlæggende formel for Spearman-koefficienten.
  3. Dernæst findes de kritiske værdier for det givne kriterium. Dette kan kun gøres ved hjælp af en speciel tabel, som viser forskellige værdier for de givne indikatorer: signifikansniveauet (l) og tallet, der bestemmer (n).
  4. Nu skal vi sammenligne de to modtagne værdier: den etablerede observerbare såvel som den kritiske. For at gøre dette skal du bygge en kritisk region. Det er nødvendigt at tegne en lige linje, markere på den punkterne for den kritiske værdi af koefficienten med tegnet "-" og med tegnet "+". Til venstre og til højre for de kritiske værdier er de kritiske områder plottet i halvcirkler fra punkterne. I midten, ved at kombinere to værdier, er det markeret med en halvcirkel af OPG.
  5. Derefter konkluderes der om stramheden af ​​forholdet mellem de to funktioner.

Hvor er det bedste sted at bruge denne værdi?

Den allerførste videnskab, hvor denne koefficient blev aktivt brugt, var psykologi. Når alt kommer til alt, er dette en videnskab, der ikke er baseret på tal, men for at bevise vigtige hypoteser om udvikling af relationer, karaktertræk hos mennesker, elevernes viden, statistisk bekræftelse af konklusionerne er påkrævet. Det bruges også i økonomien, især i valutatransaktioner. Her vurderes funktioner uden statistik. Spearmans rangkorrelationskoefficient er meget praktisk i dette anvendelsesområde, idet vurderingen foretages uafhængigt af fordelingen af ​​variabler, da de erstattes af et rangnummer. Spearman-koefficienten bruges aktivt i bankvirksomhed. Sociologi, statskundskab, demografi og andre videnskaber bruger det også i deres forskning. Resultater opnås hurtigt og så præcist som muligt.

Bekvemt og hurtigt brugt Spearmans korrelationskoefficient i Excel. Her er der specielle funktioner, som hjælper dig med hurtigt at få de nødvendige værdier.

Hvilke andre korrelationskoefficienter findes der?

Ud over det, vi lærte om Spearman-korrelationskoefficienten, er der også forskellige korrelationskoefficienter, der giver dig mulighed for at måle, evaluere kvalitative træk, forholdet mellem kvantitative træk, tætheden af ​​forholdet mellem dem, præsenteret i en rangskala. Disse er sådanne koefficienter som bis-seriel, rang-bis-seriel, indhold, associationer og så videre. Spearman-koefficienten viser tætheden af ​​forbindelsen meget nøjagtigt, i modsætning til alle andre metoder til dens matematiske bestemmelse.