Correlaties in diplomawerken in de psychologie. Spearman's correlatiecoëfficiënt

Een studentenpsycholoog (socioloog, manager, manager, etc.) is vaak geïnteresseerd in hoe twee of meer variabelen met elkaar samenhangen in een of meer studiegroepen.

Om de relaties tussen variabelen te beschrijven, wordt in de wiskunde het concept van een functie F gebruikt, die elke specifieke waarde van de onafhankelijke variabele X associeert met een specifieke waarde van de afhankelijke variabele Y. De resulterende afhankelijkheid wordt aangegeven als Y=F(X). ).

Tegelijkertijd kunnen de soorten correlaties tussen de gemeten kenmerken verschillend zijn: de correlatie kan bijvoorbeeld lineair en niet-lineair, positief en negatief zijn. Het is lineair: als bij een toename of afname van één variabele X, de tweede variabele Y gemiddeld ook toeneemt of afneemt. Het is niet-lineair als, bij een toename van één waarde, de aard van de verandering in de tweede waarde niet lineair is, maar wordt beschreven door andere wetten.

De correlatie zal positief zijn als, gemiddeld, met een toename van de variabele X, de variabele Y ook toeneemt, en als de variabele Y gemiddeld de neiging heeft af te nemen met een toename van X, dan zeggen ze dat er een negatief effect is. correlatie. Er is een situatie mogelijk waarin het onmogelijk is om enige afhankelijkheid tussen variabelen vast te stellen. In dit geval zeggen we dat er geen correlatie is.

De taak van de correlatieanalyse wordt beperkt tot het vaststellen van de richting (positief of negatief) en de vorm (lineair, niet-lineair) van de relatie tussen verschillende kenmerken, het meten van de nauwkeurigheid ervan en, ten slotte, het controleren van het significantieniveau van de verkregen correlatiecoëfficiënten. .

De rangcorrelatiecoëfficiënt, voorgesteld door K. Spearman, verwijst naar niet-parametrische indicatoren van de relatie tussen variabelen gemeten op een rangschaal. Bij het berekenen van deze coëfficiënt zijn geen aannames vereist over de aard van de verdeling van kenmerken in de algemene bevolking. Deze coëfficiënt bepaalt de mate van dichtheid van de verbinding van ordinale kenmerken, die in dit geval de rangen van de vergeleken waarden vertegenwoordigen.

De rangschikkingscoëfficiënt van lineaire correlatie van Spearman wordt berekend met de formule:

waarbij n het aantal gerangschikte kenmerken is (indicatoren, onderwerpen);
D is het verschil tussen de rangschikkingen in twee variabelen voor elk onderwerp;
D2 is de som van de kwadraten van de rangverschillen.

De kritische waarden van de Spearman-rangcorrelatiecoëfficiënt worden hieronder weergegeven:

De waarde van de lineaire correlatiecoëfficiënt van Spearman ligt in het bereik van +1 en -1. De lineaire correlatiecoëfficiënt van Spearman kan positief of negatief zijn en karakteriseert de richting van de relatie tussen twee kenmerken gemeten op een rangschaal.

Als de modulocorrelatiecoëfficiënt dichtbij 1 ligt, komt dit overeen met een hoog niveau van relatie tussen de variabelen. Dus, in het bijzonder, wanneer een variabele met zichzelf gecorreleerd is, zal de waarde van de correlatiecoëfficiënt gelijk zijn aan +1. Een dergelijke relatie kenmerkt een direct proportionele relatie. Als de waarden van de variabele X in oplopende volgorde zijn gerangschikt, en dezelfde waarden (nu aangeduid als de variabele Y) in aflopende volgorde zijn gerangschikt, dan zal in dit geval de correlatie tussen de variabelen X en Y precies zijn -1. Deze waarde van de correlatiecoëfficiënt karakteriseert de omgekeerd evenredige afhankelijkheid.

Het teken van de correlatiecoëfficiënt is erg belangrijk voor het interpreteren van de resulterende relatie. Als het teken van de lineaire correlatiecoëfficiënt plus is, dan is de relatie tussen de gecorreleerde kenmerken zodanig dat een grotere waarde van één kenmerk (variabele) overeenkomt met een grotere waarde van een ander kenmerk (een andere variabele). Met andere woorden: als de ene indicator (variabele) toeneemt, neemt de andere indicator (variabele) dienovereenkomstig toe. Deze relatie wordt een direct proportionele relatie genoemd.

Als het minteken wordt verkregen, komt de grotere waarde van het ene attribuut overeen met de kleinere waarde van het andere. Met andere woorden: als er een minteken staat, komt een toename van één variabele (attribuut, waarde) overeen met een afname van een andere variabele. Deze relatie wordt een omgekeerde relatie genoemd. In dit geval is de keuze van de variabele waaraan het karakter (de trend) van de stijging wordt toegeschreven willekeurig. Dit kan de variabele X zijn of de variabele Y. Als echter wordt aangenomen dat de variabele X toeneemt, zal de variabele Y dienovereenkomstig afnemen, en omgekeerd.

Beschouw het voorbeeld van de correlatie van Spearman.

De psycholoog ontdekt hoe de individuele indicatoren van schoolbereidheid verkregen vóór de start van school voor 11 eerste-klassers en hun gemiddelde prestaties aan het einde van het schooljaar met elkaar verbonden zijn.

Om dit probleem op te lossen, hebben we in de eerste plaats de waarden gerangschikt van indicatoren van schoolbereidheid die zijn verkregen bij het naar school gaan, en ten tweede de uiteindelijke prestatie-indicatoren aan het einde van het jaar voor gemiddeld dezelfde studenten. De resultaten worden weergegeven in de tabel:

We vervangen de verkregen gegevens in de bovenstaande formule en berekenen. We krijgen:

Om het significantieniveau te vinden, wenden we ons tot de tabel "Kritische waarden van de rangcorrelatiecoëfficiënt van Spearman", die de kritische waarden voor de rangcorrelatiecoëfficiënten toont.

We bouwen de overeenkomstige "as van betekenis":

De resulterende correlatiecoëfficiënt viel samen met de kritische waarde voor een significantieniveau van 1%. Daarom kan worden gesteld dat de indicatoren van schoolbereidheid en de eindcijfers van eerste klassers positief gecorreleerd zijn - met andere woorden: hoe hoger de indicator van schoolbereidheid, hoe beter de eerste klasser leert. In termen van statistische hypothesen moet de psycholoog de nulhypothese (H0) van gelijkenis verwerpen en het alternatief (H1) van verschillen aanvaarden, die zegt dat de relatie tussen schoolbereidheid en gemiddelde prestaties niet nul is.

Spearman-correlatie. Correlatieanalyse volgens de Spearman-methode. Spearman-rangen. Spearman's correlatiecoëfficiënt. Spearman's rangcorrelatie

In de praktijk wordt de rangcorrelatiecoëfficiënt (P) van Spearman vaak gebruikt om de nauwheid van de relatie tussen twee kenmerken te bepalen. De waarden van elk kenmerk worden gerangschikt in oplopende volgorde (van 1 tot n), waarna het verschil (d) tussen de rangen die overeenkomen met één waarneming wordt bepaald.

Voorbeeld 1. De relatie tussen het volume van de industriële productie en investeringen in vaste activa in 10 regio's van een van de federale districten van de Russische Federatie in 2003 wordt gekenmerkt door de volgende gegevens.
Berekenen Spearman's rangcorrelatiecoëfficiënten en Kendala. Controleer hun significantie bij α=0,05. Formuleer een conclusie over de relatie tussen het volume van de industriële productie en investeringen in vaste activa in de beschouwde regio's van de Russische Federatie.

Ken rangen toe aan het kenmerk Y en de factor X. Bereken de som van het verschil in vierkanten d 2 .
Met behulp van de rekenmachine berekenen we de rangcorrelatiecoëfficiënt van Spearman:

X Y rang X, dx rang Y, d y (dx - dy) 2
1.3 300 1 2 1
1.8 1335 2 12 100
2.4 250 3 1 4
3.4 946 4 8 16
4.8 670 5 7 4
5.1 400 6 4 4
6.3 380 7 3 16
7.5 450 8 5 9
7.8 500 9 6 9
17.5 1582 10 16 36
18.3 1216 11 9 4
22.5 1435 12 14 4
24.9 1445 13 15 4
25.8 1820 14 19 25
28.5 1246 15 10 25
33.4 1435 16 14 4
42.4 1800 17 18 1
45 1360 18 13 25
50.4 1256 19 11 64
54.8 1700 20 17 9
364

De relatie tussen kenmerk Y-factor X is sterk en direct.

Schatting van de rangcorrelatiecoëfficiënt van Spearman



Volgens de studententabel vinden we Ttable.
T-tabel \u003d (18; 0,05) \u003d 1,734
Omdat Tobs > Ttabl verwerpen we de hypothese dat de rangcorrelatiecoëfficiënt gelijk is aan nul. Met andere woorden: de rangcorrelatiecoëfficiënt van Spearman is statistisch significant.

Intervalschatting voor rangcorrelatiecoëfficiënt (betrouwbaarheidsinterval)
Betrouwbaarheidsinterval voor de rangcorrelatiecoëfficiënt van Spearman: p(0,5431;0,9095).

Voorbeeld #2. Initiële data.

5 4
3 4
1 3
3 1
6 6
2 2
Omdat de matrix gerelateerde rangen (hetzelfde rangnummer) van de eerste rij heeft, zullen we deze opnieuw vormgeven. De rangen worden opnieuw gevormd zonder het belang van de rang te veranderen, dat wil zeggen dat de overeenkomstige verhoudingen (groter dan, kleiner dan of gelijk aan) tussen de rangnummers behouden moeten blijven. Het wordt ook niet aanbevolen om de rangorde boven 1 en onder de waarde gelijk aan het aantal parameters in te stellen (in dit geval n = 6). De reformatie van de rangen vindt plaats in de tabel.
Nieuwe rangen
1 1 1
2 2 2
3 3 3.5
4 3 3.5
5 5 5
6 6 6
Omdat er gebonden rijen van de tweede rij in de matrix zijn, zullen we deze opnieuw vormgeven. De reformatie van de rangen vindt plaats in de tabel.
Stoelnummers in geordende rijLocatie van factoren volgens het oordeel van de deskundigeNieuwe rangen
1 1 1
2 2 2
3 3 3
4 4 4.5
5 4 4.5
6 6 6
Rangsmatrix.
rang X, dxrang Y, d y(dx - dy) 2
5 4.5 0.25
3.5 4.5 1
1 3 4
3.5 1 6.25
6 6 0
2 2 0
21 21 11.5
Omdat er onder de waarden van de kenmerken x en y verschillende identieke zijn, d.w.z. Er worden gebonden rangen gevormd, waarna in dit geval de Spearman-coëfficiënt als volgt wordt berekend:

Waar


j - aantal links in volgorde voor kenmerk x;
En j is het aantal identieke rangen in de j-de bundel in x;
k - aantal schijven volgens kenmerk y;
In k - het aantal identieke rangen in de k-de bundel in y.
EEN = [(2 3 -2)]/12 = 0,5
B = [(2 3 -2)]/12 = 0,5
D = EEN + B = 0,5 + 0,5 = 1

De relatie tussen kenmerk Y en factor X is gematigd en direct.

In gevallen waarin de metingen van de bestudeerde kenmerken worden uitgevoerd op een ordeschaal, of de vorm van de relatie verschilt van een lineaire, wordt de studie van de relatie tussen twee willekeurige variabelen uitgevoerd met behulp van rangcorrelatiecoëfficiënten. Beschouw de rangcorrelatiecoëfficiënt van Spearman. Bij de berekening ervan is het noodzakelijk om de voorbeeldopties te rangschikken (ordenen). Ranking is het groeperen van experimentele gegevens in een bepaalde volgorde, oplopend of aflopend.

De rangschikkingsbewerking wordt uitgevoerd volgens het volgende algoritme:

1. Een lagere waarde krijgt een lagere rang toegewezen. Aan de hoogste waarde wordt een rang toegewezen die overeenkomt met het aantal gerangschikte waarden. Aan de laagste waarde wordt rangnummer 1 toegekend. Als n=7 bijvoorbeeld, krijgt de hoogste waarde rangnummer 7, behalve in de gevallen waarin de tweede regel voorziet.

2. Als meerdere waarden gelijk zijn, krijgen ze een rang toegewezen, wat het gemiddelde is van die rangen die ze zouden hebben ontvangen als ze niet gelijk waren. Beschouw als voorbeeld een oplopende steekproef bestaande uit 7 elementen: 22, 23, 25, 25, 25, 28, 30. De waarden 22 en 23 komen één keer voor, dus hun rangorde is respectievelijk gelijk aan R22=1, en R23=2. De waarde 25 komt 3 keer voor. Als deze waarden zich niet zouden herhalen, zouden hun rangschikkingen gelijk zijn aan 3, 4, 5. Daarom is hun rangorde R25 gelijk aan het rekenkundig gemiddelde van 3, 4 en 5: . De waarden 28 en 30 herhalen zich niet, dus hun rangorde is respectievelijk R28=6 en R30=7. Tenslotte hebben wij de volgende correspondentie:

3. Het totale aantal rangen moet overeenkomen met het berekende aantal, dat wordt bepaald door de formule:

waarbij n het totale aantal gerangschikte waarden is.

De discrepantie tussen de werkelijke en de berekende aantallen rangen zal duiden op een fout die is gemaakt bij de berekening van de rangen of de optelling ervan. In dit geval moet u de fout opsporen en oplossen.

De rangcorrelatiecoëfficiënt van Spearman is een methode waarmee u de sterkte en richting van de relatie tussen twee kenmerken of twee kenmerkhiërarchieën kunt bepalen. Het gebruik van de rangcorrelatiecoëfficiënt heeft een aantal beperkingen:

  • a) De verwachte correlatie moet monotoon zijn.
  • b) Het volume van elk van de monsters moet groter zijn dan of gelijk zijn aan 5. Om de bovengrens van het monster te bepalen, worden tabellen met kritische waarden gebruikt (tabel 3 van de bijlage). De maximale waarde van n in de tabel is 40.
  • c) Tijdens de analyse is het waarschijnlijk dat een groot aantal identieke rangen zal voorkomen. In dit geval moet er een wijziging worden doorgevoerd. Het gunstigste geval is wanneer beide bestudeerde monsters twee reeksen niet-overeenkomende waarden vertegenwoordigen.

Om een ​​correlatieanalyse uit te voeren, moet de onderzoeker twee steekproeven hebben die kunnen worden gerangschikt, bijvoorbeeld:

  • - twee tekens gemeten bij dezelfde groep proefpersonen;
  • - twee individuele kenmerkenhiërarchieën geïdentificeerd in twee onderwerpen voor dezelfde reeks kenmerken;
  • - twee groepshiërarchieën van attributen;
  • - individuele en groepshiërarchieën van tekens.

We beginnen de berekening met het afzonderlijk rangschikken van de bestudeerde indicatoren voor elk van de tekens.

Laten we een geval analyseren met twee kenmerken gemeten in dezelfde groep proefpersonen. Eerst worden de individuele waarden gerangschikt op basis van het eerste attribuut dat door verschillende onderwerpen is verkregen, en vervolgens de individuele waarden op basis van het tweede attribuut. Als lagere rangen van één indicator overeenkomen met lagere rangen van een andere indicator, en hogere rangen van één indicator corresponderen met hogere rangen van een andere indicator, dan zijn de twee kenmerken positief gerelateerd. Als de hogere rangen van de ene indicator overeenkomen met de lagere rangen van een andere indicator, zijn de twee tekens negatief gerelateerd. Om rs te vinden, bepalen we de verschillen tussen de rangen (d) voor elk onderwerp. Hoe kleiner het verschil tussen de rangen, hoe dichter de rangcorrelatiecoëfficiënt rs bij "+1" zal liggen. Als er geen relatie is, zal er geen correspondentie tussen beide zijn, en daarom zal rs bijna nul zijn. Hoe groter het verschil tussen de rangen van de onderwerpen in twee variabelen, hoe dichter bij "-1" de waarde van de coëfficiënt rs zal liggen. De Spearman-rangcorrelatiecoëfficiënt is dus een maatstaf voor elke monotone relatie tussen de twee onderzochte kenmerken.

Beschouw het geval met twee individuele kenmerkhiërarchieën geïdentificeerd in twee onderwerpen voor dezelfde reeks kenmerken. In deze situatie worden de individuele waarden die door elk van de twee onderwerpen zijn verkregen volgens een bepaalde reeks kenmerken gerangschikt. Het kenmerk met de laagste waarde moet de eerste rang krijgen; het attribuut met een hogere waarde - de tweede rang, enz. Er moet voor worden gezorgd dat alle attributen in dezelfde eenheden worden gemeten. Het is bijvoorbeeld onmogelijk om indicatoren te rangschikken als ze worden uitgedrukt in verschillende "prijs" -punten, omdat het onmogelijk is om te bepalen welke van de factoren qua ernst de eerste plaats zal innemen totdat alle waarden op één schaal zijn gebracht. Als kenmerken die een lage rangorde hebben in het ene onderwerp, ook een lage rangorde hebben in het andere, en vice versa, dan zijn de individuele hiërarchieën positief met elkaar verbonden.

In het geval van twee groepshiërarchieën van kenmerken worden de gemiddelde groepswaarden verkregen in twee groepen onderwerpen gerangschikt volgens dezelfde reeks kenmerken voor de bestudeerde groepen. Vervolgens volgen we het algoritme dat in de voorgaande gevallen is gegeven.

Laten we het geval analyseren met individuele en groepshiërarchie van kenmerken. Ze beginnen met het afzonderlijk rangschikken van de individuele waarden van het subject en de gemiddelde groepswaarden volgens dezelfde reeks kenmerken die werden verkregen, met uitzondering van het subject dat niet deelneemt aan de gemiddelde groepshiërarchie, aangezien zijn individu hiërarchie zal ermee vergeleken worden. Rangcorrelatie maakt het mogelijk om de mate van consistentie tussen de individuele en groepshiërarchie van kenmerken te beoordelen.

Laten we eens kijken hoe de significantie van de correlatiecoëfficiënt wordt bepaald in de hierboven genoemde gevallen. In het geval van twee kenmerken wordt dit bepaald door de steekproefomvang. In het geval van twee afzonderlijke kenmerkhiërarchieën hangt de betekenis af van het aantal kenmerken dat in de hiërarchie is opgenomen. In de laatste twee gevallen wordt de significantie bepaald door het aantal onderzochte kenmerken, en niet door de grootte van de groepen. De betekenis van rs wordt dus in alle gevallen bepaald door het aantal gerangschikte waarden n.

Bij het testen van de statistische significantie van rs worden tabellen met kritische waarden van de rangcorrelatiecoëfficiënt gebruikt, samengesteld voor verschillende aantallen gerangschikte waarden en verschillende significantieniveaus. Als de absolute waarde van rs een kritische waarde bereikt of overschrijdt, is de correlatie significant.

Bij het overwegen van de eerste optie (een geval met twee kenmerken gemeten in dezelfde groep proefpersonen), zijn de volgende hypothesen mogelijk.

H0: De correlatie tussen variabelen x en y verschilt niet van nul.

H1: De correlatie tussen de variabelen x en y verschilt significant van nul.

Als we met een van de drie resterende gevallen werken, moeten we nog een paar hypothesen naar voren brengen:

H0: De correlatie tussen de x- en y-hiërarchieën is niet nul.

H1: De correlatie tussen x- en y-hiërarchieën verschilt aanzienlijk van nul.

De volgorde van acties bij het berekenen van de Spearman-rangcorrelatiecoëfficiënt rs is als volgt.

  • - Bepaal welke twee features of twee featurehiërarchieën zullen deelnemen aan de matching als x- en y-variabelen.
  • - Rangschik de waarden van de variabele x, waarbij rang 1 wordt toegewezen aan de kleinste waarde, volgens de rangschikkingsregels. Plaats de rangen in de eerste kolom van de tabel in volgorde van de nummers van de onderwerpen of tekens.
  • - Rangschik de waarden van de variabele y. Plaats de rangen in de tweede kolom van de tabel in volgorde van de nummers van de onderwerpen of tekens.
  • - Bereken de verschillen d tussen de rangen x en y voor elke rij van de tabel. De resultaten worden in de volgende kolom van de tabel geplaatst.
  • - Bereken de gekwadrateerde verschillen (d2). Plaats de verkregen waarden in de vierde kolom van de tabel.
  • - Bereken de som van de kwadraten van de verschillen? d2.
  • - Als dezelfde rangen voorkomen, bereken dan de correcties:

waarbij tx het volume is van elke groep met gelijke rangen in monster x;

ty is de grootte van elke groep met gelijke rangen in steekproef y.

Bereken de rangcorrelatiecoëfficiënt afhankelijk van de aan- of afwezigheid van identieke rangen. Als er geen identieke rangen zijn, wordt de rangcorrelatiecoëfficiënt rs berekend met behulp van de formule:

In aanwezigheid van dezelfde rangen wordt de rangcorrelatiecoëfficiënt rs berekend met behulp van de formule:

waarbij?d2 de som is van de kwadratische verschillen tussen de rangen;

Tx en Ty - correcties voor dezelfde rangen;

n is het aantal onderwerpen of kenmerken dat heeft deelgenomen aan de ranglijst.

Bepaal de kritische waarden van rs uit tabel 3 van de bijlage, voor een bepaald aantal onderwerpen n. Er zal een significant verschil ten opzichte van nul van de correlatiecoëfficiënt worden waargenomen, op voorwaarde dat rs niet kleiner is dan de kritische waarde.

Pearson-correlatiecoëfficiënt

Coëfficiënt R- Pearson wordt gebruikt om de relatie te bestuderen tussen twee metrische variabelen gemeten op hetzelfde monster. Er zijn veel situaties waarin het passend is om het te gebruiken. Heeft intelligentie invloed op de prestaties van studenten? Is het salaris van een werknemer gerelateerd aan zijn welwillendheid jegens collega’s? Heeft de stemming van een leerling invloed op het succes van het oplossen van een complex rekenkundig probleem? Om dergelijke vragen te beantwoorden, moet de onderzoeker twee indicatoren meten die van belang zijn voor elk lid van de steekproef.

De waarde van de correlatiecoëfficiënt wordt niet beïnvloed door de eenheden waarin de kenmerken worden gepresenteerd. Daarom veranderen eventuele lineaire transformaties van kenmerken (vermenigvuldigen met een constante, optellen van een constante) de waarde van de correlatiecoëfficiënt niet. Een uitzondering is de vermenigvuldiging van een van de tekens met een negatieve constante: de correlatiecoëfficiënt verandert van teken naar het tegenovergestelde.

Toepassing van de Spearman- en Pearson-correlatie.

De Pearson-correlatie is een maatstaf voor de lineaire relatie tussen twee variabelen. Hiermee kunt u bepalen hoe proportioneel de variabiliteit van twee variabelen is. Als de variabelen evenredig aan elkaar zijn, kan de relatie daartussen grafisch worden weergegeven als een rechte lijn met een positieve (directe proportionele) of negatieve (inverse proportionele) helling.

In de praktijk is de relatie tussen twee variabelen, indien aanwezig, probabilistisch en ziet deze er grafisch uit als een ellipsvormige verstrooiingswolk. Deze ellipsoïde kan echter worden weergegeven (bij benadering) als een rechte lijn of als een regressielijn. De regressielijn is een rechte lijn die is geconstrueerd met behulp van de kleinste kwadratenmethode: de som van de kwadratische afstanden (berekend langs de y-as) vanaf elk punt van het spreidingsdiagram tot de lijn is minimaal.

Van bijzonder belang voor het beoordelen van de nauwkeurigheid van de voorspelling is de variantie van de schattingen van de afhankelijke variabele. In essentie is de variantie van schattingen van de afhankelijke variabele Y dat deel van de totale variantie dat te wijten is aan de invloed van de onafhankelijke variabele X. Met andere woorden, de verhouding tussen de variantie van schattingen van de afhankelijke variabele en zijn werkelijke variantie. is gelijk aan het kwadraat van de correlatiecoëfficiënt.

Het kwadraat van de correlatiecoëfficiënt van de afhankelijke en onafhankelijke variabelen vertegenwoordigt het deel van de variantie van de afhankelijke variabele als gevolg van de invloed van de onafhankelijke variabele, en wordt de determinatiecoëfficiënt genoemd. De determinatiecoëfficiënt geeft dus aan in hoeverre de variabiliteit van de ene variabele het gevolg is (bepaald) van de invloed van een andere variabele.

De determinatiecoëfficiënt heeft een belangrijk voordeel ten opzichte van de correlatiecoëfficiënt. Correlatie is geen lineaire functie van de relatie tussen twee variabelen. Daarom valt het rekenkundig gemiddelde van de correlatiecoëfficiënten voor verschillende steekproeven niet samen met de correlatie die onmiddellijk wordt berekend voor alle proefpersonen uit deze steekproeven (d.w.z. de correlatiecoëfficiënt is niet additief). Integendeel, de determinatiecoëfficiënt weerspiegelt de relatie lineair en is daarom additief: deze kan over meerdere monsters worden gemiddeld.

Aanvullende informatie over de sterkte van het verband wordt gegeven door de waarde van de correlatiecoëfficiënt in het kwadraat – de determinatiecoëfficiënt: dit is het deel van de variantie van de ene variabele dat kan worden verklaard door de invloed van een andere variabele. In tegenstelling tot de correlatiecoëfficiënt neemt de determinatiecoëfficiënt lineair toe met een toename van de sterkte van de verbinding.

Spearman's correlatiecoëfficiënten en τ - Kendal ( rangcorrelaties )

Als beide variabelen waartussen de relatie wordt bestudeerd op een ordinale schaal worden gepresenteerd, of een ervan op een ordinale schaal en de andere op een metrische schaal, dan worden de rangcorrelatiecoëfficiënten toegepast: Spearman of τ - Kendell. Beide coëfficiënten vereisen een voorafgaande rangschikking van beide variabelen voor hun toepassing.

De rangcorrelatiecoëfficiënt van Spearman is een niet-parametrische methode die wordt gebruikt om de relatie tussen verschijnselen statistisch te bestuderen. In dit geval wordt de werkelijke mate van parallellisme tussen de twee kwantitatieve reeksen van de bestudeerde kenmerken bepaald en wordt de strakheid van de vastgestelde relatie geschat met behulp van een kwantitatief uitgedrukte coëfficiënt.

Als de leden van de groep eerst werden gerangschikt op basis van de x-variabele en vervolgens op basis van de y-variabele, dan kan de correlatie tussen de x- en y-variabelen worden verkregen door eenvoudigweg de Pearson-coëfficiënt voor de twee rangreeksen te berekenen. Op voorwaarde dat er geen links in de rangen zijn (dat wil zeggen, geen herhaalde rangen) voor beide variabelen, kan de formule voor Pearson computationeel aanzienlijk worden vereenvoudigd en omgezet in de formule die bekend staat als Spearman.

De kracht van de Spearman-rangcorrelatiecoëfficiënt is enigszins lager dan de kracht van de parametrische correlatiecoëfficiënt.

Het is raadzaam om de rangcorrelatiecoëfficiënt te gebruiken als er sprake is van een klein aantal waarnemingen. Deze methode kan niet alleen worden gebruikt voor gekwantificeerde gegevens, maar ook in gevallen waarin de geregistreerde waarden worden bepaald door beschrijvende kenmerken van verschillende intensiteit.

De rangcorrelatiecoëfficiënt van Spearman met een groot aantal identieke rangen voor een of beide vergeleken variabelen levert grovere waarden op. Idealiter zouden beide gecorreleerde reeksen twee reeksen van niet-overeenkomende waarden moeten zijn

Een alternatief voor de Spearman-correlatie voor rangen is de correlatie τ - Kendal. De door M. Kendall voorgestelde correlatie is gebaseerd op het idee dat de richting van het verband kan worden beoordeeld door de proefpersonen in paren te vergelijken: als een paar proefpersonen een verandering in x heeft die in richting samenvalt met een verandering in y, dan is dit duidt op een positieve relatie, als deze niet overeenkomt - iets over een negatieve relatie.

Correlatiecoëfficiënten zijn specifiek ontworpen om numeriek de sterkte en richting te bepalen van een relatie tussen twee eigenschappen gemeten op numerieke schalen (metrisch of rang). Zoals reeds vermeld komen de correlatiewaarden +1 (strikte directe of direct proportionele relatie) en -1 (strikte omgekeerde of omgekeerd proportionele relatie) overeen met de maximale sterkte van de relatie, de correlatie gelijk aan nul komt overeen met de afwezigheid van de relatie. Aanvullende informatie over de sterkte van het verband wordt geleverd door de waarde van de determinatiecoëfficiënt: dit is het deel van de variantie van de ene variabele dat kan worden verklaard door de invloed van een andere variabele.

9. Parametrische methoden voor gegevensvergelijking

Parametrische vergelijkingsmethoden zijn van toepassing als uw variabelen op een metrische schaal zijn gemeten.

Vergelijking van varianties 2- x monsters volgens Fisher's test .


Met deze methode kunt u de hypothese testen dat de varianties van twee algemene populaties waaruit de vergeleken steekproeven zijn gehaald, van elkaar verschillen. Beperkingen van de methode - de verdeling van het kenmerk in beide steekproeven mag niet afwijken van normaal.

Een alternatief voor het vergelijken van varianties is de Lieven-test, waarbij niet hoeft te worden getest op normale verdeling. Deze methode kan worden gebruikt om de aanname van gelijkheid (homogeniteit) van varianties te testen voordat de betrouwbaarheid van het verschil in de gemiddelden wordt gecontroleerd met de Student's t-test voor onafhankelijke steekproeven van verschillende groottes.

De discipline 'hogere wiskunde' veroorzaakt bij sommigen afwijzing, omdat niet iedereen het kan begrijpen. Maar degenen die het geluk hebben dit onderwerp te bestuderen en problemen op te lossen met behulp van verschillende vergelijkingen en coëfficiënten, kunnen bogen op een bijna volledige kennis ervan. In de psychologische wetenschap bestaat niet alleen een humanitaire oriëntatie, maar ook bepaalde formules en methoden voor de wiskundige verificatie van de hypothese die in de loop van het onderzoek naar voren wordt gebracht. Hiervoor worden verschillende coëfficiënten toegepast.

Spearman's correlatiecoëfficiënt

Dit is een gebruikelijke meting om de nauwheid van de relatie tussen twee kenmerken te bepalen. De coëfficiënt wordt ook wel de niet-parametrische methode genoemd. Het toont verbindingsstatistieken. Dat wil zeggen, we weten bijvoorbeeld dat bij een kind agressie en prikkelbaarheid met elkaar verband houden, en de Spearman-rangcorrelatiecoëfficiënt toont de statistische wiskundige relatie tussen deze twee kenmerken.

Hoe wordt de rangschikkingscoëfficiënt berekend?

Uiteraard hebben alle wiskundige definities of grootheden hun eigen formules waarmee ze worden berekend. Het heeft ook de Spearman-correlatiecoëfficiënt. De formule is de volgende:

Op het eerste gezicht is de formule niet helemaal duidelijk, maar als je kijkt, is alles heel eenvoudig te berekenen:

  • n is het aantal kenmerken of indicatoren dat is gerangschikt.
  • d is het verschil tussen bepaalde twee rangen die overeenkomen met de specifieke twee variabelen van elk onderwerp.
  • ∑d 2 is de som van alle gekwadrateerde verschillen van de kenmerkrangen, waarvan de kwadraten voor elke rang afzonderlijk worden berekend.

Reikwijdte van de wiskundige verbindingsmaatstaf

Om de rangschikkingscoëfficiënt toe te passen, is het noodzakelijk dat de kwantitatieve gegevens van het kenmerk worden gerangschikt, dat wil zeggen dat ze een bepaald nummer krijgen, afhankelijk van de plaats waar het kenmerk zich bevindt en van de waarde ervan. Het is bewezen dat twee rijen tekens, uitgedrukt in numerieke vorm, enigszins evenwijdig aan elkaar zijn. De rangcorrelatiecoëfficiënt van Spearman bepaalt de mate van dit parallellisme, de nauwheid van de relatie tussen kenmerken.

Voor een wiskundige bewerking om de relatie tussen objecten te berekenen en te bepalen met behulp van de opgegeven coëfficiënt, moet u een aantal acties uitvoeren:

  1. Aan elke waarde van elk onderwerp of fenomeen wordt een nummer toegewezen: een rangorde. Het kan overeenkomen met de waarde van het fenomeen in oplopende en aflopende volgorde.
  2. Vervolgens worden de rangen van de waarden van de tekens van twee kwantitatieve reeksen vergeleken om het verschil daartussen te bepalen.
  3. In een aparte kolom van de tabel wordt voor elk verkregen verschil het kwadraat geschreven, en de resultaten worden hieronder samengevat.
  4. Na deze stappen wordt een formule toegepast waarmee de Spearman-correlatiecoëfficiënt wordt berekend.

Eigenschappen van de correlatiecoëfficiënt

De belangrijkste eigenschappen van de Spearman-coëfficiënt zijn onder meer:

  • Meetwaarden tussen -1 en 1.
  • Het teken van de interpretatiecoëfficiënt heeft nee.
  • De nauwheid van de verbinding wordt bepaald door het principe: hoe hoger de waarde, hoe nauwer de verbinding.

Hoe de ontvangen waarde controleren?

Om de relatie tussen tekens te controleren, moet u bepaalde acties uitvoeren:

  1. De nulhypothese (H0), die tevens de hoofdhypothese is, wordt naar voren gebracht, waarna een andere wordt geformuleerd, als alternatief voor de eerste (H 1). De eerste hypothese zou zijn dat de Spearman-correlatiecoëfficiënt 0 is, wat betekent dat er geen verband zal zijn. De tweede zegt daarentegen dat de coëfficiënt niet gelijk is aan 0, dan is er een verband.
  2. De volgende stap is het vinden van de waargenomen waarde van het criterium. Het wordt gevonden door de basisformule van de Spearman-coëfficiënt.
  3. Vervolgens worden de kritische waarden van het gegeven criterium gevonden. Dit kan alleen worden gedaan met behulp van een speciale tabel, die verschillende waarden weergeeft voor de gegeven indicatoren: het significantieniveau (l) en het getal dat bepaalt (n).
  4. Nu moeten we de twee ontvangen waarden vergelijken: zowel de vastgestelde waarneembare als de kritische. Om dit te doen, moet u een kritieke regio bouwen. Het is noodzakelijk om een ​​rechte lijn te tekenen, daarop de punten van de kritische waarde van de coëfficiënt te markeren met het "-" teken en met het "+" teken. Links en rechts van de kritische waarden zijn de kritische gebieden vanuit de punten in halve cirkels uitgezet. In het midden, waarbij twee waarden worden gecombineerd, is het gemarkeerd met een halve cirkel van de OPG.
  5. Daarna wordt een conclusie getrokken over de strakheid van de relatie tussen de twee kenmerken.

Waar kan ik deze waarde het beste gebruiken?

De allereerste wetenschap waarbij deze coëfficiënt actief werd gebruikt, was de psychologie. Dit is tenslotte een wetenschap die niet op cijfers is gebaseerd. Om belangrijke hypothesen over de ontwikkeling van relaties, karaktereigenschappen van mensen, de kennis van studenten en statistische bevestiging van de conclusies te bewijzen, is echter vereist. Het wordt ook gebruikt in de economie, met name bij valutatransacties. Hier worden functies zonder statistieken geëvalueerd. De rangcorrelatiecoëfficiënt van Spearman is erg handig in dit toepassingsgebied omdat de beoordeling onafhankelijk wordt gemaakt van de verdeling van variabelen, omdat deze worden vervangen door een rangnummer. De Spearman-coëfficiënt wordt actief gebruikt in het bankwezen. Ook sociologie, politieke wetenschappen, demografie en andere wetenschappen gebruiken het in hun onderzoek. Resultaten worden snel en zo nauwkeurig mogelijk verkregen.

Handig en snel gebruik van de correlatiecoëfficiënt van Spearman in Excel. Er zijn hier speciale functies waarmee u snel de benodigde waarden kunt verkrijgen.

Welke andere correlatiecoëfficiënten bestaan ​​er?

Naast wat we hebben geleerd over de Spearman-correlatiecoëfficiënt, zijn er ook verschillende correlatiecoëfficiënten waarmee u kwalitatieve kenmerken, de relatie tussen kwantitatieve kenmerken en de nabijheid van de relatie daartussen kunt meten en evalueren, gepresenteerd in een rangschaal. Dit zijn coëfficiënten als bis-serieel, rang-bis-serieel, inhoud, associaties, enzovoort. De Spearman-coëfficiënt geeft de dichtheid van de verbinding zeer nauwkeurig weer, in tegenstelling tot alle andere methoden voor de wiskundige bepaling ervan.