Kriittiset Spearman-sijoituskorrelaatioarvot. Spearman- ja Pearson-korrelaation soveltaminen

37. Spearmanin rankkorrelaatiokerroin.

S. 56 (64) 063.JPG

http://psystat.at.ua/publ/1-1-0-33

Spearmanin rankkorrelaatiokerrointa käytetään, kun:
- muuttujilla on ranking-asteikko mitat;
- tiedon jakelu on liian erilainen kuin normaali tai ei tunneta ollenkaan
- näytteet ovat pieniä (N< 30).

Spearmanin rankkorrelaatiokertoimen tulkinta ei poikkea Pearsonin kertoimesta, mutta sen merkitys on hieman erilainen. Ymmärtääksemme näiden menetelmien välisen eron ja perustellaksemme loogisesti niiden käyttöalueita, verrataan niiden kaavoja.

Pearson-korrelaatiokerroin:

Spearmanin korrelaatiokerroin:

Kuten näet, kaavat eroavat huomattavasti. Vertaa kaavoja

Pearsonin korrelaatiokaava käyttää korreloidun sarjan aritmeettista keskiarvoa ja keskihajontaa, kun taas Spearmanin kaava ei. Siten riittävän Pearsonin kaavan mukaisen tuloksen saamiseksi on välttämätöntä, että korreloitu sarja on lähellä normaalijakaumaa (keskiarvo ja keskihajonta ovat normaalijakauman parametrit). Spearman-kaavan kannalta tällä ei ole merkitystä.

Pearsonin kaavan osa on jokaisen sarjan standardointi z-pisteet.

Kuten näet, muuttujien muuntaminen Z-asteikkoon on läsnä Pearsonin korrelaatiokerroinkaavassa. Näin ollen Pearson-kertoimelle datan mittakaava on täysin epäolennainen: voimme esimerkiksi korreloida kaksi muuttujaa, joista toisella on min. = 0 ja max. = 1, ja toinen min. = 100 ja max. = 1000. Riippumatta siitä, kuinka erilainen arvoalue on, ne kaikki muunnetaan vakio-z-arvoiksi, jotka ovat samat mittakaavaltaan.

Spearman-kertoimessa ei ole tällaista normalisointia, joten

SPEERMAN-KERTOINNON KÄYTTÖ PAKOLLINEN EHDOTUS ON KAHDEN MUUTTUJAN ALUEEN TASUUS.

Ennen kuin käytät Spearman-kerrointa tietosarjoille, joilla on eri alueita, on välttämätöntä sijoitus. Järjestys johtaa siihen, että näiden sarjojen arvot saavat saman minimiarvon = 1 (minimiarvo) ja maksimiarvon, joka on yhtä suuri kuin arvojen lukumäärä (maksimi, viimeinen arvo = N, eli tapausten enimmäismäärä näyte).

Missä tapauksissa on mahdollista tehdä ilman sijoitusta

Nämä ovat tapauksia, joissa tiedot ovat alun perin ranking-asteikko. Esimerkiksi Rokeach-arvoorientaatiotesti.

Nämä ovat myös tapauksia, joissa arvovaihtoehtojen määrä on pieni ja otoksessa on kiinteä minimi ja maksimi. Esimerkiksi semanttisessa differentiaalissa minimi = 1, maksimi = 7.

Esimerkki Spearman-arvokorrelaatiokertoimen laskemisesta

Rokeach-arvoorientaatiotesti suoritettiin kahdelle näytteelle X ja Y. Tehtävänä oli selvittää, kuinka läheisiä näiden näytteiden arvohierarkiat ovat (kirjaimellisesti kuinka samankaltaisia ​​ne ovat).

Tuloksena olevaa arvoa r=0,747 verrataan kriittisten arvojen taulukko. Taulukon mukaan N=18:lla saatu arvo on luotettava tasolla p<=0,005

Rankkorrelaatiokertoimet Spearmanin ja Kendalin mukaan

Järjestysasteikkoon kuuluville muuttujille tai muuttujille, jotka eivät noudata normaalijakaumaa, sekä intervalliasteikkoon kuuluville muuttujille lasketaan Spearmanin rankkorrelaatio Pearson-kertoimen sijaan. Tätä varten muuttujien yksittäisille arvoille annetaan sijoituspaikat, jotka käsitellään myöhemmin sopivilla kaavoilla. Voit paljastaa rankkorrelaation poistamalla valinnan oletusarvoisesta Pearson-korrelaatiosta -valintaruudusta Bivariate Correlations... -valintaikkunassa. Aktivoi sen sijaan Spearman-korrelaatiolaskenta. Tämä laskelma antaa seuraavat tulokset. Rankkorrelaatiokertoimet ovat hyvin lähellä vastaavia Pearson-kertoimien arvoja (alkuperäisillä muuttujilla on normaalijakauma).

titkova-matmetody.pdf s. 45

Spearmanin rankkorrelaatiomenetelmän avulla voit määrittää tiiviyden (lujuuden) ja suunnan

välinen korrelaatio kaksi merkkiä tai kaksi profiilia (hierarkia) merkkejä.

Sijoituskorrelaation laskemiseksi tarvitaan kaksi arvosarjaa,

jotka voidaan luokitella. Nämä arvoalueet voivat olla:

1) kaksi merkkiä samalla mitattuna ryhmä koehenkilöt;

2) kaksi yksittäistä ominaisuushierarkiaa, tunnistettu kahdessa koehenkilössä samalle

joukko ominaisuuksia;

3) kaksi ominaisuuksien ryhmähierarkiat,

4) yksilö ja ryhmä ominaisuushierarkia.

Ensinnäkin indikaattorit luokitellaan erikseen kullekin ominaisuudelle.

Pääsääntöisesti ominaisuuden pienemmälle arvolle annetaan alempi arvo.

Ensimmäisessä tapauksessa (kaksi ominaisuutta) yksittäiset arvot luokitellaan ensimmäisen mukaan

eri koehenkilöiden saama ominaisuus ja sitten toisen yksittäiset arvot

merkki.

Jos kaksi merkkiä ovat positiivisesti yhteydessä toisiinsa, niin alhaalla olevat kohteet ovat mukana

toisella heistä on alhainen arvosana toisessa ja korkealuokkaisilla aiheilla

yhdellä ominaisuuksista on myös korkea arvosana toisessa ominaisuudessa. rs laskemiseen

on tarpeen määrittää erot (d) näiden koehenkilöiden molemmissa saavuttamien pisteiden välillä

merkkejä. Sitten nämä indikaattorit d muunnetaan tietyllä tavalla ja vähennetään luvusta 1. Kuin

mitä pienempi ero on, sitä suurempi rs on, sitä lähempänä +1:tä.

Jos korrelaatiota ei ole, kaikki arvot sekoittuvat ja niitä ei ole

ei osumia. Kaava on suunniteltu siten, että tässä tapauksessa rs on lähellä nollaa.

Negatiivisen korrelaation tapauksessa alhainen kohteiden joukko yhdellä perusteella

vastaa korkeita sijoituksia toisessa ominaisuudessa ja päinvastoin. Mitä enemmän ristiriitaa

kahden muuttujan koehenkilöiden välillä, mitä lähempänä rs on -1.

Toisessa tapauksessa (kaksi yksittäistä profiilia), yksilö

arvot, jotka kukin kahdesta koehenkilöstä on saanut tietyn mukaisesti (sama heille

molemmat) joukko ominaisuuksia. Ensimmäisellä sijalla on ominaisuus, jolla on pienin arvo; toinen arvo -

arvoltaan korkeampi merkki jne. On selvää, että kaikki ominaisuudet on mitattava

samat yksiköt, muuten sijoitus on mahdotonta. Esimerkiksi se on mahdotonta

järjestele indikaattorit Cattellin persoonallisuuskyselyn (16PF) mukaan, jos ne on ilmaistu

"raa'at" pisteet, koska arvoalueet ovat erilaisia ​​eri tekijöille: 0 - 13, 0 -

20 ja 0 - 26. Emme voi sanoa, mikä tekijöistä tulee ykkössijalle

vakavuus, kunnes saamme kaikki arvot yhdelle asteikolle (useimmiten tämä on seinien asteikko).

Jos kahden kohteen yksilölliset hierarkiat liittyvät positiivisesti toisiinsa, niin merkit

joilla on alhaisia ​​arvoja toisessa, on alhainen arvo toisessa ja päinvastoin.

Esimerkiksi, jos yhden kohteen tekijällä E (dominanssi) on alhaisin arvo, silloin

toisen kohteen, sen tulee olla alhainen, jos yhdellä koehenkilöllä on tekijä C

(emotionaalinen vakaus) on korkein, niin myös toisella tutkittavalla on oltava

tällä tekijällä on korkea arvo ja niin edelleen.

Kolmannessa tapauksessa (kaksi ryhmäprofiilia) ryhmien keskiarvot asetetaan paremmuusjärjestykseen,

vastaanotettu 2 ryhmässä aiheita tietyn, identtinen kahdelle ryhmälle, joukko

merkkejä. Seuraavassa päättely on sama kuin kahdessa edellisessä tapauksessa.

Neljännen (yksilö- ja ryhmäprofiili) tapauksessa ne luokitellaan erikseen

kohteen yksittäiset arvot ja keskimääräiset ryhmäarvot samalle sarjalle

merkit, jotka saadaan pääsääntöisesti ilman tätä yksittäistä subjektia - hän

ei osallistu keskimääräiseen ryhmäprofiiliin, johon hänen yksilöään verrataan

profiili. Sijoituskorrelaation avulla voit tarkistaa, kuinka johdonmukainen yksilö ja

ryhmäprofiilit.

Kaikissa neljässä tapauksessa saadun korrelaatiokertoimen merkitsevyys määräytyy

rankattujen arvojen lukumäärän mukaan N. Ensimmäisessä tapauksessa tämä luku on sama kuin

näytteen koko n. Toisessa tapauksessa havaintojen määrä on piirteiden lukumäärä,

muodostaen hierarkian. Kolmannessa ja neljännessä tapauksessa N on myös täsmäytyneiden lukumäärä

merkkejä, ei koehenkilöiden lukumäärää ryhmissä. Yksityiskohtaiset selitykset annetaan esimerkeissä. Jos

rs:n itseisarvo saavuttaa kriittisen arvon tai ylittää sen, korrelaatio

luotettava.

Hypoteesit.

On olemassa kaksi mahdollista hypoteesia. Ensimmäinen viittaa tapaukseen 1, toinen kolmeen muuhun

Ensimmäinen versio hypoteeseista

H0: Muuttujien A ja B välinen korrelaatio ei eroa nollasta.

H2: Muuttujien A ja B välinen korrelaatio eroaa merkittävästi nollasta.

Toinen versio hypoteeseista

H0: Hierarkioiden A ja B välinen korrelaatio ei eroa nollasta.

H2: Hierarkioiden A ja B välinen korrelaatio eroaa merkittävästi nollasta.

Rankkorrelaatiokertoimen rajoitukset

1. Jokaisesta muuttujasta on toimitettava vähintään 5 huomautusta. Yläosa

näytteenottoraja määräytyy saatavilla olevien kriittisten arvojen taulukoiden mukaan .

2. Spearmanin rankkorrelaatiokerroin rs suurella määrällä identtisiä

ranks yhdelle tai molemmille vastaaville muuttujille antaa karkeita arvoja. Ihannetapauksessa

molempien korreloitujen sarjojen on oltava kaksi yhteensopimatonta sarjaa

arvot. Jos tämä ehto ei täyty, on tehtävä säätö

samat rivit.

Spearmanin rankkorrelaatiokerroin lasketaan kaavalla:

Jos molemmissa vertailusarjoissa on samanarvoisia ryhmiä,

ennen rankkorrelaatiokertoimen laskemista on tarpeen korjata sama

sijoittuu Ta:lle ja Tv:lle:

Ta \u003d Σ (a3 - a) / 12,

TV \u003d Σ (v3 - c) / 12,

missä a - kunkin identtisten asteiden ryhmän määrä A-arvosarjassa, in kunkin tilavuus

samanarvoiset ryhmät sarjassa B.

Laskeaksesi rs:n empiirisen arvon, käytä kaavaa:

38. Pisteellinen biserialinen korrelaatiokerroin.

Korrelaatiosta yleisesti, katso kysymys nro 36 kanssa. 56 (64) 063.JPG

harchenko-korranaliz.pdf

Mitataan muuttuja X vahvalla asteikolla ja muuttuja Y dikotomisella asteikolla. Pisteen biserialinen korrelaatiokerroin rpb lasketaan kaavalla:

Tässä x 1 on X-objektin keskiarvo ja Y:n arvo "yksi";

x 0 - X-objektin keskiarvo, jonka Y:n arvo on "nolla";

s x - kaikkien X:n arvojen keskihajonta;

n 1 - objektien lukumäärä "yksi" Y:ssä, n 0 - objektien lukumäärä "nolla" Y:ssä;

n = n 1 + n 0 on otoskoko.

Pistebissarjakorrelaatiokerroin voidaan laskea myös käyttämällä muita vastaavia lausekkeita:

Tässä x on muuttujan yleinen keskiarvo X.

Pisteen biserialinen korrelaatiokerroin rpb vaihtelee -1:stä +1:een. Sen arvo on nolla, jos muuttujat ovat yksiköllä for Y on keskiarvo Y, yhtä suuri kuin nollalla olevien muuttujien keskiarvo Y.

Tutkimus merkitsevyyshypoteesit pisteen biserialinen korrelaatiokerroin on tarkistettava nollahypoteesih 0 yleisen korrelaatiokertoimen yhtäläisyydestä nollaan: ρ = 0, joka suoritetaan Studentin kriteerillä. Empiirinen arvo

verrattuna kriittisiin arvoihin t a (df) vapausasteiden lukumäärälle df = n– 2

Jos ehto | t| ≤ ta(df), nollahypoteesia ρ = 0 ei hylätä. Pisteen biserialinen korrelaatiokerroin eroaa merkittävästi nollasta, jos empiirinen arvo | t| putoaa kriittiselle alueelle, eli jos tila | t| > ta(n– 2). Suhteen luotettavuus lasketaan käyttämällä pisteen biserialista korrelaatiokerrointa rpb, voidaan määrittää myös kriteerin avulla χ 2 vapausasteiden lukumäärälle df= 2.

Piste-biserialinen korrelaatio

Momenttien tulon korrelaatiokertoimen myöhempi modifikaatio heijastui katkoviivassa r. Tämä tilasto osoittaa kahden muuttujan välisen suhteen, joista toinen on oletettavasti jatkuva ja normaalijakautuma, kun taas toinen on diskreetti sanan tarkassa merkityksessä. Piste-bissarjakorrelaatiokerroin on merkitty r pbis Koska sisään r pbis dikotomia heijastaa diskreetin muuttujan todellista luonnetta eikä ole keinotekoista, kuten tapauksessa r bis, sen merkki on määritetty mielivaltaisesti. Siksi kaikkiin käytäntöihin tavoitteet r pbis pidetään välillä 0,00 - +1,00.

On myös sellainen tapaus, jossa kahta muuttujaa pidetään jatkuvina ja normaalijakautuneena, mutta molemmat on keinotekoisesti dikotomisoitu, kuten biserialisen korrelaation tapauksessa. Tällaisten muuttujien välisen suhteen arvioimiseksi käytetään tetrakoorista korrelaatiokerrointa r tet, jonka on myös kasvattanut Pearson. Main (tarkat) kaavat ja laskentamenetelmät r tet ovat melko monimutkaisia. Siis käytännössä. tämä menetelmä käyttää approksimaatioita r tet lyhennettyjen menettelyjen ja taulukoiden perusteella.

/online/dictionary/dictionary.php?term=511

PISTETTY BISERIAALIKORRELAATIOKERTOIMINTA on kahden muuttujan välinen korrelaatiokerroin, joista toinen mitataan kaksijakoisella ja toinen intervalliasteikolla. Sitä käytetään klassisessa ja nykyaikaisessa testologiassa testitehtävän laadun indikaattorina - luotettavuus-yhdenmukaisuus testin kokonaispistemäärän kanssa.

Korreloidaksesi muuttujia mitattuna dikotominen ja intervalliasteikko käyttää piste-bissarja-korrelaatiokerroin.
Piste-biserialinen korrelaatiokerroin on menetelmä muuttujien suhteen korrelaatioanalyysiin, joista yksi mitataan nimiasteikolla ja ottaa vain 2 arvoa (esimerkiksi miehet / naiset, vastaus on oikea / vastaus on virheellinen, on merkki / ei ole merkkiä), ja toinen asteikkosuhteissa tai intervalliasteikossa. Kaava piste-bissarjakorrelaatiokertoimen laskemiseksi:

Missä:
m1 ja m0 ovat X:n keskiarvoja, joiden arvo on 1 tai 0 Y:ssä.
σx on X:n kaikkien arvojen keskihajonta
n1,n0 – X-arvojen määrä välillä 1 tai 0 - Y.
n on arvoparien kokonaismäärä

Useimmiten tämän tyyppistä korrelaatiokerrointa käytetään laskettaessa testikohteiden suhdetta yhteenvetoasteikolla. Tämä on eräänlainen vahvistustarkistus.

39. Rank-biserial-korrelaatiokerroin.

Korrelaatiosta yleisesti, katso kysymys nro 36 kanssa. 56 (64) 063.JPG

harchenko-korranaliz.pdf s. 28

Rank-biserial-korrelaatiokerroin, jota käytetään, kun yksi muuttujista ( X) esitetään järjestysasteikossa ja toinen ( Y) - dikotomisina, laskettuna kaavan mukaan

.

Tässä on niiden objektien keskimääräinen arvo, joissa on yhtenäisyyttä Y; on objektien keskimääräinen arvo nolla tuumaa Y, n on näytteen koko.

Tutkimus merkitsevyyshypoteesit rank-biserial-korrelaatiokerroin suoritetaan samalla tavalla kuin pistebissarjakorrelaatiokerroin käyttäen Studentin t-testiä korvaamalla kaavoissa rpb päällä rrb.

Kun yhtä muuttujaa mitataan dikotomisella asteikolla (muuttuja x), ja toinen asteikolla (muuttuja Y) käyttäen asteikon-biserialista korrelaatiokerrointa. Muistamme, että muuttuja x, kaksijakoisella asteikolla mitattuna ottaa vain kaksi arvoa (koodia) 0 ja 1. Korostetaan erityisesti: vaikka tämä kerroin vaihtelee välillä –1 ja +1, sen merkillä ei ole väliä tulkinnan kannalta. tuloksia. Tämä on toinen poikkeus yleisestä säännöstä.

Tämä kerroin lasketaan kaavan mukaan:

missä ` X 1 keskimääräinen sijoitus verrattuna muuttujan elementteihin Y, joka vastaa muuttujan koodia (ominaisuus) 1 X;

`X 0 – muuttujan elementtien keskiarvo Y, joka vastaa muuttujan koodia (ominaisuutta) 0 X\

N- muuttujan elementtien kokonaismäärä x.

Rank-biserial-korrelaatiokertoimen soveltaminen edellyttää, että seuraavat ehdot täyttyvät:

1. Verrattavat muuttujat on mitattava eri asteikoilla: yksi X- dikotomisessa mittakaavassa; toinen Y- ranking-asteikolla.

2. Vaihtelevien ominaisuuksien lukumäärä verratuissa muuttujissa X ja Y pitäisi olla sama.

3. Rank-biserial-korrelaatiokertoimen luotettavuuden arvioimiseksi tulee käyttää Studentin testin kaavaa (11.9) ja kriittisten arvojen taulukkoa, kun k = n - 2.

http://psystat.at.ua/publ/drugie_vidy_koehfficienta_korreljacii/1-1-0-38

Tapaukset, joissa jokin muuttujista on läsnä dikotominen mittakaava, ja toinen sisään sijoitus (järjestys), vaativat käyttöä rank-biserial-korrelaatiokerroin:

rpb = 2 / n * (m1 - m0)

missä:
n on mittauskohteiden lukumäärä
m1 ja m0 - niiden kohteiden keskimääräinen sijoitus, joiden toisessa muuttujassa on 1 tai 0.
Tätä kerrointa käytetään myös testien validiteetin tarkistamisessa.

40. Lineaarinen korrelaatiokerroin.

Korrelaatiosta yleensä (ja erityisesti lineaarisesta korrelaatiosta), katso kysymys nro 36 kanssa. 56 (64) 063.JPG

Mr. PEARSONIN KORRELAATIOKERTOINTI

r-Pearson (Pearson r) käytetään kahden mittarin välisen suhteen tutkimiseenmuut samasta otoksesta mitatut muuttujat. On monia tilanteita, joissa sitä kannattaa käyttää. Vaikuttaako älykkyys suoritukseen korkeakouluvuosina? Liittyykö työntekijän palkan suuruus hänen hyväntahtoisuuteensa kollegoita kohtaan? Vaikuttaako opiskelijan mieliala monimutkaisen aritmeettisen ongelman ratkaisun onnistumiseen? Vastatakseen tällaisiin kysymyksiin tutkijan on mitattava kaksi otoksen jokaista jäsentä kiinnostavaa indikaattoria. Suhteen tutkimiseen tarvittavat tiedot on sitten taulukoitu, kuten alla olevassa esimerkissä.

ESIMERKKI 6.1

Taulukossa on esimerkki kahden älykkyysindikaattorin (verbaalisen ja ei-verbaalisen) alkumittaustiedoista 20 8. luokan oppilaalla.

Näiden muuttujien välinen suhde voidaan kuvata käyttämällä sirontadiagrammia (katso kuva 6.3). Kaavio osoittaa, että mitattujen indikaattoreiden välillä on jokin yhteys: mitä suurempi on verbaalisen älykkyyden arvo, sitä (pääasiassa) ei-verbaalisen älykkyyden arvo on.

Ennen kuin annat korrelaatiokertoimen kaavan, yritetään jäljittää sen esiintymisen logiikka esimerkin 6.1 tietojen avulla. Kunkin /-pisteen (kohteen numerolla /) sijainti sirontakaaviossa suhteessa muihin pisteisiin (kuva 6.3) voidaan antaa muuttujien vastaavien arvojen poikkeamien suuruuksilla ja etumerkeillä niiden arvoista. keskiarvot: (xj - MJ ja (mieli klo ). Jos näiden poikkeamien merkit ovat samat, tämä osoittaa positiivisen suhteen puolesta (suuret arvot X vastaavat suuria arvoja klo tai pienempiä arvoja varten X vastaavat pienempiä arvoja y).

Kohteen nro 1 osalta poikkeama keskiarvosta X ja klo positiivinen, ja aiheen nro 3 osalta molemmat poikkeamat ovat negatiivisia. Näin ollen molempien tiedot osoittavat positiivisen suhteen tutkittujen ominaisuuksien välillä. Päinvastoin, jos merkkejä poikkeamista keskiarvosta X ja klo eroavat toisistaan, tämä osoittaa merkkien välisen negatiivisen suhteen. Siten aiheen nro 4 poikkeama keskiarvosta X on negatiivinen, mukaan y - positiivinen, ja aiheen nro 9 osalta - päinvastoin.

Eli jos poikkeamien tulo (x, - M X ) X (mieli klo ) positiivinen, silloin /-subjektin tiedot osoittavat suoraa (positiivista) suhdetta ja jos negatiivista, niin käänteistä (negatiivista) suhdetta. Vastaavasti jos Xwy ovat enimmäkseen suoraan verrannollisia, silloin suurin osa poikkeamien tuloista on positiivisia, ja jos ne liittyvät käänteisesti, niin suurin osa tuloista on negatiivisia. Siksi tietyn näytteen poikkeamien tulojen summa voi toimia yleisenä indikaattorina suhteen vahvuudelle ja suunnalle:

Kun muuttujien välinen suhde on suoraan verrannollinen, tämä arvo on suuri ja positiivinen - suurimmalle osalle koehenkilöistä poikkeamat ovat etumerkissä samat (yhden muuttujan suuret arvot vastaavat toisen muuttujan suuria arvoja ja päinvastoin). Jos X ja klo saada palautetta, niin useimmille aiheille yhden muuttujan suuret arvot vastaavat toisen muuttujan pienempiä arvoja, eli tuotteiden merkit ovat negatiivisia ja tuotteiden summa kokonaisuutena on myös suuri absoluuttisessa arvossa, mutta negatiivisessa etumerkissä. Jos muuttujien välillä ei ole systemaattista yhteyttä, positiiviset termit (poikkeamien tulot) tasapainotetaan negatiivisilla termeillä ja kaikkien poikkeamien tulojen summa on lähellä nollaa.

Jotta tuotteiden summa ei riipu otoskoosta, riittää sen keskiarvo. Mutta olemme kiinnostuneita suhteen mittaamisesta ei yleisenä parametrina, vaan laskennallisena arviona siitä - tilastoista. Siksi, mitä tulee dispersiokaavaan, tässä tapauksessa teemme samoin, jaamme poikkeamien tulojen summaa ei N, ja televisiossa - 1. Osoittautuu fysiikassa ja teknisissä tieteissä laajalti käytetty viestintämittari, jota kutsutaan ns. kovarianssi (Kovahance):


AT psykologiassa, toisin kuin fysiikassa, useimmat muuttujat mitataan mielivaltaisilla asteikoilla, koska psykologeja ei kiinnosta piirteen itseisarvo, vaan koehenkilöiden suhteellinen asema ryhmässä. Lisäksi kovarianssi on erittäin herkkä asteikolle (dispersiolle), jolla piirteitä mitataan. Jotta tiedonsiirron mitta olisi riippumaton kumman tahansa attribuutin mittayksiköistä, riittää jakaa kovarianssi vastaaviksi keskihajotuksiksi. Siten se saatiin varten-K. Pearsonin korrelaatiokertoimen muuli:

tai sen jälkeen, kun lausekkeet on korvattu o x:lla ja


Jos molempien muuttujien arvot muunnetaan r-arvoiksi kaavan avulla


silloin r-Pearson-korrelaatiokerroinkaava näyttää yksinkertaisemmalta (071.JPG):

/dict/sociology/article/soc/soc-0525.htm

KORRELAATIO LINEAARINEN- tilastollinen ei-syy-lineaarinen suhde kahden kvantitatiivisen muuttujan välillä X ja klo. Mitattu käyttämällä "tekijää K.L." Pearson, joka on tulos jakamalla kovarianssi molempien muuttujien keskihajonnoista:

,

missä s xy- muuttujien välinen kovarianssi X ja klo;

s x , s y- muuttujien keskihajonnat X ja klo;

x i , y i- muuttuvat arvot X ja klo kohteen numerolle i;

x, y- muuttujien aritmeettiset keskiarvot X ja klo.

Pearsonin suhde r voi ottaa arvoja väliltä [-1; +1]. Merkitys r = 0 tarkoittaa, että muuttujien välillä ei ole lineaarista suhdetta X ja klo(mutta ei sulje pois epälineaarista tilastollista yhteyttä). Positiiviset kertoimen arvot ( r> 0) osoittavat suoraa lineaarista suhdetta; mitä lähempänä sen arvo on +1, sitä vahvempi on tilastollinen suora yhteys. Negatiiviset kertoimen arvot ( r < 0) свидетельствуют об обратной линейной связи; чем ближе его значение к -1, тем сильнее обратная связь. Значения r= ±1 tarkoittaa suoran tai käänteisen suoran lineaarisen yhteyden olemassaoloa. Jos yhteys on täydellinen, kaikki pisteet, joilla on koordinaatit ( x i , y i) makaa suoralla linjalla y = a + bx.

"Kerroin K.L." Pearsonia käytetään myös mittaamaan suhteen tiukkuutta lineaarisessa pariregressiomallissa.

41. Korrelaatiomatriisi ja korrelaatiograafi.

Korrelaatiosta yleisesti, katso kysymys nro 36 kanssa. 56 (64) 063.JPG

korrelaatiomatriisi. Usein korrelaatioanalyysi sisältää tutkimuksen, jossa ei tutkita kahden, vaan usean muuttujan suhdetta mitattuna kvantitatiivisella asteikolla yhdestä otoksesta. Tässä tapauksessa korrelaatiot lasketaan tämän muuttujajoukon jokaiselle parille. Laskelmat suoritetaan yleensä tietokoneella ja tuloksena on korrelaatiomatriisi.

Korrelaatiomatriisi(korrelaatio matriisi) on tulos laskettaessa samantyyppisiä korrelaatioita jokaiselle joukon parille R muuttujat mitattuna kvantitatiivisella asteikolla yhdessä otoksessa.

ESIMERKKI

Oletetaan, että tutkimme 5 muuttujan välisiä suhteita (vl, v2,..., v5; P= 5), mitattuna näytteestä N = 30 Ihmisen. Alla on taulukko lähtötiedoista ja korrelaatiomatriisi.

Ja
asiaan liittyvät tiedot:

Korrelaatiomatriisi:

On helppo nähdä, että korrelaatiomatriisi on neliömäinen, symmetrinen päälävistäjän (takkakg, y = /) y suhteen, yksiköt päädiagonaalissa (koska G ja = Gu = 1).

Korrelaatiomatriisi on neliö: rivien ja sarakkeiden määrä on yhtä suuri kuin muuttujien lukumäärä. Hän on symmetrinen suhteessa päädiagonaaliin, koska korrelaatio X kanssa klo vastaa korrelaatiota klo kanssa X. Yksiköt sijaitsevat sen päälävistäjällä, koska ominaisuuden korrelaatio itsensä kanssa on yhtä suuri kuin yksi. Näin ollen kaikki korrelaatiomatriisin elementit eivät ole analyysin kohteena, vaan ne, jotka ovat päädiagonaalin ylä- tai alapuolella.

korrelaatiokertoimien lukumäärä, Suhteiden tutkimuksessa analysoitavat P-ominaisuudet määritetään kaavalla: P(P- 1)/2. Yllä olevassa esimerkissä tällaisten korrelaatiokertoimien lukumäärä on 5(5 - 1)/2 = 10.

Korrelaatiomatriisin analyysin päätehtävä on paljastaa joukon piirteiden välisten suhteiden rakenteen. Tämä mahdollistaa visuaalisen analyysin korrelaatioplejadit- graafinen kuva rakenteet tilastollisestimerkittäviä yhteyksiä jos tällaisia ​​yhteyksiä ei ole kovin paljon (jopa 10-15). Toinen tapa on käyttää monimuuttujamenetelmiä: moniregressio-, tekijä- tai klusterianalyysi (katso kohta "Monimuuttujamenetelmät..."). Tekijä- tai klusterianalyysin avulla on mahdollista tunnistaa muuttujien ryhmiä, jotka liittyvät läheisemmin toisiinsa kuin muihin muuttujiin. Näiden menetelmien yhdistelmä on myös erittäin tehokas esimerkiksi, jos merkkejä on monia ja ne eivät ole homogeenisia.

Korrelaatioiden vertailu - lisätehtävä analysoida korrelaatiomatriisia, jossa on kaksi vaihtoehtoa. Jos on tarpeen vertailla korrelaatioita jollain korrelaatiomatriisin rivillä (yhdelle muuttujalle), käytetään riippuvien näytteiden vertailumenetelmää (s. 148-149). Eri näytteille laskettuja samannimistä korrelaatioita verrattaessa käytetään riippumattomien näytteiden vertailumenetelmää (s. 147-148).

Vertailumenetelmät korrelaatioita diagonaaleissa korrelaatiomatriisi (satunnaisprosessin stationaarisuuden arvioimiseksi) ja vertailu useita eri näytteille saadut korrelaatiomatriisit (niiden homogeenisuuden vuoksi) ovat aikaa vieviä ja tämän kirjan soveltamisalan ulkopuolella. Voit tutustua näihin menetelmiin GV Sukhodolskyn kirjasta 1 .

Korrelaatioiden tilastollisen merkittävyyden ongelma. Ongelmana on, että tilastollinen hypoteesien testausmenettely sisältää yksi-useita yhdelle näytteelle tehty testi. Jos käytetään samaa menetelmää monta kertaa, vaikka suhteessa eri muuttujiin, niin todennäköisyys saada tulos puhtaasti sattumalta kasvaa. Yleensä, jos toistamme saman hypoteesin testausmenetelmän aikoihin eri muuttujien tai näytteiden suhteen, niin vahvistetulla a:n arvolla saamme taatusti vahvistuksen hypoteesille ah tapausten määrä.

Oletetaan, että 15 muuttujan korrelaatiomatriisi analysoidaan, eli lasketaan 15(15-1)/2 = 105 korrelaatiokerrointa. Hypoteesien testaamiseksi asetetaan taso a = 0,05. Testaamalla hypoteesia 105 kertaa, saamme sen vahvistuksen viisi kertaa (!) riippumatta siitä, onko yhteys todella olemassa. Kun tiedämme tämän ja olemme saaneet esimerkiksi 15 "tilastollisesti merkitsevää" korrelaatiokerrointa, voimmeko sanoa, mitkä niistä on saatu sattumalta ja mitkä heijastavat todellista suhdetta?

Tarkkaan ottaen tilastollisen päätöksen tekemiseksi tasoa a on alennettava niin monta kertaa kuin testattavien hypoteesien määrä. Mutta tämä tuskin on suositeltavaa, koska todennäköisyys jättää huomiotta tosielämän yhteys (tehdä tyypin II virhe) kasvaa arvaamattomalla tavalla.

Pelkkä korrelaatiomatriisi ei ole riittävä perustasiihen sisältyviä yksittäisiä kertoimia koskevia tilastollisia päätelmiä vartenkorrelaatioita!

On vain yksi todella vakuuttava tapa ratkaista tämä ongelma: jakaa otos satunnaisesti kahteen osaan ja ottaa huomioon vain ne korrelaatiot, jotka ovat tilastollisesti merkitseviä molemmissa otoksen osissa. Vaihtoehtona voi olla monimuuttujamenetelmien käyttö (faktoriaalinen, klusteri- tai moniregressioanalyysi) - tilastollisesti merkitsevästi toisiinsa liittyvien muuttujien ryhmien valintaan ja myöhempään tulkintaan.

Puuttuvien arvojen ongelma. Jos tiedoista puuttuu arvoja, on kaksi vaihtoehtoa korrelaatiomatriisin laskemiseksi: a) arvojen rivi riviltä poistaminen (sulkea poistapauksialistallisesti); b) arvojen poistaminen pareittain (sulkea poistapauksiapareittain). klo rivi riviltä poisto havaintoja, joissa on aukkoja, koko rivi poistetaan objektilta (aiheelta), jolla on vähintään yksi puuttuva arvo jollekin muuttujalle. Tämä menetelmä johtaa "oikeaan" korrelaatiomatriisiin siinä mielessä, että kaikki kertoimet lasketaan samasta objektijoukosta. Kuitenkin, jos puuttuvat arvot jakautuvat satunnaisesti muuttujiin, tämä menetelmä voi johtaa siihen, että tarkasteltavassa tietojoukossa ei jää yhtään objektia (jokaisella rivillä on vähintään yksi puuttuva arvo). Voit välttää tämän tilanteen käyttämällä toista menetelmää nimeltä pareittainen poisto. Tämä menetelmä ottaa huomioon vain aukot kussakin valitussa muuttujasarakeparissa ja jättää huomiotta muiden muuttujien aukot. Korrelaatio muuttujaparille lasketaan niille kohteille, joissa ei ole aukkoja. Monissa tilanteissa, varsinkin kun aukkojen määrä on suhteellisen pieni, esimerkiksi 10 %, ja aukot jakautuvat melko satunnaisesti, tämä menetelmä ei johda vakaviin virheisiin. Joskus näin ei kuitenkaan ole. Esimerkiksi estimaatin systemaattisessa biasissa (siirtymässä) aukkojen systemaattinen sijainti voidaan "piilottaa", mikä on syynä eri osajoukkojen (esimerkiksi eri objektien alaryhmien) korrelaatiokertoimien eroon. ). Toinen ongelma, joka liittyy korrelaatiomatriisiin, joka on laskettu pareittain aukon poistaminen tapahtuu, kun tätä matriisia käytetään muuntyyppisissä analyyseissä (esimerkiksi moniregressio- tai tekijäanalyysissä). He olettavat, että "oikeaa" korrelaatiomatriisia käytetään tietyllä johdonmukaisuuden ja eri kertoimien "vastaavuuden" tasolla. Matriisin käyttö "huonoilla" (harhoilla) arvioilla johtaa siihen, että ohjelma joko ei pysty analysoimaan tällaista matriisia tai tulokset ovat virheellisiä. Siksi, jos käytetään parittaista menetelmää puuttuvan tiedon poistamiseksi, on tarpeen tarkistaa, onko aukkojen jakautumisessa systemaattisia kaavoja vai ei.

Jos puuttuvien tietojen pareittainen eliminointi ei johda systemaattiseen keskiarvojen ja varianssien (keskihajonnan) muutokseen, nämä tilastot ovat samanlaisia ​​kuin viivakohtaisella aukkojen poistamismenetelmällä lasketut tilastot. Jos ero on merkittävä, on syytä olettaa, että arvioissa on tapahtunut muutos. Esimerkiksi, jos muuttujan arvojen keskiarvo (tai keskihajonta). MUTTA, jota käytettiin laskettaessa sen korrelaatiota muuttujan kanssa AT, paljon pienempi kuin muuttujan samojen arvojen keskiarvo (tai keskihajonta). MUTTA, joita käytettiin laskettaessa sen korrelaatiota muuttujan C kanssa, on syytä olettaa, että nämä kaksi korrelaatiota (A-Bmeille) perustuu eri tietoryhmiin. Korrelaatioissa tapahtuu muutos, joka johtuu muuttujien arvojen aukkojen ei-satunnaisesta sijainnista.

Korrelaatioplejadien analyysi. Korrelaatiomatriisin elementtien tilastollisen merkittävyyden ongelman ratkaisemisen jälkeen voidaan tilastollisesti merkitsevät korrelaatiot esittää graafisesti korrelaatioplejadin tai plejadin muodossa. Korrelaatiogalaksi - se on pisteistä ja niitä yhdistävistä viivoista koostuva kuvio. Huiput vastaavat ominaisuuksia ja on yleensä merkitty numeroilla - muuttujien numeroilla. Viivat vastaavat tilastollisesti merkittäviä suhteita ja ilmaisevat graafisesti suhteen etumerkin ja joskus /j-merkittävyystason.

Korrelaatiogalaksi voi heijastaa kaikki korrelaatiomatriisin tilastollisesti merkitseviä suhteita (jota joskus kutsutaan korrelaatiokaavio ) tai vain niiden mielekkäästi valittu osa (esimerkiksi tekijäanalyysin tulosten mukaan yhtä tekijää vastaava).

ESIMERKKI KORRELAATIOPLEIADI:N MUODOSTAMISESTA


Valmistelu valmistuneiden valtion (lopulliseen) sertifiointiin: USE-tietokannan muodostaminen (yleinen luettelo kaikkien luokkien USE-osallistujista, aiheet mainitaan) - ottaen huomioon varapäivät, jos aiheet vastaavat;

  • Työsuunnitelma (27)

    Päätös

    2. Oppilaitoksen toiminta luonnon- ja matematiikan opetuksen aineiden sisällön parantamiseksi ja laadun arvioimiseksi MOU-yleisoppilaitos nro 4, Litvinovskaya, Chapaevskaya,

  • Tapauksissa, joissa tutkittujen ominaisuuksien mittaukset suoritetaan järjestysasteikolla tai yhteyden muoto poikkeaa lineaarisesta, kahden satunnaismuuttujan välisen suhteen tutkimus suoritetaan rankkorrelaatiokertoimien avulla. Tarkastellaan Spearmanin rankkorrelaatiokerrointa. Sitä laskettaessa on tarpeen järjestellä (järjestää) näytevaihtoehdot. Ranking on kokeellisten tietojen ryhmittely tiettyyn järjestykseen, joko nousevaan tai laskevaan järjestykseen.

    Luokitustoiminto suoritetaan seuraavan algoritmin mukaan:

    1. Pienemmälle arvolle annetaan alempi arvo. Korkeimmalle arvolle annetaan järjestys, joka vastaa rankattujen arvojen määrää. Pienimmälle arvolle annetaan arvo, joka on yhtä suuri kuin 1. Jos esimerkiksi n=7, niin korkein arvo saa arvon 7, lukuun ottamatta toisen säännön mukaisia ​​tapauksia.

    2. Jos useat arvot ovat yhtä suuret, niille annetaan arvo, joka on keskiarvo niistä arvoista, jotka he olisivat saaneet, jos ne eivät olisi yhtä suuret. Esimerkkinä voidaan harkita nousevaa näytettä, joka koostuu 7 elementistä: 22, 23, 25, 25, 25, 28, 30. Arvot 22 ja 23 esiintyvät kerran, joten niiden järjestys on R22=1 ja R23. =2. Arvo 25 esiintyy 3 kertaa. Jos nämä arvot eivät toistu, niiden arvot olisivat yhtä suuria kuin 3, 4, 5. Siksi niiden arvo R25 on yhtä suuri kuin 3, 4 ja 5:n aritmeettinen keskiarvo: . Arvot 28 ja 30 eivät toistu, joten niiden arvot ovat R28=6 ja R30=7. Lopuksi meillä on seuraava kirjeenvaihto:

    3. Sijoitusten kokonaismäärän on vastattava laskettua arvoa, joka määritetään kaavalla:

    missä n on rankattujen arvojen kokonaismäärä.

    Todellisen ja lasketun arvosanan välinen poikkeama osoittaa rivejen laskennassa tai niiden summauksessa tehdyn virheen. Tässä tapauksessa sinun on löydettävä ja korjattava virhe.

    Spearmanin rankkorrelaatiokerroin on menetelmä, jonka avulla voit määrittää kahden ominaisuuden tai kahden piirrehierarkian välisen suhteen vahvuuden ja suunnan. Rankkorrelaatiokertoimen käytöllä on useita rajoituksia:

    • a) Odotetun korrelaation tulee olla monotoninen.
    • b) Kunkin näytteen tilavuuden on oltava suurempi tai yhtä suuri kuin 5. Näytteen ylärajan määrittämiseen käytetään kriittisten arvojen taulukoita (liitteen taulukko 3). Taulukon n:n enimmäisarvo on 40.
    • c) Analyysin aikana on todennäköistä, että esiintyy suuri määrä identtisiä arvoja. Tässä tapauksessa muutos on tehtävä. Edullisin tapaus on, kun molemmat tutkitut näytteet edustavat kahta yhteensopimattomien arvojen sarjaa.

    Korrelaatioanalyysin suorittamiseksi tutkijalla on oltava kaksi näytettä, jotka voidaan luokitella, esimerkiksi:

    • - kaksi merkkiä mitattuna samassa ryhmässä;
    • - kaksi yksilöllistä ominaisuushierarkiaa, jotka on tunnistettu kahdessa koehenkilössä samalle ominaisuusjoukolle;
    • - kaksi attribuuttien ryhmähierarkiaa;
    • - yksittäisten ja ryhmien ominaisuuksien hierarkiat.

    Aloitamme laskennan järjestämällä tutkitut indikaattorit erikseen kullekin merkille.

    Analysoidaan tapausta, jossa on kaksi ominaisuutta mitattuna samassa ryhmässä. Ensin yksittäiset arvot luokitellaan eri koehenkilöiden saaman ensimmäisen attribuutin mukaan ja sitten yksittäiset arvot toisen attribuutin mukaan. Jos yhden indikaattorin alemmat arvot vastaavat toisen indikaattorin alempia arvoja ja yhden indikaattorin korkeammat arvot vastaavat toisen indikaattorin korkeampia arvoja, nämä kaksi ominaisuutta liittyvät positiivisesti toisiinsa. Jos yhden indikaattorin korkeammat arvot vastaavat toisen indikaattorin alempia arvoja, nämä kaksi merkkiä liittyvät negatiivisesti. Löytääksemme rs:n määritämme kunkin aiheen arvojen (d) väliset erot. Mitä pienempi ero rivien välillä on, sitä lähempänä sijoituskorrelaatiokerroin rs on arvoa "+1". Jos suhdetta ei ole, niiden välillä ei ole vastaavuutta, joten rs on lähellä nollaa. Mitä suurempi ero koehenkilöiden välillä on kahdessa muuttujassa, sitä lähempänä "-1" on kertoimen rs arvo. Siten Spearmanin rankkorrelaatiokerroin on kahden tutkittavan ominaisuuden välisen monotonisen suhteen mitta.

    Harkitse tapausta, jossa kaksi yksittäistä ominaisuushierarkiaa on tunnistettu kahdessa aiheessa samalle ominaisuusjoukolle. Tässä tilanteessa kummankin kohteen saamat yksittäiset arvot tietyn ominaisuusjoukon mukaan asetetaan paremmuusjärjestykseen. Alhaisimman arvon omaavalle ominaisuudelle tulee antaa ensimmäinen arvo. attribuutti, jolla on korkeampi arvo - toinen arvo jne. On huolehdittava siitä, että kaikki attribuutit mitataan samoilla yksiköillä. On esimerkiksi mahdotonta asettaa indikaattoreita paremmuusjärjestykseen, jos ne ilmaistaan ​​eri "hinnan" pisteissä, koska on mahdotonta määrittää, mikä tekijöistä on vakavuuden kannalta ensimmäinen, ennen kuin kaikki arvot on saatettu yhteen. mittakaavassa. Jos ominaisuuksilla, joilla on alhainen arvo jossakin oppiaineessa, on matalat arvot toisessa ja päinvastoin, yksittäiset hierarkiat liittyvät positiivisesti toisiinsa.

    Kahden ominaisuushierarkian tapauksessa kahdessa kohderyhmässä saadut keskimääräiset ryhmäarvot luokitellaan tutkittujen ryhmien saman ominaisuusjoukon mukaan. Seuraavaksi noudatamme edellisissä tapauksissa annettua algoritmia.

    Analysoidaan tapausta yksilöllisten ja ryhmien ominaisuuksien hierarkialla. He alkavat sijoittelemalla erikseen tutkittavan yksilölliset arvot ja ryhmän keskiarvot saman ominaisuusjoukon mukaan, jotka saatiin, lukuun ottamatta tutkittavaa, joka ei osallistu keskimääräiseen ryhmähierarkiaan, koska hänen yksilönsä hierarkiaa verrataan siihen. Sijoituskorrelaation avulla voidaan arvioida ominaisuuksien yksilö- ja ryhmähierarkian yhdenmukaisuuden astetta.

    Tarkastellaanpa, miten korrelaatiokertoimen merkitys määritetään edellä luetelluissa tapauksissa. Kahden ominaisuuden tapauksessa se määräytyy otoskoon mukaan. Kahden yksittäisen ominaisuushierarkian tapauksessa merkitys riippuu hierarkiaan sisältyvien ominaisuuksien lukumäärästä. Kahdessa viimeisessä tapauksessa merkityksen määrää tutkittujen ominaisuuksien määrä, ei ryhmien koko. Siten rs:n merkitys kaikissa tapauksissa määräytyy rankattujen arvojen n määrällä.

    Testattaessa rs:n tilastollista merkitsevyyttä käytetään järjestyskorrelaatiokertoimen kriittisten arvojen taulukoita, jotka on laadittu erilaisille ranking-arvoille ja eri merkittävyystasoille. Jos rs:n itseisarvo saavuttaa kriittisen arvon tai ylittää sen, korrelaatio on merkitsevä.

    Kun tarkastellaan ensimmäistä vaihtoehtoa (tapaus, jossa on kaksi ominaisuutta mitattuna samassa ryhmässä), seuraavat hypoteesit ovat mahdollisia.

    H0: Muuttujien x ja y välinen korrelaatio ei eroa nollasta.

    H1: Muuttujien x ja y välinen korrelaatio eroaa merkittävästi nollasta.

    Jos työskentelemme jonkin kolmesta jäljellä olevasta tapauksesta, meidän on esitettävä toinen hypoteesipari:

    H0: Korrelaatio x- ja y-hierarkioiden välillä on nollasta poikkeava.

    H1: Korrelaatio x- ja y-hierarkioiden välillä eroaa merkittävästi nollasta.

    Toimintojen järjestys Spearman-arvokorrelaatiokertoimen rs laskennassa on seuraava.

    • - Määritä, mitkä kaksi ominaisuutta tai kaksi ominaisuushierarkiaa osallistuvat yhteensovittamiseen x- ja y-muuttujina.
    • - Järjestä muuttujan x arvot asettamalla arvo 1 pienimmälle arvolle järjestyssääntöjen mukaan. Sijoita rivit taulukon ensimmäiseen sarakkeeseen aiheiden tai merkkien numeroiden mukaiseen järjestykseen.
    • - Järjestä muuttujan y arvot. Sijoita rivit taulukon toiseen sarakkeeseen aiheiden tai merkkien numeroiden mukaiseen järjestykseen.
    • - Laske erot d rivien x ja y välillä taulukon kullekin riville. Tulokset sijoitetaan taulukon seuraavaan sarakkeeseen.
    • - Laske neliöerot (d2). Sijoita saadut arvot taulukon neljänteen sarakkeeseen.
    • - Laske erojen neliöiden summa? d2.
    • - Jos samat arvot esiintyvät, laske korjaukset:

    missä tx on kunkin samanarvoisen ryhmän tilavuus näytteessä x;

    ty on kunkin samanarvoisen ryhmän koko otoksessa y.

    Laske korrelaatiokerroin sen mukaan, onko identtisiä arvoja vai ei. Jos identtisiä arvoja ei ole, korrelaatiokerroin rs lasketaan kaavalla:

    Kun samat arvot ovat läsnä, korrelaatiokerroin rs lasketaan kaavalla:

    missä?d2 on rivien välisten erojen neliöityjen summa;

    Tx ja Ty - korjaukset samoille riveille;

    n on sijoitukseen osallistuneiden aiheiden tai ominaisuuksien lukumäärä.

    Määritä rs:n kriittiset arvot liitteen taulukosta 3 tietylle määrälle koehenkilöitä n. Merkittävä ero korrelaatiokertoimen nollasta havaitaan edellyttäen, että rs ei ole pienempi kuin kriittinen arvo.

    on kvantitatiivinen arvio ilmiöiden välisten suhteiden tilastotutkimuksesta, jota käytetään ei-parametrisissä menetelmissä.

    Indikaattori näyttää kuinka havaittu rivien välisten erojen neliösumma eroaa tapauksesta, jossa yhteyttä ei ole.

    Palvelutehtävä. Tämän online-laskimen avulla voit:

    • Spearmanin rankkorrelaatiokertoimen laskeminen;
    • kertoimen luottamusvälin laskeminen ja sen merkityksen arviointi;

    Spearmanin rankkorrelaatiokerroin viittaa viestinnän läheisyyden arvioinnin indikaattoreihin. Rankkorrelaatiokertoimen ja muiden korrelaatiokertoimien suhteen tiukkuuden kvalitatiivinen ominaisuus voidaan arvioida Chaddock-asteikolla.

    Kerroinlaskenta koostuu seuraavista vaiheista:

    Spearmanin rankkorrelaatiokertoimen ominaisuudet

    Sovellusalue. Rankkorrelaatiokerroin käytetään arvioimaan kahden joukon välisen viestinnän laatua. Lisäksi sen tilastollista merkitsevyyttä käytetään analysoitaessa tietoja heteroskedastisuuden varalta.

    Esimerkki. Havaittujen muuttujien X ja Y datanäytteessä:

    1. tee sijoitustaulukko;
    2. Etsi Spearmanin rankkorrelaatiokerroin ja testaa sen merkitys tasolla 2a
    3. arvioida riippuvuuden luonnetta
    Päätös. Anna arvot piirteelle Y ja tekijä X .
    XYsijoitus X, dxsijoitus Y, d y
    28 21 1 1
    30 25 2 2
    36 29 4 3
    40 31 5 4
    30 32 3 5
    46 34 6 6
    56 35 8 7
    54 38 7 8
    60 39 10 9
    56 41 9 10
    60 42 11 11
    68 44 12 12
    70 46 13 13
    76 50 14 14

    Sijoitusmatriisi.
    sijoitus X, dxsijoitus Y, d y(dx - dy) 2
    1 1 0
    2 2 0
    4 3 1
    5 4 1
    3 5 4
    6 6 0
    8 7 1
    7 8 1
    10 9 1
    9 10 1
    11 11 0
    12 12 0
    13 13 0
    14 14 0
    105 105 10

    Matriisin kokoamisen oikeellisuuden tarkistaminen tarkistussumman laskennan perusteella:

    Matriisin sarakkeiden summat ovat yhtä suuria keskenään ja tarkistussumman kanssa, mikä tarkoittaa, että matriisi on muodostettu oikein.
    Kaavan avulla laskemme Spearmanin rankkorrelaatiokertoimen.


    Ominaisuuden Y ja tekijä X välinen suhde on vahva ja suora
    Spearmanin rankkorrelaatiokertoimen merkitys
    Nollahypoteesin testaamiseksi merkitsevyystasolla α, että yleinen Spearmanin rankkorrelaatiokerroin on nolla kilpailevan hypoteesin Hi alla. p ≠ 0, on tarpeen laskea kriittinen piste:

    missä n on näytteen koko; ρ on Spearmanin otosrankkorrelaatiokerroin: t(α, k) on kaksipuolisen kriittisen alueen kriittinen piste, joka saadaan Studentin jakauman kriittisten pisteiden taulukosta merkitsevyystason α ja lukujen mukaan. vapausasteet k = n-2.
    Jos |p|< Т kp - нет оснований отвергнуть нулевую гипотезу. Ранговая корреляционная связь между качественными признаками не значима. Если |p| >T kp - nollahypoteesi hylätään. Laadullisten ominaisuuksien välillä on merkittävä korrelaatio.
    Studentin taulukon mukaan saadaan t(α/2, k) = (0,1/2;12) = 1,782

    Koska T kp< ρ , то отклоняем гипотезу о равенстве 0 коэффициента ранговой корреляции Спирмена. Другими словами, коэффициент ранговой корреляции статистически - значим и ранговая корреляционная связь между оценками по двум тестам значимая.

    Tämä alla oleva laskin laskee Spearmanin rankkorrelaatiokertoimen kahden satunnaismuuttujan välillä.Teoreettinen osa on perinteinen laskimen alla.

    lisätä tuonti ja vienti mode_edit poistaa

    Satunnaismuuttujien muutokset

    nuoli_ylöspäinnuoli_alaspäin nuoli_ylöspäinnuoli_alaspäin
    Kohteita sivulla: 5 10 20 50 100 chevron_left chevron_right

    Satunnaismuuttujien muutokset

    Tietojen tuonti Tuontivirhe

    "Yhtä seuraavista merkeistä käytetään tietokenttien erottamiseen: sarkain, puolipiste (;) tai pilkku (,)" Esimerkki: -50.5;-50.5

    Tuo Takaisin Peruuta

    Numerot desimaalipilkun jälkeen: 4

    Laskea

    Spearmanin korrelaatiokerroin

    Tallentaa Jaa laajennus

    Spearmanin rankkorrelaatiokertoimen laskentamenetelmä on itse asiassa melko yksinkertainen.Se on kuin Pearsonin korrelaatiokerroin, mutta se ei ole suunniteltu vain satunnaismuuttujien mittaamiseen, vaan niiden mittaamiseen. ranking-arvot.

    Meidän on vain ymmärrettävä, mikä on arvoarvo ja miksi tämä kaikki on välttämätöntä.

    Jos variaatiosarjan elementit on järjestetty nousevaan tai laskevaan järjestykseen, se sijoitus elementistä on hänen numeronsa järjestetyssä sarjassa.

    Esimerkiksi meillä on variaatiosarja (17,26,5,14,21). Lajittelemme elementit laskevaan järjestykseen (26,21,17,14,5). 26:lla on sijoitus 1, 21 - sijoitus 2 ja niin edelleen, sijoitusarvojen vaihtelusarja näyttää tältä (3,1,5,4,2).

    Eli Spearmanin kerrointa laskettaessa alkuvaihtelusarjat muunnetaan rankingarvojen vaihtelusarjoiksi ja sitten niihin sovelletaan Pearsonin kaavaa.
    .
    On yksi hienous - toistuvien arvojen järjestys on arvojen keskiarvo. Eli sarjan (17, 15, 14, 15) sijoitussarjat näyttävät tältä (1, 2,5, 4, 2,5), koska ensimmäisen elementin 15 arvo on 2 ja toisen - 3, ja.

    Jos sinulla ei ole toistuvia arvoja eli kaikkia sijoitussarjojen arvoja - numeroita välillä 1 ja n, Pearsonin kaava voidaan yksinkertaistaa

    Muuten, tämä kaava annetaan usein kaavana Spearmanin kertoimen laskemiseen.

    Mikä on olemus siirtymisessä itse arvoista niiden arvoarvoon?
    Sijoitusarvojen korrelaatiota tutkiessa voit selvittää, kuinka hyvin monotoninen funktio kuvaa kahden muuttujan riippuvuutta.

    Kertoimen etumerkki ilmaisee muuttujien välisen suhteen suunnan. Jos etumerkki on positiivinen, Y:n arvoilla on taipumus kasvaa X:n kasvaessa. Jos etumerkki on negatiivinen, Y:n arvoilla on taipumus pienentyä X:n kasvaessa. Jos kerroin on 0, ei sitten ole taipumusta. Jos kerroin on 1 tai -1, X:n ja Y:n välinen suhde näyttää monotoniselta funktiolta, ts. X:n kasvaessa myös Y kasvaa ja päinvastoin.

    Toisin kuin Pearsonin korrelaatiokerroin, joka voi havaita vain yhden muuttujan lineaarisen suhteen toisesta, Spearmanin korrelaatiokerroin voi havaita monotonisen riippuvuuden, jossa suoraa lineaarista suhdetta ei voida paljastaa.

    Tässä on esimerkki.
    Selitänpä esimerkillä. Oletetaan, että tarkastelemme funktiota y=10/x.
    Meillä on seuraavat X:n ja Y:n mitat
    {{1,10}, {5,2}, {10,1}, {20,0.5}, {100,0.1}}
    Näille tiedoille Pearson-korrelaatiokerroin on yhtä suuri kuin -0,4686, ts. suhde on heikko tai puuttuu. Ja Spearmanin korrelaatiokerroin on tiukasti yhtä suuri kuin -1, ikään kuin se vihjaisi tutkijalle, että Y:llä on vahvasti negatiivinen monotoninen riippuvuus X:stä.

    K. Spearmanin ehdottama rankkorrelaatiokerroin viittaa muuttujien välisen suhteen ei-parametrisiin indikaattoreihin, jotka on mitattu asteikolla. Tätä kerrointa laskettaessa ei vaadita oletuksia piirteiden jakautumisen luonteesta yleisessä populaatiossa. Tämä kerroin määrittää järjestysominaisuuksien kytkennän tiukkuusasteen, jotka tässä tapauksessa edustavat vertailuarvojen rivejä.

    Spearmanin korrelaatiokertoimen arvo on myös välillä +1 ja -1. Se, kuten Pearson-kerroin, voi olla positiivinen ja negatiivinen, luonnehtien kahden asteikolla mitatun ominaisuuden välisen suhteen suuntaa.

    Periaatteessa rankattujen ominaisuuksien (ominaisuudet, piirteet jne.) lukumäärä voi olla mikä tahansa, mutta yli 20 ominaisuuden luokittelu on vaikeaa. On mahdollista, että tästä syystä sijoituskorrelaatiokertoimen kriittisten arvojen taulukko lasketaan vain neljällekymmenelle järjestetylle ominaisuudelle (n< 40, табл. 20 приложения 6).

    Spearmanin rankkorrelaatiokerroin lasketaan kaavalla:

    missä n on järjestettävien ominaisuuksien (indikaattorit, aiheet) lukumäärä;

    D on ero kunkin aiheen kahden muuttujan välillä;

    Sijoituserojen neliösumma.

    Tarkastellaan seuraavaa esimerkkiä käyttämällä rankkorrelaatiokerrointa.

    Esimerkki: Psykologi selvittää, miten 11 ekaluokkalaisen ennen koulun alkua saadut yksittäiset kouluvalmiusmittarit ja heidän keskimääräinen suorituksensa lukuvuoden lopussa liittyvät toisiinsa.

    Tämän ongelman ratkaisemiseksi järjestimme ensinnäkin kouluun tullessa saadut kouluvalmiusindikaattoreiden arvot ja toiseksi näiden samojen oppilaiden lopulliset suoritusindikaattorit vuoden lopussa. Tulokset on esitetty taulukossa. kolmetoista.

    Taulukko 13

    Opiskelijoiden määrä

    Kouluvalmiuden indikaattoreiden arvot

    Keskimääräisen vuosittaisen suorituskyvyn sijoitukset

    Korvaamme saadut tiedot kaavaan ja suoritamme laskennan. Saamme:

    Merkitystason selvittämiseksi siirrymme taulukkoon. Liitteen 6 20, joka antaa kriittiset arvot rankkorrelaatiokertoimille.

    Korostamme sitä taulukossa. 20 Liite 6 sekä Pearsonin lineaarisen korrelaation taulukossa kaikki korrelaatiokertoimien arvot on annettu absoluuttisina arvoina. Siksi korrelaatiokertoimen etumerkki otetaan huomioon vain sitä tulkittaessa.

    Merkitystasojen löytäminen tästä taulukosta tapahtuu luvun n mukaan, eli koehenkilöiden lukumäärän mukaan. Meidän tapauksessamme n = 11. Tälle numerolle saamme:

    0,61 P:lle 0,05

    0,76 P:lle 0,01

    Rakennamme vastaavan "merkittävyysakselin":

    Tuloksena saatu korrelaatiokerroin osui yhteen 1 %:n merkitsevyystason kriittisen arvon kanssa. Voidaan siis väittää, että ekaluokkalaisten kouluvalmiuden indikaattorit ja loppuarvosanat korreloivat positiivisesti – eli mitä korkeampi kouluvalmiusmittari on, sitä paremmin ekaluokkalainen oppii. Tilastollisten hypoteesien osalta psykologin on hylättävä samankaltaisuuden nollahypoteesi ja hyväksyttävä vaihtoehtoinen (mutta ero)hypoteesi, jonka mukaan kouluvalmiuden ja keskimääräisen suorituskyvyn välinen suhde on nollasta poikkeava.

    Tapaus identtisistä (tasavertaisista) arvoista

    Samojen rivien läsnä ollessa Spearmanin lineaarisen korrelaatiokertoimen laskentakaava on hieman erilainen. Tässä tapauksessa korrelaatiokertoimien laskentakaavaan lisätään kaksi uutta termiä ottaen huomioon samat arvot. Niitä kutsutaan korjauksiksi samoihin arvoihin ja ne lisätään laskentakaavan osoittajaan.

    missä n on identtisten rivien lukumäärä ensimmäisessä sarakkeessa,

    k on identtisten rivien lukumäärä toisessa sarakkeessa.

    Jos jossakin sarakkeessa on kaksi ryhmää identtisiä arvoja, korjauskaavasta tulee hieman monimutkaisempi:

    missä n on samansuuruisten rivien lukumäärä järjestetyn sarakkeen ensimmäisessä ryhmässä,

    k on samanarvoisten rivien lukumäärä järjestetyn sarakkeen toisessa ryhmässä. Kaavan muunnos yleisessä tapauksessa on seuraava:

    Esimerkki: Psykologi suorittaa henkisen kehityksen testiä (ISTU) käyttäen älykkyystutkimuksen 12 luokan 9 opiskelijalle. Samalla hän pyytää kirjallisuuden ja matematiikan opettajia luokittelemaan nämä samat opiskelijat henkisen kehityksen mittareiden mukaan. Tehtävänä on selvittää, miten henkisen kehityksen objektiiviset indikaattorit (STI-tiedot) ja opettajien asiantuntija-arviot liittyvät toisiinsa.

    Tämän tehtävän kokeelliset tiedot ja Spearman-korrelaatiokertoimen laskemiseen tarvittavat lisäsarakkeet on esitetty taulukon muodossa. neljätoista.

    Taulukko 14

    Opiskelijoiden määrä

    Testausarvot SHTURin avulla

    Asiantuntijaarvioinnit matematiikan opettajista

    Kirjallisuuden opettajien asiantuntija-arviot

    D (toinen ja kolmas sarake)

    D (toinen ja neljäs sarake)

    (toinen ja kolmas sarake)

    (toinen ja neljäs sarake)

    Koska rankingissa käytettiin samoja arvoja, on tarpeen tarkistaa taulukon toisen, kolmannen ja neljännen sarakkeen sijoituksen oikeellisuus. Kunkin näiden sarakkeiden summaus antaa saman summan - 78.

    Tarkistamme laskentakaavan mukaan. Sekki antaa:

    Taulukon viides ja kuudes sarake osoittavat kunkin opiskelijan STUD-testissä psykologin asiantuntija-arvioinnin ja opettajien asiantuntija-arvioinnin arvot matematiikan ja kirjallisuuden välillä. . Arvoerojen summan on oltava nolla. D-arvojen summaus viidennessä ja kuudennessa sarakkeessa antoi halutun tuloksen. Siksi rivien vähentäminen suoritettiin oikein. Samanlainen tarkistus on tehtävä joka kerta, kun suoritetaan monimutkaisia ​​​​luokitustyyppejä.

    Ennen kuin aloitat laskennan kaavalla, on tarpeen laskea korjaukset samalle tasolle taulukon toiselle, kolmannelle ja neljännelle sarakkeelle.

    Meidän tapauksessamme taulukon toisessa sarakkeessa on kaksi identtistä arvoa, joten kaavan mukaan korjausarvo D1 on:

    Kolmannessa sarakkeessa on kolme identtistä järjestystä, joten kaavan mukaan korjausarvo D2 on:

    Taulukon neljännessä sarakkeessa on kaksi ryhmää, joissa on kolme identtistä arvoa, joten kaavan mukaan D3-korjausarvo on:

    Ennen kuin jatkamme ongelman ratkaisemista, muistetaan, että psykologi selvittää kaksi kysymystä - kuinka STUR-testin arvot liittyvät matematiikan ja kirjallisuuden asiantuntijaarvioihin. Siksi laskenta suoritetaan kahdesti.

    Otamme huomioon ensimmäisen asteen kertoimen, kun otetaan huomioon lisäaineet kaavan mukaan. Saamme:

    Lasketaan ottamatta huomioon lisäystä:

    Kuten näet, ero korrelaatiokertoimien arvojen välillä osoittautui erittäin merkityksettömäksi.

    Otamme huomioon toisen asteen kertoimen, kun otetaan huomioon lisäaineet kaavan mukaan. Saamme:

    Lasketaan ottamatta huomioon lisäystä:

    Erot olivat jälleen hyvin pieniä. Koska opiskelijamäärä molemmissa tapauksissa on sama, taulukon mukaan. 20 Liite 6 löytää kriittiset arvot n = 12 molemmille korrelaatiokertoimille kerralla.

    0,58 P:lle 0,05

    0,73 P:lle 0,01

    Piirrä ensimmäinen arvo "merkittävyysakselille":

    Ensimmäisessä tapauksessa saatu rankkorrelaatiokerroin on merkitsevyyden vyöhykkeellä. Siksi psykologin on hylättävä nollahypoteesi, jonka mukaan korrelaatiokerroin on nollan kaltainen, ja hyväksyttävä vaihtoehtoinen hypoteesi, että korrelaatiokerroin on merkittävästi erilainen kuin nolla. Toisin sanoen saatu tulos viittaa siihen, että mitä korkeammat opiskelijoiden asiantuntijapisteet STUD-testissä ovat, sitä korkeammat ovat heidän asiantuntijapisteensä matematiikassa.

    Piirrä toinen arvo "merkittävyysakselille":

    Toisessa tapauksessa rankkorrelaatiokerroin on epävarmuusvyöhykkeellä. Siksi psykologi voi hyväksyä nollahypoteesin, jonka mukaan korrelaatiokerroin on samanlainen kuin nolla, ja hylätä vaihtoehtoisen hypoteesin, että korrelaatiokerroin on merkittävästi erilainen kuin nolla. Tässä tapauksessa saatu tulos viittaa siihen, että opiskelijoiden STUD-testin asiantuntija-arviot eivät liity kirjallisuuden asiantuntija-arvioihin.

    Spearman-korrelaatiokertoimen soveltaminen edellyttää, että seuraavat ehdot täyttyvät:

    1. Vertailtavat muuttujat on hankittava järjestysasteikolla, mutta ne voidaan mitata myös intervallien ja suhteiden asteikolla.

    2. Korreloitujen arvojen jakauman luonteella ei ole väliä.

    3. Vertailumuuttujien X ja Y vaihtelevien ominaisuuksien lukumäärän on oltava sama.

    Taulukot Spearman-korrelaatiokertoimen kriittisten arvojen määrittämiseksi (taulukko 20, liite 6) lasketaan n = 5 - n = 40 merkkien lukumäärästä, ja suuremmalla määrällä verrattavia muuttujia taulukko On käytettävä Pearson-korrelaatiokerrointa (taulukko 19, liite 6). Kriittisten arvojen löytäminen suoritetaan kohdassa k = n.