Spearman-korrelaatioanalyysi, käytännön kauppa esimerkein. Esimerkki Spearmanin rankkorrelaatiokertoimen löytämisestä

on kvantitatiivinen arvio ilmiöiden välisten suhteiden tilastotutkimuksesta, jota käytetään ei-parametrisissa menetelmissä.

Indikaattori osoittaa, kuinka havainnoinnin aikana saatujen rivien välisten erojen neliösumma eroaa tapauksesta, jossa ei yhteyttä.

Palvelun tarkoitus. Tämän online-laskimen avulla voit:

  • Spearmanin rankkorrelaatiokertoimen laskeminen;
  • lasketaan kertoimen luottamusväli ja arvioidaan sen merkitys;

Spearmanin rankkorrelaatiokerroin viittaa viestinnän läheisyyden arvioinnin indikaattoreihin. Rankkorrelaatiokertoimen ja muiden korrelaatiokertoimien yhteyden läheisyyden laadullista ominaisuutta voidaan arvioida Chaddock-asteikolla.

Kertoimen laskeminen koostuu seuraavista vaiheista:

Spearmanin rankkorrelaatiokertoimen ominaisuudet

Sovellusalue. Rankkorrelaatiokerroin käytetään kahden väestön välisen viestinnän laadun arvioimiseen. Lisäksi sen tilastollista merkitsevyyttä käytetään analysoitaessa dataa heteroskedastisuuden suhteen.

Esimerkki. Havaittujen muuttujien X ja Y otoksen perusteella:

  1. luo sijoitustaulukko;
  2. Etsi Spearmanin rankkorrelaatiokerroin ja tarkista sen merkitys tasolla 2a
  3. arvioida riippuvuuden luonnetta
Ratkaisu. Määritetään arvot piirteelle Y ja tekijä X.
XYsija X, d xsijoitus Y, d y
28 21 1 1
30 25 2 2
36 29 4 3
40 31 5 4
30 32 3 5
46 34 6 6
56 35 8 7
54 38 7 8
60 39 10 9
56 41 9 10
60 42 11 11
68 44 12 12
70 46 13 13
76 50 14 14

Sijoitusmatriisi.
sija X, d xsijoitus Y, d y(d x - d y) 2
1 1 0
2 2 0
4 3 1
5 4 1
3 5 4
6 6 0
8 7 1
7 8 1
10 9 1
9 10 1
11 11 0
12 12 0
13 13 0
14 14 0
105 105 10

Matriisin oikeellisuuden tarkistaminen tarkistussummalaskelman perusteella:

Matriisin sarakkeiden summa on yhtä suuri keskenään ja tarkistussumman kanssa, mikä tarkoittaa, että matriisi on muodostettu oikein.
Kaavan avulla laskemme Spearmanin rankkorrelaatiokertoimen.


Ominaisuuden Y ja tekijä X välinen suhde on vahva ja suora
Spearmanin rankkorrelaatiokertoimen merkitys
Nollahypoteesin testaamiseksi merkitsevyystasolla α, että yleinen Spearmanin rankkorrelaatiokerroin on nolla kilpailevan hypoteesin Hi alla. p ≠ 0, meidän on laskettava kriittinen piste:

missä n on näytteen koko; ρ on näyte Spearmanin rankkorrelaatiokerroin: t(α, k) on kaksipuolisen kriittisen alueen kriittinen piste, joka saadaan Studentin jakauman kriittisten pisteiden taulukosta merkitsevyystason α ja luvun mukaan. vapausasteiden k = n-2.
Jos |p|< Т kp - нет оснований отвергнуть нулевую гипотезу. Ранговая корреляционная связь между качественными признаками не значима. Если |p| >T kp - nollahypoteesi hylätään. Laadullisten ominaisuuksien välillä on merkittävä korrelaatio.
Studentin taulukkoa käyttämällä saadaan t(α/2, k) = (0.1/2;12) = 1.782

Koska T kp< ρ , то отклоняем гипотезу о равенстве 0 коэффициента ранговой корреляции Спирмена. Другими словами, коэффициент ранговой корреляции статистически - значим и ранговая корреляционная связь между оценками по двум тестам значимая.

37. Spearmanin rankkorrelaatiokerroin.

S. 56 (64) 063.JPG

http://psystat.at.ua/publ/1-1-0-33

Spearmanin rankkorrelaatiokerrointa käytetään tapauksissa, joissa:
- muuttujilla on ranking-asteikko mitat;
- tiedon jakelu on liian erilainen kuin normaali tai ei tunneta ollenkaan;
- näytteillä on pieni tilavuus (N< 30).

Spearmanin rankkorrelaatiokertoimen tulkinta ei eroa Pearsonin kertoimesta, mutta sen merkitys on hieman erilainen. Ymmärtääksemme näiden menetelmien välisen eron ja perustellaksemme loogisesti niiden käyttöalueita, verrataan niiden kaavoja.

Pearson-korrelaatiokerroin:

Spearman-korrelaatiokerroin:

Kuten näet, kaavat eroavat huomattavasti. Verrataan kaavoja

Pearsonin korrelaatiokaava käyttää korreloidun sarjan aritmeettista keskiarvoa ja keskihajontaa, mutta Spearmanin kaava ei. Siten riittävän tuloksen saamiseksi Pearsonin kaavalla, on välttämätöntä, että korreloitu sarja on lähellä normaalijakaumaa (keskiarvo ja keskihajonnan normaalijakauman parametrit). Tämä ei koske Spearmanin kaavaa.

Pearson-kaavan osa on jokaisen sarjan standardointi z-asteikko.

Kuten näet, muuttujien muuntaminen Z-asteikolle on Pearson-korrelaatiokertoimen kaavassa. Näin ollen Pearson-kertoimelle datan mittakaavalla ei ole mitään merkitystä: voimme esimerkiksi korreloida kaksi muuttujaa, joista toisella on min. = 0 ja max. = 1, ja toinen min. = 100 ja max. = 1000. Riippumatta siitä, kuinka erilainen arvoalue on, ne kaikki muunnetaan vakio-z-arvoiksi, jotka ovat samat mittakaavaltaan.

Tällaista normalisointia ei siis esiinny Spearman-kertoimessa

PAKOLLINEN EHTO SPEARMAN-KERTOINKÄYTTÖÖN ON KAHDEN MUUTTUJAN ALUEEN TASUUS.

Ennen kuin käytät Spearman-kerrointa tietosarjoille, joilla on eri alueita, on välttämätöntä sijoitus. Järjestyksen tuloksena näiden sarjojen arvot saavat saman minimiarvon = 1 (minimiarvo) ja maksimiarvon, joka on yhtä suuri kuin arvojen lukumäärä (maksimi, viimeinen sijoitus = N, eli tapausten enimmäismäärä otoksessa) .

Missä tapauksissa voit tehdä ilman sijoitusta?

Nämä ovat tapauksia, joissa tiedot ovat alun perin ranking-asteikko. Esimerkiksi Rokeachin arvoorientaatiotesti.

Nämä ovat myös tapauksia, joissa arvovaihtoehtojen määrä on pieni ja otos sisältää kiinteän minimin ja maksimin. Esimerkiksi semanttisessa differentiaalissa minimi = 1, maksimi = 7.

Esimerkki Spearmanin rankkorrelaatiokertoimen laskemisesta

Rokeachin arvoorientaatiotesti suoritettiin kahdella näytteellä X ja Y. Tavoite: selvittää, kuinka lähellä näiden näytteiden arvohierarkiat ovat (kirjaimellisesti, kuinka samanlaisia ​​ne ovat).

Tuloksena oleva arvo r=0,747 tarkistetaan kriittisten arvojen taulukko. Taulukon mukaan N=18:lla saatu arvo on merkitsevä p-tasolla<=0,005

Spearmanin ja Kendalin rankkorrelaatiokertoimet

Järjestysasteikkoon kuuluville muuttujille tai muuttujille, jotka eivät kuulu normaalijakaumaan, sekä intervalliasteikkoon kuuluville muuttujille lasketaan Spearman-rankkorrelaatio Pearson-kertoimen sijaan. Tätä varten yksittäisille muuttujan arvoille annetaan arvot, jotka käsitellään myöhemmin sopivilla kaavoilla. Voit havaita rankkorrelaation poistamalla oletusarvoisen Pearson-korrelaation valintaruudun Bivariate Correlations... -valintaikkunassa. Aktivoi sen sijaan Spearman-korrelaatiolaskenta. Tämä laskelma antaa seuraavat tulokset. Rankkorrelaatiokertoimet ovat hyvin lähellä vastaavia Pearson-kertoimien arvoja (alkuperäisillä muuttujilla on normaalijakauma).

titkova-matmetody.pdf s. 45

Spearmanin rankkorrelaatiomenetelmän avulla voit määrittää tiiviyden (voiman) ja suunnan

välinen korrelaatio kaksi merkkiä tai kaksi profiilia (hierarkia) merkkejä.

Sijoituskorrelaation laskemiseksi tarvitaan kaksi arvoriviä,

jotka voidaan luokitella. Tällaisia ​​arvosarjoja voisivat olla:

1) kaksi merkkiä samalla mitattuna ryhmä aiheet;

2) kaksi yksilöllistä ominaisuushierarkiaa, tunnistettu kahdessa koehenkilössä käyttäen samaa

joukko ominaisuuksia;

3) kaksi ominaisuusryhmien hierarkiat,

4) yksilö ja ryhmä ominaisuuksien hierarkia.

Ensinnäkin indikaattorit luokitellaan erikseen kunkin ominaisuuden osalta.

Pääsääntöisesti alemmalle attribuutin arvolle annetaan alempi arvo.

Ensimmäisessä tapauksessa (kaksi ominaisuutta) yksittäiset arvot luokitellaan ensimmäisen mukaan

eri aiheiden saamat ominaispiirteet ja sitten toisen yksittäiset arvot

merkki.

Jos kaksi ominaisuutta liittyvät positiivisesti toisiinsa, niin alhaisia ​​​​arvoja

yhdellä heistä on alhainen arvo toisessa ja aiheet, joilla on korkeat arvot

yhdellä ominaisuuksista on myös korkea arvosana toiselle ominaisuudelle. Laskeaksesi rs

erot on selvitettävä (d) tietyn kohteen saamien sijoitusten välillä molemmissa

merkkejä. Sitten nämä indikaattorit d muunnetaan tietyllä tavalla ja vähennetään luvusta 1. Kuin

Mitä pienempi ero on, sitä suurempi rs on, sitä lähempänä +1:tä.

Jos korrelaatiota ei ole, kaikki arvot sekoittuvat ja niitä ei ole

ei kirjeenvaihtoa. Kaava on suunniteltu siten, että tässä tapauksessa rs on lähellä nollaa.

Negatiivisen korrelaation tapauksessa alhainen kohteiden joukko yhdellä perusteella

korkeat sijoitukset muilta osin vastaavat ja päinvastoin. Mitä suurempi ero

kahden muuttujan koehenkilöiden välillä, mitä lähempänä rs on -1.

Toisessa tapauksessa (kaksi yksittäistä profiilia), yksittäiset ovat paremmuusjärjestykseen

arvot, jotka kukin kahdesta koehenkilöstä on saanut tietyn mukaisesti (sama heille

molemmat) ominaisuuksia. Ensimmäinen arvo annetaan ominaisuudelle, jolla on pienin arvo. toinen arvo -

arvoltaan korkeampi merkki jne. On selvää, että kaikki ominaisuudet on mitattava

samat yksiköt, muuten sijoitus on mahdotonta. Esimerkiksi se on mahdotonta

Sijoita indikaattorit Cattellin persoonallisuusluetteloon (16PF), jos ne ilmaistaan

"raakoja" pisteitä, koska arvoalueet ovat erilaisia ​​eri tekijöille: 0 - 13, 0 -

20 ja 0-26. Emme voi sanoa, mikä tekijä sijoittuu ensimmäiseksi

lauseke, kunnes saamme kaikki arvot yhdelle asteikolle (useimmiten tämä on seinäasteikko).

Jos kahden kohteen yksilölliset hierarkiat liittyvät positiivisesti toisiinsa, niin merkit

joilla on alhainen arvo yhdessä niistä, on alhainen arvo toisessa ja päinvastoin.

Jos esimerkiksi yhden kohteen tekijällä E (dominanssi) on alhaisin arvo, niin

toisella koehenkilöllä, sen tulee olla alhainen, jos yhdellä koehenkilöllä on tekijä C

(emotionaalinen vakaus) on korkein, niin myös toisella tutkittavalla on oltava

tällä tekijällä on korkea arvo jne.

Kolmannessa tapauksessa (kaksi ryhmäprofiilia) ryhmien keskiarvot asetetaan paremmuusjärjestykseen,

saatu kahdessa ryhmässä tietyn sarjan mukaan, identtiset molemmille ryhmille

merkkejä. Seuraavassa päättely on sama kuin kahdessa edellisessä tapauksessa.

Tapauksessa 4 (yksityis- ja ryhmäprofiilit) ne luokitellaan erikseen

kohteen yksittäiset arvot ja ryhmän keskiarvot samalle sarjalle

merkit, jotka saadaan pääsääntöisesti sulkemalla pois tämä yksittäinen subjekti - hän

ei osallistu keskimääräiseen ryhmäprofiiliin, johon hänen yksilöprofiiliaan verrataan

profiili. Sijoituskorrelaation avulla voit tarkistaa, kuinka johdonmukainen yksilö ja

ryhmäprofiilit.

Kaikissa neljässä tapauksessa määritetään tuloksena olevan korrelaatiokertoimen merkitys

rankattujen arvojen lukumäärän mukaan N. Ensimmäisessä tapauksessa tämä määrä on sama kuin

näytteen koko n. Toisessa tapauksessa havaintojen määrä on piirteiden lukumäärä,

muodostavat hierarkian. Kolmannessa ja neljännessä tapauksessa N on myös vertailtujen lukumäärä

ominaisuudet, ei ryhmissä olevien aiheiden lukumäärä. Yksityiskohtaiset selitykset annetaan esimerkeissä. Jos

rs:n itseisarvo saavuttaa tai ylittää kriittisen arvon, korrelaation

luotettava.

Hypoteesit.

On olemassa kaksi mahdollista hypoteesia. Ensimmäinen koskee tapausta 1, toinen kolmea muuta

Ensimmäinen versio hypoteeseista

H0: Muuttujien A ja B välinen korrelaatio ei eroa nollasta.

H2: Muuttujien A ja B välinen korrelaatio eroaa merkittävästi nollasta.

Toinen versio hypoteeseista

H0: Hierarkioiden A ja B välinen korrelaatio ei eroa nollasta.

H2: Hierarkioiden A ja B välinen korrelaatio eroaa merkittävästi nollasta.

Rankkorrelaatiokertoimen rajoitukset

1. Jokaisesta muuttujasta on esitettävä vähintään 5 havaintoa. Yläosa

näytteenottoraja määräytyy saatavilla olevien kriittisten arvojen taulukoiden mukaan .

2. Spearmanin rankkorrelaatiokerroin rs suurelle määrälle identtisiä

ranks yhdelle tai molemmille verratuille muuttujille antaa karkeita arvoja. Ihannetapauksessa

molempien korreloitujen sarjojen tulee edustaa kahta divergenttien sarjaa

arvot. Jos tämä ehto ei täyty, siihen on tehtävä muutos

samoilla riveillä.

Spearmanin rankkorrelaatiokerroin lasketaan kaavalla:

Jos molemmat verratut arvosarjat sisältävät samanarvoisia ryhmiä,

ennen rankkorrelaatiokertoimen laskemista on tarpeen tehdä korjauksia samaan

Ta ja TV sijoitukset:

Ta = Σ (a3 – a)/12,

Тв = Σ (в3 – в)/12,

Missä A - kunkin identtisten sijoitusten ryhmän tilavuus sarjassa A, in kunkin tilavuus

samanarvoiset ryhmät sarjassa B.

Laskeaksesi rs:n empiirisen arvon, käytä kaavaa:

38. Piste-biserialinen korrelaatiokerroin.

Korrelaatiosta yleensä, katso kysymys nro 36 Kanssa. 56 (64) 063.JPG

harchenko-korranaliz.pdf

Mitataan muuttuja X vahvalla asteikolla ja muuttuja Y dikotomisella asteikolla. Pisteen biserialinen korrelaatiokerroin rpb lasketaan kaavalla:

Tässä x 1 on X objektin keskiarvo, jonka arvo on "yksi" Y:n kohdalla;

x 0 – keskiarvo yli X objektin arvolla "nolla" yli Y;

s x – kaikkien X:n arvojen keskihajonta;

n 1 – kohteiden määrä "yksi" Y:ssä, n 0 - kohteiden määrä "nolla" Y:ssä;

n = n 1 + n 0 – otoskoko.

Pisteen biserialinen korrelaatiokerroin voidaan laskea myös käyttämällä muita vastaavia lausekkeita:

Tässä x– muuttujan kokonaiskeskiarvo X.

Pisteen biserialinen korrelaatiokerroin rpb vaihtelee -1:stä +1:een. Sen arvo on nolla, jos muuttuja on yksi Y on keskiarvo Y, yhtä suuri kuin nollalla olevien muuttujien keskiarvo Y.

Tutkimus merkitsevyyshypoteesit pisteen biserialinen korrelaatiokerroin on tarkistettava nollahypoteesih 0 yleisen korrelaatiokertoimen yhtäläisyydestä nollaan: ρ = 0, joka suoritetaan Studentin t-testillä. Empiirinen merkitys

kriittisiin arvoihin verrattuna t a (df) vapausasteiden lukumäärälle df = n– 2

Jos ehto | t| ≤ (df), nollahypoteesia ρ = 0 ei hylätä. Pisteen biserialinen korrelaatiokerroin eroaa merkittävästi nollasta, jos empiirinen arvo | t| putoaa kriittiselle alueelle, eli jos tila | t| > (n– 2). Suhteen luotettavuus, joka on laskettu käyttämällä prpb, voidaan määrittää myös kriteerin avulla χ 2 vapausasteiden lukumäärälle df= 2.

Piste biserial korrelaatio

Momenttien tulon korrelaatiokertoimen myöhempi muutos näkyi pisteen biserialissa r. Tämä tilasto osoittaa kahden muuttujan välisen suhteen, joista toinen on oletettavasti jatkuva ja normaalijakautuma, ja toinen on diskreetti sanan suppeassa merkityksessä. Pisteen biserialinen korrelaatiokerroin on merkitty r pbis Vuodesta lähtien r pbis dikotomia heijastaa diskreetin muuttujan todellista luonnetta eikä ole keinotekoista, kuten tapauksessa r bis, sen merkki määritetään mielivaltaisesti. Siksi kaikkiin käytännön tarkoituksiin. tavoitteet r pbis pidetään välillä 0,00 - +1,00.

On myös tapaus, jossa kahden muuttujan oletetaan olevan jatkuvia ja normaalijakautuneita, mutta molemmat on keinotekoisesti dikotomisoitu, kuten biserialisen korrelaation tapauksessa. Tällaisten muuttujien välisen suhteen arvioimiseksi käytetään tetrakoorista korrelaatiokerrointa r tet, jonka on myös kasvattanut Pearson. Perus (tarkat) kaavat ja laskentamenetelmät r tet melko monimutkaista. Siksi käytännön Tämä menetelmä käyttää approksimaatioita r tet, joka on saatu lyhennettyjen menettelyjen ja taulukoiden perusteella.

/on-line/dictionary/dictionary.php?term=511

PISTE BISERIAALIKERROIN on kahden muuttujan välinen korrelaatiokerroin, joista toinen mitataan kaksijakoisella ja toinen intervalliasteikolla. Sitä käytetään klassisessa ja nykyaikaisessa testauksessa testitehtävän laadun indikaattorina - luotettavuudesta ja johdonmukaisuudesta testin kokonaispistemäärän kanssa.

Korreloidaksesi muuttujia mitattuna dikotominen ja intervalliasteikko käyttää piste-bissarja-korrelaatiokerroin.
Piste-bissarjakorrelaatiokerroin on menetelmä muuttujien suhteen korrelaatioanalyysiin, joista yksi mitataan nimiasteikolla ja saa vain 2 arvoa (esim. miehet/naiset, oikea vastaus/väärä vastaus, ominaisuus läsnä/ei läsnä) ja toinen asteikkosuhteilla tai intervalliasteikolla. Kaava piste-bissarja-korrelaatiokertoimen laskemiseksi:

Missä:
m1 ja m0 ovat X:n keskiarvoja, joiden arvo on 1 tai 0 Y:ssä.
σx – kaikkien arvojen keskihajonta X:llä
n1,n0 – X-arvojen määrä välillä 1 tai 0 - Y.
n – arvoparien kokonaismäärä

Useimmiten tämän tyyppistä korrelaatiokerrointa käytetään laskettaessa testikohteiden ja kokonaisasteikon välistä suhdetta. Tämä on eräänlainen kelvollisuustarkistus.

39. Rank-biserial-korrelaatiokerroin.

Korrelaatiosta yleensä, katso kysymys nro 36 Kanssa. 56 (64) 063.JPG

harchenko-korranaliz.pdf s. 28

Rank biserial -korrelaatiokerroin, jota käytetään tapauksissa, joissa jokin muuttujista ( X) esitetään järjestysasteikossa ja toinen ( Y) – kaksijakoinen, laskettu kaavalla

.

Tässä on niiden kohteiden keskimääräinen sijoitus, joilla on yksi tuuma Y; – kohteiden keskimääräinen sijoitus nollasta Y, n- otoskoko.

Tutkimus merkitsevyyshypoteesit Rank-biserial-korrelaatiokerroin suoritetaan samalla tavalla kuin pistebissarjakorrelaatiokerroin käyttäen Studentin testiä korvaamalla kaavoissa rpb päällä rrb.

Tapauksissa, joissa yhtä muuttujaa mitataan dikotomisella asteikolla (muuttuja X), ja toisessa arvoasteikossa (muuttuja Y), käytetään rank-biserial-korrelaatiokerrointa. Muistamme, että muuttuja X, kaksijakoisella asteikolla mitattuna ottaa vain kaksi arvoa (koodia) 0 ja 1. Erityisesti korostamme: huolimatta siitä, että tämä kerroin vaihtelee välillä –1 ja +1, sen merkillä ei ole väliä tulkinnan kannalta. tuloksia. Tämä on toinen poikkeus yleisestä säännöstä.

Tämä kerroin lasketaan kaavalla:

missä ` X 1 muuttujan näiden elementtien keskimääräinen sijoitus Y, joka vastaa muuttujan koodia (merkkiä) 1 X;

`X 0 – muuttujan elementtien keskiarvo Y, joka vastaa muuttujan koodia (merkkiä) 0 X\

N – muuttujan elementtien kokonaismäärä X.

Rank-biserial-korrelaatiokertoimen soveltaminen edellyttää, että seuraavat ehdot täyttyvät:

1. Verrattavat muuttujat on mitattava eri asteikoilla: yksi X – dikotomisessa mittakaavassa; muu Y- ranking-asteikolla.

2. Vaihtelevien ominaisuuksien lukumäärä verrattavissa muuttujissa X Ja Y pitäisi olla sama.

3. Arvioidaksesi rank-biserial-korrelaatiokertoimen luotettavuustasoa, sinun tulee käyttää Student-kriteerin kaavaa (11.9) ja kriittisten arvojen taulukkoa. k = n - 2.

http://psystat.at.ua/publ/drugie_vidy_koehfficienta_korreljacii/1-1-0-38

Tapaukset, joissa jokin muuttujista on edustettuna dikotominen mittakaava, ja toinen sisään sijoitus (järjestys), vaativat hakemuksen rank-biserial-korrelaatiokerroin:

rpb = 2 / n * (m1 - m0)

Missä:
n – mittauskohteiden lukumäärä
m1 ja m0 - objektien keskimääräinen sijoitus, joiden toisessa muuttujassa on 1 tai 0.
Tätä kerrointa käytetään myös testien validiteetin tarkistuksessa.

40. Lineaarinen korrelaatiokerroin.

Korrelaatiosta yleensä (ja erityisesti lineaarisesta korrelaatiosta), katso kysymys nro 36 Kanssa. 56 (64) 063.JPG

Mr. PEARSONIN KERROIN

r-Pearson (Pearson r) käytetään kahden mittarin välisen suhteen tutkimiseensamasta otoksesta mitattuja eri muuttujia. On monia tilanteita, joissa sen käyttö on tarkoituksenmukaista. Vaikuttaako älykkyys akateemiseen suoritukseen korkeakouluvuosina? Liittyykö työntekijän palkan suuruus hänen ystävällisyyteensä työtovereita kohtaan? Vaikuttaako opiskelijan mieliala monimutkaisen aritmeettisen ongelman ratkaisun onnistumiseen? Vastatakseen tällaisiin kysymyksiin tutkijan on mitattava kaksi kiinnostavaa indikaattoria kullekin otoksen jäsenelle. Suhteen tutkimiseen tarvittavat tiedot on sitten taulukoitu, kuten alla olevassa esimerkissä.

ESIMERKKI 6.1

Taulukossa on esimerkki lähtötiedoista kahden älykkyysindikaattorin (verbaalinen ja ei-sanallinen) mittaamiseksi 20 8. luokan oppilaalle.

Näiden muuttujien välinen suhde voidaan kuvata käyttämällä sirontadiagrammia (katso kuva 6.3). Kaavio osoittaa, että mitattujen indikaattoreiden välillä on jonkinlainen suhde: mitä suurempi on verbaalisen älykkyyden arvo, sitä (enimmäkseen) sitä suurempi on ei-verbaalisen älykkyyden arvo.

Ennen kuin annat korrelaatiokertoimen kaavan, yritetään jäljittää sen esiintymisen logiikka esimerkin 6.1 tietojen avulla. Jokaisen /-pisteen (kohde numerolla /) sijainti sirontakaaviossa suhteessa muihin pisteisiin (kuva 6.3) voidaan määrittää vastaavien muuttujien arvojen ja niiden keskiarvojen poikkeamien arvojen ja merkkien avulla. : (xj - MJ Ja (mieli klo ). Jos näiden poikkeamien merkit ovat samat, tämä osoittaa positiivista suhdetta (suuremmat arvot X suuret arvot vastaavat klo tai pienempiä arvoja X pienemmät arvot vastaavat y).

Kohteen nro 1 osalta poikkeama keskiarvosta X ja klo positiivisia, ja aiheen nro 3 osalta molemmat poikkeamat ovat negatiivisia. Näin ollen molempien tiedot osoittavat positiivisen suhteen tutkittujen ominaisuuksien välillä. Päinvastoin, jos merkkejä poikkeamista keskiarvosta X ja klo eroavat, tämä osoittaa negatiivista suhdetta ominaisuuksien välillä. Siten aiheen nro 4 poikkeama keskiarvosta X on negatiivinen, by y - positiivinen, ja aiheen nro 9 osalta - päinvastoin.

Jos siis poikkeamien tulo (x,- M X ) X (mieli klo ) positiivinen, silloin /-kohteen tiedot osoittavat suoraa (positiivista) suhdetta ja jos negatiivista, niin käänteistä (negatiivista) suhdetta. Vastaavasti jos Xwv v ovat yleensä suoraan verrannollisia, silloin suurin osa poikkeamien tuloista on positiivisia, ja jos ne liittyvät käänteisellä suhteella, niin suurin osa tuloista on negatiivisia. Siksi yleinen indikaattori suhteen vahvuudelle ja suunnalle voi olla tietyn näytteen kaikkien poikkeamien tulojen summa:

Kun muuttujien välinen suhde on suoraan verrannollinen, tämä arvo on suuri ja positiivinen - useimmilla koehenkilöillä poikkeamat ovat samat etumerkissä (yhden muuttujan suuret arvot vastaavat toisen muuttujan suuria arvoja ja päinvastoin). Jos X Ja klo saada palautetta, niin useimmille aiheille yhden muuttujan suuremmat arvot vastaavat toisen muuttujan pienempiä arvoja, eli tuotteiden merkit ovat negatiivisia ja tuotteiden summa kokonaisuutena on myös suuri itseisarvossa, mutta negatiivisessa etumerkissä. Jos muuttujien välillä ei ole systemaattista yhteyttä, positiiviset termit (poikkeamien tulot) tasapainotetaan negatiivisilla termeillä ja kaikkien poikkeamien tulojen summa on lähellä nollaa.

Jotta tuotteiden summa ei riipu otoksen koosta, riittää sen keskiarvo. Mutta meitä kiinnostaa yhteenliittämisen mitta ei yleisenä parametrina, vaan laskennallisena arviona siitä - tilastoista. Siksi, mitä tulee dispersiokaavaan, tässä tapauksessa teemme samoin, jaa poikkeamien tulojen summa, ei N, ja TV:ssä - 1. Tämä johtaa fysiikassa ja teknisissä tieteissä laajalti käytettyyn yhteysmittaan, jota kutsutaan ns. kovarianssi (Kovahance):


SISÄÄN Psykologiassa, toisin kuin fysiikassa, useimmat muuttujat mitataan mielivaltaisilla asteikoilla, koska psykologeja ei kiinnosta merkin absoluuttinen arvo, vaan koehenkilöiden suhteellinen asema ryhmässä. Lisäksi kovarianssi on erittäin herkkä sen asteikon (varianssin) asteikolle, jolla piirteet mitataan. Jotta liityntämitta olisi riippumaton molempien ominaisuuksien mittayksiköistä, riittää, että kovarianssi jaetaan vastaaviin standardipoikkeamiin. Näin se saatiin varten-K. Pearsonin korrelaatiokertoimen muuli:

tai sen jälkeen, kun lausekkeet on korvattu o x:lla ja


Jos molempien muuttujien arvot muunnetaan r-arvoiksi kaavan avulla


silloin r-Pearson-korrelaatiokertoimen kaava näyttää yksinkertaisemmalta (071.JPG):

/dict/sociology/article/soc/soc-0525.htm

KORRELAATIO LINEAARINEN- tilastollinen lineaarinen suhde, joka ei ole luonteeltaan kausaalinen kahden kvantitatiivisen muuttujan välillä X Ja klo. Mitattu käyttämällä "K.L-kerrointa." Pearson, joka on tulos jakamalla kovarianssi molempien muuttujien keskihajonnoista:

,

Missä s xy- muuttujien välinen kovarianssi X Ja klo;

s x , s y- muuttujien keskihajonnat X Ja klo;

x i , y i- muuttuvat arvot X Ja klo numerolla varustetulle kohteelle i;

x, y- muuttujien aritmeettiset keskiarvot X Ja klo.

Pearsonin kerroin r voi ottaa arvoja väliltä [-1; +1]. Merkitys r = 0 tarkoittaa, että muuttujien välillä ei ole lineaarista suhdetta X Ja klo(mutta ei sulje pois epälineaarista tilastollista yhteyttä). Positiiviset kertoimen arvot ( r> 0) osoittavat suoraa lineaarista yhteyttä; mitä lähempänä sen arvo on +1, sitä vahvempi suhde on tilastoviivalla. Negatiiviset kertoimen arvot ( r < 0) свидетельствуют об обратной линейной связи; чем ближе его значение к -1, тем сильнее обратная связь. Значения r= ±1 tarkoittaa täydellistä lineaarista suoraa tai käänteistä yhteyttä. Jos yhteys on täydellinen, kaikki pisteet, joissa on koordinaatit ( x i , y i) makaa suoralla linjalla y = a + bx.

"Kerroin K.L." Pearsonia käytetään myös mittaamaan yhteyden vahvuutta lineaarisessa parittaisessa regressiomallissa.

41. Korrelaatiomatriisi ja korrelaatiograafi.

Korrelaatiosta yleensä, katso kysymys nro 36 Kanssa. 56 (64) 063.JPG

Korrelaatiomatriisi. Usein korrelaatioanalyysi sisältää ei kahden, vaan usean muuttujan välisten suhteiden tutkimisen, jotka mitataan kvantitatiivisella asteikolla yhdessä otoksessa. Tässä tapauksessa korrelaatiot lasketaan tämän muuttujajoukon jokaiselle parille. Laskelmat tehdään yleensä tietokoneella ja tuloksena on korrelaatiomatriisi.

Korrelaatiomatriisi(Korrelaatio Matriisi) on tulos yhden tyypin korrelaatioiden laskemisesta jokaiselle joukon parille R muuttujat mitattuna kvantitatiivisella asteikolla yhdessä otoksessa.

ESIMERKKI

Oletetaan, että tutkimme 5 muuttujan välisiä suhteita (vl, v2,..., v5; P= 5), mitattuna näytteestä N = 30 Ihmisen. Alla on taulukko lähdetiedoista ja korrelaatiomatriisi.

JA
samanlaisia ​​tietoja:

Korrelaatiomatriisi:

On helppo huomata, että korrelaatiomatriisi on neliömäinen, symmetrinen päälävistäjän suhteen (takkak,y = /) y, yksiköt päädiagonaalissa (koska G Ja = Gu = 1).

Korrelaatiomatriisi on neliö: rivien ja sarakkeiden määrä on yhtä suuri kuin muuttujien lukumäärä. Hän symmetrinen suhteessa päädiagonaaliin, koska korrelaatio X Kanssa klo yhtä suuri kuin korrelaatio klo Kanssa X. Yksiköt sijaitsevat sen päälävistäjällä, koska ominaisuuden korrelaatio itsensä kanssa on yhtä suuri. Näin ollen kaikki korrelaatiomatriisin elementit eivät ole analyysin kohteena, vaan ne, jotka sijaitsevat päädiagonaalin ylä- tai alapuolella.

korrelaatiokertoimien lukumäärä, Suhteita tutkittaessa analysoitavat piirteet määritetään kaavalla: P(P- 1)/2. Yllä olevassa esimerkissä tällaisten korrelaatiokertoimien lukumäärä on 5(5 - 1)/2 = 10.

Korrelaatiomatriisin analyysin päätehtävä on monien piirteiden välisten suhteiden rakenteen tunnistaminen. Tässä tapauksessa visuaalinen analyysi on mahdollista korrelaatiogalaksit- graafinen kuva rakenteet tilastollisestimerkityksellisiä yhteyksiä, jos tällaisia ​​yhteyksiä ei ole kovin paljon (jopa 10-15). Toinen tapa on käyttää monimuuttujamenetelmiä: moniregressio-, tekijä- tai klusterianalyysi (katso kohta ”Monimuuttujamenetelmät...”). Tekijä- tai klusterianalyysin avulla on mahdollista tunnistaa muuttujien ryhmittymiä, jotka liittyvät läheisemmin toisiinsa kuin muihin muuttujiin. Näiden menetelmien yhdistelmä on myös erittäin tehokas esimerkiksi, jos merkkejä on monia ja ne eivät ole homogeenisia.

Korrelaatioiden vertailu - lisätehtävä analysoida korrelaatiomatriisia, jossa on kaksi vaihtoehtoa. Jos on tarpeen verrata korrelaatioita jollain korrelaatiomatriisin rivillä (yhdelle muuttujalle), käytetään riippuvien näytteiden vertailumenetelmää (s. 148-149). Eri näytteille laskettuja samannimiä korrelaatioita verrattaessa käytetään riippumattomien näytteiden vertailumenetelmää (s. 147-148).

Vertailumenetelmät korrelaatioita diagonaaleissa korrelaatiomatriisi (satunnaisprosessin stationaarisuuden arvioimiseksi) ja vertailu useita Eri näytteille (niiden homogeenisuuden vuoksi) saadut korrelaatiomatriisit ovat työvoimavaltaisia ​​ja tämän kirjan soveltamisalan ulkopuolella. Voit tutustua näihin menetelmiin G.V. Sukhodolskyn kirjasta 1.

Korrelaatioiden tilastollisen merkitsevyyden ongelma. Ongelmana on, että tilastollisen hypoteesin testausmenettely olettaa yksi-useita yhdelle näytteelle tehty testi. Jos käytetään samaa menetelmää toistuvasti, vaikka eri muuttujien suhteen todennäköisyys saada tulos puhtaasti sattumalta kasvaa. Yleensä, jos toistamme saman hypoteesin testausmenetelmän kerran eri muuttujien tai näytteiden suhteen, niin vahvistetulla arvolla a saamme taatusti vahvistuksen hypoteesille ah tapausten määrä.

Oletetaan, että korrelaatiomatriisi analysoidaan 15 muuttujalle, eli 15(15-1)/2 = 105 korrelaatiokerrointa lasketaan. Hypoteesien testaamiseksi asetetaan taso a = 0,05. Tarkistamalla hypoteesi 105 kertaa, saamme sille vahvistuksen viisi kertaa (!), riippumatta siitä, onko yhteys todella olemassa. Kun tiedämme tämän ja meillä on esimerkiksi 15 "tilastollisesti merkitsevää" korrelaatiokerrointa, voimmeko sanoa, mitkä niistä on saatu sattumalta ja mitkä heijastavat todellista suhdetta?

Tarkkaan ottaen tilastollisen päätöksen tekemiseksi on tarpeen alentaa tasoa a niin monta kertaa kuin testattavien hypoteesien määrä. Mutta tämä tuskin on suositeltavaa, koska todennäköisyys jättää huomiotta todella olemassa oleva yhteys (tehdä tyypin II virhe) kasvaa arvaamattomalla tavalla.

Pelkkä korrelaatiomatriisi ei ole riittävä perustasiihen sisältyviä yksittäisiä kertoimia koskevia tilastollisia päätelmiä vartenkorrelaatioita!

On vain yksi todella vakuuttava tapa ratkaista tämä ongelma: jakaa otos satunnaisesti kahteen osaan ja ottaa huomioon vain ne korrelaatiot, jotka ovat tilastollisesti merkitseviä molemmissa otoksen osissa. Vaihtoehtona voi olla monimuuttujamenetelmien (tekijä-, klusteri- tai moniregressioanalyysi) käyttö tilastollisesti merkitsevästi toisiinsa liittyvien muuttujien ryhmien tunnistamiseksi ja tulkitsemiseksi.

Puuttuvien arvojen ongelma. Jos tiedoista puuttuu arvoja, niin korrelaatiomatriisin laskemiseen on kaksi vaihtoehtoa: a) arvojen poisto rivi riviltä (Sulje poistapauksialistallisesti); b) arvojen poistaminen pareittain (Sulje poistapauksiapareittain). klo rivi riviltä poisto Jos havaintoja puuttuu arvoista, koko rivi objektilta (aiheelta), jolla on vähintään yksi puuttuva arvo jollekin muuttujasta, poistetaan. Tämä menetelmä johtaa "oikeaan" korrelaatiomatriisiin siinä mielessä, että kaikki kertoimet lasketaan samasta objektijoukosta. Kuitenkin, jos puuttuvat arvot jakautuvat satunnaisesti muuttujiin, tämä menetelmä voi johtaa siihen, että tarkasteltavassa tietojoukossa ei ole enää yhtäkään objektia (jokaisella rivillä on vähintään yksi puuttuva arvo) . Voit välttää tämän tilanteen käyttämällä toista menetelmää nimeltä pareittainen poisto. Tämä menetelmä ottaa huomioon vain aukot kussakin valitussa sarake-muuttujaparissa ja jättää huomiotta muiden muuttujien aukot. Korrelaatio muuttujaparille lasketaan niille kohteille, joissa ei ole aukkoja. Monissa tilanteissa, varsinkin kun aukkojen määrä on suhteellisen pieni, esimerkiksi 10%, ja aukot jakautuvat melko satunnaisesti, tämä menetelmä ei johda vakaviin virheisiin. Joskus näin ei kuitenkaan ole. Esimerkiksi systemaattinen harha (siirtymä) arvioinnissa voi "piilottaa" systemaattisen poisjättöjen järjestelyn, mikä on syynä eri osajoukkojen (esimerkiksi eri objektien alaryhmien) korrelaatiokertoimien eroon. Toinen ongelma, joka liittyy korrelaatiomatriisiin, joka on laskettu pareittain aukkojen poistaminen tapahtuu, kun tätä matriisia käytetään muuntyyppisissä analyyseissä (esimerkiksi moniregressio- tai tekijäanalyysissä). He olettavat, että "oikeaa" korrelaatiomatriisia käytetään tietyllä johdonmukaisuuden ja eri kertoimien "yhteensopivuuden" tasolla. Matriisin käyttäminen "huonoilla" (harhoilla) arvioilla johtaa siihen, että ohjelma joko ei pysty analysoimaan tällaista matriisia tai tulokset ovat virheellisiä. Siksi, jos käytetään parittaista puuttuvien tietojen poissulkemismenetelmää, on tarpeen tarkistaa, onko puuttuvien tietojen jakautumisessa systemaattisia kaavoja.

Jos puuttuvien tietojen pareittainen poistaminen ei johda keskiarvojen ja varianssien (keskihajonnan) systemaattiseen muutokseen, nämä tilastot ovat samanlaisia ​​kuin ne, jotka on laskettu käyttämällä puuttuvien tietojen poistamista rivi riviltä. Jos havaitaan merkittävä ero, on syytä olettaa, että arvioissa on tapahtunut muutos. Esimerkiksi jos muuttujan arvojen keskiarvo (tai keskihajonta). A, jota käytettiin laskettaessa sen korrelaatiota muuttujan kanssa SISÄÄN, paljon pienempi kuin muuttujan samojen arvojen keskiarvo (tai keskihajonta). A, joita käytettiin laskettaessa sen korrelaatiota muuttujan C kanssa, on syytä olettaa, että nämä kaksi korrelaatiota (A-Bmeille) perustuu eri tietoryhmiin. Korrelaatioissa esiintyy harhaa, joka johtuu muuttujien arvoissa olevien aukkojen ei-satunnaisesta sijoittamisesta.

Korrelaatiogalaksien analyysi. Korrelaatiomatriisin elementtien tilastollisen merkitsevyyden ongelman ratkaisemisen jälkeen tilastollisesti merkitsevät korrelaatiot voidaan esittää graafisesti korrelaatiogalaksin tai galaksin muodossa. Korrelaatiogalaksi - Tämä on kuvio, joka koostuu kärjeistä ja niitä yhdistävistä viivoista. Huiput vastaavat ominaisuuksia ja on yleensä merkitty numeroilla - muuttuvilla numeroilla. Viivat vastaavat tilastollisesti merkitseviä yhteyksiä ja ilmaisevat graafisesti yhteyden etumerkkiä ja joskus j-merkitystä.

Korrelaatiogalaksi voi heijastaa Kaikki korrelaatiomatriisin tilastollisesti merkitseviä yhteyksiä (jota joskus kutsutaan korrelaatiokaavio ) tai vain niiden mielekkäästi valittu osa (esimerkiksi tekijäanalyysin tulosten mukaan yhtä tekijää vastaava).

ESIMERKKI KORRELAATIOPLIAADIN RAKEENTAMISESTA


Valmistuminen valmistuneiden valtion (lopulliseen) sertifiointiin: Unified State Exam -tietokannan muodostaminen (yleinen luettelo kaikkien luokkien yhtenäisen valtiontutkinnon osallistujista, aineina) - ottaen huomioon varapäivät samojen oppiaineiden osalta;

  • Työsuunnitelma (27)

    Ratkaisu

    2. Oppilaitoksen toimet luonnontieteiden ja matematiikan opetuksen aineiden sisällön parantamiseksi ja laadun arvioimiseksi Kunnallinen oppilaitos lukio nro 4, Litvinovskaya, Chapaevskaya,

  • Tapauksissa, joissa tutkittavien ominaisuuksien mittaukset suoritetaan järjestysasteikolla tai yhteyden muoto poikkeaa lineaarisesta, kahden satunnaismuuttujan välisen suhteen tutkimus suoritetaan rankkorrelaatiokertoimien avulla. Harkitse Spearmanin rankkorrelaatiokerrointa. Sitä laskettaessa on tarpeen järjestää (järjestää) näytevaihtoehdot. Ranking on kokeellisten tietojen ryhmittely tiettyyn järjestykseen, joko nousevaan tai laskevaan järjestykseen.

    Luokitustoiminto suoritetaan seuraavan algoritmin mukaan:

    1. Pienemmälle arvolle annetaan alempi arvo. Korkeimmalle arvolle annetaan arvo, joka vastaa rankattujen arvojen määrää. Pienimmälle arvolle annetaan arvo 1. Jos esimerkiksi n=7, niin suurin arvo saa arvon 7, paitsi toisessa säännössä määrätyissä tapauksissa.

    2. Jos useat arvot ovat yhtä suuret, niille annetaan arvo, joka on niiden arvojen keskiarvo, jotka he saisivat, jos ne eivät olisi yhtä suuret. Esimerkkinä voidaan harkita nousevassa järjestyksessä olevaa näytettä, joka koostuu 7 elementistä: 22, 23, 25, 25, 25, 28, 30. Arvot 22 ja 23 esiintyvät kukin kerran, joten niiden järjestys on R22=1, ja R23=2. Arvo 25 näkyy 3 kertaa. Jos näitä arvoja ei toistettaisi, niiden arvot olisivat 3, 4, 5. Siksi niiden R25-arvo on yhtä suuri kuin 3, 4 ja 5:n aritmeettinen keskiarvo: . Arvot 28 ja 30 eivät toistu, joten niiden arvot ovat R28=6 ja R30=7. Lopuksi meillä on seuraava kirjeenvaihto:

    3. Ristojen kokonaissumman on oltava sama kuin laskettu summa, joka määritetään kaavalla:

    missä n on rankattujen arvojen kokonaismäärä.

    Todellisen ja lasketun pistesumman välinen ero osoittaa, että rivejä laskettaessa tai summattaessa on tehty virhe. Tässä tapauksessa sinun on löydettävä ja korjattava virhe.

    Spearmanin rankkorrelaatiokerroin on menetelmä, jonka avulla voidaan määrittää kahden ominaisuuden tai kahden ominaisuushierarkian välisen suhteen vahvuus ja suunta. Rankkorrelaatiokertoimen käytöllä on useita rajoituksia:

    • a) Oletetun korrelaatioriippuvuuden tulee olla monotoninen.
    • b) Kunkin näytteen tilavuuden on oltava suurempi tai yhtä suuri kuin 5. Määritä näytteen yläraja käyttämällä kriittisten arvojen taulukoita (liitteen taulukko 3). Taulukon n:n enimmäisarvo on 40.
    • c) Analyysin aikana on todennäköistä, että suuri määrä identtisiä arvoja voi syntyä. Tässä tapauksessa muutos on tehtävä. Edullisin tapaus on, kun molemmat tutkittavat näytteet edustavat kahta erilaisten arvojen sarjaa.

    Korrelaatioanalyysin suorittamiseksi tutkijalla on oltava kaksi näytettä, jotka voidaan luokitella, esimerkiksi:

    • - kaksi ominaisuutta mitattuna samassa ryhmässä;
    • - kaksi yksilöllistä ominaisuushierarkiaa, jotka on tunnistettu kahdessa henkilössä, jotka käyttävät samaa ominaisuusjoukkoa;
    • - kaksi ominaisuusryhmien hierarkiaa;
    • - yksilöllisten ja ryhmien ominaisuushierarkiat.

    Aloitamme laskennan järjestämällä tutkitut indikaattorit kunkin ominaisuuden osalta erikseen.

    Analysoidaan tapausta, jossa on kaksi merkkiä mitattuna samassa ryhmässä. Ensin eri koehenkilöiden saamat yksittäiset arvot luokitellaan ensimmäisen ominaisuuden mukaan ja sitten yksittäiset arvot toisen ominaisuuden mukaan. Jos yhden indikaattorin alemmat arvot vastaavat toisen indikaattorin alempia arvoja ja yhden indikaattorin korkeammat arvot vastaavat toisen indikaattorin suurempia arvoja, nämä kaksi ominaisuutta liittyvät positiivisesti toisiinsa. Jos yhden indikaattorin korkeammat arvot vastaavat toisen indikaattorin alempia arvoja, nämä kaksi ominaisuutta liittyvät negatiivisesti toisiinsa. Löytääksemme rs:n määritämme erot kunkin kohteen (d) välillä. Mitä pienempi ero rivien välillä on, sitä lähempänä sijoituskorrelaatiokerroin rs on arvoa "+1". Jos suhdetta ei ole, niiden välillä ei ole vastaavuutta, joten rs on lähellä nollaa. Mitä suurempi ero kahden muuttujan koehenkilöiden välillä on, sitä lähempänä arvoa "-1" rs-kertoimen arvo on. Siten Spearmanin rankkorrelaatiokerroin on kahden tutkittavan ominaisuuden välisen monotonisen suhteen mitta.

    Tarkastellaan tilannetta, jossa kaksi yksilöllistä ominaisuushierarkiaa, jotka tunnistetaan kahdessa subjektissa, jotka käyttävät samaa ominaisuusjoukkoa. Tässä tilanteessa kummankin kohteen saamat yksittäiset arvot luokitellaan tietyn ominaisuusjoukon mukaan. Alhaisimman arvon omaavalle ominaisuudelle on annettava ensimmäinen arvo. ominaisuus, jolla on korkeampi arvo, on toinen arvo jne. Erityistä huolellisuutta tulee olla sen varmistamiseksi, että kaikki attribuutit mitataan samoilla yksiköillä. Esimerkiksi indikaattoreita on mahdotonta luokitella, jos ne ilmaistaan ​​eri "hintapisteissä", koska on mahdotonta määrittää, mikä tekijöistä on vakavuuden kannalta ensimmäinen, ennen kuin kaikki arvot on saatettu yhdelle asteikolle. Jos ominaisuuksilla, joilla on alhainen arvo jossakin oppiaineessa, on alhainen arvo toisessa ja päinvastoin, yksittäiset hierarkiat liittyvät positiivisesti toisiinsa.

    Kahden ryhmien ominaisuushierarkian tapauksessa kahdessa kohderyhmässä saadut keskimääräiset ryhmäarvot luokitellaan tutkittujen ryhmien saman ominaisuusjoukon mukaan. Seuraavaksi noudatamme aiemmissa tapauksissa annettua algoritmia.

    Analysoidaan tapausta yksilöllisen ja ryhmän ominaisuushierarkialla. Ne alkavat sijoittamalla erikseen koehenkilön yksittäiset arvot ja keskimääräiset ryhmäarvot samojen ominaisuuksien mukaan, jotka saatiin, pois lukien tutkittava, joka ei osallistu keskimääräiseen ryhmähierarkiaan, koska hänen yksilöllinen hierarkia on siihen verrattuna. Sijoituskorrelaation avulla voimme arvioida piirteiden yksilö- ja ryhmähierarkian johdonmukaisuuden astetta.

    Tarkastellaan, miten korrelaatiokertoimen merkitys määritetään edellä luetelluissa tapauksissa. Kahden ominaisuuden tapauksessa se määräytyy otoskoon mukaan. Kahden yksittäisen ominaisuushierarkian tapauksessa merkitys riippuu hierarkiaan sisältyvien ominaisuuksien lukumäärästä. Kahdessa viimeisessä tapauksessa merkitsevyyden määrää tutkittavien ominaisuuksien määrä, ei ryhmien lukumäärä. Siten rs:n merkitys kaikissa tapauksissa määräytyy rankattujen arvojen n määrällä.

    rs:n tilastollista merkitsevyyttä tarkistettaessa käytetään rankkorrelaatiokertoimen kriittisten arvojen taulukoita, jotka on laadittu erilaisille ranking-arvoille ja eri merkittävyystasoille. Jos rs:n itseisarvo saavuttaa tai ylittää kriittisen arvon, korrelaatio on luotettava.

    Kun harkitaan ensimmäistä vaihtoehtoa (tapaus, jossa on kaksi merkkiä mitattuna samassa ryhmässä), seuraavat hypoteesit ovat mahdollisia.

    H0: Muuttujien x ja y välinen korrelaatio ei eroa nollasta.

    H1: Muuttujien x ja y välinen korrelaatio eroaa merkittävästi nollasta.

    Jos työskentelemme jollakin kolmesta jäljellä olevasta tapauksesta, on tarpeen esittää toinen hypoteesipari:

    H0: Hierarkioiden x ja y välinen korrelaatio ei eroa nollasta.

    H1: Hierarkioiden x ja y välinen korrelaatio eroaa merkittävästi nollasta.

    Toimintojen järjestys Spearman-arvokorrelaatiokerrointa rs laskettaessa on seuraava.

    • - Määritä mitkä kaksi ominaisuutta tai kaksi ominaisuushierarkiaa osallistuvat vertailuun muuttujina x ja y.
    • - Järjestä muuttujan x arvot asettamalla arvo 1 pienimmälle arvolle järjestyssääntöjen mukaisesti. Sijoita rivit taulukon ensimmäiseen sarakkeeseen koehenkilöiden tai ominaisuuksien järjestykseen.
    • - Järjestä muuttujan y arvot. Sijoita rivit taulukon toiseen sarakkeeseen koehenkilöiden tai ominaisuuksien järjestykseen.
    • - Laske erot d rivien x ja y välillä taulukon kullekin riville. Sijoita tulokset taulukon seuraavaan sarakkeeseen.
    • - Laske neliöerot (d2). Sijoita saadut arvot taulukon neljänteen sarakkeeseen.
    • - Lasketaan erojen neliösumma? d2.
    • - Jos sijoitukset ovat samat, laske korjaukset:

    missä tx on kunkin identtisten järjestysten ryhmän tilavuus näytteessä x;

    ty on näytteen y kunkin identtisten asteiden ryhmän tilavuus.

    Laske korrelaatiokerroin sen mukaan, onko identtisiä arvoja vai ei. Jos identtisiä rivejä ei ole, laske korrelaatiokerroin rs kaavalla:

    Jos rivit ovat identtisiä, laske korrelaatiokerroin rs kaavalla:

    missä?d2 on rivien välisten erojen neliöityjen summa;

    Tx ja Ty - korjaukset yhtäläisille riveille;

    n on sijoitukseen osallistuvien aiheiden tai ominaisuuksien lukumäärä.

    Määritä rs:n kriittiset arvot liitteen taulukosta 3 tietylle määrälle koehenkilöitä n. Merkittävä ero korrelaatiokertoimen nollasta havaitaan edellyttäen, että rs ei ole pienempi kuin kriittinen arvo.

    Psykologian opiskelija (sosiologi, johtaja, johtaja jne.) on usein kiinnostunut siitä, kuinka kaksi tai useampi muuttuja liittyy toisiinsa yhdessä tai useammassa tutkittavassa ryhmässä.

    Matematiikassa muuttujasuureiden välisten suhteiden kuvaamiseen käytetään funktion F käsitettä, joka yhdistää riippumattoman muuttujan X jokaisen tietyn arvon riippuvan muuttujan Y tiettyyn arvoon. Tuloksena oleva riippuvuus merkitään Y=F( X).

    Samalla mitattujen ominaisuuksien väliset korrelaatiotyypit voivat olla erilaisia: esimerkiksi korrelaatio voi olla lineaarinen ja epälineaarinen, positiivinen ja negatiivinen. Se on lineaarinen - jos yhden muuttujan X kasvaessa tai pienentyessä, toinen muuttuja Y keskimäärin joko kasvaa tai pienenee. Se on epälineaarinen, jos yhden suuren kasvaessa toisen muutoksen luonne ei ole lineaarinen, vaan sitä kuvaavat muut lait.

    Korrelaatio on positiivinen, jos muuttujan X kasvaessa myös muuttuja Y kasvaa keskimäärin, ja jos X:n kasvaessa muuttuja Y pyrkii keskimäärin pienenemään, niin puhutaan negatiivisen olemassaolosta. korrelaatio. On mahdollista, että muuttujien välistä suhdetta on mahdotonta määrittää. Tässä tapauksessa he sanovat, että korrelaatiota ei ole.

    Korrelaatioanalyysin tehtävänä on määrittää vaihtelevien ominaisuuksien välisen suhteen suunta (positiivinen tai negatiivinen) ja muoto (lineaarinen, epälineaarinen), mitata sen läheisyys ja lopuksi tarkistaa saatujen korrelaatiokertoimien merkitsevyystaso.

    K. Spearmanin ehdottama rankkorrelaatiokerroin viittaa ei-parametriseen mitta-asteikolla mitattuun muuttujien väliseen suhteeseen. Tätä kerrointa laskettaessa ei vaadita oletuksia perusjoukon ominaisuusjakaumien luonteesta. Tämä kerroin määrittää ordinaalisten ominaisuuksien välisen yhteyden läheisyyden, jotka tässä tapauksessa edustavat vertailtavien suureiden rivejä.

    Spearmanin lineaarinen korrelaatiokerroin lasketaan kaavalla:

    missä n on järjestettävien ominaisuuksien (indikaattorit, aiheet) lukumäärä;
    D on kunkin aiheen kahden muuttujan arvosanan ero;
    D2 on rivien neliöityjen erojen summa.

    Spearmanin rankkorrelaatiokertoimen kriittiset arvot on esitetty alla:

    Spearmanin lineaarisen korrelaatiokertoimen arvo on välillä +1 ja -1. Spearmanin lineaarinen korrelaatiokerroin voi olla positiivinen tai negatiivinen, mikä kuvaa kahden asteikolla mitatun ominaisuuden välisen suhteen suuntaa.

    Jos absoluuttisen arvon korrelaatiokerroin on lähellä 1:tä, tämä vastaa suurta yhteyttä muuttujien välillä. Joten varsinkin kun muuttuja korreloi itsensä kanssa, korrelaatiokertoimen arvo on +1. Tällainen suhde luonnehtii suoraan verrannollista riippuvuutta. Jos X-muuttujan arvot on järjestetty nousevaan järjestykseen ja samat arvot (nykyisin Y-muuttujaksi nimetty) on järjestetty laskevaan järjestykseen, niin tässä tapauksessa X- ja Y-muuttujien välinen korrelaatio on täsmälleen -1. Tämä korrelaatiokertoimen arvo luonnehtii käänteisesti verrannollista suhdetta.

    Korrelaatiokertoimen etumerkki on erittäin tärkeä tuloksena olevan suhteen tulkinnassa. Jos lineaarisen korrelaatiokertoimen etumerkki on plus, niin korreloivien piirteiden välinen suhde on sellainen, että yhden ominaisuuden (muuttujan) suurempi arvo vastaa toisen ominaisuuden (toisen muuttujan) suurempaa arvoa. Toisin sanoen, jos yksi indikaattori (muuttuja) kasvaa, niin toinen indikaattori (muuttuja) kasvaa vastaavasti. Tätä riippuvuutta kutsutaan suoraan verrannolliseksi riippuvuudeksi.

    Jos miinusmerkki vastaanotetaan, yhden ominaisuuden suurempi arvo vastaa toisen pienempää arvoa. Toisin sanoen, jos on miinusmerkki, yhden muuttujan (merkki, arvo) lisäys vastaa toisen muuttujan laskua. Tätä riippuvuutta kutsutaan käänteisesti verrannolliseksi riippuvuudeksi. Tässä tapauksessa sen muuttujan valinta, jolle kasvun merkki (tendenssi) on määritetty, on mielivaltainen. Se voi olla joko muuttuja X tai muuttuja Y. Jos muuttujan X katsotaan kuitenkin kasvavan, muuttuja Y vastaavasti pienenee ja päinvastoin.

    Katsotaanpa esimerkkiä Spearman-korrelaatiosta.

    Psykologi selvittää, miten 11 ekaluokkalaisen ennen koulun alkua saadut yksittäiset kouluvalmiusmittarit liittyvät toisiinsa ja heidän keskimääräiseen suoritukseensa lukuvuoden lopussa.

    Tämän ongelman ratkaisemiseksi järjestimme ensinnäkin kouluun pääsyn yhteydessä saatujen kouluvalmiusindikaattoreiden arvot ja toiseksi näiden samojen opiskelijoiden keskimääräiset akateemisen suorituskyvyn lopulliset indikaattorit vuoden lopussa. Esitämme tulokset taulukossa:

    Korvaamme saadut tiedot yllä olevaan kaavaan ja suoritamme laskennan. Saamme:

    Merkitsevyystason selvittämiseksi katsomme taulukkoa "Spearmanin rankkorrelaatiokertoimen kriittiset arvot", joka näyttää rankkorrelaatiokertoimien kriittiset arvot.

    Rakennamme vastaavan "merkitysakselin":

    Tuloksena saatu korrelaatiokerroin osui yhteen 1 %:n merkitsevyystason kriittisen arvon kanssa. Näin ollen voidaan väittää, että ekaluokkalaisten kouluvalmiusindikaattoreita ja loppuluokkia yhdistää positiivinen korrelaatio - eli mitä korkeampi kouluvalmiusmittari on, sitä paremmin ekaluokkalaiset opiskelevat. Tilastollisten hypoteesien osalta psykologin on hylättävä nolla (H0) -hypoteesi samankaltaisuudesta ja hyväksyttävä erojen vaihtoehto (H1), mikä viittaa siihen, että kouluvalmiuden indikaattoreiden ja keskimääräisen akateemisen suorituskyvyn välinen suhde on erilainen kuin nolla.

    Spearman-korrelaatio. Korrelaatioanalyysi Spearmanin menetelmällä. Spearman riveissä. Spearmanin korrelaatiokerroin. Spearman rankkorrelaatio

    Alla oleva laskin laskee Spearman-arvokorrelaatiokertoimen kahden satunnaismuuttujan välillä. Teoreettinen osa, jotta se ei häiriintyisi laskimesta, on perinteisesti sijoitettu sen alle.

    lisätä tuonti ja vienti mode_edit poistaa

    Muutokset satunnaismuuttujissa

    nuoli_ylöspäinnuoli_alaspäin Xnuoli_ylöspäinnuoli_alaspäin Y
    Sivun koko: 5 10 20 50 100 chevron_left chevron_right

    Muutokset satunnaismuuttujissa

    Tuo tiedot Tuontivirhe

    Voit käyttää jotakin seuraavista symboleista kenttien erottamiseen: Tab, ";" tai "," Esimerkki: -50,5; -50,5

    Tuo Takaisin Peruuta

    Spearman-arvokorrelaatiokertoimen laskentamenetelmä kuvataan itse asiassa hyvin yksinkertaisesti. Tämä on sama Pearson-korrelaatiokerroin, joka ei ole laskettu itse satunnaismuuttujien mittaustuloksille, vaan niiden mittaustuloksille. sijoitusarvot.

    Tuo on,

    Jäljelle jää vain selvittää, mitkä arvot ovat ja miksi kaikkea tätä tarvitaan.

    Jos variaatiosarjan elementit on järjestetty nousevaan tai laskevaan järjestykseen, niin sijoitus elementti on sen numero tässä järjestetyssä sarjassa.

    Otetaan esimerkiksi muunnelmasarja (17,26,5,14,21). Lajitellaan sen elementit laskevaan järjestykseen (26,21,17,14,5). 26 on sijoitus 1, 21 on sijoitus 2 jne. Sijoitusarvojen variaatiosarja näyttää tältä (3,1,5,4,2).

    Eli Spearman-kerrointa laskettaessa alkuperäiset variaatiosarjat muunnetaan arvoarvojen variaatiosarjoiksi, minkä jälkeen niihin sovelletaan Pearsonin kaavaa.

    On yksi hienous - toistuvien arvojen järjestys on arvojen keskiarvo. Eli sarjan (17, 15, 14, 15) arvoarvojen sarja näyttää tältä (1, 2,5, 4, 2,5), koska ensimmäisellä elementillä, joka on yhtä suuri kuin 15, on arvo 2 ja toisella on sijalla 3 ja .

    Jos toistuvia arvoja ei ole, eli kaikki arvosarjan arvot ovat numeroita välillä 1 - n, Pearsonin kaava voidaan yksinkertaistaa

    No, muuten, tämä kaava annetaan useimmiten kaavana Spearman-kertoimen laskemiseksi.

    Mikä on siirtymisen ydin arvoista itse arvoihinsa?
    Asia on siinä, että tutkimalla arvoarvojen korrelaatiota voit määrittää, kuinka hyvin kahden muuttujan riippuvuus kuvataan monotonisella funktiolla.

    Kertoimen etumerkki ilmaisee muuttujien välisen suhteen suunnan. Jos etumerkki on positiivinen, Y-arvoilla on taipumus kasvaa X-arvojen kasvaessa; jos etumerkki on negatiivinen, niin Y-arvot pyrkivät pienenemään X-arvojen kasvaessa. Jos kerroin on 0, ei ole trendiä. Jos kerroin on 1 tai -1, niin X:n ja Y:n välinen suhde on monotonisen funktion muotoinen - eli kun X kasvaa, myös Y kasvaa, tai päinvastoin, kun X kasvaa, Y pienenee.

    Toisin kuin Pearson-korrelaatiokerroin, joka voi paljastaa vain yhden muuttujan lineaarisen riippuvuuden toisesta, Spearman-korrelaatiokerroin voi paljastaa monotonisen riippuvuuden, kun suoraa lineaarista suhdetta ei havaita.

    Selitänpä esimerkillä. Oletetaan, että tarkastelemme funktiota y=10/x.
    Meillä on seuraavat X- ja Y-mitat
    {{1,10}, {5,2}, {10,1}, {20,0.5}, {100,0.1}}
    Näille tiedoille Pearson-korrelaatiokerroin on -0,4686, eli suhde on heikko tai puuttuu. Mutta Spearman-korrelaatiokerroin on tiukasti yhtä suuri kuin -1, mikä näyttää vihjaavan tutkijalle, että Y:llä on tiukka negatiivinen monotoninen riippuvuus X:stä.