Sample na koepisyent ng ugnayan ng ranggo ng Spearman. Pagsusuri ng ugnayan ng Spearman

Kinakalkula ng calculator na ito sa ibaba ang rank correlation coefficient ng Spearman sa pagitan ng dalawang random na variable Ang teoretikal na bahagi ay tradisyonal sa ibaba ng calculator.

idagdag import_export mode_edit tanggalin

Mga pagbabago sa mga random na variable

arrow_pataasarrow_pababa arrow_pataasarrow_pababa
Mga item sa bawat pahina: 5 10 20 50 100 chevron_left chevron_right

Mga pagbabago sa mga random na variable

Mag-import ng data Error sa pag-import

"Ang isa sa mga sumusunod na character ay ginagamit upang paghiwalayin ang mga field ng data: tab, semicolon (;) o kuwit(,)" Sample: -50.5;-50.5

I-import Bumalik Kanselahin

Mga digit pagkatapos ng decimal point: 4

Kalkulahin

Koepisyent ng ugnayan ng Spearman

I-save ibahagi extension

Ang paraan ng pagkalkula ng koepisyent ng ugnayan ng ranggo ng Spearman ay talagang medyo simple Ito ay parang dinisenyo ang koepisyent ng ugnayan ng Pearson , ngunit hindi para sa mga sukat ng mga random na variable lamang ngunit para sa kanila. mga halaga ng pagraranggo.

Kailangan lang nating maunawaan kung ano ang halaga ng ranggo at kung bakit kailangan ang lahat ng ito.

Kung ang mga elemento ng isang variational series ay nakaayos sa pataas o pababang pagkakasunud-sunod, iyon ranggo ng elemento ang magiging numero niya sa ordered series.

Halimbawa, mayroon kaming iba't ibang serye (17,26,5,14,21). Pagbukud-bukurin natin ang mga elemento nito sa pababang pagkakasunud-sunod (26,21,17,14,5). Ang 26 ay may ranggo na 1, 21 - ranggo ng 2 at iba pa, Ang pagkakaiba-iba ng serye ng mga halaga ng pagraranggo ay magiging ganito (3,1,5,4,2).

I.e. kapag kinakalkula ang coefficient Spearman's initial variation series ay na-convert sa variational series ng ranking values ​​at pagkatapos ay inilapat sa kanila ang formula ng Pearson.
.
Mayroong isang subtlety - ang ranggo ng mga paulit-ulit na halaga ay kinuha bilang average ng mga ranggo. Iyon ay, para sa isang serye (17, 15, 14, 15)ranggo serye ay magmumukhang (1, 2.5, 4, 2.5), dahil ang unang elemento ay 15 ay may ranggo na 2, at ang pangalawa - ranggo ng 3, at.

Kung wala kang mga umuulit na halaga, iyon ay, lahat ng mga halaga ng serye ng pagraranggo - ang mga numero sa pagitan ng 1 at n, ang formula ng Pearson ay maaaring gawing simple upang

Sa pamamagitan ng paraan, ang formula na ito ay madalas na ibinibigay bilang formula para sa pagkalkula ng koepisyent ng Spearman.

Ano ang kakanyahan ng paglipat mula sa mga halaga mismo sa kanilang ranggo na halaga?
Kapag sinisiyasat ang ugnayan ng mga halaga ng pagraranggo, makikita mo kung gaano kahusay ang pag-asa ng dalawang variable ay inilarawan ng isang monotonikong function.

Ang tanda ng koepisyent ay nagpapahiwatig ng direksyon ng relasyon sa pagitan ng mga variable. Kung ang tanda ay positibo, ang mga halaga ng Y ay may posibilidad na tumaas sa pagtaas ng X. Kung ang palatandaan ay negatibo, ang mga halaga ng Y ay may posibilidad na bumaba sa pagtaas ng X. Kung ang koepisyent ay 0 doon ay walang ugali kung gayon. Kung ang koepisyent ay katumbas ng 1 o -1, ang relasyon sa pagitan ng X at Y ay may hitsura ng monotonic function, i.e. sa pagtaas ng X, tataas din ang Y at vice versa.

Iyon ay, hindi tulad ng koepisyent ng ugnayan ng Pearson, na maaaring makakita lamang ng linear na relasyon ng isang variable mula sa isa pa, ang koepisyent ng ugnayan ng Spearman ay maaaring makakita ng monotonikong pagdepende, kung saan ang direktang linear na relasyon ay hindi maihayag.

Narito ang isang halimbawa.
Hayaan akong ipaliwanag sa isang halimbawa. Ipagpalagay natin, sinusuri natin ang function na y=10/x.
Mayroon kaming mga sumusunod na sukat ng X at Y
{{1,10}, {5,2}, {10,1}, {20,0.5}, {100,0.1}}
Para sa data na ito, ang Pearson correlation coefficient ay katumbas ng -0.4686, i.e. mahina o wala ang relasyon. At ang koepisyent ng ugnayan ng Spearman ay mahigpit na katumbas ng -1, na para bang nagpapahiwatig ito sa mananaliksik na ang Y ay may malakas na negatibong monotonikong pagdepende mula sa X.

37. Koepisyent ng ugnayan ng ranggo ng Spearman.

S. 56 (64) 063.JPG

http://psystat.at.ua/publ/1-1-0-33

Ginagamit ang rank correlation coefficient ng Spearman sa mga kaso kung saan:
- may mga variable iskala ng pagraranggo mga sukat;
- masyadong naiiba ang pamamahagi ng data sa normal o hindi kilala sa lahat;
- ang mga sample ay may maliit na dami (N< 30).

Ang interpretasyon ng koepisyent ng ugnayan ng ranggo ng Spearman ay hindi naiiba sa koepisyent ng Pearson, ngunit ang kahulugan nito ay medyo naiiba. Upang maunawaan ang pagkakaiba sa pagitan ng mga pamamaraang ito at lohikal na bigyang-katwiran ang kanilang mga lugar ng aplikasyon, ihambing natin ang kanilang mga formula.

Pearson correlation coefficient:

Koepisyent ng ugnayan ng Spearman:

Tulad ng nakikita mo, ang mga formula ay naiiba nang malaki. Ihambing natin ang mga formula

Ang pormula ng ugnayan ng Pearson ay gumagamit ng arithmetic mean at standard deviation ng magkakaugnay na serye, ngunit ang Spearman formula ay hindi. Kaya, upang makakuha ng sapat na resulta gamit ang Pearson formula, kinakailangan na ang magkakaugnay na serye ay malapit sa normal na distribusyon (ang mean at standard deviation ay normal na mga parameter ng pamamahagi). Hindi ito nauugnay sa formula ng Spearman.

Ang isang elemento ng Pearson formula ay ang standardisasyon ng bawat serye sa z-scale.

Tulad ng nakikita mo, ang conversion ng mga variable sa Z-scale ay naroroon sa formula para sa koepisyent ng ugnayan ng Pearson. Alinsunod dito, para sa koepisyent ng Pearson, ang sukat ng data ay hindi mahalaga: halimbawa, maaari nating iugnay ang dalawang variable, ang isa ay may min. = 0 at max. = 1, at ang pangalawang min. = 100 at max. = 1000. Gaano man kaiba ang hanay ng mga halaga, lahat sila ay mako-convert sa karaniwang z-values ​​​​na pareho sa sukat.

Ang ganitong normalisasyon ay hindi nangyayari sa koepisyent ng Spearman, samakatuwid

ISANG MANDATORYONG KUNDISYON PARA SA PAGGAMIT NG SPEARMAN COEFFICIENT AY ANG PANTAY NG RANGE NG DALAWANG VARIABLE.

Bago gamitin ang koepisyent ng Spearman para sa serye ng data na may iba't ibang saklaw, kinakailangan na ranggo. Ang pagraranggo ay nagreresulta sa mga halaga ng mga seryeng ito na nakakakuha ng parehong minimum = 1 (minimum na ranggo) at isang maximum na katumbas ng bilang ng mga halaga (maximum, huling ranggo = N, ibig sabihin, ang maximum na bilang ng mga kaso sa sample) .

Sa anong mga kaso maaari mong gawin nang walang pagraranggo?

Ang mga ito ay mga kaso kapag ang data ay sa una iskala ng pagraranggo. Halimbawa, ang pagsubok ni Rokeach sa mga oryentasyon ng halaga.

Gayundin, ito ay mga kaso kapag ang bilang ng mga pagpipilian sa halaga ay maliit at ang sample ay naglalaman ng isang nakapirming minimum at maximum. Halimbawa, sa isang semantic differential, minimum = 1, maximum = 7.

Halimbawa ng pagkalkula ng koepisyent ng ugnayan ng ranggo ng Spearman

Ang pagsubok ng mga oryentasyon ng halaga ni Rokeach ay isinagawa sa dalawang sample na X at Y. Layunin: upang malaman kung gaano kalapit ang mga hierarchies ng mga halaga ng mga sample na ito (sa literal, kung gaano sila magkatulad).

Ang resultang halaga r=0.747 ay sinuri ng talahanayan ng mga kritikal na halaga. Ayon sa talahanayan, na may N=18, ang nakuhang halaga ay makabuluhan sa antas ng p<=0,005

Mga koepisyent ng ugnayan sa ranggo ng Spearman at Kendal

Para sa mga variable na kabilang sa isang ordinal scale o para sa mga variable na hindi napapailalim sa isang normal na distribusyon, gayundin para sa mga variable na kabilang sa isang interval scale, ang Spearman rank correlation ay kinakalkula sa halip na ang Pearson coefficient. Upang gawin ito, ang mga indibidwal na variable na halaga ay itinalaga ng mga ranggo, na kasunod na pinoproseso gamit ang naaangkop na mga formula. Upang makita ang ugnayan ng ranggo, i-clear ang default na Pearson correlation check box sa Bivariate Correlations... dialog box. Sa halip, i-activate ang pagkalkula ng ugnayan ng Spearman. Ang pagkalkulang ito ay magbibigay ng mga sumusunod na resulta. Ang mga koepisyent ng ugnayan ng ranggo ay napakalapit sa kaukulang mga halaga ng mga coefficient ng Pearson (ang mga orihinal na variable ay may normal na pamamahagi).

titkova-matmetody.pdf p. 45

Ang paraan ng ugnayan ng ranggo ng Spearman ay nagpapahintulot sa iyo na matukoy ang higpit (lakas) at direksyon

ugnayan sa pagitan ng dalawang palatandaan o dalawang profile (hierarchies) palatandaan.

Upang makalkula ang ugnayan ng ranggo, kinakailangan na magkaroon ng dalawang hanay ng mga halaga,

na maaaring i-rank. Ang nasabing serye ng mga halaga ay maaaring:

1) dalawang palatandaan sinusukat sa pareho pangkat mga paksa;

2) dalawang indibidwal na hierarchy ng mga katangian, nakilala sa dalawang paksa gamit ang pareho

hanay ng mga tampok;

3) dalawa pangkat hierarchies ng mga katangian,

4) indibidwal at pangkat hierarchy ng mga tampok.

Una, ang mga tagapagpahiwatig ay niraranggo nang hiwalay para sa bawat isa sa mga katangian.

Bilang isang panuntunan, ang isang mas mababang ranggo ay itinalaga sa isang mas mababang halaga ng katangian.

Sa unang kaso (dalawang katangian), ang mga indibidwal na halaga ay niraranggo ayon sa una

katangian na nakuha ng iba't ibang mga paksa, at pagkatapos ay mga indibidwal na halaga para sa pangalawa

tanda.

Kung ang dalawang katangian ay positibong nauugnay, ang mga paksang may mababang ranggo

ang isa sa kanila ay magkakaroon ng mababang ranggo sa isa, at ang mga paksang may mataas na ranggo sa

ang isa sa mga katangian ay magkakaroon din ng mataas na ranggo para sa iba pang katangian. Upang makalkula ang rs

kailangang matukoy ang mga pagkakaiba (d) sa pagitan ng mga ranggo na nakuha ng isang ibinigay na paksa sa pareho

palatandaan. Pagkatapos ang mga tagapagpahiwatig na ito ay binabago sa isang tiyak na paraan at ibinabawas sa 1. Kaysa

Kung mas maliit ang pagkakaiba sa pagitan ng mga ranggo, mas malaki ang magiging rs, mas malapit ito sa +1.

Kung walang ugnayan, lahat ng ranggo ay magkakahalo at walang

walang sulat. Ang formula ay idinisenyo upang sa kasong ito ang rs ay magiging malapit sa 0.

Sa kaso ng negatibong ugnayan mababang ranggo ng mga paksa sa isang batayan

mataas na ranggo sa ibang batayan ay tumutugma, at vice versa. Mas malaki ang pagkakaiba

sa pagitan ng mga ranggo ng mga paksa sa dalawang variable, ang mas malapit na rs ay sa -1.

Sa pangalawang kaso (dalawang indibidwal na profile), ang mga indibidwal ay niraranggo

mga halaga na nakuha ng bawat isa sa 2 paksa ayon sa isang tiyak (pareho para sa kanila

pareho) hanay ng mga tampok. Ang unang ranggo ay ibibigay sa tampok na may pinakamababang halaga; pangalawang ranggo -

isang tanda na may mas mataas na halaga, atbp. Malinaw, ang lahat ng mga katangian ay dapat masukat sa

ang parehong mga yunit, kung hindi, ang pagraranggo ay imposible. Halimbawa, imposible

ranggo ang mga indicator sa Cattell Personality Inventory (16PF), kung ang mga ito ay ipinahayag sa

"raw" na mga puntos, dahil ang mga saklaw ng mga halaga ay naiiba para sa iba't ibang mga kadahilanan: mula 0 hanggang 13, mula 0 hanggang

20 at mula 0 hanggang 26. Hindi natin masasabi kung aling salik ang mauuna

expression hanggang dalhin namin ang lahat ng mga halaga sa isang solong sukat (kadalasan ito ang sukat ng dingding).

Kung ang mga indibidwal na hierarchies ng dalawang paksa ay positibong nauugnay, kung gayon ang mga palatandaan

ang pagkakaroon ng mababang ranggo sa isa sa kanila ay magkakaroon ng mababang ranggo sa isa pa, at kabaliktaran.

Halimbawa, kung ang factor E (dominance) ng isang paksa ay may pinakamababang ranggo, kung gayon

isa pang test subject, mababa ang rank kung may factor C ang isang test subject

(katatagan ng emosyon) ang may pinakamataas na ranggo, kung gayon ang ibang paksa ay dapat na mayroon din

ang salik na ito ay may mataas na ranggo, atbp.

Sa pangatlong kaso (dalawang profile ng grupo), niraranggo ang average na halaga ng grupo,

nakuha sa 2 grupo ng mga paksa ayon sa isang tiyak na hanay, magkapareho para sa parehong grupo

palatandaan. Sa mga sumusunod, ang linya ng pangangatwiran ay kapareho ng sa nakaraang dalawang kaso.

Sa kaso 4 (indibidwal at pangkat na mga profile), sila ay niraranggo nang hiwalay

indibidwal na mga halaga ng paksa at pangkat ng mga average na halaga para sa parehong hanay

mga palatandaan na nakuha, bilang panuntunan, sa pamamagitan ng pagbubukod ng indibidwal na paksang ito - siya

ay hindi lumalahok sa karaniwang profile ng grupo kung saan ihahambing ang kanyang indibidwal na profile

profile. Ang ugnayan ng ranggo ay magbibigay-daan sa iyo upang suriin kung gaano pare-pareho ang indibidwal at

mga profile ng grupo.

Sa lahat ng apat na kaso, ang kahalagahan ng resultang koepisyent ng ugnayan ay tinutukoy

sa pamamagitan ng bilang ng mga niraranggo na halaga N. Sa unang kaso, ang dami na ito ay magkakasabay sa

laki ng sample n. Sa pangalawang kaso, ang bilang ng mga obserbasyon ay ang bilang ng mga tampok,

bumubuo sa hierarchy. Sa ikatlo at pang-apat na kaso, ang N ay ang bilang din ng kumpara

katangian, at hindi ang bilang ng mga paksa sa mga pangkat. Ang mga detalyadong paliwanag ay ibinigay sa mga halimbawa. Kung

ang ganap na halaga ng rs ay umabot o lumampas sa isang kritikal na halaga, ugnayan

maaasahan.

Hypotheses.

Mayroong dalawang posibleng hypotheses. Nalalapat ang una sa case 1, ang pangalawa sa tatlo pa

Unang bersyon ng hypotheses

H0: Ang ugnayan sa pagitan ng mga variable A at B ay hindi naiiba sa zero.

H2: Ang ugnayan sa pagitan ng mga variable A at B ay makabuluhang naiiba mula sa zero.

Pangalawang bersyon ng hypotheses

H0: Ang ugnayan sa pagitan ng hierarchies A at B ay hindi naiiba sa zero.

H2: Ang ugnayan sa pagitan ng hierarchies A at B ay makabuluhang naiiba mula sa zero.

Mga limitasyon ng koepisyent ng ugnayan ng ranggo

1. Para sa bawat variable, hindi bababa sa 5 obserbasyon ang dapat ipakita. Itaas

ang hangganan ng sampling ay tinutukoy ng mga magagamit na talahanayan ng mga kritikal na halaga .

2. Ang koepisyent ng ugnayan ng ranggo ng Spearman ay rs para sa isang malaking bilang ng magkapareho

Ang mga ranggo para sa isa o pareho na pinaghahambing na mga variable ay nagbibigay ng mga magaspang na halaga. Sa isip

parehong magkakaugnay na serye ay dapat na kumakatawan sa dalawang sequence ng divergent

mga halaga. Kung hindi matugunan ang kundisyong ito, kailangang gumawa ng pagbabago sa

parehong ranggo.

Ang koepisyent ng ugnayan ng ranggo ng Spearman ay kinakalkula gamit ang formula:

Kung ang parehong pinaghahambing na serye ng ranggo ay naglalaman ng mga pangkat ng parehong ranggo,

bago kalkulahin ang koepisyent ng ugnayan ng ranggo, kinakailangan na gumawa ng mga pagwawasto para sa pareho

Mga ranggo ng Ta at TV:

Ta = Σ (a3 – a)/12,

Тв = Σ (в3 – в)/12,

saan A- ang dami ng bawat pangkat ng magkatulad na ranggo sa ranggo serye A, sa dami ng bawat isa

mga pangkat ng magkatulad na ranggo sa serye ng ranggo B.

Upang kalkulahin ang empirical na halaga ng rs, gamitin ang formula:

38. Point-biserial correlation coefficient.

Tungkol sa ugnayan sa pangkalahatan, tingnan ang tanong Blg. 36 Sa. 56 (64) 063.JPG

harchenko-korranaliz.pdf

Hayaang sukatin ang variable X sa isang malakas na sukat, at variable Y sa isang dichotomous scale. Ang point biserial correlation coefficient rpb ay kinakalkula gamit ang formula:

Dito ang x 1 ay ang average na halaga sa mga X na bagay na may halaga na "isa" sa Y;

x 0 – average na halaga sa mga X na bagay na may halagang “zero” sa Y;

s x - karaniwang paglihis ng lahat ng mga halaga kasama ang X;

n 1 - bilang ng mga bagay na "isa" sa Y, n 0 - bilang ng mga bagay na "zero" sa Y;

n = n 1 + n 0 – laki ng sample.

Ang point biserial correlation coefficient ay maaari ding kalkulahin gamit ang iba pang katumbas na expression:

Dito x– pangkalahatang average na halaga para sa variable X.

Point biserial correlation coefficient rpb nag-iiba mula -1 hanggang +1. Ang halaga nito ay zero kung ang mga variable ay may isa Y magkaroon ng average Y, katumbas ng average ng mga variable na may zero over Y.

Pagsusulit mga hypotheses ng kahalagahan point biserial correlation coefficient ay upang suriin null hypothesish 0 tungkol sa pagkakapantay-pantay ng pangkalahatang koepisyent ng ugnayan sa zero: ρ = 0, na isinasagawa gamit ang t-test ng Estudyante. Empirical na kahalagahan

kumpara sa mga kritikal na halaga t a (df) para sa bilang ng mga antas ng kalayaan df = n– 2

Kung ang kondisyon | t| ≤ (df), ang null hypothesis ρ = 0 ay hindi tinatanggihan. Ang point biserial correlation coefficient ay malaki ang pagkakaiba sa zero kung ang empirical value | t| nahuhulog sa kritikal na rehiyon, iyon ay, kung ang kondisyon | t| > (n– 2). Ang pagiging maaasahan ng relasyon na kinakalkula gamit ang point biserial correlation coefficient rpb, maaari ding matukoy gamit ang criterion χ 2 para sa bilang ng mga antas ng kalayaan df= 2.

Point biserial correlation

Ang kasunod na pagbabago ng koepisyent ng ugnayan ng produkto ng mga sandali ay makikita sa puntong biserial r. Itong stat. ay nagpapakita ng ugnayan sa pagitan ng dalawang baryabol, ang isa sa mga ito ay diumano'y tuluy-tuloy at normal na ipinamamahagi, at ang isa ay discrete sa mahigpit na kahulugan ng salita. Ang punto biserial correlation coefficient ay tinutukoy ng r pbis Since in r pbis Ang dichotomy ay sumasalamin sa tunay na katangian ng discrete variable, at hindi pagiging artipisyal, tulad ng sa kaso r bis, ang tanda nito ay tinutukoy nang arbitraryo. Samakatuwid, para sa lahat ng praktikal na layunin. mga layunin r pbis isinasaalang-alang sa hanay mula 0.00 hanggang +1.00.

Mayroon ding kaso kung saan ang dalawang variable ay ipinapalagay na tuluy-tuloy at normal na ipinamamahagi, ngunit pareho ay artipisyal na dichotomized, tulad ng sa kaso ng biserial correlation. Upang masuri ang kaugnayan sa pagitan ng mga naturang variable, ginagamit ang tetrachoric correlation coefficient r tet, na pinalaki rin ni Pearson. Basic (eksaktong) mga formula at pamamaraan para sa pagkalkula r tet medyo kumplikado. Samakatuwid, may praktikal Ang pamamaraang ito ay gumagamit ng mga pagtatantya r tet,nakuha batay sa mga pinaikling pamamaraan at talahanayan.

/on-line/dictionary/dictionary.php?term=511

POINT BISERIAL COEFFICIENT ay ang koepisyent ng ugnayan sa pagitan ng dalawang variable, ang isa ay sinusukat sa isang dichotomous scale at ang isa sa isang interval scale. Ginagamit ito sa klasikal at modernong pagsubok bilang isang tagapagpahiwatig ng kalidad ng isang gawain sa pagsubok - pagiging maaasahan at pagkakapare-pareho sa pangkalahatang marka ng pagsusulit.

Upang iugnay ang mga variable na sinusukat sa dichotomous at interval scale gamitin point-biserial correlation coefficient.
Ang point-biserial correlation coefficient ay isang paraan ng pagsusuri ng ugnayan ng mga variable, ang isa ay sinusukat sa isang sukat ng mga pangalan at tumatagal lamang ng 2 halaga (halimbawa, lalaki/babae, tamang sagot/maling sagot, tampok kasalukuyan/hindi kasalukuyan), at ang pangalawa sa isang scale ratios o interval scale. Formula para sa pagkalkula ng point-biserial correlation coefficient:

saan:
Ang m1 at m0 ay ang average na halaga ng X na may halaga na 1 o 0 sa Y.
σx – karaniwang paglihis ng lahat ng halaga ng X
n1,n0 – bilang ng mga halaga ng X mula 1 o 0 hanggang Y.
n – kabuuang bilang ng mga pares ng mga halaga

Kadalasan, ang ganitong uri ng koepisyent ng ugnayan ay ginagamit upang kalkulahin ang kaugnayan sa pagitan ng mga item sa pagsubok at ng kabuuang sukat. Ito ay isang uri ng validity check.

39. Rank-biserial correlation coefficient.

Tungkol sa ugnayan sa pangkalahatan, tingnan ang tanong Blg. 36 Sa. 56 (64) 063.JPG

harchenko-korranaliz.pdf p. 28

Rank biserial correlation coefficient, ginagamit sa mga kaso kung saan ang isa sa mga variable ( X) ay ipinakita sa isang ordinal na sukat, at ang iba pa ( Y) – dichotomous, kinakalkula ng formula

.

Narito ang average na ranggo ng mga bagay na mayroong isa Y; – average na ranggo ng mga bagay na may zero hanggang Y, n– laki ng sample.

Pagsusulit mga hypotheses ng kahalagahan Ang rank-biserial correlation coefficient ay isinasagawa nang katulad sa point biserial correlation coefficient gamit ang Student's test na may kapalit sa mga formula rpb sa rrb.

Sa mga kaso kung saan ang isang variable ay sinusukat sa isang dichotomous scale (variable X), at ang isa pa sa rank scale (variable Y), ang rank-biserial correlation coefficient ay ginagamit. Naaalala namin na ang variable X, sinusukat sa isang dichotomous scale, tumatagal lamang ng dalawang halaga (mga code) 0 at 1. Lalo naming binibigyang-diin: sa kabila ng katotohanan na ang koepisyent na ito ay nag-iiba sa saklaw mula -1 hanggang +1, ang tanda nito ay hindi mahalaga para sa interpretasyon ng resulta. Ito ay isa pang pagbubukod sa pangkalahatang tuntunin.

Ang koepisyent na ito ay kinakalkula gamit ang formula:

saan ` X 1 average na ranggo para sa mga elemento ng variable Y, na tumutugma sa code (sign) 1 sa variable X;

`X 0 – average na ranggo para sa mga elemento ng variable Y, na tumutugma sa code (sign) 0 sa variable X\

N – kabuuang bilang ng mga elemento sa variable X.

Upang mailapat ang rank-biserial correlation coefficient, ang mga sumusunod na kondisyon ay dapat matugunan:

1. Ang mga variable na inihahambing ay dapat masukat sa iba't ibang sukat: isa X – sa isang dichotomous scale; iba pa Y– sa iskala ng ranggo.

2. Bilang ng iba't ibang katangian sa inihambing na mga variable X At Y dapat pareho.

3. Upang masuri ang antas ng pagiging maaasahan ng rank-biserial correlation coefficient, dapat mong gamitin ang formula (11.9) at ang talahanayan ng mga kritikal na halaga para sa pagsusulit ng Mag-aaral k = n – 2.

http://psystat.at.ua/publ/drugie_vidy_koehfficienta_korreljacii/1-1-0-38

Mga kaso kung saan kinakatawan ang isa sa mga variable dichotomous scale, at ang iba pa sa ranggo (ordinal), nangangailangan ng aplikasyon rank-biserial correlation coefficient:

rbb=2 / n * (m1 - m0)

saan:
n – bilang ng mga bagay sa pagsukat
m1 at m0 - ang average na ranggo ng mga bagay na may 1 o 0 sa pangalawang variable.
Ginagamit din ang koepisyent na ito kapag sinusuri ang bisa ng mga pagsusulit.

40. Linear correlation coefficient.

Para sa correlation sa pangkalahatan (at linear correlation sa partikular), tingnan ang tanong Blg. 36 Sa. 56 (64) 063.JPG

G. PEARSON'S COEFFICIENT

r-Pearson (Pearson r) ay ginagamit upang pag-aralan ang relasyon sa pagitan ng dalawang sukataniba't ibang mga variable na sinusukat sa parehong sample. Mayroong maraming mga sitwasyon kung saan ang paggamit nito ay angkop. Nakakaapekto ba ang katalinuhan sa akademikong pagganap sa mga taon ng senior unibersidad? May kaugnayan ba ang laki ng suweldo ng isang empleyado sa kanyang pagiging palakaibigan sa mga kasamahan? Nakakaapekto ba ang mood ng isang mag-aaral sa tagumpay ng paglutas ng isang kumplikadong problema sa aritmetika? Upang masagot ang mga naturang katanungan, dapat sukatin ng mananaliksik ang dalawang tagapagpahiwatig ng interes para sa bawat miyembro ng sample. Ang data upang pag-aralan ang relasyon ay pagkatapos ay i-tabulated, tulad ng sa halimbawa sa ibaba.

HALIMBAWA 6.1

Ang talahanayan ay nagpapakita ng isang halimbawa ng paunang data para sa pagsukat ng dalawang tagapagpahiwatig ng katalinuhan (berbal at nonverbal) para sa 20 mga mag-aaral sa ika-8 baitang.

Ang ugnayan sa pagitan ng mga variable na ito ay maaaring ilarawan gamit ang isang scatterplot (tingnan ang Figure 6.3). Ipinapakita ng diagram na mayroong ilang ugnayan sa pagitan ng mga nasusukat na tagapagpahiwatig: mas malaki ang halaga ng verbal intelligence, ang (karamihan) mas malaki ang halaga ng non-verbal intelligence.

Bago ibigay ang formula para sa koepisyent ng ugnayan, subukan nating subaybayan ang lohika ng paglitaw nito gamit ang data mula sa halimbawa 6.1. Ang posisyon ng bawat /-point (paksa na may numero /) sa scatter diagram na nauugnay sa iba pang mga punto (Larawan 6.3) ay maaaring tukuyin ng mga halaga at palatandaan ng mga paglihis ng kaukulang mga variable na halaga mula sa kanilang mga average na halaga : (xj - MJ At (isip sa ). Kung ang mga palatandaan ng mga paglihis na ito ay nag-tutugma, kung gayon ito ay nagpapahiwatig ng isang positibong relasyon (mas malaking halaga para sa X malaking halaga ang tumutugma sa sa o mas mababang halaga X mas maliliit na halaga ang tumutugma sa y).

Para sa paksa No. 1, paglihis mula sa average X at sa pamamagitan ng sa positibo, at para sa paksa Blg. 3 parehong mga paglihis ay negatibo. Dahil dito, ang data mula sa pareho ay nagpapahiwatig ng isang positibong relasyon sa pagitan ng mga pinag-aralan na katangian. Sa laban, kung ang mga palatandaan ng deviations mula sa average X at sa pamamagitan ng sa magkaiba, ito ay magsasaad ng negatibong relasyon sa pagitan ng mga katangian. Kaya, para sa paksa Blg. 4, ang paglihis mula sa average X ay negatibo, sa pamamagitan ng y - positibo, at para sa paksa No. 9 - vice versa.

Kaya, kung ang produkto ng mga paglihis (x,- M X ) X (isip sa ) positibo, pagkatapos ay ang data ng /-subject ay nagpapahiwatig ng isang direktang (positibong) relasyon, at kung negatibo, pagkatapos ay isang baligtad (negatibong) relasyon. Alinsunod dito, kung Xwy y ay karaniwang nauugnay sa direktang proporsyon, kung gayon ang karamihan sa mga produkto ng mga deviation ay magiging positibo, at kung ang mga ito ay nauugnay sa isang kabaligtaran na relasyon, kung gayon ang karamihan sa mga produkto ay magiging negatibo. Samakatuwid, ang isang pangkalahatang tagapagpahiwatig para sa lakas at direksyon ng relasyon ay maaaring ang kabuuan ng lahat ng mga produkto ng mga paglihis para sa isang naibigay na sample:

Sa isang direktang proporsyonal na ugnayan sa pagitan ng mga variable, ang halaga na ito ay malaki at positibo - para sa karamihan ng mga paksa, ang mga paglihis ay nag-tutugma sa sign (malalaking halaga ng isang variable ay tumutugma sa malalaking halaga ng isa pang variable at vice versa). Kung X At sa magkaroon ng feedback, kung gayon para sa karamihan ng mga paksa, ang mas malalaking halaga ng isang variable ay tumutugma sa mas maliit na halaga ng isa pang variable, ibig sabihin, ang mga palatandaan ng mga produkto ay magiging negatibo, at ang kabuuan ng mga produkto sa kabuuan ay magiging malaki din sa ganap na halaga, ngunit negatibo sa sign. Kung walang sistematikong koneksyon sa pagitan ng mga variable, ang mga positibong termino (mga produkto ng deviations) ay magiging balanse ng mga negatibong termino, at ang kabuuan ng lahat ng mga produkto ng deviations ay magiging malapit sa zero.

Upang matiyak na ang kabuuan ng mga produkto ay hindi nakadepende sa laki ng sample, sapat na ang pag-average nito. Ngunit kami ay interesado sa sukatan ng pagkakabit hindi bilang isang pangkalahatang parameter, ngunit bilang isang kinakalkula na pagtatantya nito - mga istatistika. Samakatuwid, para sa formula ng pagpapakalat, sa kasong ito ay gagawin natin ang pareho, hatiin ang kabuuan ng mga produkto ng mga paglihis hindi sa pamamagitan ng N, at sa TV - 1. Nagreresulta ito sa isang sukatan ng koneksyon, malawakang ginagamit sa pisika at teknikal na agham, na tinatawag na covariance (Covahance):


SA Sa sikolohiya, hindi katulad ng pisika, karamihan sa mga variable ay sinusukat sa mga di-makatwirang mga sukat, dahil ang mga psychologist ay hindi interesado sa ganap na halaga ng isang tanda, ngunit sa kamag-anak na posisyon ng mga paksa sa isang grupo. Bilang karagdagan, ang covariance ay napakasensitibo sa sukat ng sukat (variance) kung saan sinusukat ang mga katangian. Upang gawing independyente ang sukat ng koneksyon sa mga yunit ng pagsukat ng parehong mga katangian, sapat na upang hatiin ang covariance sa kaukulang standard deviations. Kaya ito ay nakuha para sa-Mule ng K. Pearson correlation coefficient:

o, pagkatapos palitan ang mga expression para sa o x at


Kung ang mga halaga ng parehong mga variable ay na-convert sa mga r-halaga gamit ang formula


pagkatapos ay ang formula para sa r-Pearson correlation coefficient ay mukhang mas simple (071.JPG):

/dict/sociology/article/soc/soc-0525.htm

CORRELATION LINEAR- istatistikal na linear na relasyon na hindi sanhi ng kalikasan sa pagitan ng dalawang quantitative variable X At sa. Sinusukat gamit ang "K.L coefficient." Pearson, na resulta ng paghahati ng covariance sa mga standard deviations ng parehong variable:

,

saan s xy- covariance sa pagitan ng mga variable X At sa;

s x , s y- standard deviations para sa mga variable X At sa;

x i , y i- mga variable na halaga X At sa para sa bagay na may numero i;

x, y- mga average ng arithmetic para sa mga variable X At sa.

Koepisyent ng Pearson r maaaring kumuha ng mga halaga mula sa pagitan [-1; +1]. Ibig sabihin r = 0 nangangahulugan na walang linear na relasyon sa pagitan ng mga variable X At sa(ngunit hindi nagbubukod ng isang nonlinear na istatistikal na relasyon). Mga positibong halaga ng koepisyent ( r> 0) ipahiwatig ang isang direktang linear na koneksyon; mas malapit ang value nito sa +1, mas malakas ang ugnayan ng statistical line. Mga negatibong halaga ng koepisyent ( r < 0) свидетельствуют об обратной линейной связи; чем ближе его значение к -1, тем сильнее обратная связь. Значения r= ±1 ay nangangahulugan ng pagkakaroon ng isang kumpletong linear na koneksyon, direkta o baligtad. Sa kaso ng kumpletong koneksyon, lahat ng mga punto na may mga coordinate ( x i , y i) humiga sa isang tuwid na linya y = a + bx.

"Coefficient K.L." Ginagamit din ang Pearson upang sukatin ang lakas ng koneksyon sa isang linear pairwise regression model.

41. Correlation matrix at correlation graph.

Tungkol sa ugnayan sa pangkalahatan, tingnan ang tanong Blg. 36 Sa. 56 (64) 063.JPG

Correlation matrix. Kadalasan, kasama sa pagsusuri ng ugnayan ang pag-aaral ng mga relasyon sa pagitan ng hindi dalawa, ngunit maraming mga variable na sinusukat sa isang quantitative scale sa isang sample. Sa kasong ito, kinakalkula ang mga ugnayan para sa bawat pares ng hanay ng mga variable na ito. Ang mga kalkulasyon ay karaniwang isinasagawa sa isang computer, at ang resulta ay isang correlation matrix.

Correlation matrix(Kaugnayan Matrix) ay ang resulta ng pagkalkula ng mga ugnayan ng isang uri para sa bawat pares mula sa set R mga variable na sinusukat sa isang quantitative scale sa isang sample.

HALIMBAWA

Ipagpalagay na pinag-aaralan natin ang mga relasyon sa pagitan ng 5 variable (vl, v2,..., v5; P= 5), sinusukat sa isang sample ng N=30 Tao. Nasa ibaba ang isang talahanayan ng source data at isang correlation matrix.

AT
katulad na data:

Correlation matrix:

Madaling mapansin na ang correlation matrix ay parisukat, simetriko na may paggalang sa pangunahing dayagonal (takkak,y = /) y), na may mga yunit sa pangunahing dayagonal (dahil G At = Gu = 1).

Ang correlation matrix ay parisukat: ang bilang ng mga row at column ay katumbas ng bilang ng mga variable. Siya simetriko kamag-anak sa pangunahing dayagonal, dahil ang ugnayan X Sa sa katumbas ng ugnayan sa Sa X. Ang mga yunit ay matatagpuan sa pangunahing dayagonal nito, dahil ang ugnayan ng tampok sa sarili nito ay katumbas ng isa. Dahil dito, hindi lahat ng elemento ng correlation matrix ay napapailalim sa pagsusuri, ngunit ang mga nasa itaas o ibaba ng pangunahing dayagonal.

Bilang ng mga coefficient ng ugnayan, Ang mga tampok na susuriin kapag pinag-aaralan ang mga relasyon ay tinutukoy ng formula: P(P- 1)/2. Sa halimbawa sa itaas, ang bilang ng naturang mga coefficient ng ugnayan ay 5(5 - 1)/2 = 10.

Ang pangunahing gawain ng pag-aaral ng correlation matrix ay pagtukoy sa istruktura ng mga relasyon sa pagitan ng maraming mga tampok. Sa kasong ito, posible ang visual analysis correlation galaxy- graphic na imahe mga istruktura ayon sa istatistikamakabuluhang koneksyon, kung hindi masyadong maraming ganoong koneksyon (hanggang 10-15). Ang isa pang paraan ay ang paggamit ng mga multivariate na pamamaraan: multiple regression, factor o cluster analysis (tingnan ang seksyong “Multivariate method...”). Gamit ang factor o cluster analysis, posibleng matukoy ang mga pagpapangkat ng mga variable na mas malapit na nauugnay sa isa't isa kaysa sa iba pang mga variable. Ang isang kumbinasyon ng mga pamamaraan na ito ay napaka-epektibo, halimbawa, kung mayroong maraming mga palatandaan at hindi sila homogenous.

Paghahambing ng mga ugnayan - isang karagdagang gawain ng pagsusuri sa correlation matrix, na mayroong dalawang pagpipilian. Kung kinakailangan upang ihambing ang mga ugnayan sa isa sa mga hilera ng correlation matrix (para sa isa sa mga variable), ang paraan ng paghahambing para sa mga umaasang sample ay ginagamit (p. 148-149). Kapag naghahambing ng mga ugnayan ng parehong pangalan na kinakalkula para sa iba't ibang mga sample, ang paraan ng paghahambing para sa mga independiyenteng sample ay ginagamit (p. 147-148).

Mga pamamaraan ng paghahambing mga ugnayan sa mga dayagonal correlation matrix (upang masuri ang stationarity ng isang random na proseso) at paghahambing ilang Ang mga correlation matrice na nakuha para sa iba't ibang sample (para sa kanilang homogeneity) ay labor-intensive at lampas sa saklaw ng aklat na ito. Maaari kang maging pamilyar sa mga pamamaraang ito mula sa aklat ni G.V.

Ang problema ng istatistikal na kahalagahan ng mga ugnayan. Ang problema ay ang pamamaraan para sa statistical hypothesis testing ay ipinapalagay isa-maramihan isinagawa ang pagsubok sa isang sample. Kung ang parehong paraan ay inilapat paulit-ulit, kahit na may kaugnayan sa iba't ibang mga variable, ang posibilidad na makakuha ng isang resulta na puro sa pamamagitan ng pagkakataon ay tumataas. Sa pangkalahatan, kung uulitin natin ang parehong paraan ng pagsubok sa hypothesis minsan na may kaugnayan sa iba't ibang mga variable o sample, pagkatapos ay may itinatag na halaga a kami ay ginagarantiyahan na makatanggap ng kumpirmasyon ng hypothesis sa ahk bilang ng mga kaso.

Ipagpalagay na ang isang correlation matrix ay nasuri para sa 15 variable, iyon ay, 15(15-1)/2 = 105 correlation coefficients ang kinakalkula. Upang subukan ang mga hypothesis, ang antas a = 0.05 ay itinakda Sa pamamagitan ng pagsuri sa hypothesis ng 105 beses, makakatanggap kami ng kumpirmasyon nito ng limang beses (!), hindi alintana kung ang koneksyon ay aktwal na umiiral. Ang pag-alam nito at pagkakaroon, sabihin nating, 15 na "makabuluhang istatistika" na koepisyent ng ugnayan, masasabi ba natin kung alin ang nakuha ng pagkakataon at alin ang nagpapakita ng tunay na relasyon?

Sa mahigpit na pagsasalita, upang makagawa ng isang istatistikal na desisyon, kinakailangan na bawasan ang antas a nang kasing dami ng bilang ng mga hypotheses na sinusuri. Ngunit hindi ito maipapayo, dahil ang posibilidad na balewalain ang isang talagang umiiral na koneksyon (paggawa ng Type II error) ay tumataas sa isang hindi mahuhulaan na paraan.

Ang correlation matrix lamang ay hindi sapat na batayanpara sa mga istatistikal na konklusyon tungkol sa mga indibidwal na coefficient na kasama ditomga ugnayan!

Mayroon lamang isang tunay na nakakumbinsi na paraan upang malutas ang problemang ito: hatiin ang sample nang sapalaran sa dalawang bahagi at isaalang-alang lamang ang mga ugnayang iyon na makabuluhan ayon sa istatistika sa parehong bahagi ng sample. Ang isang alternatibo ay maaaring ang paggamit ng mga multivariate na pamamaraan (factor, cluster o multiple regression analysis) upang matukoy at pagkatapos ay bigyang-kahulugan ang mga grupo ng mga variable na makabuluhang nauugnay sa istatistika.

Problema sa mga nawawalang halaga. Kung may mga nawawalang halaga sa data, dalawang pagpipilian ang posible para sa pagkalkula ng correlation matrix: a) row-by-row na pag-alis ng mga halaga (Ibukodkasolistwise); b) magkapares na pagtanggal ng mga halaga (Ibukodkasomagkapares). Sa linya sa linyang pagtanggal mga obserbasyon na may mga nawawalang halaga, ang buong row para sa isang bagay (paksa) na may hindi bababa sa isang nawawalang halaga para sa isa sa mga variable ay tatanggalin. Ang pamamaraang ito ay humahantong sa isang "tamang" correlation matrix sa kahulugan na ang lahat ng mga coefficient ay kinakalkula mula sa parehong hanay ng mga bagay. Gayunpaman, kung ang mga nawawalang halaga ay ibinahagi nang sapalaran sa mga variable, kung gayon ang pamamaraang ito ay maaaring humantong sa katotohanan na walang isang bagay na natitira sa set ng data na isinasaalang-alang (magkakaroon ng hindi bababa sa isang nawawalang halaga sa bawat hilera) . Upang maiwasan ang sitwasyong ito, gumamit ng ibang paraan na tinatawag pares na pagtanggal. Isinasaalang-alang lamang ng paraang ito ang mga gaps sa bawat napiling column-variable pair at binabalewala ang mga gaps sa iba pang variable. Ang ugnayan para sa isang pares ng mga variable ay kinakalkula para sa mga bagay na iyon kung saan walang mga puwang. Sa maraming mga sitwasyon, lalo na kapag ang bilang ng mga puwang ay medyo maliit, sabihin nating 10%, at ang mga puwang ay ibinahagi nang random, ang pamamaraang ito ay hindi humahantong sa mga malubhang pagkakamali. Gayunpaman, kung minsan hindi ito ang kaso. Halimbawa, ang isang sistematikong bias (shift) sa pagtatasa ay maaaring "itago" ang isang sistematikong pag-aayos ng mga pagtanggal, na siyang dahilan ng pagkakaiba sa mga koepisyent ng ugnayan na binuo para sa iba't ibang mga subset (halimbawa, para sa iba't ibang mga subgroup ng mga bagay). Isa pang problemang nauugnay sa correlation matrix na kinakalkula sa magkapares ang pag-alis ng mga gaps ay nangyayari kapag ginagamit ang matrix na ito sa iba pang mga uri ng pagsusuri (halimbawa, sa maramihang regression o factor analysis). Ipinapalagay nila na ang "tamang" correlation matrix ay ginagamit na may isang tiyak na antas ng pagkakapare-pareho at "pagsunod" ng iba't ibang mga coefficient. Ang paggamit ng isang matrix na may "masamang" (biased) na mga pagtatantya ay humahantong sa katotohanan na ang programa ay maaaring hindi masuri ang naturang matrix, o ang mga resulta ay magiging mali. Samakatuwid, kung gagamitin ang pairwise na paraan ng pagbubukod ng nawawalang data, kinakailangang suriin kung may mga sistematikong pattern sa pamamahagi ng nawawalang data.

Kung ang pairwise na pagtanggal ng nawawalang data ay hindi humahantong sa anumang sistematikong pagbabago sa mga paraan at pagkakaiba-iba (standard deviations), ang mga istatistikang ito ay magiging katulad sa mga nakalkula gamit ang row-by-row na paraan ng pagtanggal ng nawawalang data. Kung ang isang makabuluhang pagkakaiba ay naobserbahan, pagkatapos ay may dahilan upang ipagpalagay na mayroong pagbabago sa mga pagtatantya. Halimbawa, kung ang average (o standard deviation) ng mga halaga ng isang variable A, na ginamit sa pagkalkula ng ugnayan nito sa variable SA, mas mababa kaysa sa mean (o standard deviation) ng parehong mga halaga ng variable A, na ginamit sa pagkalkula ng ugnayan nito sa variable C, kung gayon mayroong lahat ng dahilan upang asahan na ang dalawang ugnayang ito (A-Bkami) batay sa iba't ibang subset ng data. Magkakaroon ng bias sa mga ugnayang dulot ng hindi random na paglalagay ng mga puwang sa mga variable na halaga.

Pagsusuri ng correlation galaxies. Matapos malutas ang problema ng istatistikal na kahalagahan ng mga elemento ng correlation matrix, ang mga makabuluhang ugnayan sa istatistika ay maaaring katawanin nang grapiko sa anyo ng correlation galaxy o galaxy. Correlation galaxy - Ito ay isang figure na binubuo ng mga vertex at linya na nag-uugnay sa kanila. Ang mga vertice ay tumutugma sa mga katangian at karaniwang itinalaga ng mga numero - mga variable na numero. Ang mga linya ay tumutugma sa istatistikal na makabuluhang mga koneksyon at graphical na nagpapahayag ng sign at kung minsan ang j-level ng kahalagahan ng koneksyon.

Maaaring sumasalamin ang correlation galaxy Lahat istatistikal na makabuluhang mga koneksyon ng correlation matrix (minsan ay tinatawag na graph ng ugnayan ) o lamang ang kanilang makabuluhang napiling bahagi (halimbawa, naaayon sa isang salik ayon sa mga resulta ng pagsusuri sa salik).

HALIMBAWA NG PAGBUO NG CORRELATION PLEIADE


Paghahanda para sa estado (panghuling) sertipikasyon ng mga nagtapos: pagbuo ng database ng Unified State Exam (pangkalahatang listahan ng mga kalahok ng Unified State Exam ng lahat ng kategorya, na nagpapahiwatig ng mga paksa) - isinasaalang-alang ang mga araw ng reserba sa kaso ng parehong mga paksa;

  • Plano ng trabaho (27)

    Solusyon

    2. Mga aktibidad ng institusyong pang-edukasyon upang mapabuti ang nilalaman at masuri ang kalidad sa mga paksa ng edukasyon sa agham at matematika.

  • Ang disiplina na "mas mataas na matematika" ay nagdudulot ng pagtanggi sa ilan, dahil talagang hindi lahat ay naiintindihan ito. Ngunit ang mga mapalad na makapag-aral ng paksang ito at malutas ang mga problema gamit ang iba't ibang mga equation at coefficient ay maaaring magyabang ng halos kumpletong kamalayan nito. Sa sikolohikal na agham, mayroong hindi lamang makataong pokus, kundi pati na rin ang ilang mga pormula at pamamaraan para sa pagpapatunay ng matematika ng hypothesis na iniharap sa panahon ng pananaliksik. Iba't ibang mga coefficient ang ginagamit para dito.

    Koepisyent ng ugnayan ng Spearman

    Ito ay isang pangkaraniwang sukat upang matukoy ang lakas ng ugnayan sa pagitan ng alinmang dalawang katangian. Ang koepisyent ay tinatawag ding nonparametric na pamamaraan. Nagpapakita ito ng mga istatistika ng komunikasyon. Iyon ay, alam natin, halimbawa, na sa isang bata, ang pagsalakay at pagkamayamutin ay magkakaugnay, at ang koepisyent ng ugnayan ng ranggo ng Spearman ay nagpapakita ng istatistikal na kaugnayang matematika sa pagitan ng dalawang katangiang ito.

    Paano kinakalkula ang ranking coefficient?

    Naturally, lahat ng mathematical definition o quantity ay may sariling mga formula kung saan sila kinakalkula. Ang Spearman correlation coefficient ay mayroon din nito. Ang kanyang formula ay ang mga sumusunod:

    Sa unang sulyap, ang formula ay hindi ganap na malinaw, ngunit kung titingnan mo ito, ang lahat ay napakadaling kalkulahin:

    • n ay ang bilang ng mga feature o indicator na niraranggo.
    • d ay ang pagkakaiba sa pagitan ng tiyak na dalawang ranggo na tumutugma sa tiyak na dalawang variable para sa bawat paksa.
    • ∑d 2 - ang kabuuan ng lahat ng mga parisukat na pagkakaiba sa pagitan ng mga ranggo ng isang tampok, ang mga parisukat na kung saan ay hiwalay na kinakalkula para sa bawat ranggo.

    Saklaw ng aplikasyon ng mathematical measure ng koneksyon

    Upang mailapat ang koepisyent ng pagraranggo, kinakailangan na mai-ranggo ang dami ng data ng katangian, iyon ay, itinalaga sila ng isang tiyak na numero depende sa lugar kung saan matatagpuan ang katangian at sa halaga nito. Napatunayan na ang dalawang serye ng mga katangian na ipinahayag sa numerical form ay medyo parallel sa isa't isa. Tinutukoy ng koepisyent ng ugnayan ng ranggo ng Spearman ang antas ng paralelismong ito, ang lapit ng koneksyon sa pagitan ng mga katangian.

    Para sa pagpapatakbo ng matematika ng pagkalkula at pagtukoy ng kaugnayan ng mga katangian gamit ang tinukoy na koepisyent, kailangan mong magsagawa ng ilang mga aksyon:

    1. Ang bawat halaga ng anumang paksa o kababalaghan ay itinalaga ng isang numero sa pagkakasunud-sunod - isang ranggo. Maaari itong tumugma sa halaga ng isang phenomenon sa pataas o pababang pagkakasunod-sunod.
    2. Susunod, ang mga ranggo ng halaga ng mga katangian ng dalawang serye ng dami ay inihambing upang matukoy ang pagkakaiba sa pagitan nila.
    3. Para sa bawat pagkakaiba na nakuha, ang parisukat nito ay nakasulat sa isang hiwalay na hanay ng talahanayan, at ang mga resulta ay summed up sa ibaba.
    4. Pagkatapos ng mga hakbang na ito, inilapat ang isang formula upang kalkulahin ang koepisyent ng ugnayan ng Spearman.

    Mga katangian ng koepisyent ng ugnayan

    Ang mga pangunahing katangian ng koepisyent ng Spearman ay kinabibilangan ng mga sumusunod:

    • Pagsukat ng mga halaga sa pagitan ng -1 at 1.
    • Walang palatandaan ng koepisyent ng interpretasyon.
    • Ang higpit ng koneksyon ay tinutukoy ng prinsipyo: mas mataas ang halaga, mas malapit ang koneksyon.

    Paano suriin ang natanggap na halaga?

    Upang suriin ang kaugnayan sa pagitan ng mga palatandaan, kailangan mong magsagawa ng ilang mga aksyon:

    1. Ang isang null hypothesis (H0) ay iniharap, na kung saan ay din ang pangunahing isa, pagkatapos ay isa pang alternatibo sa una (H 1) ay nabuo. Ang unang hypothesis ay ang Spearman correlation coefficient ay 0 - nangangahulugan ito na walang magiging relasyon. Ang pangalawa, sa kabaligtaran, ay nagsasabi na ang koepisyent ay hindi katumbas ng 0, pagkatapos ay mayroong isang koneksyon.
    2. Ang susunod na hakbang ay upang mahanap ang naobserbahang halaga ng criterion. Ito ay matatagpuan gamit ang pangunahing formula ng Spearman coefficient.
    3. Susunod, ang mga kritikal na halaga ng ibinigay na pamantayan ay matatagpuan. Magagawa lamang ito gamit ang isang espesyal na talahanayan, na nagpapakita ng iba't ibang mga halaga para sa mga ibinigay na tagapagpahiwatig: ang antas ng kahalagahan (l) at ang pagtukoy ng numero (n).
    4. Ngayon ay kailangan mong ihambing ang dalawang nakuha na mga halaga: ang itinatag na nakikita, pati na rin ang kritikal. Upang gawin ito, kinakailangan upang bumuo ng isang kritikal na rehiyon. Kailangan mong gumuhit ng isang tuwid na linya, markahan ito ng mga punto ng kritikal na halaga ng koepisyent na may tanda na "-" at may tanda na "+". Sa kaliwa at kanan ng mga kritikal na halaga, ang mga kritikal na lugar ay naka-plot sa kalahating bilog mula sa mga punto. Sa gitna, pinagsasama ang dalawang halaga, minarkahan ito ng kalahating bilog ng OPG.
    5. Pagkatapos nito, ang isang konklusyon ay ginawa tungkol sa malapit na relasyon sa pagitan ng dalawang katangian.

    Saan ang pinakamagandang lugar para gamitin ang halagang ito?

    Ang pinakaunang agham kung saan aktibong ginamit ang coefficient na ito ay sikolohiya. Pagkatapos ng lahat, ito ay isang agham na hindi batay sa mga numero, ngunit upang patunayan ang anumang mahahalagang hypotheses tungkol sa pag-unlad ng mga relasyon, katangian ng mga tao, at kaalaman ng mga mag-aaral, kinakailangan ang kumpirmasyon ng istatistika ng mga konklusyon. Ginagamit din ito sa ekonomiya, partikular sa mga transaksyon sa foreign exchange. Dito sinusuri ang mga feature nang walang mga istatistika. Ang koepisyent ng correlation ng ranggo ng Spearman ay napaka-maginhawa sa lugar na ito ng aplikasyon dahil ang pagtatasa ay ginawa anuman ang pamamahagi ng mga variable, dahil pinalitan sila ng isang numero ng ranggo. Ang koepisyent ng Spearman ay aktibong ginagamit sa pagbabangko. Ginagamit din ito ng sosyolohiya, agham pampulitika, demograpiya at iba pang agham sa kanilang pananaliksik. Ang mga resulta ay nakuha nang mabilis at tumpak hangga't maaari.

    Ito ay maginhawa at mabilis na gamitin ang Spearman correlation coefficient sa Excel. Mayroong mga espesyal na function dito na makakatulong sa iyong mabilis na makuha ang mga kinakailangang halaga.

    Ano ang iba pang mga coefficient ng ugnayan ang umiiral?

    Bilang karagdagan sa kung ano ang natutunan namin tungkol sa Spearman correlation coefficient, mayroon ding iba't ibang mga correlation coefficient na nagbibigay-daan sa amin upang sukatin at suriin ang mga katangian ng husay, ang ugnayan sa pagitan ng mga quantitative na katangian, at ang pagiging malapit ng koneksyon sa pagitan ng mga ito, na ipinakita sa isang ranggo na sukat. Ito ay mga coefficient tulad ng biserial, rank-biserial, contingency, association, at iba pa. Ang koepisyent ng Spearman ay napakatumpak na nagpapakita ng pagiging malapit ng relasyon, hindi katulad ng lahat ng iba pang mga pamamaraan ng pagpapasiya nito sa matematika.

    Maikling teorya

    Ang rank correlation ay isang paraan ng pagsusuri ng ugnayan na sumasalamin sa mga ugnayan ng mga variable na inayos ayon sa pagtaas ng halaga.

    Ang mga ranggo ay ang mga serial number ng pinagsama-samang unit sa isang ranggo na serye. Kung niraranggo natin ang isang populasyon ayon sa dalawang katangian, ang ugnayan sa pagitan ng pinag-aaralan, kung gayon ang kumpletong pagkakaisa ng mga ranggo ay nangangahulugang ang pinakamalapit na posibleng direktang koneksyon, at ang kumpletong kabaligtaran ng mga ranggo ay nangangahulugang ang pinakamalapit na posibleng puna. Kinakailangan na ranggo ang parehong mga katangian sa parehong pagkakasunud-sunod: alinman mula sa mas maliit na mga halaga ng katangian hanggang sa mas malaki, o kabaliktaran.

    Para sa mga praktikal na layunin, ang paggamit ng rank correlation ay lubhang kapaki-pakinabang. Halimbawa, kung ang isang mataas na ranggo na ugnayan ay itinatag sa pagitan ng dalawang husay na katangian ng mga produkto, kung gayon ito ay sapat na upang kontrolin ang mga produkto lamang sa pamamagitan ng isa sa mga katangian, na binabawasan ang gastos at pinapabilis ang kontrol.

    Ang rank correlation coefficient, na iminungkahi ni K. Spearman, ay tumutukoy sa isang nonparametric na sukat ng ugnayan sa pagitan ng mga variable na sinusukat sa isang rank scale. Kapag kinakalkula ang koepisyent na ito, walang mga pagpapalagay na kinakailangan tungkol sa likas na katangian ng mga distribusyon ng mga katangian sa populasyon. Tinutukoy ng koepisyent na ito ang antas ng pagiging malapit ng koneksyon sa pagitan ng mga ordinal na katangian, na sa kasong ito ay kumakatawan sa mga ranggo ng inihambing na dami.

    Ang halaga ng koepisyent ng ugnayan ng Spearman ay nasa hanay ng +1 at -1. Maaari itong maging positibo o negatibo, na nagpapakilala sa direksyon ng ugnayan sa pagitan ng dalawang katangian na sinusukat sa iskala ng ranggo.

    Ang koepisyent ng ugnayan ng ranggo ng Spearman ay kinakalkula gamit ang formula:

    Pagkakaiba sa pagitan ng mga ranggo sa dalawang variable

    bilang ng magkatugmang pares

    Ang unang hakbang sa pagkalkula ng koepisyent ng ugnayan ng ranggo ay ang pagraranggo sa serye ng mga variable. Ang pamamaraan ng pagraranggo ay nagsisimula sa pamamagitan ng pag-aayos ng mga variable sa pataas na pagkakasunud-sunod ng kanilang mga halaga. Ang iba't ibang mga halaga ay itinalaga ng mga ranggo, na tinutukoy ng mga natural na numero. Kung mayroong ilang mga variable ng pantay na halaga, sila ay itinalaga ng isang average na ranggo.

    Ang bentahe ng koepisyent ng ugnayan ng ranggo ng Spearman ay posible na mag-ranggo ayon sa mga katangian na hindi maipahayag sa numero: posible na mag-ranggo ng mga kandidato para sa isang tiyak na posisyon ayon sa antas ng propesyonal, sa pamamagitan ng kakayahang manguna sa isang koponan, sa pamamagitan ng personal na kagandahan, at iba pa. Sa mga pagsusuri ng eksperto, posibleng i-rank ang mga pagtatasa ng iba't ibang eksperto at hanapin ang kanilang mga ugnayan sa isa't isa, upang pagkatapos ay ibukod mula sa pagsasaalang-alang ang mga pagtatasa ng eksperto na mahinang nauugnay sa mga pagtatasa ng iba pang mga eksperto. Ginagamit ang rank correlation coefficient ng Spearman upang masuri ang katatagan ng trend. Ang kawalan ng koepisyent ng ugnayan ng ranggo ay ang parehong mga pagkakaiba sa mga ranggo ay maaaring tumutugma sa ganap na magkakaibang mga pagkakaiba sa mga halaga ng mga katangian (sa kaso ng dami ng mga katangian). Samakatuwid, para sa huli, ang ugnayan ng mga ranggo ay dapat isaalang-alang na isang tinatayang sukatan ng pagiging malapit ng koneksyon, na hindi gaanong kaalaman kaysa sa koepisyent ng ugnayan ng mga numerical na halaga ng mga katangian.

    Halimbawa ng solusyon sa problema

    Ang gawain

    Ang isang survey ng random na piniling 10 mag-aaral na nakatira sa isang dormitoryo ng unibersidad ay nagpapakita ng kaugnayan sa pagitan ng average na marka mula sa nakaraang session at ang bilang ng mga oras bawat linggo na ginugol ng mag-aaral sa independiyenteng pag-aaral.

    Tukuyin ang lakas ng relasyon gamit ang koepisyent ng ugnayan ng ranggo ng Spearman.

    Kung nahihirapan kang lutasin ang mga problema, ang site ay nagbibigay ng online na tulong sa mga mag-aaral sa mga istatistika na may mga pagsusulit sa bahay o pagsusulit.

    Ang solusyon sa problema

    Kalkulahin natin ang rank correlation coefficient.

    Ranging Paghahambing ng ranggo Pagkakaiba ng ranggo 1 26 4.7 8 1 3.1 1 8 10 -2 4 2 22 4.4 10 2 3.6 2 7 9 -2 4 3 8 3.8 12 3 3.7 3 1 4 -3 9 4 12 3.7 15 4 3.8 4 3 3 0 0 5 15 4.2 17 5 3.9 5 4 7 -3 9 6 30 4.3 20 6 4 6 9 8 1 1 7 20 3.6 22 7 4.2 7 6 2 4 16 8 31 4 26 8 4.3 8 10 6 4 16 9 10 3.1 30 9 4.4 9 2 1 1 1 10 17 3.9 31 10 4.7 10 5 5 0 0 Sum 60

    Koepisyent ng ugnayan ng ranggo ng Spearman:

    Ang pagpapalit ng mga numerical na halaga, nakukuha namin:

    Konklusyon sa problema

    Ang ugnayan sa pagitan ng GPA mula sa nakaraang sesyon at ang bilang ng mga oras bawat linggo na ginugol ng mag-aaral sa independiyenteng pag-aaral ay katamtamang malakas.

    Kung nauubusan ka ng oras upang makumpleto ang isang pagsubok, maaari kang palaging mag-order ng isang agarang solusyon sa mga problema sa istatistika sa website.

    Katamtaman ang halaga ng paglutas ng isang pagsubok ay 700 - 1200 rubles (ngunit hindi bababa sa 300 rubles para sa buong order). Ang presyo ay lubos na naiimpluwensyahan ng madaliang pagdedesisyon (mula sa isang araw hanggang ilang oras). Ang halaga ng online na tulong para sa isang pagsusulit/pagsusulit ay mula sa 1000 rubles. para sa paglutas ng tiket.

    Maaari mong tanungin ang lahat ng mga katanungan tungkol sa gastos nang direkta sa chat, na naipadala na dati ang mga kondisyon ng gawain at ipinaalam sa iyo ang takdang panahon para sa solusyon na kailangan mo. Ang oras ng pagtugon ay ilang minuto.

    Mga halimbawa ng mga kaugnay na problema

    Fechner ratio
    Ang isang maikling teorya ay ibinigay at isang halimbawa ng paglutas ng problema ng pagkalkula ng Fechner sign correlation coefficient ay isinasaalang-alang.

    Mutual contingency coefficients ng Chuprov at Pearson
    Ang pahina ay naglalaman ng impormasyon sa mga pamamaraan para sa pag-aaral ng mga ugnayan sa pagitan ng mga katangian ng husay gamit ang Chuprov at Pearson coefficients ng mutual contingency.

    Ang rank correlation coefficient ng Spearman ay isang non-parametric na pamamaraan na ginagamit upang pag-aralan ng istatistika ang kaugnayan sa pagitan ng mga phenomena. Sa kasong ito, ang aktwal na antas ng parallelism sa pagitan ng dalawang quantitative series ng mga pinag-aralan na katangian ay tinutukoy at ang pagtatasa ng lapit ng itinatag na koneksyon ay ibinibigay gamit ang isang quantitatively expressed coefficient.

    1. Kasaysayan ng pag-unlad ng koepisyent ng ugnayan ng ranggo

    Ang pamantayang ito ay binuo at iminungkahi para sa pagsusuri ng ugnayan noong 1904 Charles Edward Spearman, English psychologist, propesor sa Unibersidad ng London at Chesterfield.

    2. Para saan ang Spearman coefficient ang ginagamit?

    Ang koepisyent ng ugnayan ng ranggo ng Spearman ay ginagamit upang matukoy at suriin ang lapit ng ugnayan sa pagitan ng dalawang serye ng pinaghahambing mga tagapagpahiwatig ng dami. Kung sakaling ang mga ranggo ng mga tagapagpahiwatig, na inayos ayon sa antas ng pagtaas o pagbaba, sa karamihan ng mga kaso ay nag-tutugma (isang mas malaking halaga ng isang tagapagpahiwatig ay tumutugma sa isang mas malaking halaga ng isa pang tagapagpahiwatig - halimbawa, kapag inihambing ang taas at timbang ng katawan ng pasyente), napagpasyahan na mayroon tuwid koneksyon ng ugnayan. Kung ang mga ranggo ng mga tagapagpahiwatig ay may kabaligtaran na direksyon (isang mas mataas na halaga ng isang tagapagpahiwatig ay tumutugma sa isang mas mababang halaga ng isa pa - halimbawa, kapag inihambing ang edad at rate ng puso), tapos pinag-uusapan nila reverse koneksyon sa pagitan ng mga tagapagpahiwatig.

      Ang koepisyent ng ugnayan ng Spearman ay may mga sumusunod na katangian:
    1. Ang koepisyent ng ugnayan ay maaaring tumagal ng mga halaga mula sa minus isa hanggang isa, at sa rs=1 mayroong isang mahigpit na direktang relasyon, at sa rs= -1 mayroong isang mahigpit na relasyon sa feedback.
    2. Kung ang koepisyent ng ugnayan ay negatibo, kung gayon mayroong isang relasyon sa feedback kung ito ay positibo, kung gayon mayroong isang direktang relasyon.
    3. Kung ang koepisyent ng ugnayan ay zero, kung gayon halos walang koneksyon sa pagitan ng mga dami.
    4. Kung mas malapit ang module ng correlation coefficient sa pagkakaisa, mas malakas ang ugnayan sa pagitan ng mga sinusukat na dami.

    3. Sa anong mga kaso maaaring gamitin ang Spearman coefficient?

    Dahil sa ang katunayan na ang koepisyent ay isang pamamaraan pagsusuring hindi parametric, walang pagsubok para sa normal na pamamahagi ay kinakailangan.

    Ang mga maihahambing na tagapagpahiwatig ay maaaring masukat pareho sa tuloy-tuloy na sukat(halimbawa, ang bilang ng mga pulang selula ng dugo sa 1 μl ng dugo), at sa ordinal(halimbawa, mga punto ng pagtatasa ng eksperto mula 1 hanggang 5).

    Ang pagiging epektibo at kalidad ng pagtatasa ng Spearman ay bumababa kung ang pagkakaiba sa pagitan ng iba't ibang mga halaga ng alinman sa mga sinusukat na dami ay sapat na malaki. Hindi inirerekomenda na gamitin ang koepisyent ng Spearman kung mayroong hindi pantay na pamamahagi ng mga halaga ng sinusukat na dami.

    4. Paano makalkula ang koepisyent ng Spearman?

    Kasama sa pagkalkula ng koepisyent ng ugnayan ng ranggo ng Spearman ang mga sumusunod na hakbang:

    5. Paano bigyang-kahulugan ang halaga ng koepisyent ng Spearman?

    Kapag ginagamit ang koepisyent ng ugnayan ng ranggo, ang pagkakalapit ng koneksyon sa pagitan ng mga katangian ay kondisyonal na tinasa, isinasaalang-alang ang mga halaga ng koepisyent na katumbas ng 0.3 o mas mababa bilang mga tagapagpahiwatig ng mahinang koneksyon; ang mga halagang higit sa 0.4, ngunit mas mababa sa 0.7 ay mga tagapagpahiwatig ng katamtamang lapit ng koneksyon, at ang mga halaga ng 0.7 o higit pa ay mga tagapagpahiwatig ng mataas na pagkakalapit ng koneksyon.

    Ang istatistikal na kahalagahan ng nakuha na koepisyent ay tinasa gamit ang t-test ng Mag-aaral. Kung ang kinakalkula na halaga ng t-test ay mas mababa sa naka-tabulate na halaga para sa isang naibigay na bilang ng mga antas ng kalayaan, ang naobserbahang relasyon ay hindi makabuluhan ayon sa istatistika. Kung ito ay mas malaki, kung gayon ang ugnayan ay itinuturing na makabuluhang istatistika.