Вредности за корелација на критичните вредности на Спирман. Примена на спирмен и Пирсон корелација

37. Коефициент на корелација на ранг Спирман.

S. 56 (64) 063.JPG

http://psystat.at.ua/publ/1-1-0-33

Спирмановиот коефициент на корелација на ранг се користи кога:
- променливите имаат скала за рангирањемерења;
- дистрибуцијата на податоците е премногу различна од нормалноили воопшто не се знае
- примероците се мали (Н< 30).

Интерпретацијата на коефициентот на корелација на Спирман не се разликува од Пирсоновиот коефициент, но неговото значење е нешто поинакво. За да ја разбереме разликата помеѓу овие методи и логично да ги поткрепиме областите на нивната примена, да ги споредиме нивните формули.

Пирсонов коефициент на корелација:

Спирмановиот коефициент на корелација:

Како што можете да видите, формулите значително се разликуваат. Споредете ги формулите

Формулата за корелација Пирсон ја користи аритметичката средина и стандардното отстапување на корелираните серии, додека формулата Спирман не ги користи. Така, за да се добие соодветен резултат според формулата Пирсон, потребно е корелираните серии да бидат блиску до нормалната дистрибуција (средната вредност и стандардното отстапување се параметри за нормална дистрибуција). За формулата Спирман, ова не е релевантно.

Елемент на формулата на Пирсон е стандардизацијата на секоја серија во z-оценка.

Како што можете да видите, конверзијата на променливите во скалата Z е присутна во формулата за коефициент на корелација на Пирсон. Според тоа, за Пирсон коефициентот, скалата на податоците е апсолутно ирелевантна: на пример, можеме да корелираме две променливи, од кои едната има мин. = 0 и макс. = 1, а вториот мин. = 100 и макс. = 1000. Без разлика колку е различен опсегот на вредности, сите тие ќе бидат претворени во стандардни z-вредности кои се исти по размер.

Таква нормализација нема кај Спирмановиот коефициент, па

ЗАДОЛЖИТЕЛЕН УСЛОВ ЗА КОРИСТЕЊЕ НА КОЕФИЦИЕНТОТ SPEERMAN Е ЕДНАКВОСТ НА ОПЕГАТА НА ДВЕ ПРОМЕНЛИВИ.

Пред да се користи коефициентот Spearman за серии на податоци со различни опсези, потребно е да ранг. Рангирањето води до фактот дека вредностите на овие серии го добиваат истиот минимум = 1 (минимален ранг) и максимум еднаков на бројот на вредности (максимум, последен ранг = N, т.е. максимален број случаи во пример).

Во кои случаи е можно да се направи без рангирање

Ова се случаи кога податоците се оригинални скала за рангирање. На пример, тестот за ориентации на вредности на Rokeach.

Исто така, тоа се случаи кога бројот на опции за вредност е мал и има фиксни минимум и максимум во примерокот. На пример, во семантичкиот диференцијал, минимум = 1, максимум = 7.

Пример за пресметување на коефициентот на корелација на ранг Спирман

Тестот за ориентација на вредности на Rokeach беше спроведен на два примероци X и Y. Задача: да се открие колку се блиски хиерархиите на вредностите на овие примероци (буквално, колку се слични).

Добиената вредност r=0,747 се проверува табела за критична вредност. Според табелата, при N=18, добиената вредност е сигурна на ниво на стр<=0,005

Рангирани коефициенти на корелација според Спирман и Кендал

За променливите кои припаѓаат на редната скала или за променливите кои не следат нормална дистрибуција, како и за променливите кои припаѓаат на скалата на интервалот, наместо Пирсонов коефициент се пресметува корелација на ранг на Спирман. За да го направите ова, на поединечните вредности на променливите им се доделуваат места за рангирање, кои последователно се обработуваат со помош на соодветни формули. За да ја откриете корелацијата на ранг, отштиклирајте ја стандардната корелација на Пирсон во полето за дијалог Биваријатни корелации.... Наместо тоа, активирајте ја пресметката за корелација на Спирман. Оваа пресметка ќе ги даде следните резултати. Коефициентите на корелација на ранг се многу блиску до соодветните вредности на Пирсоновите коефициенти (оригиналните променливи имаат нормална дистрибуција).

titkova-matmetody.pdf стр. 45

Методот на корелација на ранг на Спирман ви овозможува да ја одредите затегнатоста (јачината) и насоката

корелација помеѓу два знакаили два профила (хиерархии)знаци.

За да се пресмета корелацијата на ранг, потребно е да се имаат две серии на вредности,

кои можат да се рангираат. Овие опсези на вредности може да бидат:

1) два знакасе мери во истиот групаиспитаници;

2) две индивидуални хиерархии на карактеристики,идентификувани во два субјекти за истото

збир на карактеристики;

3) два групни хиерархии на карактеристики,

4) индивидуална и групнахиерархија на карактеристики.

Прво, индикаторите се рангирани посебно за секоја од карактеристиките.

Како по правило, на помала вредност на карактеристиката и се доделува понизок ранг.

Во првиот случај (две карактеристики), поединечните вредности се рангираат според првата

особина добиена од различни субјекти, а потоа поединечни вредности за втората

знак.

Ако два знака се позитивно поврзани, тогаш субјектите со ниски рангови во

еден од нив ќе има ниски рангови во другиот, а предметите со високи рангови во

еден од атрибутите ќе има и високи рангови на другиот атрибут. За броење rs

потребно е да се утврдат разликите (г)меѓу ранговите добиени од овие предмети на двете

знаци. Тогаш овие показатели d се трансформираат на одреден начин и се одземаат од 1. Отколку

колку е помала разликата помеѓу ранговите, толку ќе биде поголемо rs, толку ќе биде поблиску до +1.

Ако нема корелација, тогаш сите редови ќе бидат измешани и нема да има

не се совпаѓа. Формулата е дизајнирана така што во овој случај rs ќе биде блиску до 0.

Во случај на негативна корелацијаниски рангови на предмети по една основа

ќе одговара на високи рангови на друг атрибут, и обратно. Колку повеќе несовпаѓање

помеѓу рангот на предмети во две променливи, поблиску rs е до -1.

Во вториот случај (два индивидуални профили), индивидуална

вредностите добиени од секој од 2-те субјекти според одредено (исто за нив

и двете) збир на карактеристики. Првиот ранг ќе добие особина со најниска вредност; втор ранг -

карактеристика со поголема вредност итн. Очигледно, сите карактеристики мора да се мерат во

истите единици, инаку рангирањето е невозможно. На пример, тоа е невозможно

рангирајте ги индикаторите според Cattell Personality Questionnaire (16PF), доколку тие се изразени во

„Сурови“ резултати, бидејќи опсегот на вредности се различни за различни фактори: од 0 до 13, од 0 до

20 и од 0 до 26. Не можеме да кажеме кој од факторите ќе го заземе првото место во однос на

сериозност, додека не ги доведеме сите вредности на една скала (најчесто ова е скалата на ѕидовите).

Ако поединечните хиерархии на два субјекти се позитивно поврзани, тогаш знаците

имајќи ниски рангови во еден од нив ќе има ниски рангови во другиот, и обратно.

На пример, ако за еден предмет факторот Е (доминација) има најнизок ранг, тогаш за

друг предмет, треба да има низок ранг ако еден предмет има фактор Ц

(емоционална стабилност) има највисок ранг, тогаш мора да има и другиот субјект

овој фактор има висок ранг итн.

Во третиот случај (два групни профили), се рангираат просечните вредности на групата,

примени во 2 групи предмети според одреден, идентичен за две групи, збир

знаци. Во продолжение, линијата на размислување е иста како и во претходните два случаи.

Во случај на 4-ти (индивидуални и групни профили), тие се рангирани посебно

индивидуални вредности на предметот и просечни групни вредности за истиот сет

знаци кои се добиваат, по правило, со исклучување на овој поединечен субјект - тој

не учествува во просечниот групен профил, со кој ќе се споредува неговиот поединец

профил. Корелацијата на ранг ќе ви овозможи да проверите колку е конзистентна поединецот и

групни профили.

Во сите четири случаи значајноста на добиениот коефициент на корелација се определува со

по број на рангирани вредности Н.Во првиот случај, оваа бројка ќе се совпадне со

големина на примерокот n. Во вториот случај, бројот на набљудувања ќе биде бројот на карактеристики,

сочинуваат хиерархија. Во третиот и четвртиот случај, N е и бројот на совпаднати

знаци, а не бројот на предмети во групи. Детални објаснувања се дадени во примерите. Ако

апсолутната вредност на rs достигнува критична вредност или ја надминува, корелацијата

сигурен.

Хипотези.

Постојат две можни хипотези. Првиот се однесува на случајот 1, вториот на другите три

Првата верзија на хипотезите

H0: Корелацијата помеѓу променливите A и B не се разликува од нула.

H2: Корелацијата помеѓу променливите A и B е значително различна од нула.

Втората верзија на хипотезите

H0: Корелацијата помеѓу хиерархиите А и Б не се разликува од нула.

H2: Корелацијата помеѓу хиерархиите А и Б е значително различна од нула.

Ограничувања на коефициентот на корелација на ранг

1. За секоја променлива мора да се достават најмалку 5 набљудувања. Горна

границата за земање примероци се одредува со достапните табели на критичните вредности .

2. Спирмановиот коефициент на корелација е rs со голем број на идентични

рангирањето за една или двете совпаднати променливи дава груби вредности. Идеално

и двете корелирани серии мора да бидат две секвенци на несовпаѓање

вредности. Ако овој услов не е исполнет, мора да се направи прилагодување

истите чинови.

Коефициентот на корелација на ранг на Спирман се пресметува со формулата:

Ако во двете споредени серии за рангирање има групи од исти рангови,

пред да се пресмета коефициентот на корелација на ранг, потребно е истиот да се поправи

ги рангира Та и ТВ:

Ta \u003d Σ (a3 - a) / 12,

ТВ \u003d Σ (v3 - c) / 12,

каде а -обемот на секоја група на идентични рангови во серијата рангови А, во волумен на секоја од нив

групи од еднакви рангови во серијата рангови Б.

За да ја пресметате емпириската вредност на rs, користете ја формулата:

38. Коефициент на бисериска корелација со точки.

За корелација воопшто, видете го прашањето бр.36Со. 56 (64) 063.JPG

harchenko-korranaliz.pdf

Нека променливата X се мери на силна скала, а променливата Y на дихотомна. Точка бисериски коефициент на корелација rpb се пресметува со формулата:

Овде x 1 е просечната вредност за X објекти со вредност „еден“ за Y;

x 0 - просечната вредност за X објекти со вредност од "нула" за Y;

s x - стандардна девијација на сите вредности за X;

n 1 - бројот на објекти "еден" во Y, n 0 - бројот на објекти "нула" во Y;

n = n 1 + n 0 е големината на примерокот.

Коефициентот на бисериска корелација може да се пресмета и со други еквивалентни изрази:

Еве xе вкупната средна вредност за променливата X.

Точка бисериски коефициент на корелација rpbварира од –1 до +1. Неговата вредност е еднаква на нула во случај променливите со единица за Yимаат просек Y, еднаква на средната вредност на променливите со нула над Y.

Испитување хипотези за значењеточка бисериски коефициент на корелација е да се провери нулта хипотезач 0 за еднаквоста на општиот коефициент на корелација до нула: ρ = 0, што се изведува со помош на студентскиот критериум. Емпириска вредност

во споредба со критичните вредности т а (дф) за бројот на степени на слобода дф = n– 2

Доколку условот | т| ≤ та(дф), нултата хипотеза ρ = 0 не се отфрла. Точка бисериски коефициент на корелација значително се разликува од нула ако емпириската вредност | т| паѓа во критичниот регион, односно ако состојбата | т| > та(n– 2). Веродостојноста на односот пресметана со помош на коефициентот на бисериска корелација rpb, може да се определи и со користење на критериумот χ 2 за бројот на степени на слобода дф= 2.

Точка-бисериска корелација

Последователната модификација на коефициентот на корелација на производот на моментите се рефлектираше во бисериски со точки р. Оваа статистика. ја покажува врската помеѓу две променливи, од кои едната е наводно континуирана и нормално распределена, а другата е дискретна во точната смисла на зборот. Коефициентот на корелација со бисериски точки се означува со р pbisБидејќи во р pbisдихотомијата ја рефлектира вистинската природа на дискретната променлива, а не е вештачка, како во случајот р бис, неговиот знак е произволно определен. Затоа, за сите практики цели р pbisсметано во опсег од 0,00 до +1,00.

Има и таков случај кога две променливи се сметаат за континуирани и нормално распределени, но и двете се вештачки дихотомизирани, како во случајот со бисериска корелација. За да се процени врската помеѓу таквите променливи, се користи коефициентот на тетрахорична корелација р тет, кој исто така беше одгледуван од Пирсон. Главна (точни) формули и постапки за пресметување р тетсе доста сложени. Затоа, со пракса. овој метод ги користи апроксимациите р тетдобиени врз основа на скратени постапки и табели.

/online/dictionary/dictionary.php?term=511

ТОЧКИ БИСЕРИЈАЛЕН КОЕФИЦИЕНТ НА ​​КОРЕЛАЦИЈАе коефициентот на корелација помеѓу две променливи, од кои едната се мери на дихотомна скала, а другата на интервална скала. Се користи во класичната и модерната тестологија како показател за квалитетот на задачата за тестирање - сигурност-конзистентност со севкупниот резултат на тестот.

За корелација на променливите измерени во дихотомна и интервална скалаупотреба точка-бисериски коефициент на корелација.
Коефициентот на корелација точка-бисери е метод за анализа на корелација на односот на променливите, од кои едната се мери во скала на имиња и зема само 2 вредности (на пример, мажи / жени, одговорот е точен / одговорот не е точно, има знак / нема знак), а вториот во односот на скалата или скалата на интервалот. Формулата за пресметување на коефициентот на точка-бисериска корелација:

Каде:
m1 и m0 се просечните вредности на X со вредност од 1 или 0 во Y.
σx е стандардна девијација на сите вредности за X
n1 ,n0 - број на X вредности од 1 или 0 до Y.
n е вкупниот број на парови вредности

Најчесто, овој тип на коефициент на корелација се користи за пресметување на односот на тест ставките со сумарна скала. Ова е еден вид проверка на валидација.

39. Ранг-бисериски коефициент на корелација.

За корелација воопшто, видете го прашањето бр.36Со. 56 (64) 063.JPG

harchenko-korranaliz.pdf стр. 28

Коефициентот на ранг-бисериска корелација што се користи кога една од променливите ( X) се прикажува во редна скала, а другата ( Y) - во дихотомно, пресметано со формулата

.

Еве го просечниот ранг на предмети кои имаат единство во Y; е просечниот ранг на предмети со нула ин Y, n- големина на примерокот.

Испитување хипотези за значењеранг-бисериски коефициент на корелација се изведува слично како и точката бисериски коефициент на корелација користејќи Студентски t-тест со замена во формулите рстрна ррб.

Кога една променлива се мери на дихотомна скала (променлива x),а другата во скалата на рангирање (променлива Y), користејќи го коефициентот на корелација ранг-бисерија. Се сеќаваме дека променливата x,мерено во дихотомна скала, зема само две вредности (шифри) 0 и 1. Особено да нагласиме дека и покрај фактот што овој коефициент варира во опсег од –1 до +1, неговиот знак не е важен за толкување на резултати. Ова е уште еден исклучок од општото правило.

Пресметката на овој коефициент е направена според формулата:

каде ` X 1просечен ранг над тие елементи на променливата Y, што одговара на кодот (функција) 1 во променливата X;

`X 0 – просечен ранг за тие елементи на променливата Y,што одговара на кодот (функција) 0 во променливата X\

N-вкупниот број на елементи во променливата x.

За да се примени коефициентот на корелација на ранг-бисерија, мора да се исполнат следниве услови:

1. Променливите што се споредуваат мора да се мерат на различни скали: една X-во дихотомна скала; друг Y-во скалата за рангирање.

2. Бројот на различни карактеристики во споредените променливи Xи Yтреба да биде ист.

3. За да се процени нивото на веродостојност на коефициентот на корелација ранг-бисериски, треба да се користи формулата (11.9) и табелата со критични вредности за студентскиот тест кога k = n - 2.

http://psystat.at.ua/publ/drugie_vidy_koehfficienta_korreljacii/1-1-0-38

Случаи кога една од променливите е присутна во дихотомна скала, а другиот во ранг (реден), бараат употреба ранг-бисериски коефициент на корелација:

rpb=2 / n * (m1 - m0)

каде:
n е бројот на мерните објекти
m1 и m0 - просечниот ранг на објекти со 1 или 0 во втората променлива.
Овој коефициент се користи и при проверка на валидноста на тестовите.

40. Коефициент на линеарна корелација.

За корелацијата воопшто (и за линеарната корелација особено), видете го прашањето бр. 36Со. 56 (64) 063.JPG

КОЕФИЦИЕНТ НА ​​КОРЕЛАЦИЈА НА Г. ПИРСОН

р- Пирсон (Пирсон р) се користи за проучување на врската помеѓу две метричкидруги променливи измерени на истиот примерок.Има многу ситуации во кои е соодветно да се користи. Дали интелигенцијата влијае на перформансите во високите универзитетски години? Дали големината на платата на вработениот е поврзана со неговата добра волја кон колегите? Дали расположението на ученикот влијае на успехот во решавањето сложена аритметичка задача? За да одговори на таквите прашања, истражувачот мора да измери два индикатори од интерес за секој член на примерокот. Податоците за проучување на врската потоа се табелирани, како во примерот подолу.

ПРИМЕР 6.1

Во табелата е даден пример од првичните мерни податоци за два показатели на интелигенција (вербална и невербална) кај 20 ученици од 8-мо одделение.

Врската помеѓу овие променливи може да се прикаже со помош на дијаграм за расејување (види Слика 6.3). Дијаграмот покажува дека постои одредена врска помеѓу измерените индикатори: колку е поголема вредноста на вербалната интелигенција, толку (главно) толку е поголема вредноста на невербалната интелигенција.

Пред да ја дадеме формулата за коефициентот на корелација, да се обидеме да ја следиме логиката на неговото појавување, користејќи ги податоците од Пример 6.1. Позицијата на секоја /-точка (предмет со број /) на дијаграмот на расејување во однос на другите точки (сл. 6.3) може да се даде со големини и знаци на отстапувањата на соодветните вредности на променливите од нивните просечни вредности: (xj - МЈ и (ум на ). Ако знаците на овие отстапувања се совпаѓаат, тогаш тоа укажува во корист на позитивна врска (големи вредности за Xодговараат на големи вредности наили помали вредности за Xодговараат на помали вредности y).

За предмет бр.1, отстапувањето од просекот Xи од страна на напозитивни, а за предметот бр. 3, двете отстапувања се негативни. Следствено, податоците за двете укажуваат на позитивна врска помеѓу проучуваните особини. Напротив, ако знаците на отстапувања од просекот Xи од страна на насе разликуваат, тоа ќе укаже на негативна врска помеѓу знаците. Така, за предметот бр.4, отстапувањето од просекот Xе негативен, според y -позитивно, а за предмет бр.9 - обратно.

Така, ако производот на отстапувањата (x, - М X ) X (ум на ) позитивен, тогаш податоците на /-субјектот укажуваат на директна (позитивна) врска, а ако е негативна, тогаш обратна (негативна) врска. Според тоа, ако Xwyсе главно директно пропорционални, тогаш повеќето производи од отстапувањата ќе бидат позитивни, а ако се обратно поврзани, тогаш повеќето производи ќе бидат негативни. Затоа, збирот на сите производи на отстапувања за даден примерок може да послужи како општ индикатор за јачината и насоката на врската:

Со директно пропорционална врска помеѓу променливите, оваа вредност е голема и позитивна - за повеќето субјекти, отстапувањата се совпаѓаат во знакот (големите вредности на една променлива одговараат на големите вредности на другата променлива и обратно). Ако Xи наимаат повратни информации, тогаш за повеќето субјекти, големите вредности на една променлива ќе одговараат на помали вредности на друга променлива, т.е. знаците на производите ќе бидат негативни, а збирот на производите како целина исто така ќе биде голем во апсолутна вредност, но со негативен знак. Ако не постои систематска врска помеѓу променливите, тогаш позитивните членови (производи на отстапувања) ќе се избалансираат со негативни членови, а збирот на сите производи на отстапувања ќе биде блиску до нула.

За збирот на производите да не зависи од големината на примерокот, доволно е да се просецира. Но, нас не интересира мерката на односот не како општ параметар, туку како пресметана проценка на истата - статистика. Затоа, што се однесува до формулата за дисперзија, во овој случај ќе го сториме истото, збирот на производите на отстапувањата го делиме не со Н, и на ТВ - 1. Излегува мерка за комуникација, широко користена во физиката и техничките науки, која се нарекува. коваријанса (Коваханс):


AT психологијата, за разлика од физиката, повеќето променливи се мерат на произволни скали, бидејќи психолозите не се заинтересирани за апсолутната вредност на особината, туку за релативната положба на субјектите во групата. Покрај тоа, коваријансата е многу чувствителна на скалата (дисперзија) во која се мерат карактеристиките. За да се направи мерката на комуникација независна од мерните единици на кој било атрибут, доволно е да се подели коваријансата на соодветните стандардни отстапувања. Така е добиено за-K. Пирсоновиот коефициент на корелација мазга:

или, откако ќе се заменат изразите за o x и


Ако вредностите на двете променливи беа претворени во r-вредности со помош на формулата


тогаш формулата за коефициент на корелација r-Pearson изгледа поедноставна (071.JPG):

/dict/sociology/article/soc/soc-0525.htm

ЛИНЕАРНА КОРЕЛАЦИЈА- статистичка непричинска линеарна врска помеѓу две квантитативни променливи Xи на. Мерено со помош на „факторот K.L.“ Пирсон, што е резултат на делење на коваријансата со стандардните отстапувања на двете променливи:

,

каде с xy- коваријанса помеѓу променливите Xи на;

с x , с y- стандардни отстапувања за променливи Xи на;

x јас , y јас- променливи вредности Xи наза број на објектот јас;

x, y- аритметички просеци за променливи Xи на.

Пирсоновиот сооднос рможе да земе вредности од интервалот [-1; +1]. Значење r = 0значи дека нема линеарна врска помеѓу променливите Xи на(но не исклучува нелинеарна статистичка врска). Позитивни вредности на коефициентот ( р> 0) означува директна линеарна врска; колку неговата вредност е поблиска до +1, толку е посилна статистичката директна врска. Негативни вредности на коефициентот ( р < 0) свидетельствуют об обратной линейной связи; чем ближе его значение к -1, тем сильнее обратная связь. Значения р= ±1 значи присуство на целосна линеарна врска, директно или обратно. Во случај на целосна врска, сите точки со координати ( x јас , y јас) лежи на права линија y = а + bx.

„Коефициент К.Л. Пирсон се користи и за мерење на затегнатоста на врската во моделот на регресија на линеарни парови.

41. Матрица на корелација и график на корелација.

За корелација воопшто, видете го прашањето бр.36Со. 56 (64) 063.JPG

матрица на корелација.Честопати, анализата на корелација вклучува проучување на односи не две, туку многу променливи измерени во квантитативна скала на еден примерок. Во овој случај, корелации се пресметуваат за секој пар од овој сет на променливи. Пресметките обично се вршат на компјутер, а резултатот е матрица на корелација.

Корелација матрица(корелација матрица) е резултат на пресметување на корелации од ист тип за секој пар од множеството Рпроменливи измерени во квантитативна скала на еден примерок.

ПРИМЕР

Да претпоставиме дека ги проучуваме односите помеѓу 5 променливи (vl, v2,..., v5; П= 5), мерено на примерок од N=30човечки. Подолу е табела со првични податоци и матрица за корелација.

И
поврзани податоци:

Корелација матрица:

Лесно е да се види дека матрицата на корелација е квадратна, симетрична во однос на главната дијагонала (takkakg, y = /) y), со единици на главната дијагонала (бидејќи Г и = Гу = 1).

Матрицата на корелација е квадрат:бројот на редови и колони е еднаков на бројот на променливи. Таа е симетричниво однос на главната дијагонала, бидејќи корелацијата XСо нае еднаква на корелација наСо X.Единиците се наоѓаат на нејзината главна дијагонала, бидејќи корелацијата на карактеристиката со себе е еднаква на една. Следствено, не се предмет на анализа сите елементи од матрицата на корелација, туку оние кои се над или под главната дијагонала.

Број на коефициенти на корелација,Карактеристиките што треба да се анализираат при проучувањето на односите се одредуваат со формулата: P(P- 1)/2. Во примерот погоре, бројот на таквите коефициенти на корелација е 5(5 - 1)/2 = 10.

Главната задача за анализа на матрицата на корелација еоткривајќи ја структурата на меѓусебните односи на збир на карактеристики. Ова овозможува визуелна анализа корелација плејади- графичка слика структури статистичкизначајни врскиако нема многу такви врски (до 10-15). Друг начин е да се користат мултиваријантни методи: повеќекратна регресија, факторска или кластерска анализа (види дел „Мултиваријатни методи...“). Користејќи факторска или кластерска анализа, можно е да се идентификуваат групирања на променливи кои се потесно поврзани една со друга отколку со други променливи. Комбинацијата од овие методи е исто така многу ефикасна, на пример, ако има многу знаци и тие не се хомогени.

Споредба на корелации -дополнителна задача за анализа на матрицата на корелација, која има две опции. Доколку е потребно да се споредат корелации во една од редовите на матрицата за корелација (за една од променливите), се применува методот на споредба за зависни примероци (стр. 148-149). При споредување на корелации со исто име пресметани за различни примероци, се користи методот на споредба за независни примероци (стр. 147-148).

Методи за споредбакорелации во дијагоналиматрица на корелација (за проценка на стационарноста на случаен процес) и споредување неколкуматриците за корелација добиени за различни примероци (поради нивната хомогеност) одземаат многу време и се надвор од опсегот на оваа книга. Можете да се запознаете со овие методи од книгата на GV Sukhodolsky 1.

Проблемот на статистичка значајност на корелациите.Проблемот е што процедурата за тестирање на статистичките хипотези вклучува еден-повеќекратнитест направен на еден примерок. Доколку се примени истиот метод многу пати,дури и ако во однос на различни променливи, тогаш веројатноста за добивање резултат чисто случајно се зголемува. Во принцип, ако го повториме истиот метод на тестирање на хипотези до времињаво однос на различни променливи или примероци, тогаш со утврдената вредност на a, гарантирано ќе добиеме потврда на хипотезата во ахкбројот на случаи.

Да претпоставиме дека е анализирана матрицата на корелација за 15 променливи, односно се пресметуваат 15(15-1)/2 = 105 коефициенти на корелација. За тестирање на хипотезите се поставува нивото a = 0,05. Со тестирање на хипотезата 105 пати, ќе ја добиеме нејзината потврда пет пати (!) без разлика дали врската навистина постои. Знаејќи го ова и откако добивме, да речеме, 15 „статистички значајни“ коефициенти на корелација, дали можеме да кажеме кои од нив се случајно добиени, а кои одразуваат вистинска врска?

Строго кажано, за да се донесе статистичка одлука, потребно е да се намали нивото a за онолку пати колку што се тестираат хипотезите. Но, ова е тешко препорачливо, бидејќи веројатноста за игнорирање на навистина постоечка врска (направете грешка од типот II) се зголемува на непредвидлив начин.

Матрицата на корелација сама по себе не е доволна основаза статистички заклучоци во однос на поединечните коефициенти вклучени во негокорелации!

Постои само еден навистина убедлив начин да се реши овој проблем: да се подели примерокот по случаен избор на два дела и да се земат предвид само оние корелации кои се статистички значајни во двата дела од примерокот. Алтернатива може да биде употребата на повеќеваријантни методи (факторијална, кластерска или повеќекратна регресивна анализа) - за избор и последователно толкување на групи на статистички значајно поврзани променливи.

Проблемот на исчезнатите вредности.Доколку недостасуваат вредности во податоците, тогаш можни се две опции за пресметување на матрицата на корелација: а) бришење на вредности ред-по-ред (исклучуваслучаипописно); б) парно бришење на вредности (исклучуваслучаиво пар). На бришење ред по реднабљудувања со празнини, целата линија се брише за објектот (субјектот) кој има барем една вредност што недостасува за една од променливите. Овој метод води до „точна“ матрица на корелација во смисла дека сите коефициенти се пресметуваат од ист сет на објекти. Меѓутоа, ако вредностите што недостасуваат се случајно распределени во променливите, тогаш овој метод може да доведе до фактот дека нема да остане ниту еден објект во разгледуваниот сет на податоци (секоја линија ќе содржи најмалку една вредност што недостасува). За да ја избегнете оваа ситуација, користете друг метод наречен отстранување во пар.Овој метод ги зема предвид само празнините во секој одбран пар колони на променливи и ги игнорира празнините во другите променливи. Корелацијата за пар променливи се пресметува за оние објекти каде што нема празнини. Во многу ситуации, особено кога бројот на празнини е релативно мал, да речеме 10%, а празнините се прилично случајно распределени, овој метод не води до сериозни грешки. Сепак, понекогаш тоа не е случај. На пример, во систематската пристрасност (поместување) на проценката, систематската локација на празнините може да биде „скриена“, што е причина за разликата во коефициентите на корелација изградени на различни подмножества (на пример, за различни подгрупи на објекти ). Друг проблем поврзан со матрицата на корелација пресметана со во паровиОтстранувањето на јазот се случува кога се користи оваа матрица во други видови на анализа (на пример, во повеќекратна регресија или факторска анализа). Тие претпоставуваат дека се користи „точна“ матрица на корелација со одредено ниво на конзистентност и „соодветност“ на различни коефициенти. Употребата на матрица со „лоши“ (пристрасни) проценки води до фактот дека програмата или не може да анализира таква матрица или резултатите ќе бидат погрешни. Затоа, ако се користи парен метод за елиминирање на податоците што недостасуваат, неопходно е да се провери дали има или нема систематски обрасци во распределбата на празнините.

Ако парното елиминирање на податоците што недостасуваат не доведе до систематско поместување на средствата и варијансите (стандардни отстапувања), тогаш овие статистики ќе бидат слични на оние пресметани со линискиот метод за отстранување на празнините. Ако има значителна разлика, тогаш има причина да се претпостави дека има поместување во проценките. На пример, ако средната вредност (или стандардното отстапување) на вредностите на променливата НО,што се користеше при пресметување на нејзината корелација со променливата AT,многу помалку од средната вредност (или стандардното отстапување) на истите вредности на променливата НО,кои беа користени при пресметувањето на нејзината корелација со променливата C, тогаш постојат сите причини да се очекува дека овие две корелации (А-Бнас)врз основа на различни подмножества на податоци. Ќе има поместување во корелациите предизвикани од неслучајната локација на празнините во вредностите на променливите.

Анализа на корелација плејади.По решавањето на проблемот со статистичката значајност на елементите на матрицата на корелација, статистички значајните корелации може графички да се претстават во форма на корелациона плејада или плејади. Корелација галаксија -тоа е фигура која се состои од темиња и линии што ги поврзуваат. Темињата одговараат на карактеристиките и обично се означуваат со броеви - броевите на променливите. Линиите одговараат на статистички значајни врски и графички го изразуваат знакот, а понекогаш и /j-значајното ниво на врската.

Корелациската галаксија може да рефлектира ситестатистички значајни односи на матрицата на корелација (понекогаш се нарекуваат графикон на корелација ) или само нивниот значајно избран дел (на пример, што одговара на еден фактор според резултатите од факторската анализа).

ПРИМЕР ЗА ИЗГРАДУВАЊЕ НА КОРЕЛАЦИОНА ПЛАИД


Подготовка за државна (конечна) сертификација на дипломирани студенти: формирање на базата на податоци на USE (општа листа на учесници во USE од сите категории, со назначување на предмети) - земајќи ги предвид резервните денови во случај на совпаѓање на предметите;

  • Работен план (27)

    Решение

    2. Активностите на образовната институција за подобрување на содржината и оценување на квалитетот по предметите природно-математичко образование МОУ средно училиште бр. 4, Литвиновска, Чапаевскаја,

  • Во случаи кога мерењата на проучуваните карактеристики се вршат на скала на нарачка, или формата на врската се разликува од линеарната, проучувањето на врската помеѓу две случајни променливи се врши со помош на коефициенти на корелација на ранг. Размислете за коефициентот на корелација на ранг на Спирман. При неговото пресметување потребно е да се рангираат (нарачаат) опциите на примерокот. Рангирањето е групирање на експериментални податоци во одреден редослед, или растечки или опаѓачки.

    Операцијата за рангирање се изведува според следниот алгоритам:

    1. На помала вредност и се доделува понизок ранг. На највисоката вредност и се доделува ранг што одговара на бројот на рангирани вредности. На најниската вредност и се доделува ранг еднаков на 1. На пример, ако n=7, тогаш највисоката вредност ќе добие ранг број 7, освен за случаите предвидени со второто правило.

    2. Ако неколку вредности се еднакви, тогаш им се доделува ранг, што е просек од оние рангови што би ги добиле доколку не биле еднакви. Како пример, земете го растечкиот примерок кој се состои од 7 елементи: 22, 23, 25, 25, 25, 28, 30. Вредностите 22 и 23 се појавуваат еднаш, така што нивните рангови се соодветно еднакви на R22=1 и R23 =2. Вредноста 25 се јавува 3 пати. Ако овие вредности не се повторат, тогаш нивните рангови би биле еднакви на 3, 4, 5. Затоа, нивниот ранг R25 е еднаков на аритметичката средина од 3, 4 и 5: . Вредностите 28 и 30 не се повторуваат, така што нивните рангови се соодветно R28=6 и R30=7. Конечно, ја имаме следната кореспонденција:

    3. Вкупниот износ на рангови мора да одговара на пресметаниот, кој се одредува со формулата:

    каде n е вкупниот број на рангирани вредности.

    Несовпаѓањето помеѓу вистинските и пресметаните износи на рангови ќе укаже на грешка во пресметката на ранговите или нивното собирање. Во овој случај, треба да ја пронајдете и поправите грешката.

    Коефициентот на корелација на рангот на Спирман е метод кој ви овозможува да ја одредите силата и насоката на односот помеѓу две карактеристики или две хиерархии на карактеристики. Употребата на коефициентот на корелација на ранг има голем број ограничувања:

    • а) Очекуваната корелација треба да биде монотона.
    • б) Волуменот на секој од примероците мора да биде поголем или еднаков на 5. За да се одреди горната граница на примерокот, се користат табели со критични вредности (Табела 3 од Додатокот). Максималната вредност на n во табелата е 40.
    • в) Во текот на анализата, веројатно е дека ќе се појават голем број идентични рангови. Во овој случај, треба да се направи измена. Најповолен случај е кога двата проучувани примероци претставуваат две низи на неусогласени вредности.

    За да се спроведе анализа на корелација, истражувачот мора да има два примерока што може да се рангираат, на пример:

    • - два знака измерени во иста група субјекти;
    • - две индивидуални хиерархии на особини идентификувани во два субјекти за ист сет на особини;
    • - две групни хиерархии на атрибути;
    • - индивидуална и групна хиерархија на карактеристики.

    Пресметката ја започнуваме со рангирање на проучуваните индикатори посебно за секој од знаците.

    Дозволете ни да анализираме случај со две карактеристики измерени во иста група субјекти. Прво, поединечните вредности се рангирани според првата карактеристика добиена од различни субјекти, а потоа поединечните вредности според втората карактеристика. Ако пониските рангови на еден индикатор одговараат на пониските рангови на друг индикатор, а повисоките рангови на еден индикатор одговараат на повисоките рангови на друг индикатор, тогаш двете карактеристики се позитивно поврзани. Ако повисоките рангови на еден индикатор одговараат на пониските рангови на друг индикатор, тогаш двата знака се негативно поврзани. За да најдеме rs, ги одредуваме разликите помеѓу ранговите (г) за секој предмет. Колку е помала разликата помеѓу ранговите, толку е поблизок коефициентот на корелација rs до „+1“. Ако нема врска, тогаш нема да има кореспонденција меѓу нив, па оттука rs ќе биде блиску до нула. Колку е поголема разликата помеѓу рангот на субјектите во две променливи, толку поблиску до „-1“ ќе биде вредноста на коефициентот rs. Така, коефициентот на корелација на ранг Спирман е мерка за која било монотона врска помеѓу двете карактеристики што се испитуваат.

    Размислете за случајот со две поединечни хиерархии на карактеристики идентификувани во два субјекти за ист сет на карактеристики. Во оваа ситуација, се рангираат поединечните вредности добиени од секој од двата субјекти според одреден сет на карактеристики. На карактеристиката со најниска вредност треба да му се додели првиот ранг; атрибутот со поголема вредност - втор ранг и сл. Треба да се внимава да се осигура дека сите атрибути се мерат во исти единици. На пример, невозможно е да се рангираат индикаторите ако тие се изразени во точки со различна „цена“, бидејќи е невозможно да се одреди кој од факторите ќе го заземе првото место во однос на сериозноста додека сите вредности не се доведат до една единствена скала. Ако карактеристиките кои имаат ниски рангови кај еден од предметите имаат и ниски рангови кај другиот и обратно, тогаш поединечните хиерархии се позитивно поврзани.

    Во случај на две групни хиерархии на карактеристики, просечните групни вредности добиени во две групи субјекти се рангираат според истиот сет на карактеристики за проучуваните групи. Следно, го следиме алгоритмот даден во претходните случаи.

    Да го анализираме случајот со индивидуална и групна хиерархија на карактеристики. Тие започнуваат со рангирање одделно на поединечните вредности на субјектот и на средните групни вредности според истиот сет на особини што се добиени, со исклучок на субјектот кој не учествува во средната групна хиерархија, бидејќи неговиот поединец хиерархијата ќе се спореди со неа. Ранг корелацијата овозможува да се процени степенот на конзистентност помеѓу индивидуалната и групната хиерархија на карактеристики.

    Да разгледаме како се одредува значајноста на коефициентот на корелација во случаите наведени погоре. Во случај на две карактеристики, тоа ќе се определи според големината на примерокот. Во случај на две индивидуални хиерархии на карактеристики, значењето зависи од бројот на карактеристики вклучени во хиерархијата. Во последните два случаи, значајноста се определува според бројот на проучуваните особини, а не според големината на групите. Така, значењето на rs во сите случаи се определува со бројот на рангирани вредности n.

    При тестирање на статистичката значајност на rs, се користат табели со критични вредности на коефициентот на корелација на ранг, составени за различен број на рангирани вредности и различни нивоа на значајност. Ако апсолутната вредност на rs достигне критична вредност или ја надмине, тогаш корелацијата е значајна.

    Кога се разгледува првата опција (случај со две карактеристики измерени во иста група субјекти), можни се следните хипотези.

    H0: Корелацијата помеѓу променливите x и y не се разликува од нула.

    H1: Корелацијата помеѓу променливите x и y е значително различна од нула.

    Ако работиме со некој од трите преостанати случаи, тогаш треба да поставиме уште еден пар хипотези:

    H0: Корелацијата помеѓу x и y хиерархиите е ненула.

    H1: Корелацијата помеѓу x и y хиерархиите е значително различна од нула.

    Редоследот на дејства при пресметувањето на коефициентот на корелација на ранг на Спирман rs е како што следува.

    • - Определете кои две карактеристики или две хиерархии на карактеристики ќе учествуваат во совпаѓањето како x и y променливи.
    • - Рангирајте ги вредностите на променливата x, со доделување на ранг 1 на најмалата вредност, според правилата за рангирање. Ставете ги ранговите во првата колона од табелата по редослед на броевите на предметите или знаците.
    • - Рангирајте ги вредностите на променливата y. Ставете ги ранговите во втората колона од табелата по редослед на броевите на предметите или знаците.
    • - Пресметај ги разликите d помеѓу ранговите x и y за секој ред од табелата. Резултатите се ставени во следната колона од табелата.
    • - Пресметај ги квадратните разлики (d2). Ставете ги добиените вредности во четвртата колона од табелата.
    • - Пресметај го збирот на квадратите на разликите? d2.
    • - Ако се појават истите рангови, пресметајте ги корекциите:

    каде што tx е волуменот на секоја група од еднакви рангови во примерокот x;

    ty е големината на секоја група од еднакви рангови во примерокот y.

    Пресметајте го коефициентот на корелација на ранг во зависност од присуството или отсуството на идентични рангови. Во отсуство на идентични рангови, коефициентот на корелација rs се пресметува со формулата:

    Во присуство на исти рангови, коефициентот на корелација rs се пресметува со формулата:

    каде?d2 е збирот на квадратните разлики помеѓу ранговите;

    Tx и Ty - корекции за истите рангови;

    n е бројот на предмети или карактеристики кои учествувале во рангирањето.

    Одредете ги критичните вредности на rs од табелата 3 од Додатокот, за даден број на предмети n. Ќе се забележи значајна разлика од нула на коефициентот на корелација под услов rs да не е помала од критичната вредност.

    е квантитативна проценка на статистичкото проучување на односот помеѓу појавите, што се користи во непараметриските методи.

    Индикаторот покажува како набљудуваниот збир на квадратни разлики помеѓу рангот се разликува од случајот без врска.

    Доделување услуга. Со овој онлајн калкулатор, можете:

    • пресметка на коефициентот на корелација на ранг Спирман;
    • пресметка на интервалот на доверба за коефициентот и оценка на неговата значајност;

    Спирмановиот коефициент на корелација на рангсе однесува на показателите за оценка на блискоста на комуникацијата. Квалитативна карактеристика на затегнатоста на односот на коефициентот на корелација на ранг, како и другите коефициенти на корелација, може да се процени со помош на скалата на Чадок.

    Пресметка на коефициентсе состои од следните чекори:

    Својства на коефициентот на корелација на ранг на Спирман

    Областа на апликација. Коефициент на корелација на рангсе користи за оценување на квалитетот на комуникацијата помеѓу две групи. Дополнително, неговата статистичка значајност се користи при анализа на податоците за хетероскедастичност.

    Пример. На примерок на податоци од набљудуваните променливи X и Y:

    1. направи табела за рангирање;
    2. најдете го коефициентот на корелација на ранг на Спирман и тестирајте го неговото значење на ниво 2а
    3. проценете ја природата на зависноста
    Решение. Доделете рангови на карактеристиката Y и факторот X.
    XYранг X, dxранг Y, d y
    28 21 1 1
    30 25 2 2
    36 29 4 3
    40 31 5 4
    30 32 3 5
    46 34 6 6
    56 35 8 7
    54 38 7 8
    60 39 10 9
    56 41 9 10
    60 42 11 11
    68 44 12 12
    70 46 13 13
    76 50 14 14

    Матрица за рангирање.
    ранг X, dxранг Y, d y(dx - dy) 2
    1 1 0
    2 2 0
    4 3 1
    5 4 1
    3 5 4
    6 6 0
    8 7 1
    7 8 1
    10 9 1
    9 10 1
    11 11 0
    12 12 0
    13 13 0
    14 14 0
    105 105 10

    Проверка на исправноста на компилацијата на матрицата врз основа на пресметката на контролната сума:

    Збирот над колоните на матрицата се еднакви една на друга и контролната сума, што значи дека матрицата е правилно составена.
    Користејќи ја формулата, го пресметуваме коефициентот на корелација на ранг на Спирман.


    Врската помеѓу карактеристиката Y и факторот X е силна и директна
    Значење на коефициентот на корелација на рангот на Спирман
    Со цел да се тестира нултата хипотеза на ниво на значајност α дека општиот коефициент на корелација за ранг на Спирман е еднаков на нула според конкурентната хипотеза H i. p ≠ 0, потребно е да се пресмета критичната точка:

    каде n е големината на примерокот; ρ е коефициент на корелација за ранг на примерокот на Спирман: t(α, k) е критичната точка на двостраниот критичен регион, што се наоѓа од табелата со критични точки на распределбата на Студентот, според нивото на значајност α и бројот на степени на слобода k = n-2.
    Ако |p|< Т kp - нет оснований отвергнуть нулевую гипотезу. Ранговая корреляционная связь между качественными признаками не значима. Если |p| >T kp - нултата хипотеза е отфрлена. Постои значајна рангирана корелација помеѓу квалитативните карактеристики.
    Според табелата на Студент наоѓаме t(α/2, k) = (0,1/2;12) = 1,782

    Бидејќи Т кп< ρ , то отклоняем гипотезу о равенстве 0 коэффициента ранговой корреляции Спирмена. Другими словами, коэффициент ранговой корреляции статистически - значим и ранговая корреляционная связь между оценками по двум тестам значимая.

    Овој калкулатор подолу го пресметува Спирмановиот коефициент на корелација помеѓу две случајни променливи.Теоретскиот дел е традиционален под калкулаторот.

    додадете увоз извоз mode_edit избриши

    Промени на случајни променливи

    стрелка_нагорестрелка_надолу стрелка_нагорестрелка_надолу
    Ставки по страница: 5 10 20 50 100 chevron_left chevron_right

    Промени на случајни променливи

    Увезете податоци Грешка во увозот

    „Еден од следниве знаци се користи за одвојување на полињата со податоци: таб, точка-запирка (;) или запирка(,)“ Примерок: -50,5;-50,5

    Откажи назад увоз

    Цифри по децималната точка: 4

    Пресметај

    Спирманов коефициент на корелација

    Зачувај споделување продолжување

    Методот за пресметување на коефициентот на корелација на рангот на Спирман е всушност прилично едноставен.Тој е како Пирсоновиот коефициент на корелација, но дизајниран не само за мерења на случајни променливи, туку и за нивните рангирање вредности.

    Останува само да разбереме која е вредноста на рангирањето и зошто сето тоа е неопходно.

    Ако елементите на варијациската серија се подредени во растечки или опаѓачки редослед, тоа рангна елементот ќе биде неговиот број во подредени серии.

    На пример, имаме варијациска серија (17,26,5,14,21). Нека „да ги сортираме“ елементите по опаѓачки редослед (26,21,17,14,5). 26 има ранг од 1, 21 - ранг од 2 и така натаму, варијациската серија на вредности за рангирање ќе изгледа вака (3,1,5,4,2).

    т.е. при пресметување на првичните варијации на коефициентот на Спирман се претвораат во варијациони серии на вредности за рангирање и потоа на нив се применува Пирсоновата формула.
    .
    Постои една суптилност - рангирањето на вредностите што се повторуваат се зема како просек од ранговите. Односно, за серија (17, 15, 14, 15) сериите за рангирање ќе изгледаат како (1, 2,5, 4, 2,5), бидејќи првиот елемент е 15 има ранг од 2, а вториот - ранг од 3, и.

    Ако ги немате вредностите што се повторуваат, односно сите вредности на сериите за рангирање - броевите помеѓу 1 и n, формулата на Пирсон може да се поедностави на

    Патем, оваа формула често се дава како формула за пресметување на коефициентот на Спирман.

    Која е суштината на преминот од самите вредности кон нивната рангирана вредност?
    Кога ја истражувате корелацијата на вредностите за рангирање, можете да откриете колку добро е опишана зависноста на двете променливи со монотона функција.

    Знакот на коефициентот ја означува насоката на односот помеѓу променливите. Ако знакот е позитивен, вредностите на Y имаат тенденција да се зголемуваат со зголемувањето на X. Ако знакот е негативен, вредностите на Y имаат тенденција да се намалуваат со зголемувањето на X. Ако коефициентот е 0 таму тогаш нема тенденција. Ако коефициентот е еднаков на 1 или -1, односот помеѓу X и Y има појава на монотона функција, т.е. со зголемување на X се зголемува и Y и обратно.

    Односно, за разлика од Пирсоновиот коефициент на корелација, кој може да открие само линеарна врска на една променлива од друга, Спирмановиот коефициент на корелација може да открие монотона зависност, каде што директната линеарна врска не може да се открие.

    Еве еден пример.
    Да објаснам со пример. Да претпоставиме дека ја испитавме функцијата y=10/x.
    Ги имаме следните мерења на X и Y
    {{1,10}, {5,2}, {10,1}, {20,0.5}, {100,0.1}}
    За овие податоци, коефициентот на корелација на Пирсон е еднаков на -0,4686, т.е. врската е слаба или отсутна. И коефициентот на корелација на Спирман е строго еднаков на -1, како да му навестува на истражувачот дека Y има силно негативна монотона зависност од X.

    Коефициентот на корелација на ранг, предложен од К. Спирман, се однесува на непараметриски показатели за односот помеѓу променливите измерени на скала за рангирање. При пресметувањето на овој коефициент, не се потребни никакви претпоставки за природата на распределбата на карактеристиките кај општата популација. Овој коефициент го одредува степенот на затегнатост на поврзувањето на редните обележја, кои во овој случај ги претставуваат рангот на споредените вредности.

    Вредноста на Спирмановиот коефициент на корелација исто така лежи во опсегот +1 и -1. Тој, како и коефициентот Пирсон, може да биде позитивен и негативен, карактеризирајќи ја насоката на односот помеѓу две карактеристики измерени во скалата на рангирање.

    Во принцип, бројот на рангирани карактеристики (квалитети, особини, итн.) може да биде кој било, но процесот на рангирање на повеќе од 20 карактеристики е тежок. Можно е затоа табелата на критичните вредности на коефициентот на корелација на ранг се пресметува само за четириесет рангирани карактеристики (n< 40, табл. 20 приложения 6).

    Коефициентот на корелација на ранг на Спирман се пресметува со формулата:

    каде n е бројот на рангирани карактеристики (показатели, предмети);

    D е разликата помеѓу ранговите во две променливи за секој предмет;

    Збир на квадратни ранг-разлики.

    Користејќи го коефициентот на корелација на ранг, разгледајте го следниов пример.

    Пример: Психологот дознава како се меѓусебно поврзани индивидуалните показатели за подготвеност за училиште добиени пред почетокот на наставата за 11 првачиња и нивниот просечен успех на крајот на учебната година.

    За да го решиме овој проблем, прво ги рангиравме вредностите на индикаторите за училишна подготвеност добиени при влегувањето во училиште и, второ, конечните показатели за успешност на крајот на годината за истите овие ученици во просек. Резултатите се претставени во Табела. 13.

    Табела 13

    број на студенти

    Рангови на индикатори за училишна подготвеност

    Рангови на просечни годишни перформанси

    Добиените податоци ги заменуваме во формулата и ја вршиме пресметката. Добиваме:

    За да го пронајдеме нивото на значајност, се свртуваме кон Табела. 20 од Додаток 6, кој ги дава критичните вредности за коефициентите на корелација на ранг.

    Тоа го нагласуваме во Табела. 20 Додаток 6, како и во табелата за Пирсоновата линеарна корелација, сите вредности на коефициентите на корелација се дадени во апсолутна вредност. Затоа, знакот на коефициентот на корелација се зема предвид само при неговото толкување.

    Наоѓањето на нивоата на значајност во оваа табела се врши според бројот n, т.е. според бројот на предмети. Во нашиот случај, n = 11. За овој број наоѓаме:

    0,61 за P 0,05

    0,76 за P 0,01

    Ја градиме соодветната „оска на значење““:

    Добиениот коефициент на корелација се совпадна со критичната вредност за ниво на значајност од 1%. Затоа, може да се тврди дека показателите за училишна подготвеност и конечните оценки на првачињата се во позитивна корелација - со други зборови, колку е повисок индикаторот за подготвеност за училиште, толку подобро учи првачето. Во однос на статистичките хипотези, психологот мора да ја отфрли нултата хипотеза за сличност и да ја прифати алтернативната (Но разликата) хипотеза, која вели дека односот помеѓу училишната подготвеност и просечниот успех не е нула.

    Случај на идентични (еднакви) рангови

    Во присуство на исти рангови, формулата за пресметување на коефициентот на линеарна корелација на Спирман ќе биде малку поинаква. Во овој случај, во формулата за пресметување на коефициентите на корелација се додаваат два нови члена, земајќи ги предвид истите рангови. Тие се нарекуваат корекции за истите рангови и се додаваат на броителот на формулата за пресметка.

    каде n е бројот на идентични рангови во првата колона,

    k е бројот на идентични рангови во втората колона.

    Ако има две групи на идентични рангови во која било колона, тогаш формулата за корекција станува нешто покомплицирана:

    каде што n е бројот на еднакви рангови во првата група од рангираната колона,

    k е бројот на еднакви рангови во втората група од рангираната колона. Измената на формулата во општиот случај е како што следува:

    Пример: Психолог, користејќи тест за ментален развој (ISTUR), спроведува студија за интелигенција кај 12 ученици во 9 одделение. Во исто време, тој бара од наставниците по литература и математика да ги рангираат истите овие ученици според индикаторите за ментален развој. Задачата е да се утврди како се поврзани објективните показатели за менталниот развој (податоци за СПИ) и стручните проценки на наставниците.

    Експерименталните податоци за овој проблем и дополнителните колони потребни за пресметување на коефициентот на корелација на Спирман се претставени во форма на табела. Четиринаесет.

    Табела 14

    број на студенти

    Рангови на тестирање со помош на SHTUR

    Стручни оценки на наставниците по математика

    Стручни оценки на наставниците по литература

    D (втора и трета колона)

    D (втора и четврта колона)

    (втора и трета колона)

    (втора и четврта колона)

    Бидејќи рангирањето ги користело истите рангирања, неопходно е да се провери точноста на рангирањето во втората, третата и четвртата колона од табелата. Збирот во секоја од овие колони ја дава истата сума - 78.

    Проверуваме според формулата за пресметка. Проверката дава:

    Петтата и шестата колона од табелата ги прикажуваат вредностите на разликата во рангот помеѓу стручните проценки на психологот на STUD тестот за секој ученик и вредностите на стручните проценки на наставниците, соодветно, по математика и литература . Збирот на разликите во рангирањето мора да биде еднаков на нула. Збирот на вредностите D во петтата и шестата колона го даде посакуваниот резултат. Затоа, одземањето на чиновите беше извршено правилно. Слична проверка мора да се прави секој пат кога се вршат сложени типови на рангирање.

    Пред да започнете со пресметката со формулата, потребно е да се пресметаат корекциите за истите рангирања за втората, третата и четвртата колона од табелата.

    Во нашиот случај, во втората колона од табелата има два идентични рангирања, затоа, според формулата, вредноста за корекција D1 ќе биде:

    Во третата колона има три идентични рангови, затоа, според формулата, вредноста на корекцијата D2 ќе биде:

    Во четвртата колона од табелата, постојат две групи од три идентични рангови, затоа, според формулата, вредноста на корекцијата D3 ќе биде:

    Пред да продолжиме да го решаваме проблемот, да потсетиме дека психологот открива две прашања - како се поврзани вредностите на ранговите на тестот STUR со стручни проценки во математиката и литературата. Затоа пресметката се врши двапати.

    Го разгледуваме коефициентот на првиот ранг, земајќи ги предвид адитивите според формулата. Добиваме:

    Ајде да пресметаме без да го земеме предвид адитивот:

    Како што можете да видите, разликата во вредностите на коефициентите на корелација се покажа како многу незначителна.

    Го разгледуваме коефициентот на втор ранг, земајќи ги предвид адитивите според формулата. Добиваме:

    Ајде да пресметаме без да го земеме предвид адитивот:

    Повторно, разликите беа многу мали. Бидејќи бројот на ученици и во двата случаи е ист, според Табела. 20 Додаток 6 ги наоѓаме критичните вредности на n = 12 за двата коефициенти на корелација одеднаш.

    0,58 за P 0,05

    0,73 за P 0,01

    Нацртајте ја првата вредност на ``оската на значајноста““:

    Во првиот случај, добиениот коефициент на корелација на ранг е во зоната на значајност. Затоа, психологот мора да ја отфрли нултата хипотеза дека коефициентот на корелација е сличен на нула и да ја прифати алтернативната хипотеза дека коефициентот на корелација е значително различен од нула. Со други зборови, добиениот резултат сугерира дека колку се повисоки стручните резултати на учениците на STUD тестот, толку се повисоки нивните стручни резултати по математика.

    Исцртај ја втората вредност на ``оската на значајноста““:

    Во вториот случај, коефициентот на корелација на ранг е во зоната на неизвесност. Затоа, психологот може да ја прифати нултата хипотеза дека коефициентот на корелација е сличен на нула и да ја отфрли алтернативната хипотеза дека коефициентот на корелација е значително различен од нула. Во овој случај, добиениот резултат покажува дека стручните проценки на студентите на STUD тестот не се поврзани со стручните проценки во литературата.

    За да се примени Спирмановиот коефициент на корелација, мора да се исполнат следниве услови:

    1. Променливите што се споредуваат мора да се добијат на редна скала (ранг), но може да се мерат и на скала на интервали и соодноси.

    2. Природата на распределбата на корелираните вредности не е важна.

    3. Бројот на различни карактеристики во споредените променливи X и Y мора да биде ист.

    Табелите за одредување на критичните вредности на коефициентот на корелација Спирман (Табела 20, Додаток 6) се пресметуваат од бројот на знаци еднаков на n = 5 до n = 40, а со поголем број на споредени променливи, табелата за Треба да се користи коефициентот на корелација на Пирсон (Табела 19, Додаток 6). Критичните вредности се наоѓаат за k = n.