Спирман анализа на корелација, практично тргување со примери. Пример за наоѓање на коефициентот на корелација на ранг Спирман

е квантитативна проценка на статистичкото проучување на врската помеѓу појавите, што се користи во непараметриските методи.

Индикаторот покажува како збирот на квадратните разлики помеѓу ранговите добиени за време на набљудувањето се разликува од случајот без врска.

Цел на услугата. Користејќи го овој онлајн калкулатор можете:

пресметка на коефициентот на корелација на ранг Спирман;
пресметување на интервалот на доверба за коефициентот и проценка на неговата значајност;

Спирмановиот коефициент на корелација на рангсе однесува на индикатори за проценка на блискоста на комуникацијата. Квалитативната карактеристика на блискоста на поврзаноста на коефициентот на корелација на ранг, како и другите коефициенти на корелација, може да се процени со помош на скалата на Чадок.

Пресметка на коефициентсе состои од следните чекори:

Својства на коефициентот на корелација на ранг на Спирман

Областа на апликација. Коефициент на корелација на рангсе користи за проценка на квалитетот на комуникацијата помеѓу две популации. Дополнително, неговата статистичка значајност се користи при анализа на податоците за хетероскедастичност.

Пример. Врз основа на примерок од набљудуваните променливи X и Y:

креирајте табела за рангирање;
најдете го коефициентот на корелација на ранг на Спирман и проверете го неговото значење на ниво 2а
проценете ја природата на зависноста

Решение. Ајде да доделиме рангови на карактеристиките Y и факторот X.

X	Y	ранг X, d x	ранг Y, d y
28	21	1	1
30	25	2	2
36	29	4	3
40	31	5	4
30	32	3	5
46	34	6	6
56	35	8	7
54	38	7	8
60	39	10	9
56	41	9	10
60	42	11	11
68	44	12	12
70	46	13	13
76	50	14	14

Матрица за рангирање.

ранг X, d x	ранг Y, d y	(d x - d y) 2
1	1	0
2	2	0
4	3	1
5	4	1
3	5	4
6	6	0
8	7	1
7	8	1
10	9	1
9	10	1
11	11	0
12	12	0
13	13	0
14	14	0
105	105	10

Проверка на исправноста на матрицата врз основа на пресметката на контролната сума:

Збирот на колоните на матрицата е еднаков еден на друг и контролната сума, што значи дека матрицата е правилно составена.
Користејќи ја формулата, го пресметуваме коефициентот на корелација на ранг на Спирман.

Врската помеѓу карактеристиката Y и факторот X е силна и директна
Значење на коефициентот на корелација на рангот на Спирман
Со цел да се тестира нултата хипотеза на ниво на значајност α дека општиот коефициент на корелација за ранг на Спирман е еднаков на нула според конкурентната хипотеза Hi. p ≠ 0, треба да ја пресметаме критичната точка:

каде n е големината на примерокот; ρ е примерок коефициент на корелација на ранг на Спирман: t(α, k) е критична точка на двостраниот критичен регион, што се наоѓа од табелата на критични точки на Студентската распределба, според нивото на значајност α и бројот на степени на слобода k = n-2.
Ако |p|< Т kp - нет оснований отвергнуть нулевую гипотезу. Ранговая корреляционная связь между качественными признаками не значима. Если |p| >T kp - нултата хипотеза е отфрлена. Постои значајна рангирана корелација помеѓу квалитативните карактеристики.
Користејќи ја табелата на Студентот наоѓаме t(α/2, k) = (0,1/2;12) = 1,782

Бидејќи Т кп< ρ , то отклоняем гипотезу о равенстве 0 коэффициента ранговой корреляции Спирмена. Другими словами, коэффициент ранговой корреляции статистически - значим и ранговая корреляционная связь между оценками по двум тестам значимая.

37. Спирмановиот коефициент на корелација на ранг.

S. 56 (64) 063.JPG

http://psystat.at.ua/publ/1-1-0-33

Спирмановиот коефициент на корелација на ранг се користи во случаи кога:
- променливите имаат скала за рангирањемерења;
- дистрибуцијата на податоците е премногу различна од нормалноили воопшто не е познато;
- примероците имаат мал волумен (Н< 30).

Толкувањето на коефициентот на корелација на ранг Спирман не се разликува од коефициентот Пирсон, но неговото значење е малку поинакво. За да ја разбереме разликата помеѓу овие методи и логично да ги оправдаме нивните области на примена, ајде да ги споредиме нивните формули.

Пирсон коефициент на корелација:

Спирман коефициент на корелација:

Како што можете да видите, формулите значително се разликуваат. Ајде да ги споредиме формулите

Формулата за корелација Пирсон ги користи аритметичката средина и стандардното отстапување на корелираните серии, но формулата Спирман не ги користи. Така, за да се добие соодветен резултат користејќи ја формулата Пирсон, неопходно е корелираните серии да бидат блиску до нормалната дистрибуција (средната вредност и стандардното отстапување се параметри за нормална дистрибуција). Ова не е релевантно за формулата Спирман.

Елемент на формулата Пирсон е стандардизацијата на секоја серија во z-скала.

Како што можете да видите, конверзијата на променливите во скалата Z е присутна во формулата за коефициентот на корелација Пирсон. Според тоа, за коефициентот Пирсон, скалата на податоците воопшто не е важна: на пример, можеме да корелираме две променливи, од кои едната има мин. = 0 и макс. = 1, а вториот мин. = 100 и макс. = 1000. Без разлика колку е различен опсегот на вредности, сите тие ќе бидат претворени во стандардни z-вредности кои се исти по размер.

Според тоа, таквата нормализација не се случува во коефициентот Спирман

ЗАДОЛЖИТЕЛЕН УСЛОВ ЗА КОРИСТЕЊЕ НА КОЕФИЦИЕНТОТ НА СПЕРМАН Е ЕДНАКВОСТ НА ОПЕГАТА НА ДВЕТЕ ПРОМЕНЛИВИ.

Пред да се користи коефициентот Spearman за серии на податоци со различни опсези, потребно е да ранг. Рангирањето резултира со тоа што вредностите на овие серии го добиваат истиот минимум = 1 (минимален ранг) и максимум еднаков на бројот на вредности (максимум, последен ранг = N, т.е. максимален број случаи во примерокот) .

Во кои случаи можете да направите без рангирање?

Тоа се случаи кога податоците се првично скала за рангирање. На пример, тестот на Rokeach за вредносни ориентации.

Исто така, тоа се случаи кога бројот на опции за вредност е мал, а примерокот содржи фиксен минимум и максимум. На пример, во семантички диференцијал, минимум = 1, максимум = 7.

Пример за пресметување на коефициентот на корелација на ранг на Спирман

Тестот на Rokeach за вредносните ориентации беше спроведен на два примероци X и Y. Цел: да се открие колку се блиски хиерархиите на вредностите на овие примероци (буквално, колку се слични).

Добиената вредност r=0,747 се проверува со табела на критични вредности. Според табелата, со N=18, добиената вредност е значајна на ниво p<=0,005

Спирман и Кендал ги рангираат коефициентите на корелација

За променливи кои припаѓаат на редна скала или за променливи кои не подлежат на нормална дистрибуција, како и за променливи кои припаѓаат на скала на интервал, наместо Пирсонов коефициент се пресметува корелацијата за ранг на Спирман. За да го направите ова, на поединечните вредности на променливи им се доделуваат рангови, кои последователно се обработуваат користејќи соодветни формули. За да откриете корелација на ранг, избришете ја стандардната корелација на Пирсон во полето за дијалог Биваријатни корелации.... Наместо тоа, активирајте ја пресметката за корелација на Спирман. Оваа пресметка ќе ги даде следните резултати. Коефициентите на корелација на ранг се многу блиску до соодветните вредности на Пирсоновите коефициенти (оригиналните променливи имаат нормална дистрибуција).

titkova-matmetody.pdf стр. 45

Методот на корелација на ранг на Спирман ви овозможува да ја одредите затегнатоста (јачината) и насоката

корелација помеѓу два знакаили два профили (хиерархии)знаци.

За да се пресмета корелацијата на ранг, неопходно е да има два реда вредности,

кои можат да се рангираат. Таквата серија на вредности може да биде:

1) два знакасе мери во истиот групапредмети;

2) две индивидуални хиерархии на карактеристики,идентификувани во два субјекти користејќи го истото

збир на карактеристики;

3) два групни хиерархии на карактеристики,

4) индивидуална и групнахиерархија на карактеристики.

Прво, индикаторите се рангирани посебно за секоја од карактеристиките.

Како по правило, понизок ранг се доделува на пониска вредност на атрибутот.

Во првиот случај (две карактеристики), поединечните вредности се рангираат според првата

карактеристика добиена од различни субјекти, а потоа поединечни вредности за втората

знак.

Ако две карактеристики се позитивно поврзани, тогаш субјектите со ниски рангови

едниот од нив ќе има ниски рангови во другиот, а субјектите кои имаат високи рангови во

една од карактеристиките ќе има и високи рангови за другата карактеристика. Да се пресмета рс

треба да се утврдат разликите (г)меѓу чиновите што ги добива даден предмет и во двете

знаци. Тогаш овие показатели d се трансформираат на одреден начин и се одземаат од 1. Отколку

Колку е помала разликата помеѓу ранговите, толку ќе биде поголемо rs, толку поблиску ќе биде до +1.

Ако нема корелација, тогаш сите редови ќе бидат измешани и нема да има

нема кореспонденција. Формулата е дизајнирана така што во овој случај rs ќе биде блиску до 0.

Во случај на негативна корелацијаниски рангови на предмети по една основа

ќе одговараат високи чинови на друга основа, и обратно. Колку е поголема несовпаѓањето

помеѓу рангот на предмети на две променливи, поблиску rs е до -1.

Во вториот случај (два индивидуални профили), се рангираат поединечните

вредностите добиени од секој од 2-те субјекти според одредено (исто за нив

двете) збир на карактеристики. Првиот ранг ќе го добие карактеристиката со најниска вредност; втор ранг -

знак со поголема вредност и сл. Очигледно, сите карактеристики мора да се мерат во

истите единици, инаку рангирањето е невозможно. На пример, тоа е невозможно

рангирајте ги индикаторите на Cattell Personality Inventory (16PF), доколку тие се изразени во

„Сурови“ точки, бидејќи опсезите на вредности се различни за различни фактори: од 0 до 13, од 0 до

20 и од 0 до 26. Не можеме да кажеме кој фактор ќе го заземе првото место

изразување додека не ги донесеме сите вредности на една скала (најчесто ова е скалата на ѕидот).

Ако поединечните хиерархии на два субјекти се позитивно поврзани, тогаш знаците

имајќи ниски рангови во еден од нив ќе има ниски рангови во другиот, и обратно.

На пример, ако факторот Е (доминација) на еден субјект има најнизок ранг, тогаш

друг предмет за тестирање, треба да има низок ранг ако еден од испитаниците има фактор Ц

(емоционална стабилност) има највисок ранг, тогаш мора да има и другиот субјект

овој фактор има висок ранг, итн.

Во третиот случај (два групни профили), се рангираат просечните вредности на групата,

добиени во 2 групи на предмети според специфичен сет, идентични за двете групи

знаци. Во продолжение, линијата на размислување е иста како и во претходните два случаи.

Во случајот 4 (индивидуални и групни профили) тие се рангираат посебно

индивидуални вредности на предметот и групни просечни вредности за истиот сет

знаци кои се добиваат, по правило, со исклучување на овој поединечен субјект - тој

не учествува во просечниот групен профил со кој ќе се споредува неговиот индивидуален профил

профил. Корелацијата на ранг ќе ви овозможи да проверите колку е конзистентна поединецот и

групни профили.

Во сите четири случаи, се одредува значајноста на добиениот коефициент на корелација

по бројот на рангирани вредности Н.Во првиот случај, оваа количина ќе се совпадне со

големина на примерокот n. Во вториот случај, бројот на набљудувања ќе биде бројот на карактеристики,

составувајќи ја хиерархијата. Во третиот и четвртиот случај, N е и бројот на споредени

карактеристики, а не бројот на предмети во групи. Детални објаснувања се дадени во примерите. Ако

апсолутната вредност на rs достигнува или надминува критична вредност, корелација

сигурен.

Хипотези.

Постојат две можни хипотези. Првиот се однесува на случајот 1, вториот за другите три

Првата верзија на хипотезите

H0: Корелацијата помеѓу променливите A и B не се разликува од нула.

H2: Корелацијата помеѓу променливите A и B е значително различна од нула.

Втора верзија на хипотези

H0: Корелацијата помеѓу хиерархиите А и Б не се разликува од нула.

H2: Корелацијата помеѓу хиерархиите А и Б е значително различна од нула.

Ограничувања на коефициентот на корелација на ранг

1. За секоја променлива, мора да се прикажат најмалку 5 набљудувања. Горна

границата на земање примероци се одредува со достапните табели на критичните вредности .

2. Спирмановиот коефициент на корелација rs за голем број идентични

рангирањето за една или за двете споредени променливи дава груби вредности. Идеално

и двете корелирани серии мора да претставуваат две секвенци на дивергентни

вредности. Доколку овој услов не е исполнет, мора да се направи измена на

исти рангови.

Коефициентот на корелација на рангот на Спирман се пресметува со формулата:

Ако и двете споредени серии за рангирање содржат групи од исти рангови,

пред да се пресмета коефициентот на корелација на ранг, потребно е да се направат корекции за истиот

Та и ТВ рангови:

Ta = Σ (a3 – a)/12,

Тв = Σ (в3 – в)/12,

Каде А -обемот на секоја група на идентични рангови во ранг серија А, во – волумен на секоја од нив

групи од идентични рангови во серијата рангови Б.

За да ја пресметате емпириската вредност на rs, користете ја формулата:

38. Точка-бисериски коефициент на корелација.

За корелацијата воопшто, видете го прашањето бр. 36Со. 56 (64) 063.JPG

harchenko-korranaliz.pdf

Нека променливата X се мери на силна скала, а променливата Y на дихотомна скала. Точка бисериски коефициент на корелација rpb се пресметува со помош на формулата:

Овде x 1 е просечната вредност над X објекти со вредност „еден“ над Y;

x 0 – просечна вредност над X објекти со вредност „нула“ над Y;

s x - стандардна девијација на сите вредности долж X;

n 1 – број на објекти „еден“ во Y, n 0 – број на објекти „нула“ во Y;

n = n 1 + n 0 – големина на примерокот.

Коефициентот на бисериска корелација може да се пресмета и со други еквивалентни изрази:

Еве x– вкупна просечна вредност за променливата X.

Точка бисериски коефициент на корелација rpbварира од –1 до +1. Неговата вредност е нула ако варијаблите со една Yимаат просек Y, еднаков на просекот на променливите со нула над Y.

Испитување хипотези за значењеточка бисериски коефициент на корелација е да се провери нулта хипотезач 0 за еднаквоста на општиот коефициент на корелација на нула: ρ = 0, што се изведува со помош на Студентскиот t-тест. Емпириско значење

во споредба со критичните вредности т а (дф) за бројот на степени на слобода дф = n– 2

Доколку условот | т| ≤ tα(дф), нултата хипотеза ρ = 0 не се отфрла. Точка бисериски коефициент на корелација значително се разликува од нула ако емпириската вредност | т| паѓа во критичниот регион, односно ако состојбата | т| > tα(n– 2). Веродостојноста на врската пресметана со помош на коефициентот на бисериска корелација rpb, може да се определи и со користење на критериумот χ 2 за бројот на степени на слобода дф= 2.

Точка бисериска корелација

Последователната модификација на коефициентот на корелација на производот на моментите се рефлектираше во бисериската точка р. Оваа статистика. ја покажува врската помеѓу две променливи, од кои едната е наводно континуирана и нормално распределена, а другата е дискретна во строга смисла на зборот. Точка бисериски коефициент на корелација се означува со р pbisОткако во р pbisдихотомијата ја рефлектира вистинската природа на дискретната променлива, а не е вештачка, како во случајот р бис, неговиот знак се одредува произволно. Затоа, за сите практични цели. цели р pbisсметано во опсег од 0,00 до +1,00.

Има и случај кога две променливи се претпоставуваат дека се континуирани и нормално распределени, но и двете се вештачки дихотомизирани, како во случајот со бисериска корелација. За да се процени врската помеѓу таквите променливи, се користи коефициентот на тетрахорична корелација р тет, кој исто така беше одгледуван од Пирсон. Основни (точни) формули и постапки за пресметување р тетдоста сложени. Затоа, со практични Овој метод користи приближување р тет,добиени врз основа на скратени постапки и табели.

/on-line/dictionary/dictionary.php?term=511

БИСЕРИЈАЛЕН КОЕФИЦИЕНТ ТОЧКИе коефициентот на корелација помеѓу две променливи, едната мерена на дихотомна скала, а другата на интервална скала. Се користи во класичното и модерното тестирање како показател за квалитетот на тест задача - доверливост и доследност со севкупниот резултат од тестот.

За да се поврзат променливите измерени во дихотомна и интервална скалаупотреба точка-бисериски коефициент на корелација.
Точка-бисериски коефициент на корелација е метод за анализа на корелација на односот на променливите, од кои едната се мери на скала на имиња и зема само 2 вредности (на пример, мажи/жени, точен одговор/лажен одговор, карактеристика присутен/неприсутен), а вториот на сооднос на скала или скала на интервал. Формула за пресметување на коефициентот на точка-бисериска корелација:

Каде:
m1 и m0 се просечните вредности на X со вредност од 1 или 0 во Y.
σx - стандардна девијација на сите вредности за X
n1,n0 - број на X вредности од 1 или 0 до Y.
n – вкупен број на парови вредности

Најчесто, овој тип на коефициент на корелација се користи за пресметување на односот помеѓу тестните ставки и вкупната скала. Ова е еден вид проверка на валидноста.

39. Ранг-бисериски коефициент на корелација.

За корелацијата воопшто, видете го прашањето бр. 36Со. 56 (64) 063.JPG

harchenko-korranaliz.pdf стр. 28

Коефициент на рангирана бисериска корелација, што се користи во случаи кога една од променливите ( X) се прикажува во редна скала, а другата ( Y) – дихотомна, пресметана со формулата

Еве го просечниот ранг на објекти со еден ин Y; – просечен ранг на предмети со нула до Y, n- големина на примерокот.

Испитување хипотези за значењеКоефициентот на корелација ранг-бисериски се изведува слично како и коефициентот на бисериска корелација со помош на студентскиот тест со замена во формулите рстрна ррб.

Во случаи кога една променлива се мери на дихотомна скала (променлива X),а другиот во скалата на ранг (променлива Y), се користи коефициентот на корелација ранг-бисериски. Се сеќаваме дека променливата X,мерено на дихотомна скала, зема само две вредности (шифри) 0 и 1. Особено нагласуваме: и покрај фактот што овој коефициент варира во опсег од –1 до +1, неговиот знак не е важен за толкувањето на резултати. Ова е уште еден исклучок од општото правило.

Овој коефициент се пресметува со формулата:

каде ` X 1– просечен ранг за тие елементи на променливата Y, што одговара на кодот (знакот) 1 во променливата X;

`X 0 – просечен ранг за тие елементи на променливата Y,што одговара на кодот (знакот) 0 во променливата X\

N -вкупен број на елементи во променливата X.

За да се примени коефициентот на корелација на ранг-бисерија, мора да се исполнат следниве услови:

1. Променливите што се споредуваат мора да се мерат на различни скали: една X -на дихотомна скала; други Y-на скала за рангирање.

2. Број на различни карактеристики во споредените променливи XИ Yтреба да биде ист.

3. За да го процените нивото на веродостојност на коефициентот на корелација на ранг-бисерија, треба да ја користите формулата (11.9) и табелата со критични вредности за студентскиот тест k = n – 2.

http://psystat.at.ua/publ/drugie_vidy_koehfficienta_korreljacii/1-1-0-38

Случаи кога една од променливите е претставена во дихотомна скала, а другиот во ранг (реден), бара апликација ранг-бисериски коефициент на корелација:

rpb=2 / n * (m1 - m0)

Каде:
n – број на мерни објекти
m1 и m0 - просечниот ранг на објекти со 1 или 0 на втората променлива.
Овој коефициент се користи и при проверка на валидноста на тестовите.

40. Коефициент на линеарна корелација.

За корелацијата воопшто (и линеарната корелација особено), видете го прашањето бр. 36Со. 56 (64) 063.JPG

КОЕФИЦИЕНТ НА Г.ПИРСОН

р- Пирсон (Пирсон р) се користи за проучување на врската помеѓу две метричкиразлични променливи измерени на ист примерок.Постојат многу ситуации во кои неговата употреба е соодветна. Дали интелигенцијата влијае на академските перформанси во високите универзитетски години? Дали големината на платата на вработениот е поврзана со неговата љубезност кон колегите? Дали расположението на ученикот влијае на успехот во решавањето на комплексен аритметички проблем? За да одговори на ваквите прашања, истражувачот мора да измери два показатели од интерес за секој член од примерокот. Податоците за проучување на врската потоа се табелирани, како во примерот подолу.

ПРИМЕР 6.1

Во табелата е прикажан пример за првични податоци за мерење на два показатели на интелигенција (вербална и невербална) за 20 ученици од 8-мо одделение.

Врската помеѓу овие променливи може да се прикаже со помош на распрскувач (види Слика 6.3). Дијаграмот покажува дека постои одредена врска помеѓу измерените индикатори: колку е поголема вредноста на вербалната интелигенција, толку (најчесто) толку е поголема вредноста на невербалната интелигенција.

Пред да ја дадеме формулата за коефициентот на корелација, да се обидеме да ја следиме логиката на неговото појавување користејќи ги податоците од примерот 6.1. Позицијата на секоја /-точка (предмет со број /) на дијаграмот на расејување во однос на другите точки (сл. 6.3) може да се специфицира со вредностите и знаците на отстапувања на соодветните променливи вредности од нивните просечни вредности : (xj - МЈ И (ум на ). Ако знаците на овие отстапувања се совпаѓаат, тогаш ова укажува на позитивна врска (поголеми вредности за Xголемите вредности одговараат на наили пониски вредности Xсоодветствуваат помали вредности y).

За предмет бр.1 отстапување од просекот Xи од страна на напозитивни, а за предмет бр. 3 двете отстапувања се негативни. Следствено, податоците од двете укажуваат на позитивна врска помеѓу проучуваните особини. Напротив, ако знаците на отстапувања од просекот Xи од страна на насе разликуваат, тоа ќе укаже на негативна врска помеѓу карактеристиките. Така, за предметот бр.4, отстапувањето од просекот Xе негативен, од y -позитивно, а за предмет бр.9 - обратно.

Така, ако производот на отстапувањата (x,- М X ) X (ум на ) позитивен, тогаш податоците на /-субјектот укажуваат на директна (позитивна) врска, а ако е негативна, тогаш обратна (негативна) врска. Според тоа, ако Xwy yгенерално се поврзани во директна пропорција, тогаш повеќето од производите на отстапувањата ќе бидат позитивни, а ако се поврзани со обратна врска, тогаш повеќето производи ќе бидат негативни. Затоа, општ индикатор за јачината и насоката на врската може да биде збирот на сите производи на отстапувања за даден примерок:

Со директно пропорционална врска помеѓу променливите, оваа вредност е голема и позитивна - за повеќето субјекти, отстапувањата се совпаѓаат во знакот (големите вредности на една променлива одговараат на големите вредности на друга променлива и обратно). Ако XИ наимаат повратни информации, тогаш за повеќето субјекти, поголемите вредности на една променлива ќе одговараат на помали вредности на друга променлива, т.е. знаците на производите ќе бидат негативни, а збирот на производите како целина исто така ќе биде голем во апсолутна вредност, но со негативен знак. Ако не постои систематска врска помеѓу променливите, тогаш позитивните членови (производи на отстапувања) ќе се избалансираат со негативни членови, а збирот на сите производи на отстапувања ќе биде блиску до нула.

За да се осигури дека збирот на производите не зависи од големината на примерокот, доволно е да се просецира. Но, мерката за меѓусебна поврзаност не нè интересира како општ параметар, туку како пресметана проценка на истата - статистика. Затоа, што се однесува до формулата за дисперзија, во овој случај ќе го сториме истото, подели го збирот на производите на отстапувањата не со Н, и на ТВ - 1. Ова резултира со мерка за поврзаност, широко користена во физиката и техничките науки, која се нарекува. коваријанса (Коваханс):

ВО

Во психологијата, за разлика од физиката, повеќето променливи се мерат на произволни скали, бидејќи психолозите не се заинтересирани за апсолутната вредност на знакот, туку за релативната позиција на субјектите во групата. Покрај тоа, коваријансата е многу чувствителна на скалата на скалата (варијанса) на која се мерат особините. За да се направи мерката за поврзување независна од мерните единици на двете карактеристики, доволно е да се подели коваријансата на соодветните стандардни отстапувања. Така е добиено за-Мазга на коефициентот на корелација на К. Пирсон:

или, откако ќе се заменат изразите за o x и

Ако вредностите на двете променливи беа претворени во r-вредности со помош на формулата

тогаш формулата за r-Pearson коефициентот на корелација изгледа поедноставна (071.JPG):

/dict/sociology/article/soc/soc-0525.htm

ЛИНЕАРНА КОРЕЛАЦИЈА- статистичка линеарна врска од непричинска природа помеѓу две квантитативни променливи XИ на. Мерено со помош на „коефициентот K.L“. Пирсон, што е резултат на делење на коваријансата со стандардните отстапувања на двете променливи:

Каде с xy- коваријанса помеѓу променливите XИ на;

с x , с y- стандардни отстапувања за променливи XИ на;

x јас , y јас- променливи вредности XИ наза објект со број јас;

x, y- аритметички просеци за променливи XИ на.

Пирсон коефициент рможе да земе вредности од интервалот [-1; +1]. Значење r = 0значи дека нема линеарна врска помеѓу променливите XИ на(но не исклучува нелинеарна статистичка врска). Позитивни вредности на коефициентот ( р> 0) означува директна линеарна врска; колку е поблиску неговата вредност до +1, толку е посилна врската статистичката линија. Негативни вредности на коефициентот ( р < 0) свидетельствуют об обратной линейной связи; чем ближе его значение к -1, тем сильнее обратная связь. Значения р= ±1 значи присуство на целосно линеарно поврзување, директно или обратно. Во случај на целосно поврзување, сите точки со координати ( x јас , y јас) легнете на права линија y = а + bx.

„Коефициент К.Л. Пирсон се користи и за мерење на јачината на поврзувањето во линеарен регресивен модел во пар.

41. Матрица на корелација и график на корелација.

За корелацијата воопшто, видете го прашањето бр. 36Со. 56 (64) 063.JPG

Корелација матрица.Честопати, анализата на корелација вклучува проучување на односите меѓу не две, туку многу променливи измерени на квантитативна скала во еден примерок. Во овој случај, корелации се пресметуваат за секој пар од овој сет на променливи. Пресметките обично се вршат на компјутер, а резултатот е матрица на корелација.

Корелација матрица(Корелација Матрица) е резултат на пресметување на корелации од еден тип за секој пар од множеството Рпроменливи измерени на квантитативна скала во еден примерок.

ПРИМЕР

Да претпоставиме дека ги проучуваме односите помеѓу 5 променливи (vl, v2,..., v5; П= 5), мерено на примерок од N=30Човечки. Подолу е табела со изворни податоци и корелација матрица.

И
слични податоци:

Матрица на корелација:

Лесно е да се забележи дека матрицата на корелација е квадратна, симетрична во однос на главната дијагонала (takkak,y = /) y), со единици на главната дијагонала (бидејќи Г И = Гу = 1).

Матрицата на корелација е квадрат:бројот на редови и колони е еднаков на бројот на променливи. Таа симетричниво однос на главната дијагонала, бидејќи корелацијата XСо наеднаква на корелација наСо X.Единиците се наоѓаат на нејзината главна дијагонала, бидејќи корелацијата на карактеристиката со себе е еднаква на една. Следствено, не се предмет на анализа сите елементи на матрицата на корелација, туку оние што се наоѓаат над или под главната дијагонала.

Број на коефициенти на корелација,Карактеристиките што треба да се анализираат при проучувањето на врските се одредуваат со формулата: P(P- 1)/2. Во горниот пример, бројот на таквите коефициенти на корелација е 5(5 - 1)/2 = 10.

Главната задача за анализа на матрицата на корелација еидентификување на структурата на односите помеѓу многу карактеристики. Во овој случај, можна е визуелна анализа корелација галаксии- графичка слика структури статистичкизначајни врски,ако нема многу такви врски (до 10-15). Друг начин е да се користат мултиваријантни методи: повеќекратна регресија, анализа на фактори или кластери (види дел „Мултиваријатни методи...“). Користејќи анализа на фактори или кластери, можно е да се идентификуваат групирања на променливи кои се потесно поврзани една со друга отколку со други променливи. Комбинацијата од овие методи е исто така многу ефикасна, на пример, ако има многу знаци и тие не се хомогени.

Споредба на корелации -дополнителна задача за анализа на матрицата на корелација, која има две опции. Доколку е потребно да се споредат корелациите во една од редовите на матрицата за корелација (за една од променливите), се користи методот на споредба за зависни примероци (стр. 148-149). При споредување на корелации со исто име пресметани за различни примероци, се користи методот на споредба за независни примероци (стр. 147-148).

Методи за споредбакорелации во дијагоналиматрица на корелација (за проценка на стационарноста на случаен процес) и споредба неколкукорелационите матрици добиени за различни примероци (поради нивната хомогеност) се трудоинтензивни и надвор од опсегот на оваа книга. Можете да се запознаете со овие методи од книгата на Г.В. Суходолски 1.

Проблемот на статистичка значајност на корелациите.Проблемот е што процедурата за тестирање на статистички хипотези претпоставува еден-повеќекратнитест направен на еден примерок. Доколку се примени истиот метод постојано,дури и ако во однос на различни променливи, веројатноста за добивање резултат чисто случајно се зголемува. Во принцип, ако го повториме истиот метод на тестирање на хипотези еднашво однос на различни променливи или примероци, тогаш со утврдената вредност a гарантирано ќе добиеме потврда на хипотезата во ахкброј на случаи.

Да претпоставиме дека матрицата на корелација е анализирана за 15 променливи, односно се пресметуваат 15(15-1)/2 = 105 коефициенти на корелација. За тестирање на хипотезите се поставува нивото a = 0,05. Со проверка на хипотезата 105 пати, ќе добиеме потврда за истата пет пати (!), без разлика дали врската навистина постои. Знаејќи го ова и имајќи, да речеме, 15 „статистички значајни“ коефициенти на корелација, дали можеме да кажеме кои од нив се добиени случајно, а кои од нив одразуваат вистинска врска?

Строго кажано, за да се донесе статистичка одлука потребно е да се намали нивото a за онолку пати колку што е бројот на хипотези кои се тестираат. Но, ова е тешко препорачливо, бидејќи веројатноста да се игнорира навистина постоечка врска (да се направи грешка од тип II) се зголемува на непредвидлив начин.

Самата матрица на корелација не е доволна основаза статистички заклучоци во однос на поединечните коефициенти вклучени во негокорелации!

Постои само еден навистина убедлив начин да се реши овој проблем: поделете го примерокот по случаен избор на два дела и земете ги предвид само оние корелации кои се статистички значајни во двата дела од примерокот. Алтернатива може да биде употребата на повеќеваријантни методи (фактор, кластер или повеќекратна регресивна анализа) за да се идентификуваат и последователно да се интерпретираат групи на статистички значајно поврзани променливи.

Проблем со вредностите што недостасуваат.Ако недостасуваат вредности во податоците, тогаш можни се две опции за пресметување на матрицата на корелација: а) отстранување на вредностите ред по ред (Исклучислучаипописно); б) парно бришење на вредностите (Исклучислучаиво пар). На бришење ред по реднабљудувања со вредности што недостасуваат, се брише целиот ред за објект (предмет) кој има барем една вредност што недостасува за една од променливите. Овој метод води до „точна“ корелација матрица во смисла дека сите коефициенти се пресметуваат од истиот сет на објекти. Меѓутоа, ако вредностите што недостасуваат се распределуваат случајно во променливите, тогаш овој метод може да доведе до фактот дека нема оставен ниту еден објект во множеството податоци што се разгледува (ќе има барем една вредност што недостасува во секој ред) . За да ја избегнете оваа ситуација, користете друг метод наречен отстранување во пар.Овој метод ги разгледува само празнините во секој одбран пар колона-променлива и ги игнорира празнините во другите променливи. Корелацијата за пар променливи се пресметува за оние објекти каде што нема празнини. Во многу ситуации, особено кога бројот на празнини е релативно мал, да речеме 10%, а празнините се распределуваат сосема случајно, овој метод не води до сериозни грешки. Меѓутоа, понекогаш тоа не е случај. На пример, систематската пристрасност (поместување) во оценувањето може да „скрие“ систематско распоредување на пропусти, што е причина за разликата во коефициентите на корелација конструирани за различни подмножества (на пример, за различни подгрупи на објекти). Друг проблем поврзан со матрицата на корелација пресметана со во паротстранување на празнините се случува кога се користи оваа матрица во други видови на анализа (на пример, во повеќекратна регресија или факторска анализа). Тие претпоставуваат дека „точната“ матрица на корелација се користи со одредено ниво на конзистентност и „усогласеност“ на различни коефициенти. Користењето матрица со „лоши“ (пристрасни) проценки води до фактот дека програмата или не може да ја анализира таквата матрица или резултатите ќе бидат погрешни. Затоа, ако се користи паровиот метод за исклучување на податоците што недостасуваат, потребно е да се провери дали постојат систематски обрасци во распределбата на податоците што недостасуваат.

Ако парното бришење на податоците што недостасуваат не доведе до никакво систематско поместување на средствата и варијансите (стандардни отстапувања), тогаш овие статистики ќе бидат слични на оние пресметани со методот ред-по-ред за бришење на податоците што недостасуваат. Ако се забележи значителна разлика, тогаш постои причина да се претпостави дека постои промена во проценките. На пример, ако просечното (или стандардното отстапување) на вредностите на променливата А,што се користеше при пресметување на нејзината корелација со променливата ВО,многу помалку од средната (или стандардното отстапување) на истите вредности на променливата А,кои беа користени при пресметување на нејзината корелација со променливата C, тогаш има сите причини да се очекува дека овие две корелации (А-Бнас)врз основа на различни подмножества на податоци. Ќе има пристрасност во корелациите предизвикани од неслучајното поставување на празнините во вредностите на променливите.

Анализа на корелациони галаксии.По решавањето на проблемот на статистичка значајност на елементите на матрицата на корелација, статистички значајните корелации може графички да се претстават во форма на корелациона галаксија или галаксија. Корелација галаксија -Ова е фигура која се состои од темиња и линии што ги поврзуваат. Темињата одговараат на карактеристиките и обично се означени со броеви - променливи броеви. Линиите одговараат на статистички значајни врски и графички го изразуваат знакот, а понекогаш и j-нивото на значајност на врската.

Корелациската галаксија може да рефлектира Ситестатистички значајни врски на матрицата на корелација (понекогаш се нарекуваат графикон на корелација ) или само нивниот значајно избран дел (на пример, што одговара на еден фактор според резултатите од факторската анализа).

ПРИМЕР НА ИЗГРАДБА НА КОРЕЛАЦИОНА ПЛЕЈАДА

Подготовка за државна (конечна) сертификација на дипломирани студенти: формирање на база на податоци за обединетите државни испити (општа листа на учесници на обединет државен испит од сите категории, со назначување на предмети) - земајќи ги предвид резервните денови во случај на исти предмети;

Работен план (27)

Решение

2. Активности на воспитно-образовната институција за подобрување на содржината и оценување на квалитетот по предметите научно-математичко образование Општинска образовна институција средно училиште бр.4, Литвиновска, Чапаевскаја,

Во случаи кога мерењата на карактеристиките што се испитуваат се вршат на редовна скала или формата на врската се разликува од линеарната, проучувањето на врската помеѓу две случајни променливи се врши со помош на коефициенти на корелација на ранг. Размислете за коефициентот на корелација на ранг Спирман. При неговото пресметување потребно е да се рангираат (нарачаат) опциите на примерокот. Рангирањето е групирање на експериментални податоци во одреден редослед, или растечки или опаѓачки.

Операцијата за рангирање се изведува според следниот алгоритам:

1. На помала вредност и се доделува понизок ранг. На највисоката вредност и се доделува ранг што одговара на бројот на рангирани вредности. На најмалата вредност и се доделува ранг од 1. На пример, ако n=7, тогаш најголемата вредност ќе добие ранг од 7, освен во случаите предвидени во второто правило.

2. Ако неколку вредности се еднакви, тогаш им се доделува ранг што е просек од ранговите што би ги добиле доколку не се еднакви. Како пример, земете примерок со растечки редослед кој се состои од 7 елементи: 22, 23, 25, 25, 25, 28, 30. Вредностите 22 и 23 се појавуваат по еднаш, така што нивните рангови се соодветно R22=1, и R23=2. Вредноста 25 се појавува 3 пати. Ако овие вредности не се повторат, тогаш нивните рангови би биле 3, 4, 5. Затоа, нивниот ранг R25 е еднаков на аритметичката средина од 3, 4 и 5: . Вредностите 28 и 30 не се повторуваат, така што нивните рангови се соодветно R28=6 и R30=7. Конечно ја имаме следната кореспонденција:

3. Вкупниот збир на рангови мора да се совпадне со пресметаниот, кој се одредува со формулата:

каде n е вкупниот број на рангирани вредности.

Несовпаѓање помеѓу реалните и пресметаните збирови на рангирањето ќе укаже на грешка направена при пресметувањето на ранговите или нивното сумирање. Во овој случај, треба да ја пронајдете и поправите грешката.

Спирмановиот коефициент на корелација на ранг е метод кој овозможува да се одреди силата и насоката на односот помеѓу две особини или две хиерархии на особини. Употребата на коефициентот на корелација на ранг има голем број ограничувања:

а) Претпоставената корелација зависност мора да биде монотона.
б) Волуменот на секој примерок мора да биде поголем или еднаков на 5. За да се одреди горната граница на примерокот, користете табели со критични вредности (Табела 3 од Додатокот). Максималната вредност на n во табелата е 40.
в) За време на анализата, веројатно е дека може да се појават голем број идентични рангови. Во овој случај, мора да се направи измена. Најповолен случај е кога двата примерока што се испитуваат претставуваат две секвенци на дивергентни вредности.

За да се спроведе анализа на корелација, истражувачот мора да има два примерока што може да се рангираат, на пример:

- две карактеристики измерени во иста група на предмети;
- две поединечни хиерархии на особини идентификувани во два субјекти користејќи ист сет на особини;
- две групни хиерархии на карактеристики;
- индивидуални и групни хиерархии на карактеристики.

Пресметката ја започнуваме со рангирање на проучуваните индикатори посебно за секоја од карактеристиките.

Да анализираме случај со два знака измерени во иста група субјекти. Прво, поединечните вредности добиени од различни субјекти се рангираат според првата карактеристика, а потоа поединечните вредности се рангираат според втората карактеристика. Ако пониските рангови на еден индикатор одговараат на пониските рангови на друг индикатор, а повисоките рангови на еден индикатор одговараат на поголемите рангови на друг индикатор, тогаш двете карактеристики се позитивно поврзани. Ако повисоките рангови на еден индикатор одговараат на пониските рангови на друг индикатор, тогаш двете карактеристики се негативно поврзани. За да најдеме rs, ги одредуваме разликите помеѓу ранговите (г) за секој предмет. Колку е помала разликата помеѓу ранговите, толку поблиску ќе биде коефициентот на корелација на рангирањето rs до „+1“. Ако нема врска, тогаш нема да има кореспонденција меѓу нив, па оттука rs ќе биде блиску до нула. Колку е поголема разликата помеѓу рангот на предметите на две променливи, толку поблиску до „-1“ ќе биде вредноста на коефициентот rs. Така, коефициентот на корелација на ранг Спирман е мерка за која било монотона врска помеѓу двете карактеристики што се испитуваат.

Дозволете ни да го разгледаме случајот со две индивидуални хиерархии на особини идентификувани во два субјекти користејќи ист сет на особини. Во оваа ситуација, индивидуалните вредности добиени од секој од двата субјекти се рангираат според одреден сет на карактеристики. На карактеристиката со најниска вредност мора да му се додели првиот ранг; карактеристиката со поголема вредност е вториот ранг и сл. Посебно треба да се внимава да се осигура дека сите атрибути се мерат во исти единици. На пример, невозможно е да се рангираат индикаторите ако тие се изразени во различни точки на „цена“, бидејќи е невозможно да се одреди кој од факторите ќе го заземе првото место во однос на сериозноста додека сите вредности не се доведат до една скала. Ако карактеристиките кои имаат ниски рангови кај еден од предметите имаат и ниски рангови кај друг, и обратно, тогаш поединечните хиерархии се позитивно поврзани.

Во случај на две групни хиерархии на карактеристики, просечните групни вредности добиени во две групи субјекти се рангираат според истиот сет на карактеристики за проучуваните групи. Следно, го следиме алгоритмот даден во претходните случаи.

Дозволете ни да анализираме случај со индивидуална и групна хиерархија на карактеристики. Тие започнуваат со одделно рангирање на поединечните вредности на субјектот и просечните групни вредности според истиот сет на карактеристики што се добиени, со исклучок на субјектот кој не учествува во просечната групна хиерархија, бидејќи неговата индивидуална хиерархија ќе биде во споредба со него. Ранг корелацијата ни овозможува да го процениме степенот на конзистентност на индивидуалната и групната хиерархија на особини.

Да разгледаме како се одредува значајноста на коефициентот на корелација во случаите наведени погоре. Во случај на две карактеристики, тоа ќе се определи според големината на примерокот. Во случај на две индивидуални хиерархии на карактеристики, значењето зависи од бројот на карактеристики вклучени во хиерархијата. Во последните два случаи, значајноста се одредува според бројот на карактеристики што се проучуваат, а не според бројот на групи. Така, значењето на rs во сите случаи се определува со бројот на рангирани вредности n.

При проверка на статистичката значајност на rs, се користат табели со критични вредности на коефициентот на корелација на ранг, составени за различни броеви на рангирани вредности и различни нивоа на значајност. Ако апсолутната вредност на rs достигне или надмине критична вредност, тогаш корелацијата е сигурна.

Кога се разгледува првата опција (случај со два знака измерени во иста група субјекти), можни се следните хипотези.

H0: Корелацијата помеѓу променливите x и y не се разликува од нула.

H1: Корелацијата помеѓу променливите x и y е значително различна од нула.

Ако работиме со кој било од трите преостанати случаи, тогаш е неопходно да се изнесат уште еден пар хипотези:

H0: Корелацијата помеѓу хиерархиите x и y не се разликува од нула.

H1: Корелацијата помеѓу хиерархиите x и y е значително различна од нула.

Редоследот на дејства при пресметување на коефициентот на корелација на ранг на Спирман rs е како што следува.

- Определи кои две карактеристики или две хиерархии на карактеристики ќе учествуваат во споредбата како променливи x и y.
- Рангирајте ги вредностите на променливата x, со доделување на ранг 1 на најмалата вредност, во согласност со правилата за рангирање. Ставете ги ранговите во првата колона од табелата по редослед на испитаници или карактеристики.
- Рангирајте ги вредностите на променливата y. Ставете ги ранговите во втората колона од табелата по редослед на испитаници или карактеристики.
- Пресметај ги разликите d помеѓу ранговите x и y за секој ред од табелата. Ставете ги резултатите во следната колона на табелата.
- Пресметај ги квадратните разлики (d2). Ставете ги добиените вредности во четвртата колона од табелата.
- Пресметај го збирот на квадратни разлики? d2.
- Ако се појават идентични редови, пресметајте ги корекциите:

каде што TX е обемот на секоја група на идентични редови во примерокот X;

TY е обемот на секоја група на идентични редови во примерокот y.

Пресметајте го коефициентот на корелација на рангот во зависност од присуството или отсуството на идентични редови. Ако нема идентични редови, пресметајте го коефициентот на корелација на рангот РС со употреба на формулата:

Ако има идентични редови, пресметајте го коефициентот на корелација на ранг РС со употреба на формулата:

каде? Д2 е збирот на квадратни разлики помеѓу редови;

Tx и Ty - корекции за еднакви рангови;

n е бројот на предмети или карактеристики кои учествуваат на рангирањето.

Одредете ги критичните вредности на РС од Додаток Табела 3 за даден број на субјекти n. Значајна разлика од нула од коефициентот на корелација ќе се забележи под услов РС да не е помала од критичната вредност.

Студентот по психологија (социолог, менаџер, менаџер, итн.) често е заинтересиран за тоа како две или повеќе променливи се поврзани една со друга во една или повеќе групи што се проучуваат.

Во математиката, за да се опишат односите помеѓу променливите величини, се користи концептот на функција F, која секоја специфична вредност на независната променлива X ја поврзува со одредена вредност на зависната променлива Y. Резултирачката зависност е означена како Y=F( X).

Во исто време, видовите на корелации помеѓу измерените карактеристики можат да бидат различни: на пример, корелацијата може да биде линеарна и нелинеарна, позитивна и негативна. Таа е линеарна - ако со зголемување или намалување на една променлива X, втората променлива Y, во просек, или исто така се зголемува или намалува. Таа е нелинеарна ако, со зголемување на една количина, природата на промената во втората не е линеарна, туку е опишана со други закони.

Корелацијата ќе биде позитивна ако со зголемување на променливата X се зголемува и променливата Y во просек, а ако со зголемување на X променливата Y има тенденција да се намалува во просек, тогаш зборуваме за присуство на негативна корелација. Можно е да е невозможно да се воспостави каква било врска помеѓу променливите. Во овој случај, тие велат дека нема корелација.

Задачата за анализа на корелација се сведува на утврдување на насоката (позитивна или негативна) и формата (линеарна, нелинеарна) на врската помеѓу различните карактеристики, мерење на нејзината блискост и, конечно, проверка на нивото на значајност на добиените коефициенти на корелација.

Коефициентот на корелација на ранг, предложен од К. Спирман, се однесува на непараметриска мерка на односот помеѓу променливите измерени на скала за рангирање. При пресметувањето на овој коефициент, не се потребни претпоставки за природата на распределбите на карактеристиките во популацијата. Овој коефициент го одредува степенот на блискост на поврзаноста помеѓу редните карактеристики, кои во овој случај ги претставуваат рангот на споредените величини.

Коефициентот на линеарна корелација на Спирман се пресметува со формулата:

каде n е бројот на рангирани карактеристики (показатели, предмети);
D е разликата помеѓу ранговите за две променливи за секој предмет;
Д2 е збир на квадратни разлики во редовите.

Критичните вредности на коефициентот на корелација на ранг Спирман се претставени подолу:

Вредноста на Спирмановиот линеарен коефициент на корелација лежи во опсегот +1 и -1. Коефициентот на линеарна корелација на Спирман може да биде позитивен или негативен, карактеризирајќи ја насоката на односот помеѓу две особини измерени на скала за рангирање.

Ако коефициентот на корелација во апсолутна вредност е блиску до 1, тогаш тоа одговара на високо ниво на поврзаност помеѓу променливите. Значи, особено, кога променливата е во корелација со себе, вредноста на коефициентот на корелација ќе биде еднаква на +1. Таквиот однос карактеризира директно пропорционална зависност. Ако вредностите на променливата X се подредени во растечки редослед, а истите вредности (сега означени како променлива Y) се наредени во опаѓачки редослед, тогаш во овој случај корелацијата помеѓу променливите X и Y ќе биде точно -1. Оваа вредност на коефициентот на корелација карактеризира обратно пропорционална врска.

Знакот на коефициентот на корелација е многу важен за толкување на добиената врска. Ако знакот на коефициентот на линеарна корелација е плус, тогаш односот помеѓу корелираните карактеристики е таков што поголема вредност на една карактеристика (променлива) одговара на поголема вредност на друга карактеристика (друга променлива). Со други зборови, ако еден индикатор (променлива) се зголемува, тогаш и другиот индикатор (променлива) соодветно се зголемува. Оваа зависност се нарекува директно пропорционална зависност.

Ако се добие знак минус, тогаш поголема вредност на една карактеристика одговара на помала вредност на друга. Со други зборови, ако има знак минус, зголемувањето на една променлива (знак, вредност) одговара на намалување на друга променлива. Оваа зависност се нарекува обратно пропорционална зависност. Во овој случај, изборот на променливата на која е доделен карактерот (тенденцијата) на зголемување е произволен. Може да биде или променлива X или променлива Y. Меѓутоа, ако се смета дека променливата X се зголемува, тогаш променливата Y соодветно ќе се намали, и обратно.

Да го погледнеме примерот на Спирмановата корелација.

Психологот открива како поединечните показатели за подготвеност за училиште, добиени пред почетокот на наставата кај 11 првачиња, се поврзани меѓу себе и нивниот просечен успех на крајот од учебната година.

За да го решиме овој проблем, ги рангиравме, прво, вредностите на индикаторите за училишна подготвеност добиени при приемот во училиште и, второ, конечните показатели за академските перформанси на крајот на годината за истите овие ученици во просек. Резултатите ги прикажуваме во табелата:

Добиените податоци ги заменуваме во горната формула и ја вршиме пресметката. Добиваме:

За да го пронајдеме нивото на значајност, се повикуваме на табелата „Критични вредности на коефициентот на корелација на ранг Спирман“, која ги прикажува критичните вредности за коефициентите на корелација на ранг.

Ја конструираме соодветната „оска на значење“:

Добиениот коефициент на корелација се совпадна со критичната вредност за нивото на значајност од 1%. Следствено, може да се тврди дека показателите за училишна подготвеност и конечните оценки на првачињата се поврзани со позитивна корелација - со други зборови, колку е повисок индикаторот за училишна подготвеност, толку подобро студираат првачињата. Во однос на статистичките хипотези, психологот мора да ја отфрли нултата (H0) хипотеза за сличност и да ја прифати алтернативата (H1) на разлики, што сугерира дека врската помеѓу индикаторите за училишна подготвеност и просечните академски перформанси е различна од нула.

Спирман корелација. Анализа на корелација со помош на методот Спирман. Спирман е рангирана. Спирман коефициент на корелација. Корелација за ранг на Спирман

Калкулаторот подолу го пресметува коефициентот на корелација на ранг на Спирман помеѓу две случајни променливи. Теоретскиот дел, за да не се одвлекува вниманието од калкулаторот, традиционално се става под него.

додадете увоз извоз mode_edit избриши

Промени во случајни променливи

	стрелка_нагорестрелка_надолу X	стрелка_нагорестрелка_надолу Y
			mode_edit

Големина на страница: 5 10 20 50 100 chevron_left chevron_right

Промени во случајни променливи

Увезете податоциГрешка во увозот

Можете да користите еден од овие симболи за да ги одделите полињата: Tab, ";" или "," Пример: -50,5;-50,5

Откажи назад увоз

Методот за пресметување на коефициентот на корелација на ранг Спирман е всушност опишан многу едноставно. Ова е истиот коефициент на корелација на Пирсон, само пресметан не за резултатите од мерењата на самите случајни променливи, туку за нивните ранг вредности.

Тоа е,

Останува само да откриеме кои се вредностите на рангирањето и зошто е потребно сето тоа.

Ако елементите на варијациската серија се подредени во растечки или опаѓачки редослед, тогаш рангелемент ќе биде неговиот број во оваа нарачана серија.

На пример, да имаме серија на варијации (17,26,5,14,21). Да ги подредиме неговите елементи по опаѓачки редослед (26,21,17,14,5). 26 има ранг 1, 21 има ранг 2 итн. Серијата на варијации на вредности на рангирање ќе изгледа вака (3,1,5,4,2).

Односно, при пресметување на коефициентот Спирман, оригиналните серии на варијации се трансформираат во варијации на вредности на рангирање, по што на нив се применува Пирсоновата формула.

Постои една суптилност - рангот на повторени вредности се зема како просек на рангот. Односно, за серијата (17, 15, 14, 15) серијата на вредности на рангирање ќе изгледа како (1, 2,5, 4, 2,5), бидејќи првиот елемент еднаков на 15 има ранг 2, а вториот има ранг 3, и.

Ако нема вредности кои се повторуваат, односно, сите вредности од сериите на ранг се броеви од опсегот од 1 до n, формулата Пирсон може да се поедностави на

Па, патем, оваа формула најчесто се дава како формула за пресметување на коефициентот Спирман.

Која е суштината на преминот од самите вредности кон нивните рангирани вредности?
Поентата е дека со проучување на корелацијата на вредностите на рангирањето, можете да одредите колку добро е опишана зависноста на две променливи со монотона функција.

Знакот на коефициентот ја означува насоката на односот помеѓу променливите. Ако знакот е позитивен, тогаш вредностите Y имаат тенденција да се зголемуваат како што се зголемуваат вредностите на X; ако знакот е негативен, тогаш вредностите Y имаат тенденција да се намалуваат како што се зголемуваат вредностите на X. Ако коефициентот е 0, тогаш нема тренд. Ако коефициентот е 1 или -1, тогаш врската помеѓу X и Y има форма на монотона функција - односно, како што се зголемува X, Y исто така се зголемува, или обратно, како што X се зголемува, Y се намалува.

Односно, за разлика од Пирсоновиот коефициент на корелација, кој може да открие само линеарна зависност на една променлива од друга, Спирмановиот коефициент на корелација може да открие монотона зависност каде што не е откриена директна линеарна врска.

Да објаснам со пример. Да претпоставиме дека ја испитуваме функцијата y=10/x.
Ги имаме следните мерења X и Y
{{1,10}, {5,2}, {10,1}, {20,0.5}, {100,0.1}}
За овие податоци, коефициентот на корелација на Пирсон е -0.4686, односно врската е слаба или отсутна. Но, коефициентот на корелација Спирман е строго еднаков на -1, што се чини дека му навестува на истражувачот дека Y има строга негативна монотона зависност од X.