Korelacje w pracach dyplomowych z psychologii. Współczynnik korelacji Spearmana

Studenta-psychologa (socjologa, menedżera, menedżera itp.) często interesuje to, w jaki sposób dwie lub więcej zmiennych jest ze sobą powiązanych w jednej lub większej liczbie grup badawczych.

W matematyce do opisu zależności pomiędzy zmiennymi wykorzystuje się pojęcie funkcji F, która wiąże każdą konkretną wartość zmiennej niezależnej X z określoną wartością zmiennej zależnej Y. Powstałą zależność oznaczamy jako Y=F(X ).

Jednocześnie rodzaje korelacji pomiędzy mierzonymi cechami mogą być różne: na przykład korelacja może być liniowa i nieliniowa, dodatnia i ujemna. Jest liniowy - jeśli wraz ze wzrostem lub spadkiem jednej zmiennej X, druga zmienna Y średnio również wzrasta lub maleje. Jest nieliniowy, jeśli wraz ze wzrostem jednej wartości charakter zmiany drugiej nie jest liniowy, ale jest opisany innymi prawami.

Korelacja będzie dodatnia, jeśli średnio wraz ze wzrostem zmiennej X wzrasta również zmienna Y, a jeśli średnio zmienna Y ma tendencję do zmniejszania się wraz ze wzrostem X, to mówią, że istnieje ujemna korelacja korelacja. Możliwa jest sytuacja, gdy nie da się ustalić żadnej zależności pomiędzy zmiennymi. W tym przypadku mówimy, że nie ma korelacji.

Zadanie analizy korelacji sprowadza się do ustalenia kierunku (dodatniego lub ujemnego) i postaci (liniowa, nieliniowa) zależności pomiędzy różnymi cechami, pomiaru jej szczelności i wreszcie sprawdzenia poziomu istotności uzyskanych współczynników korelacji .

Współczynnik korelacji rang, zaproponowany przez K. Spearmana, odnosi się do nieparametrycznych wskaźników zależności między zmiennymi mierzonymi na skali rang. Przy obliczaniu tego współczynnika nie są wymagane żadne założenia dotyczące charakteru rozkładu cech w populacji ogólnej. Współczynnik ten określa stopień szczelności połączenia cech porządkowych, które w tym przypadku reprezentują szeregi porównywanych wartości.

Współczynnik rangi Spearmana korelacji liniowej oblicza się ze wzoru:

gdzie n to liczba uszeregowanych cech (wskaźników, przedmiotów);
D jest różnicą pomiędzy rangami w dwóch zmiennych dla każdego przedmiotu;
D2 jest sumą kwadratów różnic rang.

Poniżej przedstawiono wartości krytyczne współczynnika korelacji rang Spearmana:

Wartość współczynnika korelacji liniowej Spearmana mieści się w przedziale +1 i -1. Współczynnik korelacji liniowej Spearmana może być dodatni lub ujemny, charakteryzując kierunek związku między dwiema cechami mierzonymi na skali rang.

Jeżeli współczynnik korelacji modulo jest bliski 1, oznacza to wysoki poziom zależności pomiędzy zmiennymi. Zatem w szczególności, gdy zmienna jest skorelowana sama ze sobą, wartość współczynnika korelacji będzie wynosić +1. Taka zależność charakteryzuje relację wprost proporcjonalną. Jeśli wartości zmiennej X ułożymy w porządku rosnącym, a te same wartości (teraz oznaczone jako zmienna Y) ułożymy w porządku malejącym, to w tym przypadku korelacja pomiędzy zmiennymi X i Y będzie wynosić dokładnie -1. Ta wartość współczynnika korelacji charakteryzuje zależność odwrotnie proporcjonalną.

Znak współczynnika korelacji jest bardzo ważny dla interpretacji otrzymanej zależności. Jeżeli znak współczynnika korelacji liniowej jest dodatni, to zależność między skorelowanymi cechami jest taka, że ​​większej wartości jednej cechy (zmiennej) odpowiada większa wartość innej cechy (innej zmiennej). Innymi słowy, jeśli jeden wskaźnik (zmienna) wzrośnie, wówczas drugi wskaźnik (zmienna) odpowiednio wzrośnie. Zależność tę nazywamy relacją wprost proporcjonalną.

Jeśli uzyskany zostanie znak minus, wówczas większa wartość jednego atrybutu odpowiada mniejszej wartości drugiego. Innymi słowy, jeśli występuje znak minus, wzrost jednej zmiennej (atrybutu, wartości) odpowiada spadkowi innej zmiennej. Zależność tę nazywamy relacją odwrotną. W tym przypadku wybór zmiennej, której przypisuje się charakter (trend) wzrostu, jest arbitralny. Może to być albo zmienna X, albo zmienna Y. Jeśli jednak uznamy, że zmienna X rośnie, wówczas zmienna Y odpowiednio się zmniejszy i odwrotnie.

Rozważmy przykład korelacji Spearmana.

Psycholog dowiaduje się, w jaki sposób poszczególne wskaźniki gotowości szkolnej uzyskane przed rozpoczęciem nauki szkolnej u 11 pierwszoklasistów oraz ich średnie wyniki na koniec roku szkolnego są ze sobą powiązane.

Aby rozwiązać ten problem, dokonaliśmy rankingu, po pierwsze, wartości wskaźników gotowości szkolnej uzyskanych w momencie rozpoczęcia nauki w szkole, a po drugie, końcowych wskaźników osiągnięć na koniec roku średnio dla tych samych uczniów. Wyniki przedstawiono w tabeli:

Otrzymane dane podstawiamy do powyższego wzoru i obliczamy. Otrzymujemy:

Aby znaleźć poziom istotności, zwracamy się do tabeli „Wartości krytyczne współczynnika korelacji rang Spearmana”, która pokazuje wartości krytyczne współczynników korelacji rang.

Budujemy odpowiednią „oś znaczenia”:

Otrzymany współczynnik korelacji pokrywał się z wartością krytyczną dla poziomu istotności 1%. Można zatem postawić tezę, że wskaźniki gotowości szkolnej i oceny końcowe uczniów klas pierwszych są ze sobą dodatnio skorelowane – innymi słowy, im wyższy wskaźnik gotowości szkolnej, tym lepiej uczy się pierwszoklasista. W zakresie hipotez statystycznych psycholog musi odrzucić hipotezę zerową (H0) o podobieństwie i przyjąć alternatywną (H1) różnic, która mówi, że związek między gotowością szkolną a przeciętnymi wynikami jest niezerowy.

Korelacja Spearmana. Analiza korelacji według metody Spearmana. szeregi Spearmana. Współczynnik korelacji Spearmana. Korelacja rang Spearmana

W praktyce współczynnik korelacji rang Spearmana (P) jest często używany do określenia bliskości związku między dwiema cechami. Wartości każdej cechy szereguje się w kolejności rosnącej (od 1 do n), następnie wyznacza się różnicę (d) pomiędzy rangami odpowiadającymi jednej obserwacji.

Przykład 1. Zależność wielkości produkcji przemysłowej od inwestycji w środki trwałe w 10 obwodach jednego z okręgów federalnych Federacji Rosyjskiej w 2003 r. charakteryzują następujące dane.
Oblicz Współczynniki korelacji rang Spearmana i Kendalę. Sprawdź ich istotność przy α=0,05. Formułować wniosek na temat zależności pomiędzy wielkością produkcji przemysłowej a inwestycjami w środki trwałe w rozpatrywanych regionach Federacji Rosyjskiej.

Przypisz rangi cesze Y i czynnikowi X . Znajdź sumę różnicy kwadratów d 2 .
Za pomocą kalkulatora obliczamy współczynnik korelacji rang Spearmana:

X Y ranga X, dx ranga Y, d y (dx - dy) 2
1.3 300 1 2 1
1.8 1335 2 12 100
2.4 250 3 1 4
3.4 946 4 8 16
4.8 670 5 7 4
5.1 400 6 4 4
6.3 380 7 3 16
7.5 450 8 5 9
7.8 500 9 6 9
17.5 1582 10 16 36
18.3 1216 11 9 4
22.5 1435 12 14 4
24.9 1445 13 15 4
25.8 1820 14 19 25
28.5 1246 15 10 25
33.4 1435 16 14 4
42.4 1800 17 18 1
45 1360 18 13 25
50.4 1256 19 11 64
54.8 1700 20 17 9
364

Związek pomiędzy cechą Y i czynnikiem X jest silny i bezpośredni.

Oszacowanie współczynnika korelacji rang Spearmana



Według tabeli Studenta znajdujemy Ttable.
Tabela T \u003d (18; 0,05) \u003d 1,734
Ponieważ Tobs > Ttabl, odrzucamy hipotezę, że współczynnik korelacji rang jest równy zero. Innymi słowy, współczynnik korelacji rang Spearmana jest istotny statystycznie.

Oszacowanie przedziałowe dla współczynnika korelacji rang (przedział ufności)
Przedział ufności dla współczynnika korelacji rang Spearmana: p(0,5431;0,9095).

Przykład nr 2. Wstępne dane.

5 4
3 4
1 3
3 1
6 6
2 2
Ponieważ macierz ma powiązane rangi (ten sam numer rangi) pierwszego wiersza, zmienimy ich kształt. Rangi są tworzone na nowo bez zmiany ważności rang, to znaczy pomiędzy numerami rang muszą zostać zachowane odpowiednie proporcje (większe niż, mniejsze lub równe). Nie zaleca się również ustawiania rangi powyżej 1 i poniżej wartości równej liczbie parametrów (w tym przypadku n = 6). Reformację szeregów przedstawiono w tabeli.
Nowe szeregi
1 1 1
2 2 2
3 3 3.5
4 3 3.5
5 5 5
6 6 6
Ponieważ w macierzy istnieją powiązane szeregi drugiego rzędu, zmienimy ich kształt. Reformację szeregów przedstawiono w tabeli.
Numery miejsc w uporządkowanym rzędzieLokalizacja czynników według oceny ekspertaNowe szeregi
1 1 1
2 2 2
3 3 3
4 4 4.5
5 4 4.5
6 6 6
Macierz rang.
ranga X, dxranga Y, d y(dx - dy) 2
5 4.5 0.25
3.5 4.5 1
1 3 4
3.5 1 6.25
6 6 0
2 2 0
21 21 11.5
Ponieważ wśród wartości cech x i y jest kilka identycznych, tj. tworzone są powiązane szeregi, wówczas w tym przypadku współczynnik Spearmana oblicza się jako:

Gdzie


j - numery połączeń w kolejności dla cechy x;
A j jest liczbą identycznych rang w j-tym pakiecie w x;
k - liczba krążków w celu uzyskania cechy y;
W k - liczba identycznych szeregów w k-tym pakiecie w y.
A = [(2 · 3 -2)]/12 = 0,5
B = [(2 · 3 -2)]/12 = 0,5
D = A + B = 0,5 + 0,5 = 1

Związek pomiędzy cechą Y a czynnikiem X jest umiarkowany i bezpośredni.

W przypadkach, gdy pomiary badanych cech przeprowadza się na skali porządkowej lub postać zależności różni się od liniowej, badanie związku pomiędzy dwiema zmiennymi losowymi przeprowadza się za pomocą współczynników korelacji rangowej. Rozważmy współczynnik korelacji rang Spearmana. Obliczając to, należy uszeregować (uporządkować) opcje próbki. Ranking to grupowanie danych eksperymentalnych w określonej kolejności, rosnącej lub malejącej.

Operację rankingową przeprowadza się według następującego algorytmu:

1. Niższa wartość otrzymuje niższą rangę. Najwyższa wartość ma przypisaną rangę odpowiadającą liczbie uszeregowanych wartości. Najniższej wartości przypisuje się rangę równą 1. Przykładowo, jeśli n=7, to najwyższa wartość otrzyma rangę 7, za wyjątkiem przypadków przewidzianych przez drugą regułę.

2. Jeśli kilka wartości jest równych, wówczas przypisuje się im rangę, która jest średnią z rang, które otrzymaliby, gdyby nie były równe. Jako przykład rozważmy rosnąco uporządkowaną próbkę składającą się z 7 elementów: 22, 23, 25, 25, 25, 28, 30. Wartości 22 i 23 występują raz, więc ich rangi są odpowiednio równe R22=1, i R23=2. Wartość 25 występuje 3 razy. Gdyby te wartości się nie powtórzyły, ich rangi byłyby równe 3, 4, 5. Dlatego ich ranga R25 jest równa średniej arytmetycznej z 3, 4 i 5: . Wartości 28 i 30 nie powtarzają się, zatem ich rangi wynoszą odpowiednio R28=6 i R30=7. Wreszcie mamy następującą korespondencję:

3. Łączna liczba rang musi być zgodna z obliczoną, co określa wzór:

gdzie n jest całkowitą liczbą uszeregowanych wartości.

Rozbieżność pomiędzy rzeczywistą a obliczoną liczbą stopni będzie wskazywać na błąd popełniony w obliczeniu stopni lub ich sumowaniu. W takim przypadku musisz znaleźć i naprawić błąd.

Współczynnik korelacji rang Spearmana to metoda pozwalająca określić siłę i kierunek związku pomiędzy dwiema cechami lub dwiema hierarchiami cech. Stosowanie współczynnika korelacji rang ma szereg ograniczeń:

  • a) Oczekiwana korelacja powinna być monotoniczna.
  • b) Objętość każdej z próbek musi być większa lub równa 5. Do określenia górnej granicy próbki stosuje się tabele wartości krytycznych (Tabela 3 w Załączniku). Maksymalna wartość n w tabeli wynosi 40.
  • c) Podczas analizy prawdopodobne jest, że pojawi się duża liczba identycznych rang. W takim przypadku należy dokonać poprawki. Najkorzystniejszy przypadek ma miejsce, gdy obie badane próbki reprezentują dwa ciągi niedopasowanych wartości.

Aby przeprowadzić analizę korelacji, badacz musi dysponować dwiema próbami, które można uszeregować, np.:

  • - dwa znaki mierzone w tej samej grupie badanych;
  • - dwie indywidualne hierarchie cech zidentyfikowane u dwóch osób dla tego samego zestawu cech;
  • - dwie hierarchie grupowe atrybutów;
  • - indywidualne i grupowe hierarchie znaków.

Obliczenia rozpoczynamy od uszeregowania badanych wskaźników oddzielnie dla każdego ze znaków.

Przeanalizujmy przypadek z dwiema cechami mierzonymi w tej samej grupie osób. Najpierw poszczególne wartości są uszeregowane według pierwszego atrybutu uzyskanego przez różne podmioty, a następnie poszczególne wartości według drugiego atrybutu. Jeżeli niższe pozycje jednego wskaźnika odpowiadają niższym rangom innego wskaźnika, a wyższe pozycje jednego wskaźnika odpowiadają wyższym rangom innego wskaźnika, to te dwie cechy są ze sobą dodatnio powiązane. Jeśli wyższe stopnie jednego wskaźnika odpowiadają niższym rangom innego wskaźnika, wówczas oba znaki są ze sobą powiązane ujemnie. Aby znaleźć rs, określamy różnice między rangami (d) dla każdego przedmiotu. Im mniejsza różnica między rangami, tym współczynnik korelacji rang rs będzie bliższy „+1”. Jeśli nie ma związku, to nie będzie między nimi korespondencji, stąd rs będzie bliskie zeru. Im większa jest różnica pomiędzy rangami badanych w dwóch zmiennych, tym bliższa „-1” będzie wartość współczynnika rs. Zatem współczynnik korelacji rang Spearmana jest miarą dowolnego monotonicznego związku między dwiema badanymi cechami.

Rozważmy przypadek z dwiema indywidualnymi hierarchiami cech zidentyfikowanymi u dwóch osób dla tego samego zestawu cech. W tej sytuacji rangowane są indywidualne wartości uzyskane przez każdego z dwóch przedmiotów według pewnego zestawu cech. Cechę o najniższej wartości należy przypisać na pierwszą rangę; atrybut o wyższej wartości - druga ranga itp. Należy zadbać o to, aby wszystkie atrybuty były mierzone w tych samych jednostkach. Na przykład niemożliwe jest uszeregowanie wskaźników, jeśli są one wyrażone w różnych punktach „cenowych”, ponieważ nie można określić, który z czynników zajmie pierwsze miejsce pod względem ważności, dopóki wszystkie wartości nie zostaną sprowadzone do jednej skali. Jeżeli cechy, które zajmują niskie pozycje w jednym z przedmiotów, mają także niskie pozycje w drugim i odwrotnie, to poszczególne hierarchie są ze sobą dodatnio powiązane.

W przypadku dwóch grupowych hierarchii cech, średnie wartości grupowe uzyskane w dwóch grupach podmiotów są uszeregowane według tego samego zestawu cech dla badanych grup. Następnie postępujemy zgodnie z algorytmem podanym w poprzednich przypadkach.

Przeanalizujmy przypadek z indywidualną i grupową hierarchią cech. Zaczynają od osobnego uszeregowania indywidualnych wartości podmiotu i średnich wartości grupowych według tego samego zestawu cech, które uzyskano, z wyjątkiem podmiotu, który nie uczestniczy w średniej hierarchii grupowej, ponieważ jego indywidualne hierarchia zostanie z nią porównana. Korelacja rang pozwala ocenić stopień zgodności pomiędzy indywidualną i grupową hierarchią cech.

Zastanówmy się, jak wyznacza się istotność współczynnika korelacji w wymienionych powyżej przypadkach. W przypadku dwóch cech o tym zadecyduje liczebność próby. W przypadku dwóch indywidualnych hierarchii cech znaczenie zależy od liczby cech zawartych w hierarchii. W dwóch ostatnich przypadkach o istotności decyduje liczba badanych cech, a nie wielkość grup. Zatem znaczenie rs we wszystkich przypadkach zależy od liczby uszeregowanych wartości n.

Podczas badania istotności statystycznej rs stosuje się tabele wartości krytycznych współczynnika korelacji rang, zestawione dla różnej liczby wartości rankingowych i różnych poziomów istotności. Jeżeli wartość bezwzględna rs osiąga wartość krytyczną lub ją przekracza, wówczas korelacja jest znacząca.

Rozważając opcję pierwszą (przypadek z dwiema cechami mierzonymi w tej samej grupie osób) możliwe są następujące hipotezy.

H0: Korelacja pomiędzy zmiennymi x i y nie jest różna od zera.

H1: Korelacja pomiędzy zmiennymi x i y jest istotnie różna od zera.

Jeśli będziemy pracować z którymkolwiek z trzech pozostałych przypadków, musimy postawić kolejną parę hipotez:

H0: Korelacja między hierarchiami x i y jest różna od zera.

H1: Korelacja pomiędzy hierarchiami x i y jest istotnie różna od zera.

Kolejność działań przy obliczaniu współczynnika korelacji rang Spearmana rs jest następująca.

  • - Określ, które dwie cechy lub dwie hierarchie cech będą uczestniczyć w dopasowywaniu jako zmienne x i y.
  • - Uszereguj wartości zmiennej x, przypisując rangę 1 najmniejszej wartości, zgodnie z zasadami rankingu. Ułóż szeregi w pierwszej kolumnie tabeli w kolejności numeracji podmiotów lub znaków.
  • - Uszereguj wartości zmiennej y. Umieść szeregi w drugiej kolumnie tabeli w kolejności numeracji podmiotów lub znaków.
  • - Oblicz różnicę d pomiędzy rangami x i y dla każdego wiersza tabeli. Wyniki umieszczane są w kolejnej kolumnie tabeli.
  • - Oblicz kwadraty różnic (d2). Uzyskane wartości umieść w czwartej kolumnie tabeli.
  • - Oblicz sumę kwadratów różnic? d2.
  • - Jeżeli wystąpią te same rangi, oblicz poprawki:

gdzie tx jest objętością każdej grupy o równych szeregach w próbce x;

ty to wielkość każdej grupy o równych rangach w próbie y.

Oblicz współczynnik korelacji rang w zależności od obecności lub braku identycznych rang. W przypadku braku identycznych rang współczynnik korelacji rang rs oblicza się ze wzoru:

W przypadku występowania tych samych rang współczynnik korelacji rang rs oblicza się ze wzoru:

gdzie?d2 jest sumą kwadratów różnic pomiędzy szeregami;

Tx i Ty - poprawki dla tych samych rang;

n to liczba przedmiotów lub cech, które wzięły udział w rankingu.

Określ wartości krytyczne rs z tabeli 3 dodatku, dla danej liczby osób n. Znacząca różnica od zera współczynnika korelacji zostanie zaobserwowana pod warunkiem, że rs będzie nie mniejsze niż wartość krytyczna.

Współczynnik korelacji Pearsona

Współczynnik R- Metoda Pearsona służy do badania związku dwóch zmiennych metrycznych mierzonych w tej samej próbie. Jest wiele sytuacji, w których warto z niego skorzystać. Czy inteligencja wpływa na wyniki w nauce? Czy wynagrodzenie pracownika ma związek z jego dobrą wolą wobec współpracowników? Czy nastrój ucznia wpływa na powodzenie rozwiązywania złożonego problemu arytmetycznego? Aby odpowiedzieć na takie pytania, badacz musi zmierzyć dwa wskaźniki interesujące każdego członka próby.

Na wartość współczynnika korelacji nie mają wpływu jednostki, w jakich prezentowane są cechy. Zatem jakiekolwiek przekształcenia liniowe cech (mnożenie przez stałą, dodanie stałej) nie powodują zmiany wartości współczynnika korelacji. Wyjątkiem jest pomnożenie jednego ze znaków przez stałą ujemną: współczynnik korelacji zmienia swój znak na przeciwny.

Zastosowanie korelacji Spearmana i Pearsona.

Korelacja Pearsona jest miarą liniowej zależności między dwiema zmiennymi. Pozwala określić, jak proporcjonalna jest zmienność dwóch zmiennych. Jeśli zmienne są względem siebie proporcjonalne, wówczas graficznie zależność między nimi można przedstawić jako linię prostą o nachyleniu dodatnim (proporcja bezpośrednia) lub ujemna (proporcja odwrotna).

W praktyce związek między dwiema zmiennymi, jeśli występuje, jest probabilistyczny i graficznie wygląda jak elipsoidalna chmura rozproszona. Jednakże tę elipsoidę można przedstawić (w przybliżeniu) jako linię prostą lub linię regresji. Linia regresji to linia prosta skonstruowana metodą najmniejszych kwadratów: suma kwadratów odległości (obliczonych wzdłuż osi y) od każdego punktu wykresu rozrzutu do linii jest minimalna.

Szczególne znaczenie dla oceny trafności predykcji ma wariancja oszacowań zmiennej zależnej. W istocie wariancja oszacowań zmiennej zależnej Y to ta część jej całkowitej wariancji, która wynika z wpływu zmiennej niezależnej X. Innymi słowy, stosunek wariancji oszacowań zmiennej zależnej do jej prawdziwej wariancji jest równy kwadratowi współczynnika korelacji.

Kwadrat współczynnika korelacji zmiennej zależnej i niezależnej reprezentuje proporcję wariancji zmiennej zależnej pod wpływem zmiennej niezależnej i nazywany jest współczynnikiem determinacji. Współczynnik determinacji pokazuje zatem, w jakim stopniu zmienność jednej zmiennej jest spowodowana (determinowana) wpływem innej zmiennej.

Współczynnik determinacji ma istotną przewagę nad współczynnikiem korelacji. Korelacja nie jest liniową funkcją związku między dwiema zmiennymi. Zatem średnia arytmetyczna współczynników korelacji dla kilku prób nie pokrywa się z korelacją obliczoną od razu dla wszystkich osób z tych prób (czyli współczynnik korelacji nie jest addytywny). Wręcz przeciwnie, współczynnik determinacji odzwierciedla zależność liniowo, a zatem ma charakter addytywny: można go uśrednić dla kilku próbek.

Dodatkową informację o sile powiązania daje wartość kwadratu współczynnika korelacji – współczynnika determinacji: jest to część wariancji jednej zmiennej, którą można wytłumaczyć wpływem innej zmiennej. W przeciwieństwie do współczynnika korelacji, współczynnik determinacji rośnie liniowo wraz ze wzrostem siły połączenia.

Współczynniki korelacji Spearmana i τ - Kendall ( korelacje rang )

Jeżeli obie zmienne, pomiędzy którymi badana jest zależność, są przedstawione na skali porządkowej lub jedna z nich na skali porządkowej, a druga na skali metrycznej, wówczas stosuje się współczynniki korelacji rangowej: Spearmana lub τ - Kendella. Obydwa współczynniki wymagają wcześniejszego rankingu obu zmiennych do ich zastosowania.

Współczynnik korelacji rang Spearmana jest metodą nieparametryczną stosowaną do statystycznego badania zależności między zjawiskami. W tym przypadku określa się rzeczywisty stopień równoległości pomiędzy obydwoma szeregami ilościowymi badanych cech i ocenia szczelność ustalonej zależności za pomocą wyrażonego ilościowo współczynnika.

Jeśli członkowie grupy zostali najpierw uszeregowani według zmiennej x, a następnie według zmiennej y, wówczas korelację między zmiennymi x i y można uzyskać po prostu obliczając współczynnik Pearsona dla dwóch szeregów rang. Pod warunkiem, że nie ma powiązań w szeregach (tj. żadnych powtarzających się szeregów) dla żadnej ze zmiennych, wzór na Pearsona można znacznie uprościć obliczeniowo i przekształcić do wzoru znanego jako Spearman.

Moc współczynnika korelacji rang Spearmana jest nieco mniejsza od mocy współczynnika korelacji parametrycznej.

W przypadku małej liczby obserwacji wskazane jest stosowanie współczynnika korelacji rangowej. Metodę tę można zastosować nie tylko w przypadku danych ilościowych, ale także w przypadkach, gdy zarejestrowane wartości wyznaczane są przez cechy opisowe o różnym natężeniu.

Współczynnik korelacji rang Spearmana przy dużej liczbie identycznych rang dla jednej lub obu porównywanych zmiennych daje zagęszczone wartości. W idealnym przypadku obie skorelowane serie powinny być dwiema sekwencjami niedopasowanych wartości

Alternatywą dla korelacji Spearmana dla rang jest korelacja τ - Kendall. Korelacja zaproponowana przez M. Kendalla opiera się na założeniu, że kierunek powiązania można ocenić poprzez porównanie osób w parach: jeśli u pary osób zmiana x pokrywa się w kierunku ze zmianą y, to wskazuje na związek pozytywny, jeśli nie pasuje - coś o związku negatywnym.

Współczynniki korelacji zostały specjalnie zaprojektowane do numerycznego określania siły i kierunku związku pomiędzy dwiema właściwościami mierzonymi w skalach numerycznych (metrycznych lub rangowych). Jak już wspomniano, wartości korelacji +1 (ścisła zależność bezpośrednia lub wprost proporcjonalna) i -1 (ścisła zależność odwrotna lub odwrotnie proporcjonalna) odpowiadają maksymalnej sile zależności, korelacja równa zeru odpowiada brakowi relacja. Dodatkową informację o sile związku dostarcza wartość współczynnika determinacji: jest to część wariancji jednej zmiennej, którą można wytłumaczyć wpływem innej zmiennej.

9. Parametryczne metody porównywania danych

Metody porównań parametrycznych mają zastosowanie, jeśli zmienne zostały zmierzone w skali metrycznej.

Porównanie wariancji 2- x próbki testem Fishera .


Metoda ta pozwala na sprawdzenie hipotezy, że wariancje 2 populacji ogólnych, z których wyodrębniono porównywane próbki, różnią się od siebie. Ograniczenia metody - rozkład cechy w obu próbach nie powinien odbiegać od normalnego.

Alternatywą dla porównywania wariancji jest test Lievena, dla którego nie ma potrzeby testowania rozkładu normalnego. Metodę tę można zastosować do sprawdzenia założenia równości (jednorodności) wariancji przed sprawdzeniem wiarygodności różnicy średnich za pomocą testu t-Studenta dla niezależnych próbek o różnej wielkości.

Dyscyplina „wyższa matematyka” powoduje u niektórych odrzucenie, ponieważ naprawdę nie każdemu jest dane ją zrozumieć. Ale ci, którzy mają szczęście studiować ten temat i rozwiązywać problemy za pomocą różnych równań i współczynników, mogą pochwalić się niemal całkowitą wiedzą na ten temat. W psychologii istnieje nie tylko orientacja humanitarna, ale także pewne formuły i metody matematycznej weryfikacji postawionej w toku badań hipotezy. W tym celu stosuje się różne współczynniki.

Współczynnik korelacji Spearmana

Jest to powszechny pomiar służący do określania bliskości związku między dowolnymi dwiema cechami. Współczynnik nazywany jest również metodą nieparametryczną. Pokazuje statystyki połączeń. Czyli wiemy np., że u dziecka agresja i drażliwość są ze sobą powiązane, a współczynnik korelacji rang Spearmana pokazuje statystyczną matematyczną zależność tych dwóch cech.

Jak obliczany jest współczynnik rankingowy?

Oczywiście wszystkie matematyczne definicje lub wielkości mają swoje własne wzory, według których są obliczane. Posiada również współczynnik korelacji Spearmana. Jego formuła jest następująca:

Na pierwszy rzut oka wzór nie jest do końca jasny, ale jeśli się przyjrzysz, wszystko jest bardzo łatwe do obliczenia:

  • n to liczba cech lub wskaźników objętych rankingiem.
  • d jest różnicą między pewnymi dwoma rangami odpowiadającymi dwóm konkretnym zmiennym każdego przedmiotu.
  • ∑d 2 jest sumą wszystkich kwadratów różnic rang cech, których kwadraty są obliczane oddzielnie dla każdej rangi.

Zakres matematycznej miary połączenia

Aby zastosować współczynnik rangi, konieczne jest uszeregowanie danych ilościowych cechy, czyli przypisanie im określonej liczby w zależności od miejsca występowania cechy i jej wartości. Udowodniono, że dwa rzędy znaków wyrażone w postaci liczbowej są do siebie nieco równoległe. Współczynnik korelacji rang Spearmana określa stopień tej równoległości, szczelność związku cech.

Aby operacja matematyczna obliczyła i określiła związek cech przy użyciu określonego współczynnika, należy wykonać pewne czynności:

  1. Każdej wartości dowolnego podmiotu lub zjawiska przypisuje się numer w kolejności - rangę. Może odpowiadać wartości zjawiska w kolejności rosnącej i malejącej.
  2. Następnie porównuje się rangi wartości znaków dwóch szeregów ilościowych w celu określenia różnicy między nimi.
  3. W osobnej kolumnie tabeli dla każdej uzyskanej różnicy zapisano jej kwadrat, a wyniki podsumowano poniżej.
  4. Po tych krokach stosowany jest wzór, według którego obliczany jest współczynnik korelacji Spearmana.

Własności współczynnika korelacji

Główne właściwości współczynnika Spearmana obejmują:

  • Pomiar wartości pomiędzy -1 a 1.
  • Znak współczynnika interpretacji nie ma.
  • O bliskości połączenia decyduje zasada: im wyższa wartość, tym bliższe połączenie.

Jak sprawdzić otrzymaną wartość?

Aby sprawdzić związek między znakami, musisz wykonać pewne czynności:

  1. Stawiana jest hipoteza zerowa (H0), która jest jednocześnie hipotezą główną, a następnie formułowana jest kolejna, alternatywna w stosunku do pierwszej (H 1). Pierwsza hipoteza byłaby taka, że ​​współczynnik korelacji Spearmana wynosi 0, co oznacza, że ​​nie będzie żadnego połączenia. Drugi natomiast mówi, że współczynnik nie jest równy 0, wtedy istnieje połączenie.
  2. Następnym krokiem jest znalezienie obserwowanej wartości kryterium. Można go znaleźć za pomocą podstawowego wzoru na współczynnik Spearmana.
  3. Następnie znajdują się wartości krytyczne danego kryterium. Można to zrobić jedynie za pomocą specjalnej tabeli, która wyświetla różne wartości dla danych wskaźników: poziom istotności (l) i liczbę wyznaczającą (n).
  4. Teraz musimy porównać dwie otrzymane wartości: ustaloną obserwowalną i krytyczną. Aby to zrobić, musisz zbudować region krytyczny. Należy narysować linię prostą, zaznaczyć na niej punkty wartości krytycznej współczynnika znakiem „-” i znakiem „+”. Na lewo i na prawo od wartości krytycznych obszary krytyczne są wykreślone półkolami od punktów. Pośrodku, łącząc dwie wartości, zaznaczono go półkolem OPG.
  5. Następnie wyciąga się wniosek o szczelności związku między obiema cechami.

Gdzie najlepiej zastosować tę wartość?

Pierwszą nauką, w której aktywnie wykorzystano ten współczynnik, była psychologia. Przecież jest to nauka, która nie opiera się na liczbach, jednak aby udowodnić jakiekolwiek istotne hipotezy dotyczące rozwoju relacji, cech charakteru ludzi, wiedzy uczniów, wymagane jest statystyczne potwierdzenie wniosków. Wykorzystuje się go także w gospodarce, w szczególności w transakcjach walutowych. Tutaj oceniane są funkcje bez statystyk. Współczynnik korelacji rang Spearmana jest bardzo wygodny w tym obszarze zastosowań, ponieważ ocena dokonywana jest niezależnie od rozkładu zmiennych, ponieważ są one zastępowane liczbą rang. Współczynnik Spearmana jest aktywnie wykorzystywany w bankowości. W swoich badaniach wykorzystują ją także socjologia, politologia, demografia i inne nauki. Wyniki uzyskuje się szybko i tak dokładnie, jak to możliwe.

Wygodnie i szybko wykorzystaj współczynnik korelacji Spearmana w Excelu. Istnieją tutaj specjalne funkcje, które pomogą Ci szybko uzyskać niezbędne wartości.

Jakie inne współczynniki korelacji istnieją?

Oprócz tego, czego dowiedzieliśmy się o współczynniku korelacji Spearmana, istnieją również różne współczynniki korelacji, które pozwalają mierzyć, oceniać cechy jakościowe, związek między cechami ilościowymi, stopień bliskości związku między nimi, przedstawiony w skali rang. Są to takie współczynniki, jak bis-serial, rank-bis-serial, treść, skojarzenia i tak dalej. Współczynnik Spearmana bardzo dokładnie pokazuje szczelność połączenia, w przeciwieństwie do wszystkich innych metod jego matematycznego wyznaczania.