Kritik Spearman Sıra Korelasyon Değerleri. Spearman ve pearson korelasyonunun uygulanması

37. Spearman's rank korelasyon katsayısı.

S. 56 (64) 063.JPG

http://psystat.at.ua/publ/1-1-0-33

Spearman'ın sıra korelasyon katsayısı şu durumlarda kullanılır:
- değişkenler var sıralama ölçeğiölçümler;
- veri dağılımı çok farklı normal ya da hiç bilinmiyor
- örnekler küçüktür (N< 30).

Spearman'ın sıra korelasyon katsayısının yorumu, Pearson katsayısından farklı değildir, ancak anlamı biraz farklıdır. Bu yöntemler arasındaki farkı anlamak ve uygulama alanlarını mantıksal olarak doğrulamak için formüllerini karşılaştıralım.

Pearson korelasyon katsayısı:

Spearman korelasyon katsayısı:

Gördüğünüz gibi, formüller önemli ölçüde farklıdır. Formülleri Karşılaştır

Pearson korelasyon formülü, ilişkili serilerin aritmetik ortalamasını ve standart sapmasını kullanırken, Spearman formülü kullanmaz. Bu nedenle, Pearson formülüne göre yeterli bir sonuç elde etmek için, ilişkili serilerin normal dağılıma yakın olması gerekir (ortalama ve standart sapma, normal dağılım parametreleri). Spearman formülü için bu önemli değil.

Pearson formülünün bir unsuru, her serinin standartlaştırılmasıdır. z-puanı.

Gördüğünüz gibi, değişkenlerin Z ölçeğine dönüştürülmesi Pearson korelasyon katsayısı formülünde mevcuttur. Buna göre, Pearson katsayısı için verilerin ölçeği kesinlikle önemsizdir: örneğin, biri min. olan iki değişkeni ilişkilendirebiliriz. = 0 ve maks. = 1 ve ikinci min. = 100 ve maks. = 1000. Değer aralığı ne kadar farklı olursa olsun hepsi aynı skala ile standart z değerlerine çevrilecektir.

Spearman katsayısında böyle bir normalizasyon yoktur, dolayısıyla

SPEERMAN KATSAYISINI KULLANMAK İÇİN ZORUNLU ŞART, İKİ DEĞİŞKEN ARALIĞININ EŞİTLİĞİDİR.

Farklı aralıklara sahip veri serileri için Spearman katsayısını kullanmadan önce, rütbe. Sıralama, bu serilerin değerlerinin aynı minimum = 1 (minimum sıralama) ve değer sayısına eşit bir maksimum (maksimum, son sıralama = N, yani. örneklem).

Hangi durumlarda sıralama yapmadan yapmak mümkündür

Bunlar, verilerin orijinal olduğu durumlardır. sıralama ölçeği. Örneğin, Rokeach değer yönelimleri testi.

Ayrıca bunlar, değer seçeneklerinin sayısının az olduğu ve örneklemde sabit minimum ve maksimum değerlerinin olduğu durumlardır. Örneğin anlamsal diferansiyelde minimum = 1, maksimum = 7.

Spearman sıra korelasyon katsayısının hesaplanmasına bir örnek

Rokeach'in değer yönelimleri testi iki örnek X ve Y üzerinde gerçekleştirildi. Görev: Bu örneklerin değer hiyerarşilerinin ne kadar yakın olduğunu (kelimenin tam anlamıyla, ne kadar benzer olduklarını) bulmak.

Ortaya çıkan değer r=0.747'ye karşı kontrol edilir kritik değer tablosu. Tabloya göre N=18'de elde edilen değer p düzeyinde güvenilirdir.<=0,005

Spearman ve Kendal'a göre sıra korelasyon katsayıları

Sıralı ölçeğe ait değişkenler veya normal dağılım izlemeyen değişkenler ile aralık ölçeğine ait değişkenler için Pearson katsayısı yerine Spearman's rank korelasyonu hesaplanır. Bunu yapmak için, değişkenlerin bireysel değerlerine, daha sonra uygun formüller kullanılarak işlenen sıralama yerleri atanır. Sıra korelasyonunu ortaya çıkarmak için, İki Değişkenli Korelasyonlar... iletişim kutusundaki varsayılan Pearson korelasyon onay kutusunun işaretini kaldırın. Bunun yerine Spearman korelasyon hesaplamasını etkinleştirin. Bu hesaplama aşağıdaki sonuçları verecektir. Sıra korelasyon katsayıları, Pearson katsayılarının karşılık gelen değerlerine çok yakındır (orijinal değişkenler normal bir dağılıma sahiptir).

titkova-matmetody.pdf s. 45

Spearman's rank korelasyon yöntemi, sıkılığı (kuvvet) ve yönü belirlemenizi sağlar.

Arasındaki korelasyon iki işaret veya iki profil (hiyerarşiler) işaretler.

Sıra korelasyonunu hesaplamak için iki dizi değere sahip olmak gerekir,

hangi sıralanabilir. Bu değer aralıkları şunlar olabilir:

1) iki işaret aynı ölçülmüş grup test konuları;

2) iki ayrı özellik hiyerarşisi, aynı konu için iki konuda tanımlanmış

bir dizi özellik;

3) iki özelliklerin grup hiyerarşileri,

4) bireysel ve grupözellik hiyerarşisi.

İlk olarak, göstergeler özelliklerin her biri için ayrı ayrı sıralanır.

Kural olarak, bir özelliğin daha düşük değerine daha düşük bir sıra atanır.

İlk durumda (iki özellik), bireysel değerler birinciye göre sıralanır.

farklı denekler tarafından elde edilen özellik ve ardından ikincisi için bireysel değerler

işaret.

Eğer iki özellik pozitif olarak ilişkiliyse, o zaman düşük rütbeli denekler

bunlardan biri diğerinde düşük derecelere sahip olacak ve yüksek rütbeli denekler

özelliklerden biri, diğer özellik üzerinde de yüksek sıralara sahip olacaktır. rs saymak için

farkları belirlemek gerekir (d) her iki konuda da bu konularda elde edilen rütbeler arasında

işaretler. Daha sonra bu göstergeler d belirli bir şekilde dönüştürülür ve 1'den çıkarılır.

sıralar arasındaki fark ne kadar küçükse, rs o kadar büyük olur, +1'e o kadar yakın olur.

Korelasyon yoksa, tüm sıralar karıştırılacak ve hiçbir şey olmayacaktır.

maç yok. Formül, bu durumda rs 0'a yakın olacak şekilde tasarlanmıştır.

Negatif korelasyon durumunda tek bir temelde konuların düşük sıraları

başka bir özellikte yüksek sıralara karşılık gelir ve bunun tersi de geçerlidir. Daha fazla uyumsuzluk

iki değişkendeki denek sıraları arasında, rs -1'e ne kadar yakınsa.

İkinci durumda (iki ayrı profil), bireysel

2 konunun her birinin belirli bir değere göre elde ettiği değerler (onlar için aynı

her ikisi de) bir dizi özellik. İlk sıra, en düşük değere sahip özelliği alacak; ikinci sıra -

daha yüksek bir değere sahip bir işaret, vb. Açıkçası, tüm özellikler ölçülmelidir

aynı birimler, aksi takdirde sıralama imkansızdır. Örneğin, imkansız

göstergeleri Cattell Kişilik Anketine (16PF) göre sıralayın;

"ham" puanlar, çünkü farklı faktörler için değer aralıkları farklıdır: 0'dan 13'e, 0'dan

20 ve 0'dan 26'ya. Faktörlerden hangisinin birinci sırada yer alacağını söyleyemeyiz.

ciddiyet, tüm değerleri tek bir ölçeğe getirene kadar (çoğunlukla bu duvarların ölçeğidir).

İki konunun bireysel hiyerarşileri olumlu bir şekilde ilişkiliyse, işaretler

birinde düşük rütbeye sahip olmak, diğerinde düşük rütbeye sahip olacaktır ve bunun tersi de geçerlidir.

Örneğin, bir denek için E faktörü (baskınlık) en düşük sıraya sahipse, o zaman

başka bir konu, eğer bir konu C faktörüne sahipse düşük bir sıralamaya sahip olmalıdır.

(duygusal istikrar) en yüksek rütbeye sahipse, diğer denek de

bu faktörün yüksek bir sıralaması vardır, vb.

Üçüncü durumda (iki grup profili), ortalama grup değerleri sıralanır,

belirli bir konuya göre 2 grup halinde alınan, iki grup için aynı, set

işaretler. Aşağıda, akıl yürütme çizgisi önceki iki durumdakiyle aynıdır.

4. (bireysel ve grup profilleri) olması durumunda, ayrı ayrı sıralanırlar.

konunun bireysel değerleri ve aynı küme için ortalama grup değerleri

Kural olarak, bu bireysel konunun dışlanmasıyla elde edilen işaretler - o

bireyinin karşılaştırılacağı ortalama grup profiline katılmaz

profil. Sıra korelasyonu, bireyin ne kadar tutarlı olduğunu kontrol etmenizi sağlayacaktır.

grup profilleri.

Dört durumda da, elde edilen korelasyon katsayısının önemi şu şekilde belirlenir:

sıralanmış değerlerin sayısına göre N.İlk durumda, bu sayı ile çakışacaktır

örneklem büyüklüğü İkinci durumda, gözlem sayısı öznitelik sayısı olacaktır,

bir hiyerarşi oluşturuyor. Üçüncü ve dördüncü durumlarda, N aynı zamanda eşleşenlerin sayısıdır.

işaretler, gruplardaki denek sayısı değil. Ayrıntılı açıklamalar örneklerde verilmiştir. Eğer bir

rs'nin mutlak değeri kritik bir değere ulaşır veya onu aşar, korelasyon

güvenilir.

hipotezler.

İki olası hipotez vardır. Birincisi durum 1'e, ikincisi diğer üçüne atıfta bulunur.

Hipotezlerin ilk versiyonu

H0: A ve B değişkenleri arasındaki korelasyon sıfırdan farklı değil.

H2: A ve B değişkenleri arasındaki korelasyon sıfırdan önemli ölçüde farklıdır.

Hipotezlerin ikinci versiyonu

H0: A ve B hiyerarşileri arasındaki korelasyon sıfırdan farklı değil.

H2: A ve B hiyerarşileri arasındaki korelasyon sıfırdan önemli ölçüde farklıdır.

Sıra korelasyon katsayısının sınırlamaları

1. Her değişken için en az 5 gözlem sunulmalıdır. Üst

örnekleme limiti, mevcut kritik değerler tabloları tarafından belirlenir .

2. Spearman'ın sıra korelasyon katsayısı rs, çok sayıda özdeş

eşleşen değişkenlerden biri veya her ikisi için sıralar kaba değerler verir. ideal olarak

her iki ilişkili seri de eşleşmeyen iki dizi olmalıdır

değerler. Bu koşul karşılanmazsa, aşağıdakiler için bir ayar yapılmalıdır.

aynı sıralar.

Spearman'ın sıra korelasyon katsayısı şu formülle hesaplanır:

Karşılaştırılan her iki sıralama serisinde de aynı sıralara sahip gruplar varsa,

Sıra korelasyon katsayısını hesaplamadan önce aynısını düzeltmek gerekir.

Sıralar Ta ve Tv:

Ta \u003d Σ (a3 - a) / 12,

TV \u003d Σ (v3 - c) / 12,

nerede a - A sıra serisindeki her bir özdeş sıra grubunun hacmi, her birinin hacmi

B sıra serisindeki eşit sıra grupları.

rs'nin ampirik değerini hesaplamak için aşağıdaki formülü kullanın:

38. Noktalı ikili korelasyon katsayısı.

Genel olarak korelasyon için 36 numaralı soruya bakın. ile. 56 (64) 063.JPG

harchenko-korranaliz.pdf

X değişkeninin güçlü bir ölçekte ve Y değişkeninin ikili bir ölçekte ölçülmesine izin verin. Nokta çift seri korelasyon katsayısı rpb aşağıdaki formülle hesaplanır:

Burada x 1, Y için "bir" değerine sahip X nesneleri için ortalama değerdir;

x 0 - Y için "sıfır" değerine sahip X nesneleri için ortalama değer;

s x - X için tüm değerlerin standart sapması;

n 1 - Y'deki "bir" nesnelerin sayısı, n 0 - Y'deki "sıfır" nesnelerin sayısı;

n = n 1 + n 0 örneklem büyüklüğüdür.

Nokta çift seri korelasyon katsayısı, diğer eşdeğer ifadeler kullanılarak da hesaplanabilir:

burada x değişken için genel ortalama değerdir X.

Nokta Biserial Korelasyon Katsayısı rpb–1 ile +1 arasında değişir. Bir birimi olan değişkenlerin olması durumunda değeri sıfıra eşittir. Y bir ortalamaya sahip olmak Y, üzerinde sıfır olan değişkenlerin ortalamasına eşit Y.

muayene önem hipotezleri nokta ikili korelasyon katsayısı kontrol etmektir sıfır hipotezih 0, Öğrenci kriteri kullanılarak gerçekleştirilen genel korelasyon katsayısının sıfıra eşitliği hakkında: ρ = 0. ampirik değer

kritik değerlerle karşılaştırıldığında t a (df) serbestlik derecesi sayısı için df = n– 2

Eğer koşul | t| ≤ ta(df), sıfır hipotezi ρ = ​​0 reddedilmez. Ampirik değer | t| kritik bölgeye düşer, yani koşul | t| > ta(n– 2). Nokta çift seri korelasyon katsayısı kullanılarak hesaplanan ilişkinin güvenilirliği rpb, kriter kullanılarak da belirlenebilir χ 2 serbestlik derecesi sayısı için df= 2.

Nokta-iki seri korelasyon

Momentlerin çarpımının korelasyon katsayısının müteakip modifikasyonu noktalı-çift seriye yansıtılmıştır. r. Bu istatistik. biri sözde sürekli ve normal dağılımlı, diğeri ise kelimenin tam anlamıyla ayrık olan iki değişken arasındaki ilişkiyi gösterir. Nokta-iki seri korelasyon katsayısı ile gösterilir r pbisçünkü r pbis ikilik, ayrık değişkenin gerçek doğasını yansıtır ve durumda olduğu gibi yapay değildir r iki, işareti keyfi olarak belirlenir. Bu nedenle, tüm uygulamalar için hedefler r pbis 0.00 ile +1.00 arasında değerlendirilir.

İki değişkenin sürekli ve normal olarak dağıldığı kabul edildiğinde, ancak ikili korelasyon durumunda olduğu gibi her ikisinin de yapay olarak ikiye ayrıldığı böyle bir durum da vardır. Bu tür değişkenler arasındaki ilişkiyi değerlendirmek için tetrakorik korelasyon katsayısı kullanılır. r tet, ki bu da Pearson tarafından yetiştirildi. Ana (kesin) formüller ve hesaplama prosedürleri r tet oldukça karmaşıktır. Bu nedenle, pratik ile. bu yöntem yaklaşımları kullanır r tet kısaltılmış prosedürler ve tablolar temelinde elde edilir.

/online/dictionary/dictionary.php?term=511

NOKTALI BİSERİYEL KORELASYON KATSAYISI biri ikili ölçekte, diğeri ise aralık ölçeğinde ölçülen iki değişken arasındaki korelasyon katsayısıdır. Klasik ve modern testolojide, bir test görevinin kalitesinin bir göstergesi olarak kullanılır - genel test puanı ile güvenilirlik-tutarlılık.

Ölçülen değişkenleri ilişkilendirmek için ikili ve aralıklı ölçek kullanmak nokta-iki seri korelasyon katsayısı.
Nokta-iki seri korelasyon katsayısı, biri isim ölçeğinde ölçülen ve sadece 2 değer alan (örneğin, erkek / kadın, cevap doğru / cevap olan) değişkenlerin oranının korelasyon analizi yöntemidir. yanlış, işaret var / işaret yok) ve ikincisi ölçek oranlarında veya aralık ölçeğinde. Nokta-iki seri korelasyon katsayısını hesaplama formülü:

Neresi:
m1 ve m0, Y'de 1 veya 0 değeri olan X'in ortalama değerleridir.
σx, X için tüm değerlerin standart sapmasıdır
n1 ,n0 - 1 veya 0'dan Y'ye kadar X değerlerinin sayısı.
n, toplam değer çifti sayısıdır

Çoğu zaman, bu tür bir korelasyon katsayısı, test öğelerinin bir özet ölçekle ilişkisini hesaplamak için kullanılır. Bu, bir tür doğrulama denetimidir.

39. Sıra-iki seri korelasyon katsayısı.

Genel olarak korelasyon için 36 numaralı soruya bakın. ile. 56 (64) 063.JPG

harchenko-korranaliz.pdf s. 28

Değişkenlerden biri ( X) sıralı bir ölçekte sunulur ve diğeri ( Y) - formülle hesaplanan ikili olarak

.

Burada, içinde birliğe sahip nesnelerin ortalama sıralamasıdır. Y; içinde sıfır olan nesnelerin ortalama sıralamasıdır. Y, nörnek boyutudur.

muayene önem hipotezleri sıra-çift seri korelasyon katsayısı, formüllerde yer değiştirme ile Student t-testi kullanılarak nokta ikili korelasyon katsayısına benzer şekilde gerçekleştirilir. rpbüzerinde rrb.

Bir değişken ikili bir ölçekte ölçüldüğünde (değişken x), ve diğeri sıra ölçeğinde (Y değişkeni), sıra-çift seri korelasyon katsayısı kullanılarak. değişken olduğunu hatırlıyoruz. x, ikili bir ölçekte ölçülür, sadece 0 ve 1 değerini (kodları) alır. Özellikle vurgulayalım: bu katsayının -1 ile +1 arasında değişmesine rağmen, işaretinin yorumlanması için önemli değildir. Sonuçlar. Bu, genel kuralın başka bir istisnasıdır.

Bu katsayının hesaplanması aşağıdaki formüle göre yapılır:

nerede ` X 1 değişkenin bu öğeleri üzerinde ortalama sıralama Y, değişkendeki koda (özellik) 1 karşılık gelir X;

`X 0 – değişkenin bu unsurları için ortalama sıralama Y, değişkendeki 0 koduna (özellik) karşılık gelir X\

N- değişkendeki toplam eleman sayısı x.

Sıra-iki seri korelasyon katsayısını uygulamak için aşağıdaki koşulların karşılanması gerekir:

1. Karşılaştırılan değişkenler farklı ölçeklerde ölçülmelidir: bir X- ikili ölçekte; bir diğeri E- sıralama ölçeğinde.

2. Karşılaştırılan değişkenlerdeki değişen özelliklerin sayısı X ve Y aynı olmalıdır.

3. Sıra-çift seri korelasyon katsayısının güvenilirlik seviyesini değerlendirmek için, formül (11.9) ve Öğrenci testi için kritik değerler tablosu aşağıdaki durumlarda kullanılmalıdır. k = n - 2.

http://psystat.at.ua/publ/drugie_vidy_koehfficienta_korreljacii/1-1-0-38

Değişkenlerden birinin mevcut olduğu durumlar ikili ölçek, ve diğer sıra (sıra), kullanımını gerektirir sıra-iki seri korelasyon katsayısı:

rpb=2 / n * (m1 - m0)

nerede:
n, ölçüm nesnelerinin sayısıdır
m1 ve m0 - ikinci değişkende 1 veya 0 olan nesnelerin ortalama sıralaması.
Bu katsayı, testlerin geçerliliği kontrol edilirken de kullanılır.

40. Doğrusal korelasyon katsayısı.

Genel olarak korelasyon hakkında (ve özellikle lineer korelasyon hakkında), 36 numaralı soruya bakın ile. 56 (64) 063.JPG

Bay PEARSON'UN KORELASYON KATSAYISI

r-Pearson (Pearson r) iki metrik arasındaki ilişkiyi incelemek için kullanılıraynı örnek üzerinde ölçülen diğer değişkenler. Kullanmanın uygun olduğu birçok durum vardır. Zeka, son üniversite yıllarında performansı etkiler mi? Bir çalışanın maaşının büyüklüğü, meslektaşlarına karşı iyi niyetiyle bağlantılı mı? Bir öğrencinin ruh hali, karmaşık bir aritmetik problemini çözme başarısını etkiler mi? Bu tür soruları yanıtlamak için araştırmacı, örneklemin her bir üyesine yönelik iki ilgi göstergesini ölçmelidir. İlişkiyi incelemek için veriler, aşağıdaki örnekte olduğu gibi tablo haline getirilir.

ÖRNEK 6.1

Tablo, 8. sınıftaki 20 öğrencide iki zeka göstergesi (sözlü ve sözlü olmayan) için ilk ölçüm verilerinin bir örneğini göstermektedir.

Bu değişkenler arasındaki ilişki bir dağılım diyagramı kullanılarak gösterilebilir (bkz. Şekil 6.3). Diyagram, ölçülen göstergeler arasında bir ilişki olduğunu göstermektedir: Sözel zekanın değeri ne kadar büyükse, (esas olarak) sözel olmayan zekanın değeri de o kadar büyüktür.

Korelasyon katsayısı formülünü vermeden önce, Örnek 6.1'deki verileri kullanarak oluşum mantığını izlemeye çalışalım. Dağılım diyagramındaki diğer noktalara (Şekil 6.3) göre her bir / noktasının (sayı / ile konu) konumu, değişkenlerin karşılık gelen değerlerinin kendi değerlerinden sapmalarının büyüklükleri ve işaretleri ile verilebilir. ortalama değerler: (xj - MJ ve (akıl de ). Bu sapmaların işaretleri çakışırsa, bu olumlu bir ilişkinin lehine olduğunu gösterir (büyük değerler için X büyük değerlere karşılık gelir de veya daha küçük değerler için X daha küçük değerlere karşılık gelir y).

1 numaralı konu için ortalamadan sapma X ve tarafından de pozitiftir ve 3 numaralı konu için her iki sapma da negatiftir. Sonuç olarak, her ikisinin verileri de çalışılan özellikler arasında pozitif bir ilişki olduğunu göstermektedir. Aksine, ortalamadan sapma belirtileri varsa X ve tarafından de farklıysa, bu işaretler arasında olumsuz bir ilişki olduğunu gösterecektir. Böylece, 4 numaralı konu için ortalamadan sapma X göre olumsuz y - pozitif ve 9 numaralı konu için - tam tersi.

Böylece, eğer sapmaların ürünü (x, - M X ) X (akıl de ) pozitifse, /-subject verileri doğrudan (pozitif) bir ilişkiyi ve negatifse, ters (negatif) bir ilişkiyi gösterir. Buna göre, eğer XwyÇoğunlukla doğru orantılıysa, sapmaların ürünlerinin çoğu pozitif olacak ve eğer ters orantılıysa, ürünlerin çoğu negatif olacaktır. Bu nedenle, belirli bir numune için tüm sapma ürünlerinin toplamı, ilişkinin gücü ve yönü için genel bir gösterge işlevi görebilir:

Değişkenler arasında doğrudan orantılı bir ilişki ile, bu değer büyük ve pozitiftir - deneklerin çoğu için sapmalar işarette çakışır (bir değişkenin büyük değerleri, diğer değişkenin büyük değerlerine karşılık gelir ve bunun tersi de geçerlidir). Eğer X ve de geri bildirim var, o zaman çoğu konu için, bir değişkenin büyük değerleri başka bir değişkenin daha küçük değerlerine karşılık gelecektir, yani ürünlerin işaretleri negatif olacak ve bir bütün olarak ürünlerin toplamı da büyük olacaktır. mutlak değerde, ancak işarette negatif. Değişkenler arasında sistematik bir ilişki yoksa, pozitif terimler (sapmaların ürünleri) negatif terimlerle dengelenecek ve tüm sapma ürünlerinin toplamı sıfıra yakın olacaktır.

Ürünlerin toplamının numune boyutuna bağlı olmaması için ortalamasını almak yeterlidir. Ancak, ilişkinin ölçüsüyle genel bir parametre olarak değil, bunun hesaplanmış bir tahmini - istatistik olarak ilgileniyoruz. Bu nedenle, dağılım formülüne gelince, bu durumda aynısını yapacağız, sapma ürünlerinin toplamını şuna değil, böleceğiz. N, ve TV'de - 1. Fizik ve teknik bilimlerde yaygın olarak kullanılan, adı verilen bir iletişim ölçüsü ortaya çıkıyor. kovaryans (kovaance):


AT psikoloji, fizikten farklı olarak, psikologlar özelliğin mutlak değeriyle değil, deneklerin gruptaki göreceli konumuyla ilgilendikleri için çoğu değişken keyfi ölçeklerde ölçülür. Ayrıca kovaryans, özelliklerin ölçüldüğü ölçeğe (dağılım) çok duyarlıdır. İletişim ölçümünü her iki özelliğin ölçüm birimlerinden bağımsız hale getirmek için kovaryansı ilgili standart sapmalara bölmek yeterlidir. Böylece elde edildi için-K. Pearson korelasyon katsayısı katırı:

veya, o x için ifadeleri değiştirdikten sonra ve


Her iki değişkenin değerleri formül kullanılarak r değerlerine dönüştürülmüşse


o zaman r-Pearson korelasyon katsayısı formülü daha basit görünür (071.JPG):

/dict/sosyoloji/makale/soc/soc-0525.htm

KORELASYON DOĞRUSAL- iki nicel değişken arasındaki istatistiksel nedensel olmayan doğrusal ilişki X ve de. "K.L faktörü" kullanılarak ölçülmüştür. Kovaryansın her iki değişkenin standart sapmalarına bölünmesinin sonucu olan Pearson:

,

nerede s xy- değişkenler arasındaki kovaryans X ve de;

s x , s y- değişkenler için standart sapmalar X ve de;

x ben , y ben- değişken değerler X ve de nesne numarası için ben;

x, y- değişkenler için aritmetik ortalamalar X ve de.

Pearson oranı r[-1; +1]. Anlam r = 0 değişkenler arasında doğrusal bir ilişki olmadığı anlamına gelir X ve de(ancak doğrusal olmayan istatistiksel bir ilişkiyi dışlamaz). Pozitif katsayı değerleri ( r> 0) doğrudan doğrusal bir ilişkiyi belirtir; değeri +1'e ne kadar yakınsa, istatistiksel doğrudan ilişki o kadar güçlüdür. Negatif katsayı değerleri ( r < 0) свидетельствуют об обратной линейной связи; чем ближе его значение к -1, тем сильнее обратная связь. Значения r= ±1 doğrudan veya ters tam doğrusal bağlantının varlığı anlamına gelir. Tam bir bağlantı olması durumunda, koordinatlı tüm noktalar ( x ben , y ben) düz bir çizgide uzanmak y = a + sevgili.

"K.L katsayısı" Pearson, doğrusal çift regresyon modelindeki ilişkinin sıkılığını ölçmek için de kullanılır.

41. Korelasyon matrisi ve korelasyon grafiği.

Genel olarak korelasyon için 36 numaralı soruya bakın. ile. 56 (64) 063.JPG

korelasyon matrisi.Çoğu zaman, korelasyon analizi, iki değil, tek bir örnek üzerinde nicel bir ölçekte ölçülen birçok değişken arasındaki ilişkinin çalışmasını içerir. Bu durumda, bu değişken kümesinin her bir çifti için korelasyonlar hesaplanır. Hesaplamalar genellikle bir bilgisayarda yapılır ve sonuç bir korelasyon matrisidir.

korelasyon matrisi(korelasyon matris) kümeden her bir çift için aynı türdeki korelasyonların hesaplanmasının sonucudur. R bir örnek üzerinde nicel bir ölçekte ölçülen değişkenler.

MİSAL

5 değişken (vl, v2,..., v5; P= 5), bir numune üzerinde ölçülen N=30İnsan. Aşağıda bir başlangıç ​​verileri tablosu ve bir korelasyon matrisi bulunmaktadır.

Ve
Ilgili veriler:

Korelasyon matrisi:

Korelasyon matrisinin kare, ana köşegene göre simetrik (takkakg, y = /) y), ana köşegen üzerindeki birimlerle (çünkü G ve = Gu = 1).

korelasyon matrisi Meydan: satır ve sütun sayısı değişken sayısına eşittir. O simetrik korelasyon olduğundan, ana köşegene göre X ile de korelasyona eşittir de ile X. Bir özelliğin kendisiyle korelasyonu bire eşit olduğundan, birimler ana köşegeninde bulunur. Sonuç olarak, korelasyon matrisinin tüm elemanları analize tabi değildir, ancak ana köşegenin üstünde veya altında olanlar analize tabidir.

Korelasyon katsayılarının sayısı,İlişkiler çalışmasında analiz edilecek P özellikleri aşağıdaki formülle belirlenir: P(P- 1)/2. Yukarıdaki örnekte, bu tür korelasyon katsayılarının sayısı 5(5 - 1)/2 = 10'dur.

Korelasyon matrisini analiz etmenin ana görevi, bir dizi özelliğin karşılıklı ilişkilerinin yapısını ortaya çıkarmak. Bu görsel analize izin verir korelasyon ülkeleri- grafik görüntü istatistiksel olarak yapılarönemli bağlantılar bu tür çok fazla bağlantı yoksa (10-15'e kadar). Diğer bir yol da çok değişkenli yöntemler kullanmaktır: çoklu regresyon, faktöriyel veya küme analizi ("Çok değişkenli yöntemler..." bölümüne bakın). Faktöriyel veya küme analizini kullanarak, diğer değişkenlerden daha yakından ilişkili olan değişken gruplarını belirlemek mümkündür. Bu yöntemlerin bir kombinasyonu da çok etkilidir, örneğin, birçok işaret varsa ve bunlar homojen değilse.

Korelasyonların karşılaştırılması - iki seçeneğe sahip olan korelasyon matrisini analiz etmek için ek bir görev. Korelasyon matrisinin bir satırındaki korelasyonları karşılaştırmak gerekirse (değişkenlerden biri için), bağımlı örnekler için karşılaştırma yöntemi uygulanır (s. 148-149). Farklı örnekler için hesaplanan aynı adlı korelasyonları karşılaştırırken, bağımsız örnekler için karşılaştırma yöntemi kullanılır (s. 147-148).

Karşılaştırma Yöntemleri korelasyonlar köşegenlerde korelasyon matrisi (rastgele bir sürecin durağanlığını değerlendirmek için) ve karşılaştırma birçok Farklı örnekler (homojenlikleri için) için elde edilen korelasyon matrisleri zaman alıcıdır ve bu kitabın kapsamı dışındadır. Bu yöntemlerle GV Sukhodolsky 1'in kitabından öğrenebilirsiniz.

Korelasyonların istatistiksel önemi sorunu. Sorun, istatistiksel hipotez test prosedürünün şunları içermesidir: 1-çoklu bir numune üzerinde yapılan testtir. Aynı yöntem uygulanırsa bir cok zaman, farklı değişkenlerle ilgili olsa bile, tamamen şans eseri bir sonuç elde etme olasılığı artar. Genel olarak, aynı hipotez test yöntemini tekrar edersek kez farklı değişkenler veya örneklerle ilgili olarak, o zaman a'nın yerleşik değeriyle, hipotezin onayını almamız garanti edilir. ahk vaka sayısı.

15 değişken için korelasyon matrisinin analiz edildiğini, yani 15(15-1)/2 = 105 korelasyon katsayısının hesaplandığını varsayalım. Hipotezleri test etmek için a = 0,05 düzeyi ayarlanır.Hipotezi 105 kez test ederek, bağlantının gerçekten var olup olmadığına bakılmaksızın, onayını beş kez (!) alacağız. Bunu bilerek ve diyelim ki 15 "istatistiksel olarak anlamlı" korelasyon katsayısı elde ettikten sonra, bunlardan hangilerinin tesadüfen elde edildiğini ve hangilerinin gerçek bir ilişkiyi yansıttığını söyleyebilir miyiz?

Kesin konuşmak gerekirse, istatistiksel bir karar vermek için, test edilen hipotez sayısı kadar a düzeyini azaltmak gerekir. Ancak bu pek tavsiye edilmez, çünkü gerçekten var olan bir bağlantıyı göz ardı etme (II. tip hata yapma) olasılığı tahmin edilemez bir şekilde artar.

Tek başına korelasyon matrisi yeterli bir temel değildiriçerdiği bireysel katsayılarla ilgili istatistiksel sonuçlar içinkorelasyonlar!

Bu sorunu çözmenin gerçekten ikna edici tek bir yolu vardır: numuneyi rastgele iki parçaya bölmek ve sadece numunenin her iki kısmında da istatistiksel olarak anlamlı olan korelasyonları hesaba katmak. Bir alternatif, çok değişkenli yöntemlerin (faktöriyel, küme veya çoklu regresyon analizi) kullanımı olabilir - istatistiksel olarak anlamlı şekilde ilişkili değişken gruplarının seçimi ve ardından yorumlanması için.

Eksik değerler sorunu. Verilerde eksik değerler varsa, korelasyon matrisini hesaplamak için iki seçenek mümkündür: a) değerlerin satır satır silinmesi (hariç tutmakvakalarliste halinde); b) değerlerin ikili olarak silinmesi (hariç tutmakvakalarikili). saat satır satır silme boşluklu gözlemlerde, değişkenlerden biri için en az bir eksik değeri olan nesne (özne) için tüm satır silinir. Bu yöntem, tüm katsayıların aynı nesne kümesinden hesaplanması anlamında "doğru" bir korelasyon matrisine yol açar. Ancak, değişkenlerde eksik değerler rastgele dağıtılırsa, bu yöntem dikkate alınan veri kümesinde hiçbir nesne kalmamasına neden olabilir (her satır en az bir eksik değer içerecektir). Bu durumdan kaçınmak için, adı verilen başka bir yöntem kullanın. ikili çıkarma Bu yöntem, yalnızca seçilen her bir değişken sütun çiftindeki boşlukları hesaba katar ve diğer değişkenlerdeki boşlukları yok sayar. Bir çift değişken için korelasyon, boşluk olmayan nesneler için hesaplanır. Çoğu durumda, özellikle boşlukların sayısı nispeten küçük olduğunda, örneğin %10 olduğunda ve boşluklar oldukça rastgele dağıldığında, bu yöntem ciddi hatalara yol açmaz. Ancak, bazen durum böyle değildir. Örneğin, tahminin sistematik önyargısında (kayması), boşlukların sistematik konumu "gizlenebilir" olabilir; bu, farklı alt kümeler (örneğin, farklı nesne alt grupları için) üzerine inşa edilen korelasyon katsayılarındaki farkın nedenidir. ). ile hesaplanan korelasyon matrisi ile ilgili başka bir problem çift ​​halde boşluk giderme, bu matrisi diğer analiz türlerinde (örneğin, çoklu regresyon veya faktör analizinde) kullanırken meydana gelir. "Doğru" bir korelasyon matrisinin belirli bir düzeyde tutarlılık ve çeşitli katsayıların "karşılıklılığı" ile kullanıldığını varsayarlar. "Kötü" (önyargılı) tahminlere sahip bir matris kullanmak, programın böyle bir matrisi analiz edememesine veya sonuçların hatalı olmasına neden olur. Bu nedenle, eksik verileri ortadan kaldırmak için ikili bir yöntem kullanılıyorsa, boşlukların dağılımında sistematik kalıpların olup olmadığını kontrol etmek gerekir.

Eksik verilerin ikili olarak ortadan kaldırılması, ortalamalarda ve varyanslarda (standart sapmalar) herhangi bir sistematik kaymaya yol açmazsa, bu istatistikler, boşlukları ortadan kaldırmak için doğrusal yöntemle hesaplananlara benzer olacaktır. Önemli bir fark varsa, tahminlerde bir kayma olduğunu varsaymak için sebep vardır. Örneğin, değişkenin değerlerinin ortalaması (veya standart sapması) ise ANCAK, değişkenle ilişkisinin hesaplanmasında kullanılan AT, değişkenin aynı değerlerinin ortalamasından (veya standart sapmasından) çok daha az ANCAK, C değişkeni ile korelasyonunu hesaplamak için kullanılmışsa, bu iki korelasyonu beklemek için her türlü neden vardır. (A-Bbiz) farklı veri alt kümelerine dayanmaktadır. Değişkenlerin değerlerindeki boşlukların rastgele olmayan konumlarından kaynaklanan korelasyonlarda kayma olacaktır.

Korelasyon ülkelerinin analizi. Korelasyon matrisinin elemanlarının istatistiksel önemi problemini çözdükten sonra, istatistiksel olarak anlamlı korelasyonlar, bir korelasyon pleiad veya pleiades şeklinde grafiksel olarak temsil edilebilir. Korelasyon galaksisi - köşelerden ve onları birbirine bağlayan çizgilerden oluşan bir şekildir. Köşeler özelliklere karşılık gelir ve genellikle sayılarla gösterilir - değişkenlerin sayıları. Çizgiler istatistiksel olarak anlamlı ilişkilere karşılık gelir ve ilişkinin işaretini ve bazen /j-anlamlılık düzeyini grafiksel olarak ifade eder.

Korelasyon galaksisi yansıtabilir Tümü Korelasyon matrisinin istatistiksel olarak anlamlı ilişkileri (bazen korelasyon grafiği ) veya yalnızca anlamlı olarak seçilmiş kısımları (örneğin, faktör analizi sonuçlarına göre bir faktöre karşılık gelir).

KORELASYON PLEIADI YAPMA ÖRNEĞİ


Mezunların devlet (nihai) sertifikasyonu için hazırlık: USE veri tabanının oluşturulması (konuları gösteren tüm kategorilerdeki USE katılımcılarının genel listesi) - konuların çakışması durumunda yedek günlerin dikkate alınması;

  • Çalışma planı (27)

    Karar

    2. Eğitim kurumunun, doğal ve matematiksel eğitim MOU orta okulu No. 4, Litvinovskaya, Chapaevskaya konularında içeriği iyileştirme ve kaliteyi değerlendirme faaliyetleri,

  • İncelenen özelliklerin ölçümlerinin bir sıra ölçeğinde gerçekleştirildiği veya ilişkinin biçiminin doğrusal olandan farklı olduğu durumlarda, iki rastgele değişken arasındaki ilişkinin incelenmesi sıra korelasyon katsayıları kullanılarak gerçekleştirilir. Spearman'ın sıra korelasyon katsayısını düşünün. Hesaplarken, örnek seçenekleri sıralamak (sıralamak) gerekir. Sıralama, deneysel verilerin artan veya azalan belirli bir sırada gruplandırılmasıdır.

    Sıralama işlemi aşağıdaki algoritmaya göre gerçekleştirilir:

    1. Daha düşük bir değere daha düşük bir sıra atanır. En yüksek değere, sıralanan değerlerin sayısına karşılık gelen bir sıra atanır. En düşük değere 1'e eşit bir sıra atanır. Örneğin, n=7 ise, ikinci kuralın öngördüğü durumlar dışında en yüksek değer 7 sıra numarasını alacaktır.

    2. Birkaç değer eşitse, o zaman, eşit olmasalar alacakları sıraların ortalaması olan bir sıraya atanır. Örnek olarak, 7 öğeden oluşan artan bir örneği düşünün: 22, 23, 25, 25, 25, 28, 30. 22 ve 23 değerleri bir kez oluşur, dolayısıyla sıraları sırasıyla R22=1 ve R23'e eşittir. =2. 25 değeri 3 kez oluşur. Bu değerler tekrarlanmazsa, sıraları 3, 4, 5'e eşit olacaktır. Bu nedenle, sıraları R25, 3, 4 ve 5'in aritmetik ortalamasına eşittir: . 28 ve 30 değerleri tekrarlamadığından sıraları sırasıyla R28=6 ve R30=7 şeklindedir. Son olarak, aşağıdaki yazışmalara sahibiz:

    3. Toplam rütbe miktarı, aşağıdaki formülle belirlenen hesaplananla eşleşmelidir:

    burada n, sıralanan değerlerin toplam sayısıdır.

    Gerçek ve hesaplanan sıra miktarları arasındaki tutarsızlık, sıraların hesaplanmasında veya bunların toplamında yapılan bir hatayı gösterecektir. Bu durumda, hatayı bulmanız ve düzeltmeniz gerekir.

    Spearman's rank korelasyon katsayısı, iki özellik veya iki özellik hiyerarşisi arasındaki ilişkinin gücünü ve yönünü belirlemenizi sağlayan bir yöntemdir. Sıra korelasyon katsayısının kullanımının bir takım sınırlamaları vardır:

    • a) Beklenen korelasyon monoton olmalıdır.
    • b) Numunelerin her birinin hacmi 5'e eşit veya daha büyük olmalıdır. Numunenin üst sınırını belirlemek için kritik değer tabloları kullanılır (Ek Tablo 3). Tablodaki maksimum n değeri 40'tır.
    • c) Analiz sırasında çok sayıda aynı sıranın oluşması muhtemeldir. Bu durumda bir değişiklik yapılması gerekir. En uygun durum, incelenen her iki numunenin iki uyumsuz değer dizisini temsil etmesidir.

    Bir korelasyon analizi yapmak için, araştırmacının sıralanabilecek iki örneğe sahip olması gerekir, örneğin:

    • - aynı denek grubunda ölçülen iki işaret;
    • - aynı özellik kümesi için iki denekte tanımlanan iki bireysel özellik hiyerarşisi;
    • - niteliklerin iki grup hiyerarşisi;
    • - işaretlerin bireysel ve grup hiyerarşileri.

    Hesaplamaya, incelenen göstergelerin her bir işaret için ayrı ayrı sıralanmasıyla başlıyoruz.

    Aynı denek grubunda ölçülen iki özelliğe sahip bir vakayı analiz edelim. İlk olarak bireysel değerler, farklı denekler tarafından elde edilen birinci niteliğe göre sıralanır ve ardından bireysel değerler ikinci özniteliğe göre sıralanır. Bir göstergenin alt sıraları başka bir göstergenin alt sıralarına karşılık geliyorsa ve bir göstergenin daha yüksek sıraları başka bir göstergenin daha yüksek sıralarına karşılık geliyorsa, o zaman iki özellik pozitif ilişkilidir. Bir göstergenin üst sıraları diğer bir göstergenin alt sıralarına karşılık geliyorsa, o zaman iki işaret negatif ilişkilidir. Rs'yi bulmak için, her konu için sıralar (d) arasındaki farkları belirleriz. Sıralar arasındaki fark ne kadar küçükse, sıra korelasyon katsayısı rs "+1" e o kadar yakın olacaktır. Herhangi bir ilişki yoksa, aralarında hiçbir yazışma olmayacak, dolayısıyla rs sıfıra yakın olacaktır. İki değişkendeki deneklerin sıraları arasındaki fark ne kadar büyük olursa, rs katsayısının değeri "-1" e o kadar yakın olacaktır. Bu nedenle, Spearman sıra korelasyon katsayısı, incelenen iki özellik arasındaki herhangi bir monoton ilişkinin bir ölçüsüdür.

    Aynı özellik kümesi için iki öznede tanımlanan iki ayrı özellik hiyerarşisini düşünün. Bu durumda, iki konunun her birinin belirli bir dizi özelliğe göre elde ettiği bireysel değerler sıralanır. En düşük değere sahip özelliğe ilk sıra atanmalıdır; daha yüksek bir değere sahip nitelik - ikinci sıra, vb. Tüm niteliklerin aynı birimlerde ölçülmesine özen gösterilmelidir. Örneğin, göstergeler farklı “fiyat” puanlarında ifade ediliyorsa, tüm değerler tek bir değere getirilinceye kadar faktörlerden hangisinin şiddet açısından ilk sırada yer alacağını belirlemek mümkün olmadığı için sıralamak imkansızdır. ölçek. Deneklerden birinde düşük sıraya sahip olan özelliklerin diğerinde de düşük sıraları varsa ve bunun tersi de, bireysel hiyerarşiler pozitif olarak ilişkilidir.

    İki grup özellik hiyerarşisi durumunda, iki denek grubunda elde edilen ortalama grup değerleri, incelenen gruplar için aynı özellik kümesine göre sıralanır. Ardından, önceki durumlarda verilen algoritmayı takip ediyoruz.

    Durumu bireysel ve grup özellikleri hiyerarşisi ile analiz edelim. Ortalama grup hiyerarşisine katılmayan özne hariç, öznenin bireysel değerlerini ve elde edilen aynı özelliklere göre ortalama grup değerlerini ayrı ayrı sıralayarak başlarlar. hiyerarşi onunla karşılaştırılacaktır. Sıra korelasyonu, bireysel ve grup özellikleri hiyerarşisi arasındaki tutarlılık derecesini değerlendirmeyi mümkün kılar.

    Yukarıda sıralanan durumlarda korelasyon katsayısının öneminin nasıl belirlendiğini ele alalım. İki özellik olması durumunda, örneklem büyüklüğüne göre belirlenecektir. İki ayrı özellik hiyerarşisi olması durumunda, önem, hiyerarşiye dahil edilen özelliklerin sayısına bağlıdır. Son iki durumda, önem, grupların büyüklüğüne göre değil, çalışılan özelliklerin sayısına göre belirlenir. Bu nedenle, her durumda rs'nin önemi, sıralanan değerlerin sayısı n ile belirlenir.

    Rs'nin istatistiksel önemini test ederken, farklı sıralı değerler ve farklı önem seviyeleri için derlenen sıra korelasyon katsayısının kritik değerlerinin tabloları kullanılır. rs'nin mutlak değeri kritik bir değere ulaşırsa veya onu aşarsa, korelasyon anlamlıdır.

    İlk seçenek (aynı denek grubunda ölçülen iki özelliği olan bir durum) düşünüldüğünde, aşağıdaki hipotezler mümkündür.

    H0: x ve y değişkenleri arasındaki korelasyon sıfırdan farklı değil.

    H1: x ve y değişkenleri arasındaki korelasyon sıfırdan önemli ölçüde farklıdır.

    Kalan üç durumdan herhangi biriyle çalışırsak, o zaman başka bir çift hipotez öne sürmemiz gerekir:

    H0: x ve y hiyerarşileri arasındaki korelasyon sıfır değildir.

    H1: x ve y hiyerarşileri arasındaki korelasyon sıfırdan önemli ölçüde farklıdır.

    Spearman sıra korelasyon katsayısı rs'nin hesaplanmasındaki eylemlerin sırası aşağıdaki gibidir.

    • - Hangi iki özelliğin veya iki özellik hiyerarşisinin eşleştirmeye x ve y değişkenleri olarak katılacağını belirleyin.
    • - Sıralama kurallarına göre en küçük değere rank 1 atayarak x değişkeninin değerlerini sıralayın. Sıraları, deneklerin veya işaretlerin numaralarına göre tablonun ilk sütununa yerleştirin.
    • - y değişkeninin değerlerini sıralayın. Sıraları, konu veya işaretlerin numaralarına göre tablonun ikinci sütununa yerleştirin.
    • - Tablonun her satırı için x ve y sıraları arasındaki d farklarını hesaplayın. Sonuçlar tablonun bir sonraki sütununa yerleştirilir.
    • - Farkların karesini (d2) hesaplayın. Elde edilen değerleri tablonun dördüncü sütununa yerleştirin.
    • - Farkların karelerinin toplamını hesapla? d2.
    • - Aynı sıralar oluşursa, düzeltmeleri hesaplayın:

    burada tx, x örneğindeki her eşit sıra grubunun hacmidir;

    ty, y örneğindeki her bir eşit sıra grubunun boyutudur.

    Aynı sıraların varlığına veya yokluğuna bağlı olarak sıra korelasyon katsayısını hesaplayın. Aynı sıraların yokluğunda, sıra korelasyon katsayısı rs aşağıdaki formül kullanılarak hesaplanır:

    Aynı sıraların varlığında, sıra korelasyon katsayısı rs aşağıdaki formül kullanılarak hesaplanır:

    nerede?d2 sıralar arasındaki farkların karelerinin toplamıdır;

    Tx ve Ty - aynı sıralar için düzeltmeler;

    n, sıralamaya katılan konu veya özelliklerin sayısıdır.

    Belirli sayıda konu için Ek'teki tablo 3'ten rs'nin kritik değerlerini belirleyin n. rs'nin kritik değerden az olmaması koşuluyla, korelasyon katsayısının sıfırdan önemli bir farkı gözlemlenecektir.

    parametrik olmayan yöntemlerde kullanılan, fenomenler arasındaki ilişkinin istatistiksel çalışmasının nicel bir değerlendirmesidir.

    Gösterge, sıralar arasında gözlemlenen farkların karesi toplamının bağlantı olmaması durumundan nasıl farklı olduğunu gösterir.

    Servis ataması. Bu çevrimiçi hesap makinesiyle şunları yapabilirsiniz:

    • Spearman's rank korelasyon katsayısının hesaplanması;
    • katsayı için güven aralığının hesaplanması ve öneminin değerlendirilmesi;

    Spearman's rank korelasyon katsayısı iletişimin yakınlığının değerlendirilmesinin göstergelerini ifade eder. Sıra korelasyon katsayısının yanı sıra diğer korelasyon katsayılarının ilişkisinin sıkılığının niteliksel bir özelliği, Chaddock ölçeği kullanılarak değerlendirilebilir.

    katsayı hesaplama aşağıdaki adımlardan oluşur:

    Spearman's rank korelasyon katsayısının özellikleri

    Uygulama alanı. Sıra korelasyon katsayısı iki küme arasındaki iletişimin kalitesini değerlendirmek için kullanılır. Ek olarak, değişken varyans için veriler analiz edilirken istatistiksel önemi kullanılır.

    Misal. X ve Y gözlemlenen değişkenlerin bir veri örneğinde:

    1. bir sıralama tablosu yapın;
    2. Spearman'ın sıra korelasyon katsayısını bulun ve 2a düzeyinde önemini test edin
    3. bağımlılığın doğasını değerlendirmek
    Karar. Y özelliğine ve X faktörüne dereceler atayın.
    XYsıra X, dxSıra Y, d y
    28 21 1 1
    30 25 2 2
    36 29 4 3
    40 31 5 4
    30 32 3 5
    46 34 6 6
    56 35 8 7
    54 38 7 8
    60 39 10 9
    56 41 9 10
    60 42 11 11
    68 44 12 12
    70 46 13 13
    76 50 14 14

    Sıra matrisi.
    sıra X, dxSıra Y, d y(dx - dy) 2
    1 1 0
    2 2 0
    4 3 1
    5 4 1
    3 5 4
    6 6 0
    8 7 1
    7 8 1
    10 9 1
    9 10 1
    11 11 0
    12 12 0
    13 13 0
    14 14 0
    105 105 10

    Sağlama toplamının hesaplanmasına dayalı olarak matris derlemesinin doğruluğunu kontrol etme:

    Matrisin sütunları üzerindeki toplamı birbirine ve sağlama toplamına eşittir, bu da matrisin doğru bir şekilde oluşturulduğu anlamına gelir.
    Formülü kullanarak Spearman's rank korelasyon katsayısını hesaplıyoruz.


    Y özelliği ile X faktörü arasındaki ilişki güçlü ve doğrudandır.
    Spearman's rank korelasyon katsayısının önemi
    Rakip hipotez H i altında genel Spearman sıra korelasyon katsayısının sıfıra eşitliği hakkında α anlamlılık düzeyinde sıfır hipotezini test etmek için. p ≠ 0, kritik noktayı hesaplamak gerekir:

    n, numune boyutudur; ρ, Spearman'ın örnek sıra korelasyon katsayısıdır: t(α, k), Student dağılımının kritik noktaları tablosundan α anlamlılık düzeyine ve sayı sayısına göre bulunan iki taraflı kritik bölgenin kritik noktasıdır. serbestlik derecesi k = n-2.
    Eğer |p|< Т kp - нет оснований отвергнуть нулевую гипотезу. Ранговая корреляционная связь между качественными признаками не значима. Если |p| >T kp - boş hipotez reddedilir. Nitel özellikler arasında önemli bir sıralama korelasyonu vardır.
    Student tablosuna göre t(α/2, k) = (0.1/2;12) = 1.782 buluyoruz

    T kp'den beri< ρ , то отклоняем гипотезу о равенстве 0 коэффициента ранговой корреляции Спирмена. Другими словами, коэффициент ранговой корреляции статистически - значим и ранговая корреляционная связь между оценками по двум тестам значимая.

    Aşağıdaki hesaplayıcı, Spearman'ın iki rastgele değişken arasındaki sıra korelasyon katsayısını hesaplar.Teorik kısım, hesaplayıcının altındaki geleneksel kısımdır.

    Ekle ithalat ihracat mode_edit silmek

    Rastgele değişkenlerin değişiklikleri

    ok_upwardok_downward ok_upwardok_downward
    Sayfa başına adet: 5 10 20 50 100 chevron_left chevron_right

    Rastgele değişkenlerin değişiklikleri

    Verileri içe aktar İçe aktarma hatası

    "Veri alanlarını ayırmak için aşağıdaki karakterlerden biri kullanılır: sekme, noktalı virgül (;) veya virgül(,)" Örnek: -50,5;-50,5

    Geri Al İptal

    Ondalık noktadan sonraki rakamlar: 4

    Hesaplamak

    Spearman korelasyon katsayısı

    Kaydetmek Paylaş uzantı

    Spearman'ın sıra korelasyon katsayısı hesaplama yöntemi aslında oldukça basittir.Pearson korelasyon katsayısına benzer, ancak yalnızca rastgele değişkenlerin ölçümü için değil, onların değerleri için tasarlanmıştır. sıralama değerleri.

    Sadece rank değerinin ne olduğunu ve tüm bunların neden gerekli olduğunu anlamamız gerekiyor.

    Bir varyasyon dizisinin elemanları artan veya azalan düzende düzenlenmişse, bu rütbe elemanın sıralı serideki numarası olacaktır.

    Örneğin, bir varyasyon serimiz var (17,26,5,14,21). Öğeleri azalan düzende "sıralayalım" (26,21,17,14,5). 26'nın 1, 21 - 2'nin sıralaması vb. Varyasyonlu sıralama değerleri dizisi şöyle görünecektir (3,1,5,4,2).

    yani Spearman katsayısı hesaplanırken ilk varyasyon serileri, varyasyonel sıralama değerleri serisine dönüştürülür ve daha sonra bunlara Pearson formülü uygulanır.
    .
    Bir incelik var - yinelenen değerlerin sırası, sıraların ortalaması olarak alınır. Yani, bir dizi için (17, 15, 14, 15) sıralama dizisi (1, 2.5, 4, 2.5) gibi görünecektir, çünkü ilk eleman 15'in sıralaması 2'dir ve ikinci sıra 3'tür, ve.

    Yinelenen değerlere, yani sıralama serisinin tüm değerlerine sahip değilseniz - 1 ile n arasındaki sayılar, Pearson formülü şu şekilde basitleştirilebilir:

    Bu arada, bu formül genellikle Spearman katsayısını hesaplama formülü olarak verilir.

    Değerlerin kendisinden rütbe değerlerine geçişin özü nedir?
    Sıralama değerlerinin korelasyonunu araştırırken, iki değişkenin bağımlılığının monotonik bir fonksiyon tarafından ne kadar iyi tanımlandığını bulabilirsiniz.

    Katsayının işareti, değişkenler arasındaki ilişkinin yönünü gösterir. Eğer işaret pozitifse, X'in artmasıyla Y değerleri artma eğilimindedir. İşaret negatifse, X'in artmasıyla Y değerleri azalma eğilimindedir. Katsayı 0 ise orada o zaman eğilim yok. Katsayı 1 veya -1'e eşitse, X ve Y arasındaki ilişki monotonik bir işlev görünümüne sahiptir, yani. X'in artmasıyla Y de artar ve bunun tersi de geçerlidir.

    Yani, bir değişkenin diğerinden sadece lineer ilişkisini tespit edebilen Pearson korelasyon katsayısının aksine, Spearman korelasyon katsayısı, doğrudan lineer ilişkinin ortaya çıkarılamadığı monotonik bağımlılığı tespit edebilir.

    İşte bir örnek.
    Bir örnekle açıklayayım. Diyelim ki y=10/x fonksiyonunu inceliyoruz.
    Aşağıdaki X ve Y ölçümlerine sahibiz
    {{1,10}, {5,2}, {10,1}, {20,0.5}, {100,0.1}}
    Bu veriler için Pearson korelasyon katsayısı -0.4686'ya eşittir, yani. ilişki zayıftır veya yoktur. Ve Spearman'ın korelasyon katsayısı kesinlikle -1'e eşittir, sanki araştırmacıya Y'nin X'e güçlü bir şekilde negatif monotonik bağımlılığı olduğunu ima ediyormuş gibi.

    K. Spearman tarafından önerilen sıraların korelasyon katsayısı, bir sıra ölçeğinde ölçülen değişkenler arasındaki ilişkinin parametrik olmayan göstergelerini ifade eder. Bu katsayı hesaplanırken, genel popülasyondaki özelliklerin dağılımının doğası hakkında herhangi bir varsayıma gerek yoktur. Bu katsayı, bu durumda karşılaştırılan değerlerin sıralarını temsil eden sıralı özelliklerin bağlantısının sıkılık derecesini belirler.

    Spearman'ın korelasyon katsayısının değeri de +1 ve -1 aralığındadır. Pearson katsayısı gibi, sıralama ölçeğinde ölçülen iki özellik arasındaki ilişkinin yönünü karakterize eden pozitif ve negatif olabilir.

    Prensip olarak, sıralanan özelliklerin sayısı (nitelikler, nitelikler vb.) herhangi biri olabilir, ancak 20'den fazla özelliği sıralama süreci zordur. Sıra korelasyon katsayısının kritik değerleri tablosunun sadece kırk sıralı özellik için hesaplanmasının nedeni bu olabilir (n< 40, табл. 20 приложения 6).

    Spearman'ın sıra korelasyon katsayısı şu formülle hesaplanır:

    n, sıralanan özelliklerin sayısıdır (göstergeler, konular);

    D, her konu için iki değişkendeki sıralar arasındaki farktır;

    Kare sıra farklarının toplamı.

    Sıra korelasyon katsayısını kullanarak aşağıdaki örneği inceleyin.

    Misal: Psikolog, 11 birinci sınıf öğrencisi için okula başlamadan önce elde edilen bireysel okula hazır bulunuşluk göstergelerinin ve okul yılının sonundaki ortalama performanslarının birbiriyle nasıl bağlantılı olduğunu öğrenir.

    Bu sorunu çözmek için, ilk olarak, okula girerken elde edilen okula hazır olma göstergelerinin değerlerini ve ikinci olarak, aynı öğrenciler için yıl sonundaki nihai performans göstergelerini ortalama olarak sıraladık. Sonuçlar Tabloda sunulmuştur. on üç.

    Tablo 13

    öğrenci sayısı

    Okula hazır olma göstergelerinin sıraları

    Ortalama yıllık performans sıralaması

    Elde edilen verileri formüle yerleştirip hesaplamayı yapıyoruz. Alırız:

    Önem düzeyini bulmak için Tablo'ya dönüyoruz. Sıra korelasyon katsayıları için kritik değerleri veren Ek 6'nın 20.

    Tabloda bunu vurguluyoruz. 20 Ek 6'nın yanı sıra Pearson'ın lineer korelasyon tablosunda korelasyon katsayılarının tüm değerleri mutlak değerde verilmiştir. Bu nedenle, korelasyon katsayısının işareti yalnızca yorumlanırken dikkate alınır.

    Bu tablodaki anlamlılık düzeylerinin bulunması n sayısına göre yani denek sayısına göre yapılmaktadır. Bizim durumumuzda, n = 11. Bu sayı için şunu buluruz:

    P 0.05 için 0.61

    P 0.01 için 0.76

    Karşılık gelen ``önem eksenini"" oluşturuyoruz:

    Elde edilen korelasyon katsayısı, %1'lik bir anlamlılık düzeyi için kritik değerle çakıştı. Bu nedenle, birinci sınıf öğrencilerinin okula hazır bulunuşluk göstergeleri ile son notları arasında pozitif bir ilişki olduğu söylenebilir - başka bir deyişle, okula hazır olma göstergesi ne kadar yüksekse, birinci sınıf öğrencisi o kadar iyi öğrenir. İstatistiksel hipotezler açısından, psikolog, benzerlik sıfır hipotezini reddetmeli ve okula hazır bulunuşluk ile ortalama performans arasındaki ilişkinin sıfır olmadığını söyleyen alternatif (fakat fark) hipotezini kabul etmelidir.

    Özdeş (eşit) sıra durumu

    Aynı sıraların varlığında, Spearman doğrusal korelasyon katsayısını hesaplama formülü biraz farklı olacaktır. Bu durumda, aynı sıralar dikkate alınarak korelasyon katsayılarının hesaplanması için formüle iki yeni terim eklenir. Aynı sıralar için düzeltmeler olarak adlandırılırlar ve hesaplama formülünün payına eklenirler.

    n, ilk sütundaki özdeş sıraların sayısıdır,

    k, ikinci sütundaki özdeş sıraların sayısıdır.

    Herhangi bir sütunda iki özdeş sıra grubu varsa, düzeltme formülü biraz daha karmaşık hale gelir:

    n, sıralı sütunun ilk grubundaki eşit sıra sayısıdır,

    k, sıralı sütunun ikinci grubundaki eşit sıra sayısıdır. Genel durumda formülün modifikasyonu aşağıdaki gibidir:

    Misal: Bir psikolog, zihinsel gelişim testi (İSTUR) kullanarak 9. sınıftaki 12 öğrencide zeka çalışması yürütür. Aynı zamanda edebiyat ve matematik öğretmenlerinden aynı öğrencileri zihinsel gelişim göstergelerine göre sıralamalarını ister. Görev, zihinsel gelişimin nesnel göstergelerinin (CYBE verileri) ve öğretmenlerin uzman değerlendirmelerinin nasıl ilişkili olduğunu belirlemektir.

    Bu problemin deneysel verileri ve Spearman korelasyon katsayısının hesaplanması için gerekli ek sütunlar bir tablo şeklinde sunulmuştur. on dört.

    Tablo 14

    öğrenci sayısı

    SHTUR yardımıyla test sıralamaları

    Matematikte öğretmenlerin uzman değerlendirmeleri

    Literatürde öğretmenlerin uzman değerlendirmeleri

    D (ikinci ve üçüncü sütunlar)

    D (ikinci ve dördüncü sütunlar)

    (ikinci ve üçüncü sütunlar)

    (ikinci ve dördüncü sütunlar)

    Sıralama aynı sıraları kullandığından, tablonun ikinci, üçüncü ve dördüncü sütunlarındaki sıralamanın doğruluğunu kontrol etmek gerekir. Bu sütunların her birindeki toplam aynı toplamı verir - 78.

    Hesaplama formülüne göre kontrol ediyoruz. Çek şunları verir:

    Tablonun beşinci ve altıncı sütunları, her öğrenci için STUD testinde psikoloğun uzman değerlendirmeleri ile matematik ve edebiyatta sırasıyla öğretmenlerin uzman değerlendirmelerinin değerleri arasındaki sıralama farkının değerlerini göstermektedir. . Sıra farklarının toplamı sıfıra eşit olmalıdır. Beşinci ve altıncı sütunlardaki D değerlerinin toplamı istenilen sonucu verdi. Bu nedenle, sıraların çıkarılması doğru bir şekilde gerçekleştirildi. Karmaşık sıralama türleri gerçekleştirirken her seferinde benzer bir kontrol yapılmalıdır.

    Formülü kullanarak hesaplamaya başlamadan önce, tablonun ikinci, üçüncü ve dördüncü sütunları için aynı sıralar için düzeltmeleri hesaplamak gerekir.

    Bizim durumumuzda, tablonun ikinci sütununda iki özdeş sıra vardır, bu nedenle formüle göre D1 düzeltme değeri şöyle olacaktır:

    Üçüncü sütunda üç özdeş sıra vardır, bu nedenle formüle göre D2 düzeltme değeri şöyle olacaktır:

    Tablonun dördüncü sütununda, üç özdeş sıradan iki grup vardır, bu nedenle formüle göre D3 düzeltme değeri şöyle olacaktır:

    Sorunu çözmeye devam etmeden önce, psikologun iki soru bulduğunu hatırlayalım - matematik ve edebiyatta uzman değerlendirmeleriyle ilgili STUR testindeki sıraların değerleri nasıl. Bu nedenle hesaplama iki kez yapılır.

    Formüle göre katkı maddelerini dikkate alarak birinci sıra katsayısını dikkate alıyoruz. Alırız:

    Katkıyı hesaba katmadan hesaplayalım:

    Gördüğünüz gibi, korelasyon katsayılarının değerlerindeki fark çok önemsiz çıktı.

    Formüle göre katkı maddelerini dikkate alarak ikinci sıra katsayısını dikkate alıyoruz. Alırız:

    Katkıyı hesaba katmadan hesaplayalım:

    Yine, farklılıklar çok küçüktü. Tabloya göre her iki durumda da öğrenci sayısı aynı olduğu için. 20 Ek 6 Her iki korelasyon katsayısı için aynı anda n = 12'deki kritik değerleri buluyoruz.

    P 0.05 için 0.58

    P 0.01 için 0.73

    İlk değeri ``önem ekseni"" üzerine çizin:

    İlk durumda, elde edilen sıra korelasyon katsayısı anlamlılık bölgesindedir. Bu nedenle, psikolog, korelasyon katsayısının sıfıra benzer olduğu sıfır hipotezini reddetmeli ve korelasyon katsayısının sıfırdan önemli ölçüde farklı olduğu alternatif hipotezini kabul etmelidir. Başka bir deyişle, elde edilen sonuç, öğrencilerin STUD testinde uzman puanları ne kadar yüksekse, matematik alanındaki uzman puanlarının da o kadar yüksek olduğunu göstermektedir.

    İkinci değeri ``önem ekseni"" üzerine çizin:

    İkinci durumda, sıra korelasyon katsayısı belirsizlik bölgesindedir. Bu nedenle psikolog, korelasyon katsayısının sıfıra benzer olduğu sıfır hipotezini kabul edebilir ve korelasyon katsayısının sıfırdan önemli ölçüde farklı olduğu alternatif hipotezini reddedebilir. Bu durumda elde edilen sonuç, öğrencilerin STUD testine ilişkin uzman değerlendirmelerinin literatürdeki uzman değerlendirmeleriyle ilgili olmadığını göstermektedir.

    Spearman korelasyon katsayısını uygulamak için aşağıdaki koşulların karşılanması gerekir:

    1. Karşılaştırılan değişkenler sıralı (sıralı) bir ölçekte elde edilmelidir, ancak aynı zamanda bir aralık ve oran ölçeğinde de ölçülebilir.

    2. İlişkili değerlerin dağılımının doğası önemli değildir.

    3. Karşılaştırılan X ve Y değişkenlerindeki değişen özniteliklerin sayısı aynı olmalıdır.

    Spearman korelasyon katsayısının kritik değerlerini belirlemek için tablolar (Tablo 20, Ek 6) n = 5 ila n = 40'a eşit işaret sayısından ve daha fazla sayıda karşılaştırılan değişkenle, tablo için hesaplanır. Pearson korelasyon katsayısı kullanılmalıdır (Tablo 19, Ek 6). Kritik değerlerin bulunması k = n'de gerçekleştirilir.