Spearman korelasyon analizi, örneklerle pratik ticaret. Spearman sıra korelasyon katsayısını bulma örneği

parametrik olmayan yöntemlerde kullanılan, olaylar arasındaki ilişkinin istatistiksel çalışmasının niceliksel bir değerlendirmesidir.

Gösterge, gözlem sırasında elde edilen sıralar arasındaki farkların karelerinin toplamının, bağlantı olmaması durumundan ne kadar farklı olduğunu gösterir.

Hizmetin amacı. Bu çevrimiçi hesap makinesini kullanarak şunları yapabilirsiniz:

  • Spearman sıra korelasyon katsayısının hesaplanması;
  • katsayı için güven aralığının hesaplanması ve anlamlılığının değerlendirilmesi;

Spearman'ın sıra korelasyon katsayısı iletişimin yakınlığını değerlendirmeye yönelik göstergeleri ifade eder. Sıra korelasyon katsayısının yanı sıra diğer korelasyon katsayılarının bağlantısının yakınlığının niteliksel özelliği Chaddock ölçeği kullanılarak değerlendirilebilir.

Katsayının hesaplanması aşağıdaki adımlardan oluşur:

Spearman'ın sıra korelasyon katsayısının özellikleri

Uygulama alanı. Sıra korelasyon katsayısıİki popülasyon arasındaki iletişimin kalitesini değerlendirmek için kullanılır. Ek olarak, değişken varyans için veriler analiz edilirken istatistiksel anlamlılığı kullanılır.

Örnek. Gözlemlenen değişkenler X ve Y'nin bir örneğine dayanarak:

  1. bir sıralama tablosu oluşturun;
  2. Spearman'ın sıra korelasyon katsayısını bulun ve 2a düzeyindeki önemini kontrol edin
  3. bağımlılığın doğasını değerlendirmek
Çözüm. Y özelliğine ve X faktörüne dereceler atayalım.
Xesıra X, dxY sırası, d y
28 21 1 1
30 25 2 2
36 29 4 3
40 31 5 4
30 32 3 5
46 34 6 6
56 35 8 7
54 38 7 8
60 39 10 9
56 41 9 10
60 42 11 11
68 44 12 12
70 46 13 13
76 50 14 14

Sıra matrisi.
sıra X, dxY sırası, d y(d x - d y) 2
1 1 0
2 2 0
4 3 1
5 4 1
3 5 4
6 6 0
8 7 1
7 8 1
10 9 1
9 10 1
11 11 0
12 12 0
13 13 0
14 14 0
105 105 10

Sağlama toplamı hesaplamasına göre matrisin doğruluğunun kontrol edilmesi:

Matrisin sütunlarının toplamı birbirine ve sağlama toplamına eşittir, bu da matrisin doğru oluşturulduğu anlamına gelir.
Formülü kullanarak Spearman sıra korelasyon katsayısını hesaplıyoruz.


Y özelliği ile X faktörü arasındaki ilişki güçlü ve doğrudandır
Spearman'ın sıra korelasyon katsayısının önemi
α anlamlılık düzeyinde sıfır hipotezini test etmek için, genel Spearman sıra korelasyon katsayısının rakip hipotez Hi altında sıfıra eşit olduğu yönündedir. p ≠ 0 ise kritik noktayı hesaplamamız gerekir:

burada n örneklem büyüklüğüdür; ρ, örnek Spearman sıra korelasyon katsayısıdır: t(α, k), anlamlılık seviyesi α'ya ve sayıya göre Öğrenci dağılımının kritik noktaları tablosundan bulunan iki taraflı kritik bölgenin kritik noktasıdır. serbestlik derecesi k = n-2.
Eğer |p|< Т kp - нет оснований отвергнуть нулевую гипотезу. Ранговая корреляционная связь между качественными признаками не значима. Если |p| >T kp - sıfır hipotezi reddedildi. Niteliksel özellikler arasında anlamlı bir sıra korelasyonu vardır.
Öğrenci tablosunu kullanarak t(α/2, k) = (0,1/2;12) = 1,782'yi buluruz.

T kp'den beri< ρ , то отклоняем гипотезу о равенстве 0 коэффициента ранговой корреляции Спирмена. Другими словами, коэффициент ранговой корреляции статистически - значим и ранговая корреляционная связь между оценками по двум тестам значимая.

37. Spearman'ın sıra korelasyon katsayısı.

S.56 (64) 063.JPG

http://psystat.at.ua/publ/1-1-0-33

Spearman'ın sıra korelasyon katsayısı şu durumlarda kullanılır:
- değişkenler var sıralama ölçeğiölçümler;
- veri dağılımı şundan çok farklı: normal ya da hiç bilinmiyor;
- numunelerin hacmi küçük (N)< 30).

Spearman sıra korelasyon katsayısının yorumu Pearson katsayısından farklı değildir ancak anlamı biraz farklıdır. Bu yöntemler arasındaki farkı anlamak ve uygulama alanlarını mantıksal olarak doğrulamak için formüllerini karşılaştıralım.

Pearson korelasyon katsayısı:

Spearman korelasyon katsayısı:

Gördüğünüz gibi formüller önemli ölçüde farklılık gösteriyor. Formülleri karşılaştıralım

Pearson korelasyon formülü, ilişkili serilerin aritmetik ortalamasını ve standart sapmasını kullanır, ancak Spearman formülü bunu kullanmaz. Bu nedenle Pearson formülünü kullanarak yeterli bir sonuç elde etmek için ilişkili serilerin normal dağılıma yakın olması gerekir (ortalama ve standart sapma normal dağılım parametreleri). Bu Spearman formülüyle ilgili değildir.

Pearson formülünün bir unsuru da her serinin standardizasyonudur. z ölçeği.

Gördüğünüz gibi Pearson korelasyon katsayısı formülünde değişkenlerin Z ölçeğine dönüştürülmesi mevcut. Buna göre Pearson katsayısı için verinin ölçeğinin hiçbir önemi yok: örneğin iki değişkeni ilişkilendirebiliriz, bunlardan biri min. = 0 ve maks. = 1 ve ikinci dk. = 100 ve maks. = 1000. Değer aralığı ne kadar farklı olursa olsun hepsi aynı ölçekteki standart z değerlerine dönüştürülecektir.

Spearman katsayısında böyle bir normalizasyon oluşmaz, dolayısıyla

SPEARMAN KATSAYISININ KULLANILMASI İÇİN ZORUNLU BİR KOŞUL İKİ DEĞİŞKENİN ARALIĞININ EŞİTLİĞİDİR.

Farklı aralıklara sahip veri serileri için Spearman katsayısını kullanmadan önce, rütbe. Sıralama, bu serilerin değerlerinin aynı minimum = 1 (minimum sıra) ve değer sayısına eşit bir maksimum (maksimum, son sıra = N, yani örnekteki maksimum vaka sayısı) elde etmesiyle sonuçlanır. .

Hangi durumlarda sıralama yapmadan yapabilirsiniz?

Bunlar, verilerin başlangıçta sıralama ölçeği. Örneğin Rokeach'in değer yönelimleri testi.

Ayrıca bunlar, değer seçeneklerinin sayısının az olduğu ve numunenin sabit bir minimum ve maksimum içerdiği durumlardır. Örneğin anlamsal bir diferansiyelde minimum = 1, maksimum = 7.

Spearman'ın sıra korelasyon katsayısını hesaplama örneği

Rokeach'in değer yönelimleri testi iki X ve Y örneği üzerinde gerçekleştirildi. Amaç: Bu örneklerin değer hiyerarşilerinin ne kadar yakın olduğunu (kelimenin tam anlamıyla ne kadar benzer olduklarını) bulmak.

Ortaya çıkan değer r=0,747 şu şekilde kontrol edilir: kritik değerler tablosu. Tabloya göre N=18 ile elde edilen değer p düzeyinde anlamlıdır.<=0,005

Spearman ve Kendal sıra korelasyon katsayıları

Sıralı ölçeğe ait değişkenler veya normal dağılıma tabi olmayan değişkenler ile aralık ölçeğine ait değişkenler için Pearson katsayısı yerine Spearman sıra korelasyonu hesaplanır. Bunu yapmak için, bireysel değişken değerlerine, daha sonra uygun formüller kullanılarak işlenen sıralar atanır. Sıra korelasyonunu algılamak için, İki Değişkenli Korelasyonlar... iletişim kutusundaki varsayılan Pearson korelasyonu onay kutusunun işaretini kaldırın. Bunun yerine Spearman korelasyon hesaplamasını etkinleştirin. Bu hesaplama aşağıdaki sonuçları verecektir. Sıra korelasyon katsayıları, Pearson katsayılarının karşılık gelen değerlerine çok yakındır (orijinal değişkenler normal dağılıma sahiptir).

titkova-matmetody.pdf s. 45

Spearman'ın sıra korelasyon yöntemi sıkılığı (kuvvet) ve yönü belirlemenize olanak tanır

Arasındaki korelasyon iki işaret veya iki profil (hiyerarşiler) işaretler.

Sıra korelasyonunu hesaplamak için iki satır değere sahip olmak gerekir,

hangileri sıralanabilir? Bu tür değer dizileri şunlar olabilir:

1) iki işaret aynı şekilde ölçüldü grup konular;

2) iki ayrı özellik hiyerarşisi, aynı yöntemi kullanarak iki denekte tanımlandı

özellikler kümesi;

3) iki özelliklerin grup hiyerarşileri,

4) bireysel ve grupözelliklerin hiyerarşisi.

İlk olarak göstergeler her bir özellik için ayrı ayrı sıralanır.

Kural olarak, daha düşük bir nitelik değerine daha düşük bir sıralama atanır.

İlk durumda (iki özellik), bireysel değerler birinciye göre sıralanır.

farklı denekler tarafından elde edilen özellikler ve ardından ikincisi için bireysel değerler

imza.

Eğer iki özellik pozitif olarak ilişkiliyse, o zaman sıralaması düşük olan konular

bunlardan biri diğerinde düşük derecelere sahip olacak ve yüksek derecelere sahip konular

özelliklerden biri diğer özellik için de yüksek sıralamalara sahip olacaktır. Rs'yi hesaplamak için

Farklılıkların belirlenmesi gerekiyor (D) her ikisinde de belirli bir konunun elde ettiği sıralamalar arasında

işaretler. Daha sonra bu göstergeler d belirli bir şekilde dönüştürülerek 1'den çıkarılır.

Sıralar arasındaki fark ne kadar küçük olursa, rs o kadar büyük olur ve +1'e o kadar yakın olur.

Korelasyon yoksa tüm sıralar karışacak ve hiçbir sonuç kalmayacaktır.

yazışma yok. Formül bu durumda rs'nin 0'a yakın olacağı şekilde tasarlanmıştır.

Negatif korelasyon durumunda bir temelde konuların düşük sıraları

başka bir temelde yüksek rütbeler karşılık gelecektir ve bunun tersi de geçerlidir. Farklılık ne kadar büyük olursa

iki değişken üzerindeki deneklerin sıraları arasında, rs -1'e ne kadar yakınsa.

İkinci durumda (iki ayrı profil), bireysel olanlar sıralanır

2 deneğin her birinin belirli bir göre elde ettiği değerler (onlar için aynı)

her ikisi de) özellikler kümesi. İlk sıra en düşük değere sahip özelliğe verilecek; ikinci sıra –

daha yüksek değere sahip bir işaret vb. Açıkçası, tüm özellikler ölçülmelidir

aynı birimler, aksi takdirde sıralama mümkün değildir. Mesela imkansız

Cattell Kişilik Envanterindeki (16PF) göstergeleri şu şekilde ifade ediliyorsa sıralayın:

Farklı faktörler için değer aralıkları farklı olduğundan "ham" puanlar: 0'dan 13'e, 0'dan 13'e

20 ve 0'dan 26'ya kadar. Hangi faktörün ilk sırada yer alacağını söyleyemeyiz.

tüm değerleri tek bir ölçeğe getirene kadar ifade (çoğunlukla bu duvar ölçeğidir).

İki konunun bireysel hiyerarşileri pozitif olarak ilişkiliyse, o zaman işaretler

birinde düşük sıralamaya sahip olmak diğerinde de düşük sıralamaya sahip olacaktır ve bunun tersi de geçerlidir.

Örneğin, eğer bir deneğin E faktörü (baskınlık) en düşük sıraya sahipse, o zaman

Başka bir test deneği, eğer bir test deneği C faktörüne sahipse düşük bir sıralamaya sahip olmalıdır.

(duygusal istikrar) en yüksek sırada yer alıyorsa, diğer konunun da

bu faktörün yüksek bir sıralaması var vb.

Üçüncü durumda (iki grup profili), grup ortalama değerleri sıralanır,

her iki grup için de aynı olan, belirli bir sete göre 2 grup denekten elde edildi

işaretler. Bundan sonra, akıl yürütme çizgisi önceki iki durumdakiyle aynıdır.

4. durumda (bireysel ve grup profilleri), ayrı ayrı sıralanırlar

aynı set için konunun bireysel değerleri ve grup ortalama değerleri

kural olarak bu bireysel konuyu hariç tutarak elde edilen işaretler - o

Bireysel profilinin karşılaştırılacağı ortalama grup profiline katılmıyor

profil. Sıra korelasyonu, bireyin ve kişinin ne kadar tutarlı olduğunu kontrol etmenizi sağlayacaktır.

grup profilleri.

Her dört durumda da ortaya çıkan korelasyon katsayısının önemi belirlenir.

sıralanmış değerlerin sayısına göre N.İlk durumda, bu miktar şuna denk gelecektir:

örneklem büyüklüğü İkinci durumda gözlem sayısı özellik sayısı olacaktır,

hiyerarşiyi oluşturuyor. Üçüncü ve dördüncü durumlarda N aynı zamanda karşılaştırılanların sayısıdır.

gruplardaki deneklerin sayısı değil, özelliklerdir. Örneklerde ayrıntılı açıklamalar verilmiştir. Eğer

rs'nin mutlak değeri kritik bir değere ulaşır veya onu aşar, korelasyon

güvenilir.

Hipotezler.

İki olası hipotez vardır. Birincisi durum 1 için geçerlidir, ikincisi ise diğer üçü için geçerlidir

Hipotezlerin ilk versiyonu

H0: A ve B değişkenleri arasındaki korelasyon sıfırdan farklı değildir.

H2: A ve B değişkenleri arasındaki korelasyon sıfırdan anlamlı derecede farklıdır.

Hipotezlerin ikinci versiyonu

H0: A ve B hiyerarşileri arasındaki korelasyon sıfırdan farklı değildir.

H2: A ve B hiyerarşileri arasındaki korelasyon sıfırdan önemli ölçüde farklıdır.

Sıra korelasyon katsayısının sınırlamaları

1. Her değişken için en az 5 gözlem sunulmalıdır. Üst

örnekleme sınırı mevcut kritik değer tabloları tarafından belirlenir .

2. Çok sayıda özdeş durum için Spearman'ın sıra korelasyon katsayısı rs

Karşılaştırılan değişkenlerden biri veya her ikisi için sıralamalar kaba değerler verir. İdeal olarak

her iki ilişkili seri de birbirinden farklı iki diziyi temsil etmelidir

değerler. Bu koşulun sağlanamaması durumunda değişiklik yapılması gerekmektedir.

aynı rütbeler.

Spearman'ın sıra korelasyon katsayısı aşağıdaki formül kullanılarak hesaplanır:

Karşılaştırılan her iki sıra serisi de aynı sıradaki grupları içeriyorsa,

Sıra korelasyon katsayısını hesaplamadan önce aynı düzeltmelerin yapılması gerekir.

Ta ve TV sıralamaları:

Ta = Σ (a3 – a)/12,

Тв = Σ (в3 – в)/12,

Nerede A - A sıra serisindeki aynı sıralardan oluşan her grubun hacmi, her birinin hacmi

B sıra serisindeki aynı sıradaki gruplar.

Rs'nin ampirik değerini hesaplamak için aşağıdaki formülü kullanın:

38. Nokta-çift serili korelasyon katsayısı.

Genel olarak korelasyon hakkında 36 numaralı soruya bakınız.İle. 56 (64) 063.JPG

harchenko-korranaliz.pdf

X değişkeninin güçlü bir ölçekte ve Y değişkeninin ikili bir ölçekte ölçülmesine izin verin. Nokta çift serili korelasyon katsayısı rpb aşağıdaki formül kullanılarak hesaplanır:

Burada x 1, Y üzerinden “bir” değeriyle X nesneleri üzerindeki ortalama değerdir;

x 0 – Y üzerinde “sıfır” değeri olan X nesneleri üzerindeki ortalama değer;

s x – X boyunca tüm değerlerin standart sapması;

n 1 – Y'deki nesnelerin sayısı “bir”, n 0 – Y'deki “sıfır” nesnelerin sayısı;

n = n 1 + n 0 – örneklem büyüklüğü.

Nokta çift serili korelasyon katsayısı aynı zamanda diğer eşdeğer ifadeler kullanılarak da hesaplanabilir:

burada x– değişkenin genel ortalama değeri X.

Nokta çift serili korelasyon katsayısı rpb–1 ila +1 arasında değişir. Değişkenler bir ise değeri sıfırdır e ortalamaya sahip olmak e, sıfırın üzerinde değişkenlerin ortalamasına eşit e.

Sınav önem hipotezleri nokta çift serili korelasyon katsayısı kontrol etmektir sıfır hipoteziH 0 genel korelasyon katsayısının sıfıra eşitliği hakkında: ρ = 0, Öğrenci t testi kullanılarak gerçekleştirilir. Ampirik önem

kritik değerlerle karşılaştırıldığında T A (df) serbestlik derecesi sayısı için df = N– 2

Koşul | T| ≤ ta(df), ρ = 0 sıfır hipotezi reddedilmez. Nokta çift serili korelasyon katsayısı, ampirik değer | T| kritik bölgeye düşer, yani koşul | T| > ta(N– 2). Nokta çift serili korelasyon katsayısı kullanılarak hesaplanan ilişkinin güvenilirliği rpb kriteri kullanılarak da belirlenebilir. χ Serbestlik derecesi sayısı için 2 df= 2.

Nokta çift serili korelasyon

Momentlerin çarpımının korelasyon katsayısının müteakip modifikasyonu, çift serili noktaya yansıtıldı. R. Bu istatistik. Biri sürekli ve normal dağılımlı olduğu varsayılan, diğeri ise kelimenin tam anlamıyla ayrık olan iki değişken arasındaki ilişkiyi gösterir. Nokta çift serili korelasyon katsayısı şu şekilde gösterilir: R pbis Beri R pbis ikilik, ayrık değişkenin gerçek doğasını yansıtır ve şu durumda olduğu gibi yapay değildir: R bis işareti keyfi olarak belirlenir. Bu nedenle, tüm pratik amaçlar için. hedefler R pbis 0,00 ila +1,00 aralığında kabul edilir.

Ayrıca iki değişkenin sürekli ve normal dağılımlı olduğu varsayılır, ancak her ikisi de çift serili korelasyon durumunda olduğu gibi yapay olarak dikotomize edilir. Bu tür değişkenler arasındaki ilişkiyi değerlendirmek için tetrakorik korelasyon katsayısı kullanılır. R tet, aynı zamanda Pearson tarafından da yetiştirildi. Temel Hesaplama için (kesin) formüller ve prosedürler R tet oldukça karmaşık. Bu nedenle pratik olarak Bu yöntem yaklaşıkları kullanır R tet kısaltılmış prosedürler ve tablolar esas alınarak elde edilmiştir.

/on-line/dictionary/dictionary.php?term=511

NOKTA İKİ SERİLİ KATSAYISI biri ikili ölçekte, diğeri aralık ölçeğinde ölçülen iki değişken arasındaki korelasyon katsayısıdır. Klasik ve modern testlerde, bir test görevinin kalitesinin (güvenilirlik ve genel test puanıyla tutarlılık) bir göstergesi olarak kullanılır.

Ölçülen değişkenleri ilişkilendirmek için ikili ve aralık ölçeği kullanmak nokta-çift serili korelasyon katsayısı.
Nokta-çift serili korelasyon katsayısı, biri isim ölçeğinde ölçülen ve yalnızca 2 değer alan (örneğin, erkek/kadın, doğru cevap/yanlış cevap, özellik) değişkenlerin ilişkisinin korelasyon analizi yöntemidir. mevcut/mevcut değil) ve ikincisi ölçek oranlarında veya aralık ölçeğinde. Nokta-çift serili korelasyon katsayısını hesaplamak için formül:

Nerede:
m1 ve m0, Y'de 1 veya 0 değeri olan X'in ortalama değerleridir.
σx – tüm değerlerin X'e göre standart sapması
n1,n0 – 1 veya 0'dan Y'ye kadar olan X değerlerinin sayısı.
n – toplam değer çifti sayısı

Çoğu zaman, bu tür bir korelasyon katsayısı, test öğeleri ile toplam ölçek arasındaki ilişkiyi hesaplamak için kullanılır. Bu bir tür geçerlilik kontrolüdür.

39. Sıra-çift serili korelasyon katsayısı.

Genel olarak korelasyon hakkında 36 numaralı soruya bakınız.İle. 56 (64) 063.JPG

harchenko-korranaliz.pdf s. 28

Değişkenlerden birinin ( X) sıralı bir ölçekte sunulur ve diğeri ( e) – ikili, formülle hesaplanır

.

İşte bir tanesine sahip nesnelerin ortalama sıralaması e; – sıfır ila nesnelerin ortalama sıralaması e, N- örnek boyut.

Sınav önem hipotezleri Sıra-çift serili korelasyon katsayısı, formüllerde değişiklik yapılarak Öğrenci testi kullanılarak nokta çift serili korelasyon katsayısına benzer şekilde gerçekleştirilir. Rpb Açık Rrb.

Bir değişkenin ikili bir ölçekte ölçüldüğü durumlarda (değişken X), diğeri ise sıra ölçeğinde (değişken Y), sıra-çift serili korelasyon katsayısı kullanılır. değişken olduğunu hatırlıyoruz. X,İkili bir ölçekte ölçülen, yalnızca 0 ve 1 olmak üzere iki değer (kod) alır. Özellikle vurguluyoruz: bu katsayı -1 ila +1 aralığında değişmesine rağmen, işaretinin yorumlanması için önemli değil sonuçlar. Bu genel kuralın bir başka istisnasıdır.

Bu katsayı aşağıdaki formül kullanılarak hesaplanır:

nerede X 1 değişkenin bu unsurları için ortalama sıralama e değişkendeki kod (işaret) 1'e karşılık gelir X;

'X 0 – değişkenin bu unsurları için ortalama sıralama E, değişkendeki 0 koduna (işaretine) karşılık gelir X\

N - değişkendeki toplam öğe sayısı X.

Sıra-çift serili korelasyon katsayısını uygulamak için aşağıdaki koşulların karşılanması gerekir:

1. Karşılaştırılan değişkenler farklı ölçeklerde ölçülmelidir: X - ikili ölçekte; diğer Y– bir sıralama ölçeğinde.

2. Karşılaştırılan değişkenlerdeki değişen özelliklerin sayısı X Ve e aynı olmalıdır.

3. Sıra-çift serili korelasyon katsayısının güvenilirlik düzeyini değerlendirmek için formül (11.9) ve Öğrenci testi için kritik değerler tablosunu kullanmalısınız. k = n – 2.

http://psystat.at.ua/publ/drugie_vidy_koehfficienta_korreljacii/1-1-0-38

Değişkenlerden birinin temsil edildiği durumlar ikili ölçek, diğeri ise sıralama (sıra), başvuru gerektirir sıra-çift serili korelasyon katsayısı:

dev/dk=2 / n * (m1 - m0)

Nerede:
n – ölçüm nesnelerinin sayısı
m1 ve m0 - ikinci değişkende 1 veya 0 bulunan nesnelerin ortalama sıralaması.
Bu katsayı aynı zamanda testlerin geçerliliği kontrol edilirken de kullanılır.

40. Doğrusal korelasyon katsayısı.

Genel olarak korelasyon (ve özellikle doğrusal korelasyon) için 36 numaralı soruya bakın.İle. 56 (64) 063.JPG

Bay PEARSON'UN KATSAYISI

R-Pearson (Pearson R) iki metrik arasındaki ilişkiyi incelemek için kullanılırAynı örnek üzerinde ölçülen farklı değişkenler. Kullanımının uygun olduğu birçok durum vardır. Zeka üniversite son yıllarında akademik performansı etkiler mi? Bir çalışanın maaşının büyüklüğü onun meslektaşlarına olan dostluğuyla mı alakalı? Bir öğrencinin ruh hali karmaşık bir aritmetik problemini çözme başarısını etkiler mi? Bu tür soruları yanıtlamak için araştırmacının örneklemin her üyesi için iki ilgi göstergesini ölçmesi gerekir. İlişkiyi incelemek için gereken veriler daha sonra aşağıdaki örnekte olduğu gibi tablo haline getirilir.

ÖRNEK 6.1

Tablo, 20 8. sınıf öğrencisi için iki zeka göstergesini (sözlü ve sözsüz) ölçmek için başlangıç ​​verilerinin bir örneğini göstermektedir.

Bu değişkenler arasındaki ilişki bir dağılım grafiği kullanılarak gösterilebilir (bkz. Şekil 6.3). Diyagram, ölçülen göstergeler arasında bir ilişki olduğunu göstermektedir: sözel zekanın değeri ne kadar yüksekse, (çoğunlukla) sözel olmayan zekanın değeri de o kadar yüksektir.

Korelasyon katsayısının formülünü vermeden önce, örnek 6.1'deki verileri kullanarak bunun oluşma mantığını izlemeye çalışalım. Her /-noktasının (sayı / konusu) diğer noktalara göre dağılım diyagramındaki konumu (Şekil 6.3), karşılık gelen değişken değerlerinin ortalama değerlerinden değerleri ve sapma işaretleri ile belirlenebilir. : (xj - MJ Ve (akıl en ). Bu sapmaların işaretleri çakışıyorsa, bu pozitif bir ilişki olduğunu gösterir (daha büyük değerler X büyük değerler karşılık gelir en veya daha düşük değerler X daha küçük değerler karşılık gelir y).

1 numaralı konu için ortalamadan sapma X ve tarafından en pozitif ve 3 numaralı denek için her iki sapma da negatiftir. Sonuç olarak, her ikisinden de elde edilen veriler, incelenen özellikler arasında pozitif bir ilişkiye işaret etmektedir. Tam tersine, ortalamadan sapma işaretleri varsa X ve tarafından en farklılık gösteriyorsa bu, özellikler arasında negatif bir ilişki olduğunu gösterir. Dolayısıyla 4 numaralı konu için ortalamadan sapma X olumsuzdur, tarafından y- pozitif ve 9 numaralı konu için - tam tersi.

Böylece, eğer sapmaların çarpımı (x,- M X ) X (akıl en ) pozitifse, /-konunun verileri doğrudan (pozitif) bir ilişkiyi gösterir ve negatifse ters (negatif) bir ilişkiyi gösterir. Buna göre eğer Xwey y Genellikle doğru orantılıysa sapmaların çoğu pozitif olacaktır ve ters ilişkiyle ilişkiliyse çoğu ürün negatif olacaktır. Bu nedenle, ilişkinin gücü ve yönüne ilişkin genel bir gösterge, belirli bir örnek için tüm sapmaların çarpımlarının toplamı olabilir:

Değişkenler arasında doğrudan orantılı bir ilişki olduğunda, bu değer büyük ve pozitiftir - çoğu konu için sapmalar işaretle çakışır (bir değişkenin büyük değerleri başka bir değişkenin büyük değerlerine karşılık gelir ve bunun tersi de geçerlidir). Eğer X Ve en geri bildirime sahipseniz, çoğu konu için bir değişkenin daha büyük değerleri başka bir değişkenin daha küçük değerlerine karşılık gelecektir, yani çarpımların işaretleri negatif olacak ve bir bütün olarak çarpımların toplamı da büyük olacaktır. mutlak değerde, ancak işarette negatif. Değişkenler arasında sistematik bir bağlantı yoksa, pozitif terimler (sapmaların ürünleri) negatif terimlerle dengelenecek ve tüm sapmaların ürünlerinin toplamı sıfıra yakın olacaktır.

Ürünlerin toplamının numune büyüklüğüne bağlı olmadığından emin olmak için ortalamanın alınması yeterlidir. Ancak biz, ara bağlantının ölçüsüyle genel bir parametre olarak değil, bunun hesaplanmış bir tahmini olarak, istatistik olarak ilgileniyoruz. Bu nedenle dağılım formülüne gelince, bu durumda aynısını yapacağız, sapmaların çarpımlarının toplamını N, ve TV'de - 1. Bu, fizik ve teknik bilimlerde yaygın olarak kullanılan ve adı verilen bir bağlantı ölçüsüyle sonuçlanır. kovaryans (Kovahance):


İÇİNDE Psikolojide, fizikten farklı olarak, psikologlar bir işaretin mutlak değeriyle değil, bir gruptaki deneklerin göreceli konumuyla ilgilendikleri için çoğu değişken keyfi ölçeklerde ölçülür. Ayrıca kovaryans, özelliklerin ölçüldüğü ölçeğin (varyans) ölçeğine çok duyarlıdır. Bağlantı ölçüsünü her iki özelliğin ölçüm birimlerinden bağımsız hale getirmek için kovaryansı karşılık gelen standart sapmalara bölmek yeterlidir. Böylece elde edildi için-K. Pearson korelasyon katsayısının katırı:

veya ox ve ifadelerini değiştirdikten sonra


Her iki değişkenin değerleri aşağıdaki formül kullanılarak r değerlerine dönüştürülürse


o zaman r-Pearson korelasyon katsayısı formülü daha basit görünür (071.JPG):

/dict/socology/article/soc/soc-0525.htm

KORELASYON DOĞRUSAL- iki niceliksel değişken arasında nedensel olmayan nitelikteki istatistiksel doğrusal ilişki X Ve en. "K.L katsayısı" kullanılarak ölçülmüştür. Kovaryansın her iki değişkenin standart sapmalarına bölünmesinin sonucu olan Pearson:

,

Nerede S xy- değişkenler arasındaki kovaryans X Ve en;

S X , S sen- değişkenler için standart sapmalar X Ve en;

X Ben , sen Ben- değişken değerler X Ve en numaralı nesne için Ben;

X, sen- değişkenler için aritmetik ortalamalar X Ve en.

Pearson katsayısı R[-1; +1]. Anlam r = 0 değişkenler arasında doğrusal bir ilişki olmadığı anlamına gelir X Ve en(ancak doğrusal olmayan istatistiksel ilişkiyi hariç tutmaz). Pozitif katsayı değerleri ( R> 0) doğrudan doğrusal bağlantıyı belirtir; değeri +1'e ne kadar yakınsa, ilişki istatistiksel doğru o kadar güçlüdür. Negatif katsayı değerleri ( R < 0) свидетельствуют об обратной линейной связи; чем ближе его значение к -1, тем сильнее обратная связь. Значения R= ±1, doğrudan veya ters tam bir doğrusal bağlantının varlığı anlamına gelir. Tam bağlantı durumunda koordinatları olan tüm noktalar ( X Ben , sen Ben) düz bir çizgi üzerinde uzanmak sen = A + bx.

"Katsayı K.L." Pearson ayrıca doğrusal ikili regresyon modelinde bağlantının gücünü ölçmek için de kullanılır.

41. Korelasyon matrisi ve korelasyon grafiği.

Genel olarak korelasyon hakkında 36 numaralı soruya bakınız.İle. 56 (64) 063.JPG

Korelasyon matrisi.Çoğunlukla korelasyon analizi, tek bir örnekte niceliksel bir ölçekte ölçülen iki değil birçok değişken arasındaki ilişkilerin incelenmesini içerir. Bu durumda, bu değişken kümesinin her bir çifti için korelasyonlar hesaplanır. Hesaplamalar genellikle bilgisayarda yapılır ve sonuç bir korelasyon matrisidir.

Korelasyon matrisi(Korelasyon Matris) kümedeki her çift için bir tür korelasyonun hesaplanmasının sonucudur R değişkenler bir numunede niceliksel bir ölçekte ölçülür.

ÖRNEK

5 değişken arasındaki ilişkileri incelediğimizi varsayalım (vl, v2,..., v5; P= 5), bir numune üzerinde ölçüldü N=30İnsan. Aşağıda kaynak verilerinin bir tablosu ve bir korelasyon matrisi bulunmaktadır.

VE
benzer veriler:

Korelasyon matrisi:

Korelasyon matrisinin kare, ana köşegen (takkak,y = /) y'ye göre simetrik, ana köşegen üzerindeki birimlerle (çünkü) olduğunu fark etmek kolaydır. G Ve = Gu = 1).

Korelasyon matrisi kare: satır ve sütun sayısı değişken sayısına eşittir. O simetrik korelasyon olduğundan ana köşegene göre Xİle en korelasyona eşit enİle X.Özelliğin kendisiyle korelasyonu bire eşit olduğundan birimler ana köşegeninde bulunur. Sonuç olarak, korelasyon matrisinin tüm elemanları analize tabi değildir, ancak ana köşegenin üstünde veya altında bulunanlar analize tabidir.

Korelasyon katsayılarının sayısı,İlişkileri incelerken analiz edilecek özellikler aşağıdaki formülle belirlenir: P(P- 1)/2. Yukarıdaki örnekte bu tür korelasyon katsayılarının sayısı 5(5 - 1)/2 = 10'dur.

Korelasyon matrisini analiz etmenin ana görevi Birçok özellik arasındaki ilişkilerin yapısını belirlemek. Bu durumda görsel analiz mümkündür korelasyon galaksileri- grafik resim istatistiksel olarak yapılaranlamlı bağlantılar, bu tür çok fazla bağlantı yoksa (10-15'e kadar). Diğer bir yol ise çok değişkenli yöntemlerin kullanılmasıdır: çoklu regresyon, faktör veya küme analizi ("Çok değişkenli yöntemler..." bölümüne bakın). Faktör veya küme analizi kullanarak, birbirleriyle diğer değişkenlerden daha yakından ilişkili olan değişken gruplarını belirlemek mümkündür. Bu yöntemlerin bir kombinasyonu da çok etkilidir, örneğin çok sayıda işaret varsa ve bunlar homojen değilse.

Korelasyonların karşılaştırılması - iki seçeneğe sahip olan korelasyon matrisini analiz etmeye yönelik ek bir görev. Korelasyon matrisinin satırlarından birindeki (değişkenlerden biri için) korelasyonların karşılaştırılması gerekiyorsa, bağımlı örnekler için karşılaştırma yöntemi kullanılır (s. 148-149). Farklı örneklemler için hesaplanan aynı isimli korelasyonları karşılaştırırken bağımsız örneklemler için karşılaştırma yöntemi kullanılır (s. 147-148).

Karşılaştırma yöntemleri korelasyonlar çapraz olarak korelasyon matrisi (rastgele bir sürecin durağanlığını değerlendirmek için) ve karşılaştırma birçok Farklı numuneler için (homojenlikleri nedeniyle) elde edilen korelasyon matrisleri yoğun emek gerektirir ve bu kitabın kapsamı dışındadır. Bu yöntemleri G.V. Sukhodolsky 1'in kitabından tanıyabilirsiniz.

Korelasyonların istatistiksel anlamlılığı sorunu. Sorun, istatistiksel hipotez testi prosedürünün şunu varsaymasıdır: bir-çoklu bir numune üzerinde gerçekleştirilen test. Aynı yöntem uygulanırsa defalarca, farklı değişkenlere bağlı olsa bile tamamen tesadüf eseri bir sonuç elde etme olasılığı artar. Genel olarak aynı hipotez test yöntemini tekrarlarsak bir kere farklı değişkenler veya örneklerle ilgili olarak, belirlenen a değeriyle hipotezin onayını almamız garanti edilir. ah vaka sayısı.

Diyelim ki 15 değişken için bir korelasyon matrisi analiz ediliyor, yani 15(15-1)/2 = 105 korelasyon katsayısı hesaplanıyor. Hipotezleri test etmek için a = 0,05 düzeyi ayarlanmıştır.Hipotezi 105 kez kontrol ettiğimizde, bağlantının gerçekte var olup olmadığına bakılmaksızın, hipotezin beş kez (!) onayını alacağız. Bunu bilerek ve diyelim ki 15 “istatistiksel olarak anlamlı” korelasyon katsayısına sahip olarak hangilerinin tesadüfen elde edildiğini, hangilerinin gerçek bir ilişkiyi yansıttığını söyleyebilir miyiz?

Kesin olarak konuşursak, istatistiksel bir karar vermek için a düzeyini test edilen hipotez sayısı kadar azaltmak gerekir. Ancak bu pek tavsiye edilmez, çünkü gerçekte var olan bir bağlantıyı göz ardı etme (II. Tip hata yapma) olasılığı öngörülemeyen bir şekilde artar.

Korelasyon matrisi tek başına yeterli bir temel değildiriçerdiği bireysel katsayılara ilişkin istatistiksel sonuçlar içinkorelasyonlar!

Bu sorunu çözmenin gerçekten ikna edici tek bir yolu vardır: numuneyi rastgele iki parçaya bölün ve yalnızca numunenin her iki kısmında da istatistiksel olarak anlamlı olan korelasyonları hesaba katın. Bir alternatif, istatistiksel olarak anlamlı derecede ilişkili değişken gruplarını tanımlamak ve ardından yorumlamak için çok değişkenli yöntemlerin (faktör, küme veya çoklu regresyon analizi) kullanılması olabilir.

Eksik değerler sorunu. Verilerde eksik değerler varsa, korelasyon matrisini hesaplamak için iki seçenek mümkündür: a) değerlerin satır satır kaldırılması (Hariç tutmakvakalarliste halinde); b) değerlerin ikili olarak silinmesi (Hariç tutmakvakalarikili olarak). Şu tarihte: satır satır silme Eksik değerleri olan gözlemlerde, değişkenlerden biri için en az bir eksik değeri olan bir nesneye (konuya) ilişkin satırın tamamı silinir. Bu yöntem, tüm katsayıların aynı nesne kümesinden hesaplanması anlamında "doğru" bir korelasyon matrisine yol açar. Ancak eksik değerler değişkenlerde rastgele dağıtılıyorsa bu yöntem, söz konusu veri setinde tek bir nesnenin kalmamasına neden olabilir (her satırda en az bir eksik değer olacaktır) . Bu durumdan kaçınmak için adı verilen başka bir yöntemi kullanın. ikili kaldırma. Bu yöntem yalnızca seçilen her sütun değişken çiftindeki boşlukları dikkate alır ve diğer değişkenlerdeki boşlukları göz ardı eder. Bir değişken çiftinin korelasyonu, boşlukların olmadığı nesneler için hesaplanır. Pek çok durumda, özellikle boşluk sayısının nispeten küçük olduğu, örneğin %10 olduğu ve boşlukların oldukça rastgele dağıtıldığı durumlarda, bu yöntem ciddi hatalara yol açmaz. Ancak bazen durum böyle değildir. Örneğin, değerlendirmedeki sistematik bir önyargı (kayma), ihmallerin sistematik bir düzenlemesini "gizleyebilir"; bu, farklı alt kümeler için (örneğin, farklı nesne alt grupları için) oluşturulan korelasyon katsayıları arasındaki farkın nedenidir. Hesaplanan korelasyon matrisiyle ilgili bir diğer problem ikili olarak boşlukların giderilmesi, bu matrisin diğer analiz türlerinde (örneğin, çoklu regresyon veya faktör analizinde) kullanılması durumunda ortaya çıkar. Belirli bir tutarlılık düzeyi ve çeşitli katsayıların “uyumluluğu” ile “doğru” korelasyon matrisinin kullanıldığını varsayıyorlar. “Kötü” (önyargılı) tahminlere sahip bir matris kullanmak, programın ya böyle bir matrisi analiz edememesine ya da sonuçların hatalı olmasına neden olur. Bu nedenle, eksik verileri hariç tutmak için ikili yöntem kullanılıyorsa, eksik verilerin dağılımında sistematik kalıpların olup olmadığının kontrol edilmesi gerekir.

Eksik verilerin ikili olarak silinmesi ortalamalarda ve varyanslarda (standart sapmalar) herhangi bir sistematik kaymaya yol açmıyorsa, bu istatistikler, eksik verileri silmeye yönelik satır satır yöntemi kullanılarak hesaplanan istatistiklere benzer olacaktır. Önemli bir fark gözlenirse, tahminlerde bir değişiklik olduğunu varsaymak için neden vardır. Örneğin, bir değişkenin değerlerinin ortalaması (veya standart sapması) ise A, değişkenle korelasyonunun hesaplanmasında kullanılan İÇİNDE, değişkenin aynı değerlerinin ortalamasından (veya standart sapmasından) çok daha az A, C değişkeniyle korelasyonunun hesaplanmasında kullanılmışsa, bu iki korelasyonun da geçerli olmasını beklemek için her türlü neden vardır. (A-Bbiz) farklı veri alt kümelerine dayanmaktadır. Değişken değerlerindeki boşlukların rastgele olmayan yerleştirilmesinden kaynaklanan korelasyonlarda bir sapma olacaktır.

Korelasyon galaksilerinin analizi. Korelasyon matrisinin elemanlarının istatistiksel önemi problemini çözdükten sonra, istatistiksel olarak anlamlı korelasyonlar, bir korelasyon galaksisi veya galaksisi biçiminde grafiksel olarak gösterilebilir. Korelasyon galaksisi - Bu, köşelerden ve bunları birbirine bağlayan çizgilerden oluşan bir şekildir. Köşeler özelliklere karşılık gelir ve genellikle sayılarla - değişken sayılarla - gösterilir. Çizgiler istatistiksel olarak anlamlı bağlantılara karşılık gelir ve bağlantının işaretini ve bazen j-anlamlılık düzeyini grafiksel olarak ifade eder.

Korelasyon galaksisi yansıtabilir Tüm korelasyon matrisinin istatistiksel olarak anlamlı bağlantıları (bazen denir) korelasyon grafiği ) veya sadece anlamlı olarak seçilmiş kısmı (örneğin, faktör analizi sonuçlarına göre bir faktöre karşılık gelen kısmı).

BİR KORELASYON PLEİADE İNŞA ETME ÖRNEĞİ


Mezunların devlet (nihai) sertifikasyonu için hazırlık: Birleşik Devlet Sınavı veri tabanının oluşturulması (tüm kategorilerdeki Birleşik Devlet Sınavı katılımcılarının genel listesi, konuları belirten genel liste) - aynı konular için yedek günleri dikkate alarak;

  • Çalışma planı (27)

    Çözüm

    2. Eğitim kurumunun fen ve matematik eğitimi konularında içeriği iyileştirme ve kaliteyi değerlendirme faaliyetleri Belediye eğitim kurumu orta öğretim okulu No. 4, Litvinovskaya, Chapaevskaya,

  • İncelenen özelliklerin ölçümlerinin sıralı bir ölçekte yapıldığı veya ilişkinin biçiminin doğrusaldan farklı olduğu durumlarda, iki rastgele değişken arasındaki ilişkinin incelenmesi sıra korelasyon katsayıları kullanılarak gerçekleştirilir. Spearman sıra korelasyon katsayısını düşünün. Hesaplarken örnek seçenekleri sıralamak (sıralamak) gerekir. Sıralama, deneysel verilerin artan veya azalan şekilde belirli bir sırada gruplandırılmasıdır.

    Sıralama işlemi aşağıdaki algoritmaya göre gerçekleştirilir:

    1. Daha düşük bir değere daha düşük bir sıra atanır. En yüksek değere, sıralanan değerlerin sayısına karşılık gelen bir sıra atanır. En küçük değere 1'lik bir derece atanır. Örneğin, eğer n=7 ise, ikinci kuralda belirtilen durumlar dışında en büyük değer 7'lik bir sıra alacaktır.

    2. Birkaç değer eşitse, onlara eşit olmadıkları takdirde alacakları sıraların ortalaması olan bir sıra atanır. Örnek olarak, 7 öğeden oluşan artan sıralı bir örneği düşünün: 22, 23, 25, 25, 25, 28, 30. 22 ve 23 değerlerinin her biri bir kez görünür, dolayısıyla bunların sıralamaları sırasıyla R22=1 olur ve R23=2 . 25 değeri 3 kez görünür. Bu değerler tekrarlanmasaydı sıraları 3, 4, 5 olurdu. Dolayısıyla R25 sıraları 3, 4 ve 5'in aritmetik ortalamasına eşittir: . 28 ve 30 değerleri tekrarlanmadığından sıralamaları sırasıyla R28=6 ve R30=7'dir. Son olarak aşağıdaki yazışmalara sahibiz:

    3. Sıralamaların toplam toplamı, aşağıdaki formülle belirlenen hesaplanan değerle örtüşmelidir:

    burada n, sıralanan değerlerin toplam sayısıdır.

    Gerçek ve hesaplanan sıralama toplamları arasındaki tutarsızlık, sıralama hesaplanırken veya toplanırken yapılan bir hataya işaret eder. Bu durumda hatayı bulup düzeltmeniz gerekir.

    Spearman'ın sıra korelasyon katsayısı, kişinin iki özellik veya iki özellik hiyerarşisi arasındaki ilişkinin gücünü ve yönünü belirlemesine olanak tanıyan bir yöntemdir. Sıra korelasyon katsayısının kullanımının bir takım sınırlamaları vardır:

    • a) Varsayılan korelasyon bağımlılığı monoton olmalıdır.
    • b) Her numunenin hacmi 5'ten büyük veya ona eşit olmalıdır. Numunenin üst sınırını belirlemek için kritik değer tablolarını kullanın (Ek Tablo 3). Tablodaki n'nin maksimum değeri 40'tır.
    • c) Analiz sırasında çok sayıda özdeş sıralamanın ortaya çıkması muhtemeldir. Bu durumda değişiklik yapılması gerekir. En uygun durum, incelenen her iki numunenin de farklı değerlerin iki dizisini temsil etmesidir.

    Korelasyon analizi yapabilmek için araştırmacının sıralanabilecek iki örneğe sahip olması gerekir; örneğin:

    • - aynı denek grubunda ölçülen iki özellik;
    • - aynı özellikler kümesini kullanan iki denekte tanımlanan iki ayrı özellik hiyerarşisi;
    • - iki grup özellik hiyerarşisi;
    • - bireysel ve grup özellikleri hiyerarşileri.

    Hesaplamaya, incelenen göstergeleri her bir özellik için ayrı ayrı sıralayarak başlıyoruz.

    Aynı denek grubunda iki işaretin ölçüldüğü bir durumu analiz edelim. Öncelikle farklı deneklerin elde ettiği bireysel değerler birinci özelliğe göre sıralanır, daha sonra bireysel değerler ikinci özelliğe göre sıralanır. Bir göstergenin daha düşük sıraları başka bir göstergenin daha düşük sıralarına karşılık geliyorsa ve bir göstergenin daha yüksek sıraları başka bir göstergenin daha yüksek sıralarına karşılık geliyorsa, bu durumda iki özellik pozitif olarak ilişkilidir. Bir göstergenin daha yüksek sıraları başka bir göstergenin daha düşük sıralarına karşılık geliyorsa bu durumda iki özellik negatif ilişkilidir. Rs'yi bulmak için her konu için sıralar (d) arasındaki farkları belirleriz. Sıralar arasındaki fark ne kadar küçük olursa sıra korelasyon katsayısı rs “+1”e o kadar yakın olacaktır. Eğer ilişki yoksa aralarında yazışma da olmayacak, dolayısıyla rs sıfıra yakın olacaktır. İki değişkene göre deneklerin sıraları arasındaki fark ne kadar büyük olursa, rs katsayısının değeri “-1”e o kadar yakın olacaktır. Dolayısıyla Spearman sıra korelasyon katsayısı, incelenen iki özellik arasındaki herhangi bir monotonik ilişkinin bir ölçüsüdür.

    Aynı özellikler kümesini kullanan iki öznede tanımlanan iki ayrı özellik hiyerarşisi durumunu ele alalım. Bu durumda, iki deneğin her birinin elde ettiği bireysel değerler belirli bir dizi özelliğe göre sıralanır. En düşük değere sahip özelliğe ilk sırada yer verilmelidir; değeri daha yüksek olan karakteristik ikinci sıradır vb. Tüm özelliklerin aynı birimlerde ölçülmesine özellikle dikkat edilmelidir. Örneğin göstergelerin farklı “fiyat” noktalarıyla ifade edilmesi halinde sıralanması mümkün değildir, çünkü tüm değerler tek bir ölçeğe getirilinceye kadar faktörlerden hangisinin şiddet açısından ilk sırada yer alacağını belirlemek mümkün değildir. Konulardan birinde düşük sıralamaya sahip olan özelliklerin diğerinde de düşük sıralamaya sahip olması veya bunun tersi durumunda, bireysel hiyerarşiler pozitif olarak ilişkilidir.

    İki grup özellik hiyerarşisi durumunda, iki denek grubunda elde edilen ortalama grup değerleri, çalışılan gruplar için aynı özelliklere göre sıralanır. Daha sonra, önceki durumlarda verilen algoritmayı takip ediyoruz.

    Bireysel ve grup özellikleri hiyerarşisine sahip bir vakayı analiz edelim. Bireysel hiyerarşisi olacağından ortalama grup hiyerarşisine katılmayan konuyu hariç tutarak, elde edilen aynı özelliklere göre konunun bireysel değerlerini ve ortalama grup değerlerini ayrı ayrı sıralayarak başlarlar. onunla karşılaştırılır. Sıra korelasyonu, bireysel ve grup özellikleri hiyerarşisinin tutarlılık derecesini değerlendirmemize olanak tanır.

    Yukarıda sıralanan durumlarda korelasyon katsayısının anlamlılığının nasıl belirlendiğini ele alalım. İki özelliğin olması durumunda örneklem büyüklüğüne göre belirlenecektir. İki ayrı özellik hiyerarşisi durumunda, önem, hiyerarşide yer alan özelliklerin sayısına bağlıdır. Son iki durumda anlamlılık, grup sayısına göre değil, incelenen özelliklerin sayısına göre belirlenir. Bu nedenle, her durumda rs'nin önemi, sıralanan n değerlerinin sayısına göre belirlenir.

    Rs'nin istatistiksel önemini kontrol ederken, farklı sıralanmış değerler ve farklı önem seviyeleri için derlenen sıra korelasyon katsayısının kritik değerlerinin tabloları kullanılır. Rs'nin mutlak değeri kritik bir değere ulaşır veya onu aşarsa korelasyon güvenilirdir.

    İlk seçenek (aynı denek grubunda ölçülen iki işaretin olduğu bir durum) dikkate alındığında aşağıdaki hipotezler mümkündür.

    H0: x ve y değişkenleri arasındaki korelasyon sıfırdan farklı değildir.

    H1: x ve y değişkenleri arasındaki korelasyon sıfırdan anlamlı derecede farklıdır.

    Geriye kalan üç durumdan herhangi biriyle çalışırsak, o zaman başka bir çift hipotez öne sürmek gerekir:

    H0: x ve y hiyerarşileri arasındaki korelasyon sıfırdan farklı değildir.

    H1: X ve y hiyerarşileri arasındaki korelasyon sıfırdan önemli ölçüde farklıdır.

    Spearman sıra korelasyon katsayısı rs'yi hesaplarken yapılacak işlemlerin sırası aşağıdaki gibidir.

    • - Karşılaştırmaya x ve y değişkenleri olarak hangi iki özelliğin veya iki özellik hiyerarşisinin katılacağını belirleyin.
    • - Sıralama kurallarına uygun olarak x değişkeninin değerlerini, en küçük değere 1. sırayı atayarak sıralayın. Sıralamaları test konularına veya özelliklerine göre tablonun ilk sütununa yerleştirin.
    • - Y değişkeninin değerlerini sıralayın. Sıralamaları test konularına veya özelliklerine göre tablonun ikinci sütununa yerleştirin.
    • - Tablonun her satırı için x ve y sıraları arasındaki d farkını hesaplayın. Sonuçları tablonun bir sonraki sütununa yerleştirin.
    • - Kare farkları (d2) hesaplayın. Ortaya çıkan değerleri tablonun dördüncü sütununa yerleştirin.
    • - Farkların karelerinin toplamını hesaplayabilir misiniz? d2.
    • - Aynı sıralamalar oluşursa düzeltmeleri hesaplayın:

    burada tx, x örneğindeki aynı sıralara sahip her bir grubun hacmidir;

    ty, y örneğindeki aynı sıralara sahip her bir grubun hacmidir.

    Aynı sıraların varlığına veya yokluğuna bağlı olarak sıra korelasyon katsayısını hesaplayın. Eğer özdeş sıralamalar yoksa, aşağıdaki formülü kullanarak sıra korelasyon katsayısını (rs) hesaplayın:

    Aynı sıralar varsa, aşağıdaki formülü kullanarak sıra korelasyon katsayısını rs hesaplayın:

    nerede?d2 sıralar arasındaki farkların karelerinin toplamıdır;

    Tx ve Ty - eşit sıralar için düzeltmeler;

    n, sıralamaya katılan konu veya özelliklerin sayısıdır.

    Belirli sayıda konu için Ek Tablo 3'ten rs'nin kritik değerlerini belirleyin. Rs'nin kritik değerden küçük olmaması koşuluyla korelasyon katsayısının sıfırdan önemli bir farkı gözlenecektir.

    Bir psikoloji öğrencisi (sosyolog, yönetici, yönetici vb.) genellikle incelenen bir veya daha fazla grupta iki veya daha fazla değişkenin birbiriyle nasıl ilişkili olduğuyla ilgilenir.

    Matematikte, değişken nicelikler arasındaki ilişkileri tanımlamak için, bağımsız değişken X'in her belirli değerini bağımlı değişken Y'nin belirli bir değeriyle ilişkilendiren F fonksiyonu kavramı kullanılır. Ortaya çıkan bağımlılık, Y=F( olarak gösterilir. X).

    Aynı zamanda, ölçülen özellikler arasındaki korelasyon türleri farklı olabilir: örneğin, korelasyon doğrusal ve doğrusal olmayan, pozitif ve negatif olabilir. Doğrusaldır - eğer bir X değişkeninde bir artış veya azalma varsa, ikinci değişken Y de ortalama olarak artar veya azalır. Bir miktardaki artışla ikincideki değişimin doğası doğrusal değilse, ancak diğer yasalarla tanımlanıyorsa, doğrusal değildir.

    Korelasyon, X değişkenindeki bir artışla ortalama Y değişkeninin de artması durumunda pozitif olacaktır ve eğer X değişkenindeki bir artışla Y değişkeni ortalama olarak azalma eğilimi gösteriyorsa, o zaman negatif bir ilişkinin varlığından söz ederiz. korelasyon. Değişkenler arasında herhangi bir ilişki kurmanın imkansız olması mümkündür. Bu durumda korelasyon olmadığını söylüyorlar.

    Korelasyon analizinin görevi, değişen özellikler arasındaki ilişkinin yönünü (pozitif veya negatif) ve formunu (doğrusal, doğrusal olmayan) belirlemek, yakınlığını ölçmek ve son olarak elde edilen korelasyon katsayılarının anlamlılık düzeyini kontrol etmekten ibarettir.

    K. Spearman tarafından önerilen sıra korelasyon katsayısı, bir sıra ölçeğinde ölçülen değişkenler arasındaki ilişkinin parametrik olmayan bir ölçümünü ifade eder. Bu katsayı hesaplanırken popülasyondaki özelliklerin dağılımlarının doğası hakkında herhangi bir varsayım yapılmasına gerek yoktur. Bu katsayı, bu durumda karşılaştırılan büyüklüklerin sıralarını temsil eden sıralı özellikler arasındaki bağlantının yakınlık derecesini belirler.

    Spearman'ın sıralı doğrusal korelasyon katsayısı aşağıdaki formül kullanılarak hesaplanır:

    burada n, sıralanan özelliklerin sayısıdır (göstergeler, konular);
    D, her konu için iki değişkenin sıraları arasındaki farktır;
    D2, sıra farklarının karelerinin toplamıdır.

    Spearman sıra korelasyon katsayısının kritik değerleri aşağıda sunulmuştur:

    Spearman'ın doğrusal korelasyon katsayısının değeri +1 ile -1 aralığındadır. Spearman'ın doğrusal korelasyon katsayısı pozitif veya negatif olabilir ve bir sıra ölçeğinde ölçülen iki özellik arasındaki ilişkinin yönünü karakterize eder.

    Mutlak değerde korelasyon katsayısının 1'e yakın olması değişkenler arasında yüksek düzeyde bir bağlantıya karşılık gelir. Yani özellikle bir değişken kendisi ile korele olduğunda korelasyon katsayısının değeri +1 olacaktır. Böyle bir ilişki doğrudan orantılı bir bağımlılığı karakterize eder. X değişkeninin değerleri artan sırada düzenlenmişse ve aynı değerler (şimdi Y değişkeni olarak adlandırılmıştır) azalan sırada düzenlenmişse, bu durumda X ve Y değişkenleri arasındaki korelasyon tam olarak olacaktır. -1. Korelasyon katsayısının bu değeri ters orantılı bir ilişkiyi karakterize eder.

    Korelasyon katsayısının işareti ortaya çıkan ilişkinin yorumlanması açısından oldukça önemlidir. Doğrusal korelasyon katsayısının işareti artı ise, ilişkili özellikler arasındaki ilişki, bir özelliğin (değişken) daha büyük bir değerinin, başka bir özelliğin (başka bir değişken) daha büyük bir değerine karşılık geleceği şekildedir. Yani bir gösterge (değişken) artarsa ​​diğer gösterge (değişken) de buna bağlı olarak artar. Bu bağımlılığa doğrudan orantılı bağımlılık denir.

    Eksi işareti alınırsa, bir özelliğin daha büyük değeri diğerinin daha küçük değerine karşılık gelir. Yani eksi işareti varsa bir değişkendeki (işaret, değer) artış diğer değişkendeki azalmaya karşılık gelir. Bu bağımlılığa ters orantılı bağımlılık denir. Bu durumda artış karakterinin (eğiliminin) atandığı değişkenin seçimi keyfidir. X değişkeni ya da Y değişkeni olabilir. Ancak X değişkeninin arttığı düşünülürse Y değişkeni de buna bağlı olarak azalacaktır ve bunun tersi de geçerlidir.

    Spearman korelasyonu örneğine bakalım.

    Psikolog, 11 birinci sınıf öğrencisi arasında okula başlamadan önce elde edilen bireysel okula hazırlık göstergelerinin birbirleriyle ve okul yılı sonundaki ortalama performanslarıyla nasıl ilişkili olduğunu keşfeder.

    Bu sorunu çözmek için, öncelikle okula kabul sırasında elde edilen okula hazırlık göstergelerinin değerlerini ve ikinci olarak aynı öğrenciler için yıl sonunda akademik performansın nihai göstergelerini ortalama olarak sıraladık. Sonuçları tabloda sunuyoruz:

    Elde edilen verileri yukarıdaki formüle yerleştirip hesaplamayı yapıyoruz. Şunu elde ederiz:

    Önem düzeyini bulmak için sıra korelasyon katsayılarının kritik değerlerini gösteren “Spearman sıra korelasyon katsayısının kritik değerleri” tablosuna başvuruyoruz.

    İlgili “önem eksenini” oluşturuyoruz:

    Ortaya çıkan korelasyon katsayısı %1 anlamlılık düzeyi için kritik değere denk geldi. Sonuç olarak, okula hazırlık göstergeleri ile birinci sınıf öğrencilerinin son notlarının pozitif bir korelasyonla bağlantılı olduğu, başka bir deyişle, okula hazırlık göstergesi ne kadar yüksekse, birinci sınıf öğrencilerinin çalışmaları o kadar iyi olduğu iddia edilebilir. İstatistiksel hipotezler açısından psikolog, benzerlik hakkındaki boş (H0) hipotezini reddetmeli ve farklılıkların varlığına ilişkin alternatifi (H1) kabul etmelidir; bu, okula hazır bulunuşluk göstergeleri ile ortalama akademik performans arasındaki ilişkinin sıfırdan farklı olduğunu öne sürmektedir.

    Spearman korelasyonu. Spearman yöntemini kullanarak korelasyon analizi. Mızrakçı sırada. Spearman korelasyon katsayısı. Spearman sıralama korelasyonu

    Aşağıdaki hesaplayıcı, iki rastgele değişken arasındaki Spearman sıra korelasyon katsayısını hesaplar. Hesap makinesinden dikkatin dağılmaması için teorik kısım geleneksel olarak onun altına yerleştirilir.

    eklemek ithalat ihracat mode_edit silmek

    Rastgele değişkenlerdeki değişiklikler

    ok_yukarı doğruok_aşağı doğru Xok_yukarı doğruok_aşağı doğru e
    Sayfa boyutu: 5 10 20 50 100 chevron_left chevron_right

    Rastgele değişkenlerdeki değişiklikler

    Verileri içe aktarİçe aktarma hatası

    Alanları ayırmak için şu sembollerden birini kullanabilirsiniz: Sekme, ";" veya "," Örnek: -50,5;-50,5

    İçe Aktar Geri İptal

    Spearman sıra korelasyon katsayısını hesaplama yöntemi aslında çok basit bir şekilde anlatılmıştır. Bu aynı Pearson korelasyon katsayısıdır ve yalnızca rastgele değişkenlerin ölçüm sonuçları için değil, bunların sonuçları için de hesaplanır. sıra değerleri.

    Yani,

    Geriye kalan tek şey, sıralama değerlerinin ne olduğunu ve tüm bunlara neden ihtiyaç duyulduğunu bulmaktır.

    Bir varyasyon serisinin elemanları artan veya azalan sırada düzenlenmişse, o zaman rütbe eleman bu sıralı serideki numarası olacaktır.

    Örneğin bir varyasyon serimiz olsun (17,26,5,14,21). Elemanlarını azalan düzende sıralayalım (26,21,17,14,5). 26'nın sıralaması 1, 21'in sıralaması 2, vb. Sıralama değerlerinin varyasyon serisi şu şekilde görünecektir (3,1,5,4,2).

    Yani, Spearman katsayısı hesaplanırken orijinal varyasyon serileri, sıra değerlerinin varyasyon serilerine dönüştürülür ve ardından bunlara Pearson formülü uygulanır.

    Bir incelik var - tekrarlanan değerlerin sıralaması, sıralamaların ortalaması olarak alınır. Yani, (17, 15, 14, 15) serisi için sıra değerleri dizisi (1, 2,5, 4, 2,5) gibi görünecektir, çünkü 15'e eşit ilk öğenin sırası 2 ve ikincisidir. 3. sıraya sahiptir ve .

    Tekrarlanan değerler yoksa, yani sıra serisinin tüm değerleri 1'den n'ye kadar olan sayılar ise Pearson formülü şu şekilde basitleştirilebilir:

    Bu arada, bu formül çoğunlukla Spearman katsayısını hesaplamak için bir formül olarak verilir.

    Değerlerin kendisinden rütbe değerlerine geçişin özü nedir?
    Mesele şu ki, sıra değerlerinin korelasyonunu inceleyerek, iki değişkenin bağımlılığının monotonik bir fonksiyon tarafından ne kadar iyi tanımlandığını belirleyebilirsiniz.

    Katsayının işareti değişkenler arasındaki ilişkinin yönünü gösterir. İşaret pozitifse, X değerleri arttıkça Y değerleri de artma eğilimindedir; işareti negatifse X değerleri arttıkça Y değerleri düşme eğilimindedir, katsayı 0 ise trend yoktur. Katsayı 1 veya -1 ise, X ile Y arasındaki ilişki monotonik bir fonksiyon biçimine sahiptir - yani X arttıkça Y de artar veya tam tersi, X arttıkça Y azalır.

    Yani, bir değişkenin diğerine yalnızca doğrusal bağımlılığını ortaya koyan Pearson korelasyon katsayısından farklı olarak Spearman korelasyon katsayısı, doğrudan doğrusal bir ilişkinin tespit edilmediği monotonik bağımlılığı ortaya çıkarabilir.

    Bir örnekle açıklayayım. y=10/x fonksiyonunu incelediğimizi varsayalım.
    Aşağıdaki X ve Y ölçümlerine sahibiz
    {{1,10}, {5,2}, {10,1}, {20,0.5}, {100,0.1}}
    Bu veriler için Pearson korelasyon katsayısı -0,4686'dır, yani ilişki zayıftır veya yoktur. Ancak Spearman korelasyon katsayısı kesinlikle -1'e eşittir; bu da araştırmacıya Y'nin X'e katı bir negatif monotonik bağımlılığa sahip olduğunu ima ediyor gibi görünüyor.