Nilai Korelasi Peringkat Spearman Kritikal. Aplikasi korelasi spearman dan pearson

37. Pekali korelasi pangkat Spearman.

S. 56 (64) 063.JPG

http://psystat.at.ua/publ/1-1-0-33

Pekali korelasi pangkat Spearman digunakan apabila:
- pembolehubah mempunyai skala ranking ukuran;
- pengedaran data terlalu berbeza daripada biasa atau tidak diketahui sama sekali
- sampel adalah kecil (N< 30).

Tafsiran pekali korelasi pangkat Spearman tidak berbeza dengan pekali Pearson, tetapi maknanya agak berbeza. Untuk memahami perbezaan antara kaedah ini dan membuktikan secara logik bidang aplikasinya, mari bandingkan formulanya.

Pekali korelasi Pearson:

Pekali korelasi Spearman:

Seperti yang anda lihat, formula berbeza dengan ketara. Bandingkan Formula

Formula korelasi Pearson menggunakan min aritmetik dan sisihan piawai siri berkorelasi, manakala formula Spearman tidak. Oleh itu, untuk mendapatkan hasil yang mencukupi mengikut formula Pearson, adalah perlu bahawa siri berkorelasi adalah hampir dengan taburan normal (min dan sisihan piawai adalah parameter taburan normal). Untuk formula Spearman, ini tidak berkaitan.

Unsur formula Pearson ialah penyeragaman setiap siri dalam skor z.

Seperti yang anda lihat, penukaran pembolehubah kepada skala Z terdapat dalam formula pekali korelasi Pearson. Sehubungan itu, untuk pekali Pearson, skala data sama sekali tidak relevan: sebagai contoh, kita boleh mengaitkan dua pembolehubah, satu daripadanya mempunyai min. = 0 dan maks. = 1, dan min kedua = 100 dan maks. = 1000. Tidak kira betapa berbezanya julat nilai, semuanya akan ditukar kepada nilai z standard dengan skala yang sama.

Tiada penormalan sedemikian dalam pekali Spearman, jadi

SYARAT WAJIB UNTUK MENGGUNAKAN KOEFISIEN SPEERMAN ADALAH KESAMAAN Julat DUA PEMBOLEH UBAH.

Sebelum menggunakan pekali Spearman untuk siri data dengan julat yang berbeza, adalah perlu untuk pangkat. Kedudukan membawa kepada fakta bahawa nilai siri ini memperoleh minimum yang sama = 1 (kedudukan minimum) dan maksimum yang sama dengan bilangan nilai (maksimum, kedudukan terakhir = N, iaitu bilangan maksimum kes dalam sampel).

Dalam kes apa yang boleh dilakukan tanpa kedudukan

Ini adalah kes di mana data adalah asal skala ranking. Contohnya, ujian orientasi nilai Rokeach.

Juga, ini adalah kes di mana bilangan pilihan nilai adalah kecil dan terdapat minimum dan maksimum tetap dalam sampel. Sebagai contoh, dalam pembezaan semantik, minimum = 1, maksimum = 7.

Contoh pengiraan pekali korelasi pangkat Spearman

Ujian orientasi nilai Rokeach telah dijalankan ke atas dua sampel X dan Y. Tugasan: untuk mengetahui sejauh manakah hierarki nilai bagi sampel ini (secara literal, betapa serupanya mereka).

Nilai yang terhasil r=0.747 disemak jadual nilai kritikal. Mengikut jadual, pada N=18, nilai yang diperolehi boleh dipercayai pada tahap p<=0,005

Kedudukan pekali korelasi mengikut Spearman dan Kendal

Untuk pembolehubah yang tergolong dalam skala ordinal atau untuk pembolehubah yang tidak mengikut taburan normal, serta untuk pembolehubah yang tergolong dalam skala selang, korelasi pangkat Spearman dikira dan bukannya pekali Pearson. Untuk melakukan ini, nilai pembolehubah individu diberikan tempat kedudukan, yang kemudiannya diproses menggunakan formula yang sesuai. Untuk mendedahkan korelasi kedudukan, nyahtanda kotak semak korelasi Pearson lalai dalam kotak dialog Bivariate Correlations.... Sebaliknya, aktifkan pengiraan korelasi Spearman. Pengiraan ini akan memberikan keputusan berikut. Pekali korelasi pangkat sangat hampir dengan nilai yang sepadan dengan pekali Pearson (pembolehubah asal mempunyai taburan normal).

titkova-matmetody.pdf hlm. 45

Kaedah korelasi pangkat Spearman membolehkan anda menentukan ketat (kekuatan) dan arah

korelasi antara dua tanda atau dua profil (hierarki) tanda-tanda.

Untuk mengira korelasi pangkat, perlu mempunyai dua siri nilai,

yang boleh diperingkat. Julat nilai ini boleh menjadi:

1) dua tanda diukur dalam sama kumpulan mata pelajaran ujian;

2) dua hierarki ciri individu, dikenal pasti dalam dua mata pelajaran untuk perkara yang sama

satu set ciri;

3) dua hierarki kumpulan ciri,

4) individu dan kumpulan hierarki ciri.

Pertama, penunjuk disenaraikan secara berasingan untuk setiap ciri.

Sebagai peraturan, nilai yang lebih rendah bagi sesuatu ciri diberikan kedudukan yang lebih rendah.

Dalam kes pertama (dua ciri), nilai individu disusun mengikut yang pertama

sifat yang diperolehi oleh subjek yang berbeza, dan kemudian nilai individu untuk yang kedua

tanda.

Jika dua ciri berkait secara positif, maka subjek dengan pangkat rendah masuk

salah seorang daripada mereka akan mempunyai pangkat rendah dalam yang lain, dan subjek dengan pangkat tinggi masuk

salah satu sifat juga akan mempunyai darjat yang tinggi pada sifat yang lain. Untuk mengira rs

adalah perlu untuk menentukan perbezaan (d) antara pangkat yang diperolehi oleh subjek ini pada kedua-duanya

tanda-tanda. Kemudian penunjuk ini d diubah dengan cara tertentu dan ditolak daripada 1. Daripada

semakin kecil perbezaan antara pangkat, semakin besar rs, semakin hampir dengan +1.

Jika tidak ada korelasi, maka semua pangkat akan bercampur dan tidak ada

tidak setanding. Formula direka bentuk supaya dalam kes ini rs akan menjadi hampir 0.

Dalam kes korelasi negatif pangkat rendah mata pelajaran pada satu asas

akan sepadan dengan pangkat tinggi pada atribut lain, dan sebaliknya. Semakin tidak padan

antara jajaran subjek dalam dua pembolehubah, semakin hampir rs kepada -1.

Dalam kes kedua (dua profil individu), individu

nilai yang diperolehi oleh setiap 2 mata pelajaran mengikut tertentu (sama bagi mereka

kedua-duanya) satu set ciri. Peringkat pertama akan menerima sifat dengan nilai terendah; pangkat kedua -

tanda dengan nilai yang lebih tinggi, dsb. Jelas sekali, semua ciri mesti diukur dalam

unit yang sama, jika tidak kedudukan adalah mustahil. Sebagai contoh, ia adalah mustahil

letakkan penunjuk mengikut Soal Selidik Personaliti Cattell (16PF), jika ia dinyatakan dalam

skor "mentah", kerana julat nilai adalah berbeza untuk faktor yang berbeza: dari 0 hingga 13, dari 0 hingga

20 dan dari 0 hingga 26. Kita tidak boleh mengatakan faktor mana yang akan mengambil tempat pertama dari segi

keterukan, sehingga kami membawa semua nilai ke skala tunggal (selalunya ini adalah skala dinding).

Jika hierarki individu dua subjek berkaitan secara positif, maka tanda-tandanya

mempunyai pangkat rendah dalam salah satu daripada mereka akan mempunyai pangkat rendah pada yang lain, dan begitu juga sebaliknya.

Contohnya, jika bagi satu mata pelajaran faktor E (dominasi) mempunyai pangkat yang paling rendah, maka untuk

mata pelajaran lain, ia sepatutnya mempunyai pangkat rendah jika satu mata pelajaran mempunyai faktor C

(kestabilan emosi) mempunyai pangkat yang paling tinggi, maka subjek yang lain juga mesti mempunyai

faktor ini mempunyai pangkat yang tinggi, dan sebagainya.

Dalam kes ketiga (dua profil kumpulan), nilai kumpulan purata disenaraikan,

diterima dalam 2 kumpulan mata pelajaran mengikut tertentu, sama untuk dua kumpulan, ditetapkan

tanda-tanda. Dalam apa yang berikut, garis penaakulan adalah sama seperti dalam dua kes sebelumnya.

Dalam kes ke-4 (profil individu dan kumpulan), mereka disenaraikan secara berasingan

nilai individu subjek dan nilai kumpulan purata untuk set yang sama

tanda-tanda yang diperolehi, sebagai peraturan, dengan pengecualian subjek individu ini - dia

tidak mengambil bahagian dalam profil kumpulan purata, yang mana individunya akan dibandingkan

profil. Korelasi kedudukan akan membolehkan anda menyemak sejauh mana konsisten individu dan

profil kumpulan.

Dalam keempat-empat kes, kepentingan pekali korelasi yang diperoleh ditentukan oleh

mengikut bilangan nilai kedudukan N. Dalam kes pertama, nombor ini akan bertepatan dengan

saiz sampel n. Dalam kes kedua, bilangan pemerhatian ialah bilangan ciri,

membentuk hierarki. Dalam kes ketiga dan keempat, N juga adalah bilangan yang dipadankan

tanda, bukan bilangan subjek dalam kumpulan. Penjelasan terperinci diberikan dalam contoh. Sekiranya

nilai mutlak rs mencapai nilai kritikal atau melebihinya, korelasi

boleh dipercayai.

Hipotesis.

Terdapat dua kemungkinan hipotesis. Yang pertama merujuk kepada kes 1, yang kedua kepada tiga yang lain

Versi pertama hipotesis

H0: Korelasi antara pembolehubah A dan B tidak berbeza daripada sifar.

H2: Kolerasi antara pembolehubah A dan B adalah berbeza secara signifikan daripada sifar.

Versi kedua hipotesis

H0: Korelasi antara hierarki A dan B tidak berbeza dengan sifar.

H2: Korelasi antara hierarki A dan B adalah jauh berbeza daripada sifar.

Had pekali korelasi pangkat

1. Sekurang-kurangnya 5 pemerhatian hendaklah dikemukakan bagi setiap pembolehubah. Atas

had pensampelan ditentukan oleh jadual nilai kritikal yang tersedia .

2. Pekali korelasi pangkat Spearman rs dengan bilangan yang sama

kedudukan untuk satu atau kedua-dua pembolehubah dipadankan memberikan nilai kasar. Sebaik-baiknya

kedua-dua siri berkorelasi mestilah dua jujukan tidak sepadan

nilai. Jika syarat ini tidak dipenuhi, pelarasan mesti dibuat untuk

pangkat yang sama.

Pekali korelasi pangkat Spearman dikira dengan formula:

Jika dalam kedua-dua siri kedudukan perbandingan terdapat kumpulan yang sama pangkat,

sebelum mengira pekali korelasi pangkat, adalah perlu untuk membetulkan perkara yang sama

pangkat Ta dan Tv:

Ta \u003d Σ (a3 - a) / 12,

TV \u003d Σ (v3 - c) / 12,

di mana a - isipadu setiap kumpulan pangkat yang sama dalam siri pangkat A, dalam isipadu setiap satu

kumpulan yang sama pangkat dalam siri pangkat B.

Untuk mengira nilai empirikal rs, gunakan formula:

38. Pekali korelasi biseri bertitik.

Untuk korelasi secara umum, lihat soalan no. 36 dengan. 56 (64) 063.JPG

harchenko-korranaliz.pdf

Biarkan pembolehubah X diukur pada skala kuat, dan pembolehubah Y pada skala dikotomi. Pekali korelasi dua dua mata rpb dikira dengan formula:

Di sini x 1 ialah nilai purata untuk objek X dengan nilai "satu" untuk Y;

x 0 - nilai purata untuk objek X dengan nilai "sifar" untuk Y;

s x - sisihan piawai semua nilai untuk X;

n 1 - bilangan objek "satu" dalam Y, n 0 - bilangan objek "sifar" dalam Y;

n = n 1 + n 0 ialah saiz sampel.

Pekali korelasi dua dua mata juga boleh dikira menggunakan ungkapan setara yang lain:

Di sini x ialah nilai min keseluruhan bagi pembolehubah X.

Pekali Korelasi Biserial Titik rpb berbeza dari -1 hingga +1. Nilainya adalah sama dengan sifar sekiranya pembolehubah dengan unit untuk Y mempunyai purata Y, sama dengan min pembolehubah dengan sifar lebih Y.

Peperiksaan hipotesis kepentingan titik pekali korelasi biserial adalah untuk menyemak hipotesis nolh 0 tentang kesamaan pekali korelasi am kepada sifar: ρ = 0, yang dijalankan menggunakan kriteria Pelajar. Nilai empirikal

berbanding dengan nilai kritikal t a (df) untuk bilangan darjah kebebasan df = n– 2

Jika syarat | t| ≤ ta(df), hipotesis nol ρ = 0 tidak ditolak. Pekali korelasi dua dua mata berbeza dengan ketara daripada sifar jika nilai empirikal | t| jatuh ke dalam kawasan kritikal, iaitu, jika keadaan | t| > ta(n– 2). Kebolehpercayaan perhubungan dikira menggunakan pekali korelasi dua dua titik rpb, juga boleh ditentukan menggunakan kriteria χ 2 untuk bilangan darjah kebebasan df= 2.

Kolerasi titik-biserial

Pengubahsuaian seterusnya bagi pekali korelasi hasil darab momen dicerminkan dalam biseri bertitik. r. stat ini. menunjukkan hubungan antara dua pembolehubah, satu daripadanya kononnya berterusan dan bertaburan normal, manakala satu lagi adalah diskret dalam erti kata yang tepat. Pekali korelasi titik-biserial dilambangkan dengan r pbis Kerana dalam r pbis dikotomi mencerminkan sifat sebenar pembolehubah diskret, dan bukan buatan, seperti dalam kes r bis, tandanya ditentukan sewenang-wenangnya. Oleh itu, untuk semua amalan matlamat r pbis dipertimbangkan dalam julat dari 0.00 hingga +1.00.

Terdapat juga kes sedemikian apabila dua pembolehubah dianggap sebagai berterusan dan teragih normal, tetapi kedua-duanya dikotomi secara buatan, seperti dalam kes korelasi biserial. Untuk menilai hubungan antara pembolehubah tersebut, pekali korelasi tetrachoric digunakan r tet, yang juga dibiakkan oleh Pearson. Utama (tepat) formula dan prosedur untuk mengira r tet agak kompleks. Oleh itu, dengan amalan. kaedah ini menggunakan anggaran r tet diperoleh berdasarkan prosedur dan jadual yang dipendekkan.

/online/dictionary/dictionary.php?term=511

KOEFISIEN BISERIAL BERTITIK KORELASI ialah pekali korelasi antara dua pembolehubah, satu daripadanya diukur pada skala dikotomi dan satu lagi pada skala selang. Ia digunakan dalam testologi klasik dan moden sebagai penunjuk kualiti tugas ujian - kebolehpercayaan-konsisten dengan skor ujian keseluruhan.

Untuk mengaitkan pembolehubah yang diukur dalam skala dikotomi dan selang guna pekali korelasi dot-biserial.
Pekali korelasi dot-biserial adalah kaedah analisis korelasi nisbah pembolehubah, salah satunya diukur dalam skala nama dan hanya mengambil 2 nilai (contohnya, lelaki / wanita, jawapannya betul / jawapannya. tidak betul, ada tanda / tiada tanda), dan yang kedua dalam nisbah skala atau skala selang. Formula untuk mengira pekali korelasi titik-biserial:

di mana:
m1 dan m0 ialah nilai purata X dengan nilai 1 atau 0 dalam Y.
σx ialah sisihan piawai bagi semua nilai untuk X
n1 ,n0 – bilangan nilai X dari 1 atau 0 hingga Y.
n ialah jumlah bilangan pasangan nilai

Selalunya, jenis pekali korelasi ini digunakan untuk mengira hubungan item ujian dengan skala ringkasan. Ini adalah satu jenis semakan pengesahan.

39. Pekali korelasi pangkat-biserial.

Untuk korelasi secara umum, lihat soalan no. 36 dengan. 56 (64) 063.JPG

harchenko-korranaliz.pdf hlm. 28

Pekali korelasi pangkat-biserial digunakan apabila salah satu pembolehubah ( X) dibentangkan dalam skala ordinal, dan yang lain ( Y) - dalam dikotomi, dikira dengan formula

.

Di sini, ialah kedudukan purata objek yang mempunyai kesatuan Y; ialah kedudukan purata objek dengan sifar in Y, n ialah saiz sampel.

Peperiksaan hipotesis kepentingan pekali korelasi rank-biserial dijalankan sama dengan pekali korelasi biseri titik menggunakan ujian-t Pelajar dengan penggantian dalam formula rpb pada rrb.

Apabila satu pembolehubah diukur pada skala dikotomi (pembolehubah x), dan satu lagi dalam skala pangkat (pembolehubah Y), menggunakan pekali korelasi pangkat-biserial. Kami ingat bahawa pembolehubah x, diukur dalam skala dikotomi, hanya mengambil dua nilai (kod) 0 dan 1. Mari kita tekankan khususnya: walaupun hakikat bahawa pekali ini berbeza dalam julat dari -1 hingga +1, tandanya tidak penting untuk mentafsir keputusan. Ini adalah satu lagi pengecualian kepada peraturan am.

Pengiraan pekali ini dibuat mengikut formula:

di mana ` X 1 kedudukan purata ke atas unsur pembolehubah tersebut Y, yang sepadan dengan kod (ciri) 1 dalam pembolehubah X;

`X 0 – kedudukan purata untuk elemen pembolehubah tersebut Y, yang sepadan dengan kod (ciri) 0 dalam pembolehubah X\

N- jumlah bilangan elemen dalam pembolehubah x.

Untuk menggunakan pekali korelasi pangkat-biserial, syarat berikut mesti dipenuhi:

1. Pembolehubah yang dibandingkan mesti diukur pada skala yang berbeza: satu X- dalam skala dikotomi; yang lain Y– dalam skala ranking.

2. Bilangan ciri yang berbeza-beza dalam pembolehubah yang dibandingkan X dan Y sepatutnya sama.

3. Untuk menilai tahap kebolehpercayaan pekali korelasi pangkat-biserial, seseorang harus menggunakan formula (11.9) dan jadual nilai kritikal untuk ujian Pelajar apabila k = n - 2.

http://psystat.at.ua/publ/drugie_vidy_koehfficienta_korreljacii/1-1-0-38

Kes di mana salah satu pembolehubah hadir dalam skala dikotomi, dan yang lain dalam pangkat (ordinal), memerlukan penggunaan pekali korelasi pangkat-biserial:

rpb=2 / n * (m1 - m0)

di mana:
n ialah bilangan objek ukuran
m1 dan m0 - kedudukan purata objek dengan 1 atau 0 dalam pembolehubah kedua.
Pekali ini juga digunakan semasa menyemak kesahihan ujian.

40. Pekali korelasi linear.

Mengenai korelasi secara umum (dan tentang korelasi linear khususnya), lihat soalan No. 36 dengan. 56 (64) 063.JPG

PEKAL KORELASI En. PEARSON

r-Pearson (Pearson r) digunakan untuk mengkaji hubungan antara dua metrikpembolehubah lain yang diukur pada sampel yang sama. Terdapat banyak situasi yang sesuai untuk menggunakannya. Adakah kecerdasan mempengaruhi prestasi dalam tahun-tahun universiti senior? Adakah saiz gaji pekerja berkaitan dengan muhibahnya terhadap rakan sekerja? Adakah mood pelajar mempengaruhi kejayaan menyelesaikan masalah aritmetik yang kompleks? Untuk menjawab soalan tersebut, pengkaji mesti mengukur dua indikator yang menarik minat setiap ahli sampel. Data untuk mengkaji hubungan itu kemudiannya dijadualkan, seperti dalam contoh di bawah.

CONTOH 6.1

Jadual menunjukkan contoh data ukuran awal untuk dua indikator kecerdasan (lisan dan bukan lisan) dalam 20 orang pelajar darjah 8.

Hubungan antara pembolehubah ini boleh digambarkan menggunakan gambar rajah serakan (lihat Rajah 6.3). Rajah menunjukkan bahawa terdapat beberapa hubungan antara penunjuk yang diukur: lebih besar nilai kecerdasan lisan, (terutamanya) lebih besar nilai kecerdasan bukan lisan.

Sebelum memberikan formula untuk pekali korelasi, mari kita cuba mengesan logik kejadiannya, menggunakan data Contoh 6.1. Kedudukan setiap /-titik (subjek dengan nombor /) pada rajah serakan berbanding dengan titik lain (Rajah 6.3) boleh diberikan oleh magnitud dan tanda-tanda sisihan nilai sepadan pembolehubah daripadanya. nilai purata: (xj - MJ dan (fikiran di ). Sekiranya tanda-tanda penyimpangan ini bertepatan, maka ini menunjukkan memihak kepada hubungan positif (nilai besar untuk X sepadan dengan nilai yang besar di atau nilai yang lebih kecil untuk X sepadan dengan nilai yang lebih kecil y).

Bagi subjek No 1, sisihan daripada purata X dan oleh di positif, dan untuk subjek No. 3, kedua-dua sisihan adalah negatif. Akibatnya, data kedua-duanya menunjukkan hubungan positif antara ciri yang dikaji. Sebaliknya, jika tanda-tanda penyelewengan daripada purata X dan oleh di berbeza, ini akan menunjukkan hubungan negatif antara tanda-tanda. Oleh itu, bagi subjek No. 4, sisihan daripada purata X adalah negatif, menurut y - positif, dan untuk subjek No 9 - sebaliknya.

Oleh itu, jika hasil sisihan (x, - M X ) X (fikiran di ) positif, maka data /-subjek menunjukkan hubungan langsung (positif), dan jika negatif, maka hubungan songsang (negatif). Sehubungan itu, jika Xwy kebanyakannya berkadar terus, maka kebanyakan hasil sisihan akan menjadi positif, dan jika ia berkaitan secara songsang, maka kebanyakan produk akan menjadi negatif. Oleh itu, jumlah semua hasil sisihan untuk sampel tertentu boleh berfungsi sebagai penunjuk umum untuk kekuatan dan arah hubungan:

Dengan hubungan berkadar terus antara pembolehubah, nilai ini adalah besar dan positif - bagi kebanyakan subjek, sisihan bertepatan dalam tanda (nilai besar satu pembolehubah sepadan dengan nilai besar pembolehubah lain dan sebaliknya). Jika X dan di mempunyai maklum balas, maka untuk kebanyakan subjek, nilai besar satu pembolehubah akan sepadan dengan nilai yang lebih kecil bagi pembolehubah lain, iaitu, tanda-tanda produk akan menjadi negatif, dan jumlah produk secara keseluruhan juga akan besar. dalam nilai mutlak, tetapi negatif dalam tanda. Sekiranya tiada hubungan sistematik antara pembolehubah, maka sebutan positif (hasil sisihan) akan diimbangi dengan sebutan negatif, dan jumlah semua hasil sisihan akan hampir kepada sifar.

Supaya jumlah produk tidak bergantung pada saiz sampel, ia cukup untuk meratakannya. Tetapi kami berminat dengan ukuran hubungan bukan sebagai parameter umum, tetapi sebagai anggaran yang dikira - statistik. Oleh itu, bagi formula penyebaran, dalam kes ini kita akan melakukan perkara yang sama, kita membahagikan jumlah hasil sisihan bukan dengan N, dan di TV - 1. Ternyata ukuran komunikasi, digunakan secara meluas dalam fizik dan sains teknikal, yang dipanggil kovarians (Covahance):


AT psikologi, tidak seperti fizik, kebanyakan pembolehubah diukur pada skala sewenang-wenangnya, kerana ahli psikologi tidak berminat dengan nilai mutlak sifat, tetapi dalam kedudukan relatif subjek dalam kumpulan. Selain itu, kovarians sangat sensitif terhadap skala (dispersi) di mana ciri-ciri diukur. Untuk menjadikan ukuran komunikasi bebas daripada unit pengukuran mana-mana atribut, cukup untuk membahagikan kovarians kepada sisihan piawai yang sepadan. Oleh itu, ia diperolehi untuk-Bagal pekali korelasi K. Pearson:

atau, selepas menggantikan ungkapan untuk o x dan


Jika nilai kedua-dua pembolehubah ditukar kepada nilai-r menggunakan formula


maka formula pekali korelasi r-Pearson kelihatan lebih mudah (071.JPG):

/dict/sociology/article/soc/soc-0525.htm

LINEAR KORELASI- statistik hubungan linear bukan sebab akibat antara dua pembolehubah kuantitatif X dan di. Diukur menggunakan "faktor K.L." Pearson, yang merupakan hasil pembahagian kovarians dengan sisihan piawai kedua-dua pembolehubah:

,

di mana s xy- kovarians antara pembolehubah X dan di;

s x , s y- sisihan piawai untuk pembolehubah X dan di;

x i , y i- nilai pembolehubah X dan di untuk nombor objek i;

x, y- purata aritmetik untuk pembolehubah X dan di.

Nisbah Pearson r boleh mengambil nilai dari selang [-1; +1]. Maknanya r = 0 bermakna tiada hubungan linear antara pembolehubah X dan di(tetapi tidak menolak hubungan statistik bukan linear). Nilai pekali positif ( r> 0) menunjukkan hubungan linear langsung; semakin hampir nilainya kepada +1, semakin kukuh hubungan langsung statistik. Nilai pekali negatif ( r < 0) свидетельствуют об обратной линейной связи; чем ближе его значение к -1, тем сильнее обратная связь. Значения r= ±1 bermaksud kehadiran sambungan linear penuh, terus atau terbalik. Dalam kes sambungan lengkap, semua titik dengan koordinat ( x i , y i) berbaring di atas garis lurus y = a + bx.

"Pekali K.L." Pearson juga digunakan untuk mengukur ketepatan hubungan dalam model regresi pasangan linear.

41. Matriks korelasi dan graf korelasi.

Untuk korelasi secara umum, lihat soalan no. 36 dengan. 56 (64) 063.JPG

matriks korelasi. Selalunya, analisis korelasi merangkumi kajian hubungan bukan dua, tetapi banyak pembolehubah yang diukur pada skala kuantitatif pada sampel tunggal. Dalam kes ini, korelasi dikira untuk setiap pasangan set pembolehubah ini. Pengiraan biasanya dijalankan pada komputer, dan hasilnya adalah matriks korelasi.

Matriks korelasi(korelasi matriks) ialah hasil pengiraan korelasi jenis yang sama bagi setiap pasangan daripada set R pembolehubah diukur dalam skala kuantitatif pada satu sampel.

CONTOH

Andaikan bahawa kita sedang mengkaji hubungan antara 5 pembolehubah (vl, v2,..., v5; P= 5), diukur pada sampel N=30 Manusia. Di bawah ialah jadual data awal dan matriks korelasi.

Dan
data berkaitan:

Matriks korelasi:

Adalah mudah untuk melihat bahawa matriks korelasi adalah segi empat sama, simetri berkenaan dengan pepenjuru utama (takkakg, y = /) y), dengan unit pada pepenjuru utama (sejak G dan = Gu = 1).

Matriks korelasi ialah segi empat sama: bilangan baris dan lajur adalah sama dengan bilangan pembolehubah. Dia simetri relatif kepada pepenjuru utama, sejak korelasi X dengan di sama korelasi di dengan X. Unit terletak pada pepenjuru utamanya, kerana korelasi ciri dengan dirinya adalah sama dengan satu. Akibatnya, bukan semua elemen matriks korelasi tertakluk kepada analisis, tetapi elemen yang berada di atas atau di bawah pepenjuru utama.

Bilangan pekali korelasi, Ciri P yang akan dianalisis dalam kajian hubungan ditentukan oleh formula: P(P- 1)/2. Dalam contoh di atas, bilangan pekali korelasi tersebut ialah 5(5 - 1)/2 = 10.

Tugas utama menganalisis matriks korelasi ialah mendedahkan struktur perkaitan satu set ciri. Ini membolehkan analisis visual pleiades korelasi- imej grafik struktur secara statistikperkaitan yang ketara jika tidak terdapat banyak sambungan sedemikian (sehingga 10-15). Satu lagi cara ialah menggunakan kaedah multivariate: regresi berbilang, analisis faktorial atau kelompok (lihat bahagian "Kaedah pelbagai variasi..."). Menggunakan analisis faktorial atau kelompok, adalah mungkin untuk mengenal pasti kumpulan pembolehubah yang lebih berkait rapat antara satu sama lain berbanding pembolehubah lain. Gabungan kaedah ini juga sangat berkesan, contohnya, jika terdapat banyak tanda dan mereka tidak homogen.

Perbandingan korelasi - tugas tambahan untuk menganalisis matriks korelasi, yang mempunyai dua pilihan. Jika perlu untuk membandingkan korelasi dalam salah satu baris matriks korelasi (untuk salah satu pembolehubah), kaedah perbandingan untuk sampel bersandar digunakan (ms 148-149). Apabila membandingkan korelasi dengan nama yang sama yang dikira untuk sampel yang berbeza, kaedah perbandingan untuk sampel bebas digunakan (ms 147-148).

Kaedah Perbandingan korelasi dalam pepenjuru matriks korelasi (untuk menilai kemantapan proses rawak) dan membandingkan beberapa matriks korelasi yang diperoleh untuk sampel yang berbeza (untuk kehomogenan mereka) memakan masa dan di luar skop buku ini. Anda boleh berkenalan dengan kaedah ini dari buku oleh GV Sukhodolsky 1 .

Masalah kepentingan statistik korelasi. Masalahnya ialah prosedur ujian hipotesis statistik melibatkan satu-pelbagai ujian dijalankan ke atas satu sampel. Jika kaedah yang sama digunakan banyak kali, walaupun jika berkaitan dengan pembolehubah yang berbeza, maka kebarangkalian untuk memperoleh keputusan semata-mata secara kebetulan meningkat. Secara umum, jika kita mengulangi kaedah ujian hipotesis yang sama kepada kali berhubung dengan pembolehubah atau sampel yang berbeza, maka dengan nilai yang ditetapkan a, kami dijamin menerima pengesahan hipotesis dalam ahk bilangan kes.

Mari kita andaikan bahawa matriks korelasi untuk 15 pembolehubah dianalisis, iaitu, 15(15-1)/2 = 105 pekali korelasi dikira. Untuk menguji hipotesis, tahap a = 0.05 ditetapkan. Dengan menguji hipotesis sebanyak 105 kali, kita akan mendapat pengesahannya lima kali (!) tanpa mengira sama ada sambungan itu benar-benar wujud. Mengetahui perkara ini dan setelah menerima, katakan, 15 pekali korelasi "bersignifikan secara statistik", bolehkah kita memberitahu yang mana antaranya diperoleh secara kebetulan, dan yang manakah mencerminkan hubungan sebenar?

Tegasnya, untuk membuat keputusan statistik, adalah perlu untuk mengurangkan tahap a sebanyak kali bilangan hipotesis yang diuji. Tetapi ini tidak digalakkan, kerana kebarangkalian untuk mengabaikan sambungan yang benar-benar sedia ada (membuat ralat jenis II) meningkat dengan cara yang tidak dapat diramalkan.

Matriks korelasi sahaja bukanlah asas yang mencukupiuntuk kesimpulan statistik mengenai pekali individu yang termasuk di dalamnyakorelasi!

Terdapat hanya satu cara yang benar-benar meyakinkan untuk menyelesaikan masalah ini: bahagikan sampel secara rawak kepada dua bahagian dan ambil kira hanya korelasi yang signifikan secara statistik dalam kedua-dua bahagian sampel. Alternatif mungkin ialah penggunaan kaedah multivariate (analisis faktorial, kelompok atau regresi berganda) - untuk pemilihan dan tafsiran seterusnya kumpulan pembolehubah yang berkaitan secara statistik.

Masalah kehilangan nilai. Sekiranya terdapat nilai yang hilang dalam data, maka dua pilihan untuk mengira matriks korelasi adalah mungkin: a) pemadaman nilai baris demi baris (mengecualikankesmengikut senarai); b) pemadaman nilai berpasangan (mengecualikankesberpasangan). Pada pemadaman baris demi baris pemerhatian dengan jurang, keseluruhan baris dipadamkan untuk objek (subjek) yang mempunyai sekurang-kurangnya satu nilai yang hilang untuk salah satu pembolehubah. Kaedah ini membawa kepada matriks korelasi "betul" dalam erti kata bahawa semua pekali dikira daripada set objek yang sama. Walau bagaimanapun, jika nilai yang hilang diedarkan secara rawak dalam pembolehubah, maka kaedah ini boleh membawa kepada fakta bahawa tidak akan ada objek yang tersisa dalam set data yang dipertimbangkan (setiap baris akan mengandungi sekurang-kurangnya satu nilai yang hilang). Untuk mengelakkan situasi ini, gunakan kaedah lain yang dipanggil penyingkiran berpasangan. Kaedah ini hanya mengambil kira jurang dalam setiap pasangan lajur pembolehubah yang dipilih dan mengabaikan jurang dalam pembolehubah lain. Korelasi untuk sepasang pembolehubah dikira untuk objek yang tiada jurang. Dalam banyak situasi, terutamanya apabila bilangan jurang agak kecil, katakan 10%, dan jurang diagihkan secara rawak, kaedah ini tidak membawa kepada ralat yang serius. Walau bagaimanapun, kadang-kadang ini tidak berlaku. Sebagai contoh, dalam bias sistematik (anjakan) anggaran, lokasi sistematik jurang boleh "disembunyikan", yang merupakan sebab perbezaan dalam pekali korelasi yang dibina pada subset yang berbeza (contohnya, untuk subkumpulan objek yang berbeza. ). Satu lagi masalah yang berkaitan dengan matriks korelasi yang dikira dengan berpasangan penyingkiran jurang berlaku apabila menggunakan matriks ini dalam jenis analisis lain (contohnya, dalam regresi berbilang atau analisis faktor). Mereka menganggap bahawa matriks korelasi "betul" digunakan dengan tahap ketekalan tertentu dan "surat-menyurat" pelbagai pekali. Penggunaan matriks dengan anggaran "buruk" (berat sebelah) membawa kepada fakta bahawa program itu sama ada tidak dapat menganalisis matriks sedemikian, atau hasilnya akan menjadi salah. Oleh itu, jika kaedah berpasangan untuk menghapuskan data yang hilang digunakan, adalah perlu untuk menyemak sama ada terdapat atau tidak pola sistematik dalam pengagihan jurang.

Jika penyingkiran data yang hilang secara berpasangan tidak membawa kepada sebarang anjakan sistematik dalam min dan varians (sisihan piawai), maka statistik ini akan serupa dengan yang dikira dengan kaedah mengikut garisan untuk membuang jurang. Sekiranya terdapat perbezaan yang ketara, maka terdapat sebab untuk mengandaikan bahawa terdapat perubahan dalam anggaran. Sebagai contoh, jika min (atau sisihan piawai) nilai pembolehubah TETAPI, yang digunakan dalam mengira korelasinya dengan pembolehubah AT, lebih kurang daripada min (atau sisihan piawai) bagi nilai pembolehubah yang sama TETAPI, yang digunakan dalam mengira korelasinya dengan pembolehubah C, maka ada sebab untuk mengharapkan kedua-dua korelasi ini (A-Bkami) berdasarkan subset data yang berbeza. Akan ada peralihan dalam korelasi yang disebabkan oleh lokasi bukan rawak jurang dalam nilai pembolehubah.

Analisis pleiades korelasi. Selepas menyelesaikan masalah kepentingan statistik unsur-unsur matriks korelasi, korelasi signifikan secara statistik boleh diwakili secara grafik dalam bentuk pleiad korelasi atau pleiades. Galaksi korelasi - ia adalah rajah yang terdiri daripada bucu dan garisan yang menghubungkannya. Bucu sepadan dengan ciri dan biasanya dilambangkan dengan nombor - nombor pembolehubah. Garisan tersebut sepadan dengan perhubungan yang signifikan secara statistik dan menyatakan secara grafik tanda, dan kadangkala tahap keertian /j perhubungan itu.

Galaksi korelasi boleh mencerminkan semua hubungan signifikan secara statistik bagi matriks korelasi (kadangkala dipanggil graf korelasi ) atau hanya bahagian yang dipilih secara bermakna (contohnya, sepadan dengan satu faktor mengikut keputusan analisis faktor).

CONTOH MEMBINA PLEIADI KORELASI


Persediaan untuk pensijilan graduan negeri (akhir): pembentukan pangkalan data USE (senarai umum peserta USE semua kategori, menunjukkan subjek) - mengambil kira hari simpanan sekiranya berlaku kebetulan subjek;

  • Rancangan kerja (27)

    Keputusan

    2. Aktiviti institusi pendidikan untuk meningkatkan kandungan dan menilai kualiti dalam mata pelajaran pendidikan semula jadi dan matematik MOU sekolah menengah No. 4, Litvinovskaya, Chapaevskaya,

  • Dalam kes di mana pengukuran ciri yang dikaji dijalankan pada skala tertib, atau bentuk perhubungan berbeza daripada yang linear, kajian hubungan antara dua pembolehubah rawak dijalankan menggunakan pekali korelasi pangkat. Pertimbangkan pekali korelasi pangkat Spearman. Apabila mengiranya, adalah perlu untuk menentukan kedudukan (menyusun) pilihan sampel. Kedudukan ialah pengumpulan data eksperimen dalam susunan tertentu, sama ada menaik atau menurun.

    Operasi ranking dijalankan mengikut algoritma berikut:

    1. Nilai yang lebih rendah diberikan pangkat yang lebih rendah. Nilai tertinggi diberikan pangkat yang sepadan dengan bilangan nilai kedudukan. Nilai terendah diberikan pangkat bersamaan dengan 1. Contohnya, jika n=7, maka nilai tertinggi akan menerima pangkat nombor 7, kecuali untuk kes yang diperuntukkan oleh peraturan kedua.

    2. Jika beberapa nilai adalah sama, maka mereka diberikan pangkat, iaitu purata pangkat yang akan mereka terima jika mereka tidak sama. Sebagai contoh, pertimbangkan sampel menaik yang terdiri daripada 7 elemen: 22, 23, 25, 25, 25, 28, 30. Nilai 22 dan 23 berlaku sekali, jadi kedudukannya masing-masing sama dengan R22=1, dan R23 =2 . Nilai 25 berlaku 3 kali. Jika nilai ini tidak berulang, maka kedudukannya akan sama dengan 3, 4, 5. Oleh itu, pangkatnya R25 adalah sama dengan min aritmetik 3, 4 dan 5: . Nilai 28 dan 30 tidak berulang, jadi pangkatnya masing-masing R28=6 dan R30=7. Akhirnya, kami mempunyai surat-menyurat berikut:

    3. Jumlah keseluruhan pangkat mesti sepadan dengan yang dikira, yang ditentukan oleh formula:

    di mana n ialah jumlah bilangan nilai kedudukan.

    Percanggahan antara jumlah pangkat sebenar dan yang dikira akan menunjukkan ralat yang dibuat dalam pengiraan pangkat atau penjumlahan mereka. Dalam kes ini, anda perlu mencari dan membetulkan ralat.

    Pekali korelasi pangkat Spearman ialah kaedah yang membolehkan anda menentukan kekuatan dan arah perhubungan antara dua ciri atau dua hierarki ciri. Penggunaan pekali korelasi pangkat mempunyai beberapa batasan:

    • a) Korelasi yang dijangkakan hendaklah monotonik.
    • b) Isipadu setiap sampel mestilah lebih besar daripada atau sama dengan 5. Untuk menentukan had atas sampel, jadual nilai kritikal digunakan (Jadual 3 Lampiran). Nilai maksimum n dalam jadual ialah 40.
    • c) Semasa analisis, kemungkinan besar bilangan pangkat yang sama akan berlaku. Dalam kes ini, pindaan perlu dibuat. Kes yang paling menguntungkan ialah apabila kedua-dua sampel yang dikaji mewakili dua jujukan nilai yang tidak sepadan.

    Untuk menjalankan analisis korelasi, pengkaji mesti mempunyai dua sampel yang boleh diberi kedudukan, contohnya:

    • - dua tanda diukur dalam kumpulan subjek yang sama;
    • - dua hierarki sifat individu yang dikenal pasti dalam dua subjek untuk set sifat yang sama;
    • - dua hierarki atribut kumpulan;
    • - hierarki atribut individu dan kumpulan.

    Kami memulakan pengiraan dengan menyusun penunjuk yang dikaji secara berasingan untuk setiap tanda.

    Marilah kita menganalisis kes dengan dua ciri yang diukur dalam kumpulan subjek yang sama. Pertama, nilai individu disusun mengikut ciri pertama yang diperolehi oleh subjek yang berbeza, dan kemudian nilai individu mengikut ciri kedua. Jika kedudukan yang lebih rendah bagi satu penunjuk sepadan dengan kedudukan yang lebih rendah daripada penunjuk yang lain, dan kedudukan yang lebih tinggi bagi satu penunjuk sepadan dengan kedudukan yang lebih tinggi dari penunjuk lain, maka kedua-dua ciri tersebut adalah berkaitan secara positif. Jika kedudukan yang lebih tinggi bagi satu penunjuk sepadan dengan kedudukan yang lebih rendah dari penunjuk yang lain, maka kedua-dua tanda itu berkaitan secara negatif. Untuk mencari rs, kita tentukan perbezaan antara pangkat (d) bagi setiap subjek. Semakin kecil perbezaan antara pangkat, semakin hampir pekali korelasi pangkat rs akan menjadi "+1". Jika tidak ada hubungan, maka tidak akan ada surat-menyurat antara mereka, maka rs akan mendekati sifar. Semakin besar perbezaan antara pangkat subjek dalam dua pembolehubah, semakin hampir kepada "-1" akan menjadi nilai pekali rs. Oleh itu, pekali korelasi pangkat Spearman ialah ukuran bagi sebarang hubungan monoton di antara dua ciri yang dikaji.

    Pertimbangkan kes dengan dua hierarki ciri individu yang dikenal pasti dalam dua subjek untuk set ciri yang sama. Dalam keadaan ini, nilai individu yang diperolehi oleh setiap dua subjek mengikut set ciri tertentu disenaraikan. Ciri dengan nilai terendah harus diberikan kedudukan pertama; atribut dengan nilai yang lebih tinggi - pangkat kedua, dsb. Penjagaan harus diambil untuk memastikan bahawa semua atribut diukur dalam unit yang sama. Sebagai contoh, adalah mustahil untuk menentukan kedudukan penunjuk jika ia dinyatakan dalam titik "harga" yang berbeza, kerana adalah mustahil untuk menentukan faktor mana yang akan mengambil tempat pertama dari segi keterukan sehingga semua nilai dibawa kepada satu. skala. Jika ciri-ciri yang mempunyai pangkat rendah dalam salah satu mata pelajaran juga mempunyai pangkat rendah dalam mata pelajaran yang lain, dan sebaliknya, maka hierarki individu adalah berkaitan secara positif.

    Dalam kes dua hierarki ciri kumpulan, nilai kumpulan purata yang diperoleh dalam dua kumpulan subjek disusun mengikut set ciri yang sama untuk kumpulan yang dikaji. Seterusnya, kami mengikuti algoritma yang diberikan dalam kes sebelumnya.

    Marilah kita menganalisis kes dengan hierarki ciri individu dan kumpulan. Mereka bermula dengan menilai secara berasingan nilai individu subjek dan nilai kumpulan min mengikut set ciri yang sama yang diperolehi, kecuali subjek yang tidak mengambil bahagian dalam hierarki kumpulan min, sejak individunya hierarki akan dibandingkan dengannya. Korelasi kedudukan memungkinkan untuk menilai tahap ketekalan antara hierarki ciri individu dan kumpulan.

    Mari kita pertimbangkan bagaimana kepentingan pekali korelasi ditentukan dalam kes yang disenaraikan di atas. Dalam kes dua ciri, ia akan ditentukan oleh saiz sampel. Dalam kes dua hierarki ciri individu, kepentingan bergantung pada bilangan ciri yang disertakan dalam hierarki. Dalam dua kes terakhir, kepentingan ditentukan oleh bilangan sifat yang dikaji, dan bukan oleh saiz kumpulan. Oleh itu, kepentingan rs dalam semua kes ditentukan oleh bilangan nilai kedudukan n.

    Apabila menguji kepentingan statistik rs, jadual nilai kritikal pekali korelasi pangkat digunakan, disusun untuk bilangan nilai kedudukan yang berbeza dan tahap kepentingan yang berbeza. Jika nilai mutlak rs mencapai nilai kritikal atau melebihinya, maka korelasi adalah signifikan.

    Apabila mempertimbangkan pilihan pertama (kes dengan dua ciri yang diukur dalam kumpulan subjek yang sama), hipotesis berikut adalah mungkin.

    H0: Korelasi antara pembolehubah x dan y tidak berbeza daripada sifar.

    H1: Kolerasi antara pembolehubah x dan y adalah berbeza secara signifikan daripada sifar.

    Jika kita bekerja dengan mana-mana daripada tiga kes yang tinggal, maka kita perlu mengemukakan sepasang hipotesis lain:

    H0: Korelasi antara hierarki x dan y ialah bukan sifar.

    H1: Korelasi antara hierarki x dan y adalah berbeza dengan ketara daripada sifar.

    Urutan tindakan dalam mengira pekali korelasi pangkat Spearman rs adalah seperti berikut.

    • - Tentukan dua ciri atau dua hierarki ciri yang akan mengambil bahagian dalam pemadanan sebagai pembolehubah x dan y.
    • - Kedudukan nilai pembolehubah x, menetapkan kedudukan 1 kepada nilai terkecil, mengikut peraturan kedudukan. Letakkan kedudukan dalam lajur pertama jadual mengikut urutan nombor subjek atau tanda.
    • - Kedudukan nilai pembolehubah y. Letakkan kedudukan dalam lajur kedua jadual mengikut urutan nombor subjek atau tanda.
    • - Kira perbezaan d antara pangkat x dan y bagi setiap baris jadual. Keputusan diletakkan di lajur jadual seterusnya.
    • - Kira beza kuasa dua (d2). Letakkan nilai yang diperoleh dalam lajur keempat jadual.
    • - Kira jumlah kuasa dua perbezaan itu? d2.
    • - Jika kedudukan yang sama berlaku, hitung pembetulan:

    dengan tx ialah isipadu setiap kumpulan yang sama pangkat dalam sampel x;

    ty ialah saiz setiap kumpulan yang sama pangkat dalam sampel y.

    Kira pekali korelasi pangkat bergantung pada kehadiran atau ketiadaan pangkat yang sama. Dengan ketiadaan pangkat yang sama, pekali korelasi pangkat rs dikira menggunakan formula:

    Dengan kehadiran pangkat yang sama, pekali korelasi pangkat rs dikira menggunakan formula:

    di mana?d2 ialah jumlah perbezaan kuasa dua antara pangkat;

    Tx dan Ty - pembetulan untuk pangkat yang sama;

    n ialah bilangan subjek atau ciri yang mengambil bahagian dalam ranking.

    Tentukan nilai kritikal rs dari jadual 3 Lampiran, untuk bilangan mata pelajaran n. Perbezaan ketara daripada sifar pekali korelasi akan diperhatikan dengan syarat rs tidak kurang daripada nilai kritikal.

    ialah penilaian kuantitatif kajian statistik tentang hubungan antara fenomena, yang digunakan dalam kaedah bukan parametrik.

    Penunjuk menunjukkan bagaimana jumlah perbezaan kuasa dua yang diperhatikan antara pangkat berbeza daripada kes tiada sambungan.

    Tugasan perkhidmatan. Dengan kalkulator dalam talian ini, anda boleh:

    • pengiraan pekali korelasi pangkat Spearman;
    • pengiraan selang keyakinan untuk pekali dan penilaian kepentingannya;

    Pekali korelasi pangkat Spearman merujuk kepada penunjuk penilaian keakraban komunikasi. Ciri kualitatif ketepatan hubungan pekali korelasi pangkat, serta pekali korelasi lain, boleh dinilai menggunakan skala Chaddock.

    Pengiraan pekali terdiri daripada langkah-langkah berikut:

    Sifat pekali korelasi pangkat Spearman

    Kawasan permohonan. Pekali korelasi kedudukan digunakan untuk menilai kualiti komunikasi antara dua set. Di samping itu, kepentingan statistiknya digunakan semasa menganalisis data untuk heteroskedastisitas.

    Contoh. Pada sampel data pembolehubah X dan Y yang diperhatikan:

    1. membuat jadual kedudukan;
    2. cari pekali korelasi pangkat Spearman dan uji keertiannya pada tahap 2a
    3. menilai sifat ketagihan
    Keputusan. Berikan pangkat kepada ciri Y dan faktor X .
    XYpangkat X, dxpangkat Y, d y
    28 21 1 1
    30 25 2 2
    36 29 4 3
    40 31 5 4
    30 32 3 5
    46 34 6 6
    56 35 8 7
    54 38 7 8
    60 39 10 9
    56 41 9 10
    60 42 11 11
    68 44 12 12
    70 46 13 13
    76 50 14 14

    Matriks pangkat.
    pangkat X, dxpangkat Y, d y(dx - dy) 2
    1 1 0
    2 2 0
    4 3 1
    5 4 1
    3 5 4
    6 6 0
    8 7 1
    7 8 1
    10 9 1
    9 10 1
    11 11 0
    12 12 0
    13 13 0
    14 14 0
    105 105 10

    Menyemak ketepatan penyusunan matriks berdasarkan pengiraan checksum:

    Jumlah di atas lajur matriks adalah sama antara satu sama lain dan jumlah semak, yang bermaksud bahawa matriks disusun dengan betul.
    Menggunakan formula, kami mengira pekali korelasi pangkat Spearman.


    Hubungan antara sifat Y dan faktor X adalah kuat dan langsung
    Kepentingan pekali korelasi pangkat Spearman
    Untuk menguji hipotesis nol pada aras keertian α bahawa pekali korelasi pangkat Spearman am adalah sama dengan sifar di bawah hipotesis bersaing H i . p ≠ 0, adalah perlu untuk mengira titik kritikal:

    di mana n ialah saiz sampel; ρ ialah pekali korelasi kedudukan sampel Spearman: t(α, k) ialah titik kritikal bagi kawasan kritikal dua belah, yang didapati daripada jadual titik kritikal taburan Pelajar, mengikut aras keertian α dan bilangan darjah kebebasan k = n-2.
    Jika |p|< Т kp - нет оснований отвергнуть нулевую гипотезу. Ранговая корреляционная связь между качественными признаками не значима. Если |p| >T kp - hipotesis nol ditolak. Terdapat korelasi kedudukan yang signifikan antara ciri kualitatif.
    Mengikut jadual Pelajar kita dapati t(α/2, k) = (0.1/2;12) = 1.782

    Sejak T kp< ρ , то отклоняем гипотезу о равенстве 0 коэффициента ранговой корреляции Спирмена. Другими словами, коэффициент ранговой корреляции статистически - значим и ранговая корреляционная связь между оценками по двум тестам значимая.

    Kalkulator di bawah ini mengira pekali korelasi kedudukan Spearman antara dua pembolehubah rawak. Bahagian teori adalah tradisional di bawah kalkulator.

    Tambah eksport import mod_edit padam

    Perubahan pembolehubah rawak

    anak panah_atasarrow_down anak panah_atasarrow_down
    Item setiap muka surat: 5 10 20 50 100 chevron_left chevron_right

    Perubahan pembolehubah rawak

    Import data Ralat import

    "Salah satu daripada aksara berikut digunakan untuk memisahkan medan data: tab, koma bertitik (;) atau koma(,)" Contoh: -50.5;-50.5

    Import Balik Batal

    Digit selepas titik perpuluhan: 4

    Kira

    Pekali korelasi Spearman

    Jimat kongsi sambungan

    Kaedah pengiraan pekali korelasi pangkat Spearman sebenarnya agak mudah. ​​Ia seperti pekali korelasi Pearson , tetapi direka bukan untuk pengukuran pembolehubah rawak sahaja tetapi untuk mereka nilai pemeringkatan.

    Kita hanya perlu memahami apakah nilai pangkat dan mengapa semua ini perlu.

    Jika unsur-unsur siri variasi disusun dalam tertib menaik atau menurun, itu pangkat daripada elemen itu akan menjadi nombornya dalam siri tertib.

    Sebagai contoh, kita mempunyai siri variasi (17,26,5,14,21). Biarkan "isih" elemen dalam susunan menurun (26,21,17,14,5). 26 mempunyai pangkat 1, 21 - pangkat 2 dan seterusnya, Siri variasi nilai kedudukan akan kelihatan seperti ini (3,1,5,4,2).

    i.e. apabila mengira siri variasi awal pekali Spearman ditukar kepada siri variasi nilai kedudukan dan kemudian formula Pearson digunakan pada mereka.
    .
    Terdapat satu kehalusan - pangkat nilai berulang diambil sebagai purata pangkat. Iaitu, untuk siri (17, 15, 14, 15) siri kedudukan akan kelihatan seperti (1, 2.5, 4, 2.5), kerana elemen pertama ialah 15 mempunyai pangkat 2, dan yang kedua - pangkat 3, dan.

    Jika anda tidak mempunyai nilai berulang, iaitu, semua nilai siri kedudukan - nombor antara 1 dan n, formula Pearson boleh dipermudahkan kepada

    Dengan cara ini, formula ini sering diberikan sebagai formula untuk mengira pekali Spearman.

    Apakah intipati peralihan daripada nilai itu sendiri kepada nilai pangkat mereka?
    Apabila menyiasat korelasi nilai kedudukan anda boleh mencari sejauh mana pergantungan kedua-dua pembolehubah diterangkan oleh fungsi monotonik.

    Tanda pekali menunjukkan arah hubungan antara pembolehubah. Jika tanda positif nilai Y mempunyai kecenderungan untuk meningkat dengan peningkatan X. Jika tanda negatif nilai Y mempunyai kecenderungan untuk menurun dengan peningkatan X. Jika pekali adalah 0 ada maka tiada kecenderungan. Jika pekali sama dengan 1 atau -1, hubungan antara X dan Y mempunyai rupa fungsi monotonik, i.e. dengan pertambahan X, Y juga bertambah dan begitu juga sebaliknya.

    Iaitu, tidak seperti pekali korelasi Pearson, yang boleh mengesan hanya hubungan linear satu pembolehubah dari yang lain, pekali korelasi Spearman boleh mengesan pergantungan monotonik, di mana hubungan linear langsung tidak dapat didedahkan.

    Berikut adalah contoh.
    Biar saya jelaskan dengan contoh. Katakan kita memeriksa fungsi y=10/x.
    Kami mempunyai ukuran X dan Y berikut
    {{1,10}, {5,2}, {10,1}, {20,0.5}, {100,0.1}}
    Untuk data ini, pekali korelasi Pearson adalah sama dengan -0.4686, i.e. hubungan itu lemah atau tiada. Dan pekali korelasi Spearman adalah sama dengan -1, seolah-olah ia memberi petunjuk kepada penyelidik bahawa Y mempunyai pergantungan monotonik negatif yang kuat daripada X.

    Pekali korelasi pangkat, yang dicadangkan oleh K. Spearman, merujuk kepada penunjuk bukan parametrik perhubungan antara pembolehubah yang diukur pada skala pangkat. Apabila mengira pekali ini, tiada andaian diperlukan tentang sifat taburan ciri dalam populasi umum. Pekali ini menentukan tahap keketatan sambungan ciri ordinal, yang dalam kes ini mewakili pangkat nilai yang dibandingkan.

    Nilai pekali korelasi Spearman juga terletak pada julat +1 dan -1. Ia, seperti pekali Pearson, boleh menjadi positif dan negatif, mencirikan arah hubungan antara dua ciri yang diukur dalam skala pangkat.

    Pada dasarnya, bilangan ciri kedudukan (kualiti, sifat, dll.) boleh menjadi apa-apa, tetapi proses penarafan lebih daripada 20 ciri adalah sukar. Ada kemungkinan bahawa inilah sebabnya mengapa jadual nilai kritikal pekali korelasi pangkat dikira hanya untuk empat puluh ciri kedudukan (n< 40, табл. 20 приложения 6).

    Pekali korelasi pangkat Spearman dikira dengan formula:

    di mana n ialah bilangan ciri kedudukan (penunjuk, subjek);

    D ialah perbezaan antara pangkat dalam dua pembolehubah bagi setiap mata pelajaran;

    Jumlah perbezaan pangkat kuasa dua.

    Dengan menggunakan pekali korelasi pangkat, pertimbangkan contoh berikut.

    Contoh: Ahli psikologi mengetahui bagaimana petunjuk individu kesediaan untuk sekolah, yang diperoleh sebelum permulaan persekolahan untuk 11 pelajar gred pertama dan prestasi purata mereka pada akhir tahun persekolahan, saling berkaitan.

    Untuk menyelesaikan masalah ini, kami meletakkan, pertama, nilai penunjuk kesediaan sekolah yang diperolehi apabila memasuki sekolah, dan, kedua, penunjuk prestasi akhir pada akhir tahun untuk pelajar yang sama secara purata. Keputusan dibentangkan dalam Jadual. tiga belas.

    Jadual 13

    Bilangan pelajar

    Peringkat penunjuk kesediaan sekolah

    Kedudukan purata prestasi tahunan

    Kami menggantikan data yang diperolehi ke dalam formula dan melakukan pengiraan. Kita mendapatkan:

    Untuk mencari tahap kepentingan, kita beralih kepada Jadual. 20 Lampiran 6, yang memberikan nilai kritikal untuk pekali korelasi pangkat.

    Kami menekankan bahawa dalam Jadual. 20 Lampiran 6, serta dalam jadual untuk korelasi linear Pearson, semua nilai pekali korelasi diberikan dalam nilai mutlak. Oleh itu, tanda pekali korelasi hanya diambil kira apabila mentafsirnya.

    Mencari aras keertian dalam jadual ini dijalankan mengikut bilangan n, iaitu mengikut bilangan subjek. Dalam kes kami, n = 11. Untuk nombor ini, kami dapati:

    0.61 untuk P 0.05

    0.76 untuk P 0.01

    Kami membina ``paksi kepentingan"" yang sepadan:

    Pekali korelasi yang terhasil bertepatan dengan nilai kritikal untuk tahap keertian 1%. Oleh itu, boleh dikatakan bahawa penunjuk kesediaan sekolah dan gred akhir gred pertama adalah berkorelasi positif - dengan kata lain, semakin tinggi penunjuk kesediaan sekolah, semakin baik pelajar gred pertama belajar. Dari segi hipotesis statistik, ahli psikologi mesti menolak hipotesis nol persamaan dan menerima hipotesis alternatif (tetapi perbezaan), yang mengatakan bahawa hubungan antara kesediaan sekolah dan prestasi purata adalah bukan sifar.

    Kes pangkat yang sama (sama).

    Dengan kehadiran pangkat yang sama, formula untuk mengira pekali korelasi linear Spearman akan agak berbeza. Dalam kes ini, dua istilah baharu ditambahkan pada formula untuk mengira pekali korelasi, dengan mengambil kira pangkat yang sama. Ia dipanggil pembetulan untuk pangkat yang sama dan ditambah kepada pengangka formula pengiraan.

    di mana n ialah bilangan pangkat yang sama dalam lajur pertama,

    k ialah bilangan pangkat yang sama dalam lajur kedua.

    Jika terdapat dua kumpulan pangkat yang sama dalam mana-mana lajur, maka formula pembetulan menjadi lebih rumit:

    di mana n ialah bilangan pangkat yang sama dalam kumpulan pertama lajur kedudukan,

    k ialah bilangan pangkat yang sama dalam kumpulan kedua lajur kedudukan. Pengubahsuaian formula dalam kes umum adalah seperti berikut:

    Contoh: Seorang ahli psikologi, menggunakan ujian perkembangan mental (ISTU), menjalankan kajian kecerdasan dalam 12 pelajar dalam darjah 9. Pada masa yang sama, beliau meminta guru sastera dan matematik untuk meletakkan kedudukan pelajar yang sama ini mengikut petunjuk perkembangan mental. Tugasnya adalah untuk menentukan bagaimana petunjuk objektif perkembangan mental (data STI) dan penilaian pakar guru berkaitan.

    Data percubaan masalah ini dan lajur tambahan yang diperlukan untuk mengira pekali korelasi Spearman dibentangkan dalam bentuk jadual. empat belas.

    Jadual 14

    Bilangan pelajar

    Peringkat ujian dengan bantuan SHTUR

    Penilaian pakar guru dalam matematik

    Penilaian pakar guru dalam sastera

    D (lajur kedua dan ketiga)

    D (lajur kedua dan keempat)

    (lajur kedua dan ketiga)

    (lajur kedua dan keempat)

    Memandangkan kedudukan menggunakan kedudukan yang sama, adalah perlu untuk menyemak ketepatan kedudukan dalam lajur kedua, ketiga dan keempat jadual. Penjumlahan dalam setiap lajur ini memberikan jumlah yang sama - 78.

    Kami menyemak mengikut formula pengiraan. Cek memberikan:

    Lajur kelima dan keenam jadual menunjukkan nilai perbezaan pangkat antara penilaian pakar ahli psikologi pada ujian STUD untuk setiap pelajar dan nilai penilaian pakar guru, masing-masing, dalam matematik dan sastera. . Jumlah perbezaan pangkat mestilah sama dengan sifar. Penjumlahan nilai D dalam lajur kelima dan keenam memberikan hasil yang diingini. Oleh itu, penolakan pangkat telah dijalankan dengan betul. Semakan serupa mesti dilakukan setiap kali semasa melakukan jenis ranking yang kompleks.

    Sebelum memulakan pengiraan menggunakan formula, adalah perlu untuk mengira pembetulan untuk kedudukan yang sama untuk lajur kedua, ketiga dan keempat jadual.

    Dalam kes kami, terdapat dua kedudukan yang sama dalam lajur kedua jadual, oleh itu, mengikut formula, nilai pembetulan D1 ialah:

    Terdapat tiga kedudukan yang sama dalam lajur ketiga, oleh itu, mengikut formula, nilai pembetulan D2 ialah:

    Dalam lajur keempat jadual, terdapat dua kumpulan tiga pangkat yang sama, oleh itu, mengikut formula, nilai pembetulan D3 ialah:

    Sebelum meneruskan untuk menyelesaikan masalah itu, mari kita ingat bahawa ahli psikologi mengetahui dua soalan - bagaimanakah nilai pangkat pada ujian STUR berkaitan dengan penilaian pakar dalam matematik dan kesusasteraan. Itulah sebabnya pengiraan dilakukan dua kali.

    Kami menganggap pekali peringkat pertama, dengan mengambil kira bahan tambahan mengikut formula. Kita mendapatkan:

    Mari kita mengira tanpa mengambil kira bahan tambahan:

    Seperti yang anda lihat, perbezaan dalam nilai pekali korelasi ternyata sangat tidak ketara.

    Kami menganggap pekali kedudukan kedua, dengan mengambil kira bahan tambahan mengikut formula. Kita mendapatkan:

    Mari kita mengira tanpa mengambil kira bahan tambahan:

    Sekali lagi, perbezaannya sangat kecil. Oleh kerana bilangan pelajar dalam kedua-dua kes adalah sama, mengikut Jadual. 20 Lampiran 6 kita dapati nilai kritikal pada n = 12 untuk kedua-dua pekali korelasi sekaligus.

    0.58 untuk P 0.05

    0.73 untuk P 0.01

    Plotkan nilai pertama pada ``paksi kepentingan"":

    Dalam kes pertama, pekali korelasi pangkat yang diperoleh adalah dalam zon keertian. Oleh itu, ahli psikologi mesti menolak hipotesis nol bahawa pekali korelasi adalah serupa dengan sifar dan menerima hipotesis alternatif bahawa pekali korelasi adalah berbeza secara signifikan daripada sifar. Dengan kata lain, keputusan yang diperoleh menunjukkan bahawa semakin tinggi markah pakar pelajar dalam ujian STUD, semakin tinggi markah pakar mereka dalam matematik.

    Plotkan nilai kedua pada ``paksi kepentingan"":

    Dalam kes kedua, pekali korelasi pangkat berada dalam zon ketidakpastian. Oleh itu, ahli psikologi boleh menerima hipotesis nol bahawa pekali korelasi adalah serupa dengan sifar dan menolak hipotesis alternatif bahawa pekali korelasi adalah berbeza secara signifikan daripada sifar. Dalam kes ini, keputusan yang diperoleh menunjukkan bahawa penilaian kepakaran pelajar terhadap ujian STUD tidak berkaitan dengan penilaian pakar dalam kesusasteraan.

    Untuk menggunakan pekali korelasi Spearman, syarat berikut mesti dipenuhi:

    1. Pembolehubah yang dibandingkan mesti diperoleh pada skala ordinal (pangkat), tetapi juga boleh diukur pada skala selang dan nisbah.

    2. Sifat pengagihan nilai berkorelasi tidak penting.

    3. Bilangan ciri yang berbeza dalam pembolehubah yang dibandingkan X dan Y mestilah sama.

    Jadual untuk menentukan nilai kritikal pekali korelasi Spearman (Jadual 20, Lampiran 6) dikira daripada bilangan tanda yang sama dengan n = 5 hingga n = 40, dan dengan bilangan pembolehubah yang lebih besar, jadual untuk Pekali korelasi Pearson harus digunakan (Jadual 19, Lampiran 6). Mencari nilai kritikal dijalankan pada k = n.