Giá trị tương quan xếp hạng quan trọng của Spearman. Ứng dụng tương quan Spearman và Pearson

37. Hệ số tương quan xếp hạng của Spearman.

S. 56 (64) 063.JPG

http://psystat.at.ua/publ/1-1-0-33

Hệ số tương quan xếp hạng của Spearman được sử dụng trong trường hợp:
- biến có thang xếp hạngđo;
- việc phân phối dữ liệu quá khác so với Bình thường hoặc hoàn toàn không được biết đến;
- mẫu có thể tích nhỏ (N< 30).

Cách giải thích hệ số tương quan xếp hạng Spearman không khác với hệ số Pearson, nhưng ý nghĩa của nó có phần khác nhau. Để hiểu sự khác biệt giữa các phương pháp này và chứng minh một cách hợp lý các lĩnh vực ứng dụng của chúng, hãy so sánh các công thức của chúng.

Hệ số tương quan Pearson:

Hệ số tương quan Spearman:

Như bạn có thể thấy, các công thức khác nhau đáng kể. Hãy so sánh các công thức

Công thức tương quan Pearson sử dụng giá trị trung bình số học và độ lệch chuẩn của chuỗi tương quan, nhưng công thức Spearman thì không. Vì vậy, để có được kết quả phù hợp khi sử dụng công thức Pearson, điều cần thiết là chuỗi tương quan phải gần với phân bố chuẩn (giá trị trung bình và độ lệch chuẩn là thông số phân phối bình thường). Điều này không liên quan đến công thức Spearman.

Một yếu tố của công thức Pearson là việc tiêu chuẩn hóa từng chuỗi trong thang đo z.

Như bạn có thể thấy, việc chuyển đổi các biến sang thang đo Z có trong công thức tính hệ số tương quan Pearson. Theo đó, đối với hệ số Pearson, thang đo của dữ liệu hoàn toàn không quan trọng: ví dụ: chúng ta có thể tương quan giữa hai biến, một trong số đó có giá trị tối thiểu. = 0 và tối đa. = 1 và phút thứ hai. = 100 và tối đa. = 1000. Cho dù phạm vi giá trị có khác nhau đến đâu thì chúng cũng sẽ được chuyển đổi thành các giá trị z tiêu chuẩn có cùng tỷ lệ.

Việc chuẩn hóa như vậy không xảy ra trong hệ số Spearman, do đó

ĐIỀU KIỆN BẮT BUỘC ĐỂ SỬ DỤNG HỆ SỐ SPEARMAN LÀ SỰ BẰNG ĐẲNG CỦA PHẠM VI HAI BIẾN.

Trước khi sử dụng hệ số Spearman cho chuỗi dữ liệu có phạm vi khác nhau, cần phải thứ hạng. Xếp hạng dẫn đến các giá trị của chuỗi này đạt được mức tối thiểu giống nhau = 1 (thứ hạng tối thiểu) và mức tối đa bằng số lượng giá trị (tối đa, thứ hạng cuối cùng = N, tức là số trường hợp tối đa trong mẫu) .

Trong trường hợp nào bạn có thể làm mà không cần xếp hạng?

Đây là những trường hợp khi dữ liệu ban đầu được thang xếp hạng. Ví dụ: bài kiểm tra định hướng giá trị của Rokeach.

Ngoài ra, đây là những trường hợp khi số lượng tùy chọn giá trị nhỏ và mẫu chứa mức tối thiểu và tối đa cố định. Ví dụ: trong vi phân ngữ nghĩa, tối thiểu = 1, tối đa = 7.

Ví dụ tính hệ số tương quan xếp hạng Spearman

Thử nghiệm định hướng giá trị của Rokeach được thực hiện trên hai mẫu X và Y. Mục tiêu: tìm hiểu mức độ phân cấp giá trị của các mẫu này (theo nghĩa đen, chúng giống nhau đến mức nào).

Giá trị kết quả r=0,747 được kiểm tra bởi bảng giá trị tới hạn. Theo bảng, với N=18 thì giá trị thu được có ý nghĩa ở mức p<=0,005

Hệ số tương quan xếp hạng Spearman và Kendal

Đối với các biến thuộc thang đo thứ tự hoặc đối với các biến không tuân theo phân phối chuẩn, cũng như đối với các biến thuộc thang đo khoảng, mối tương quan xếp hạng Spearman được tính thay vì hệ số Pearson. Để làm điều này, các giá trị biến riêng lẻ được gán thứ hạng, sau đó được xử lý bằng các công thức thích hợp. Để phát hiện mối tương quan thứ hạng, hãy xóa hộp kiểm tương quan Pearson mặc định trong hộp thoại Tương quan hai biến.... Thay vào đó, hãy kích hoạt phép tính tương quan Spearman. Tính toán này sẽ cho kết quả sau. Các hệ số tương quan xếp hạng rất gần với giá trị tương ứng của các hệ số Pearson (các biến ban đầu có phân phối chuẩn).

titkova-matmetody.pdf p. 45

Phương pháp tương quan cấp bậc của Spearman cho phép bạn xác định độ chặt (sức mạnh) và hướng

mối tương quan giữa hai dấu hiệu hoặc hai hồ sơ (phân cấp) dấu hiệu.

Để tính tương quan thứ hạng, cần có hai hàng giá trị,

có thể được xếp hạng. Chuỗi giá trị như vậy có thể là:

1) hai dấu hiệuđược đo bằng nhau nhómđối tượng;

2) hai hệ thống phân cấp đặc điểm riêng biệt,được xác định ở hai đối tượng sử dụng cùng một

tập hợp các tính năng;

3) hai hệ thống phân cấp nhóm của các đặc điểm,

4) cá nhân và nhóm thứ bậc của các tính năng.

Đầu tiên, các chỉ số được xếp hạng riêng biệt cho từng đặc điểm.

Theo quy định, thứ hạng thấp hơn sẽ được gán cho giá trị thuộc tính thấp hơn.

Trong trường hợp đầu tiên (hai đặc điểm), các giá trị riêng lẻ được xếp hạng theo đặc điểm đầu tiên

đặc điểm thu được bởi các đối tượng khác nhau, sau đó là các giá trị riêng lẻ cho lần thứ hai

dấu hiệu.

Nếu hai đặc điểm có mối quan hệ tích cực với nhau thì những đối tượng có thứ hạng thấp

một trong số họ sẽ có thứ hạng thấp trong nhóm kia, và những đối tượng có thứ hạng cao trong

một trong những đặc điểm cũng sẽ có thứ hạng cao cho đặc điểm kia. Để tính rs

sự khác biệt cần được xác định (d) giữa các cấp bậc mà một môn học nhất định đạt được trong cả hai

dấu hiệu. Sau đó, các chỉ số d này được chuyển đổi theo một cách nhất định và trừ đi 1. Hơn

Sự chênh lệch giữa các cấp bậc càng nhỏ thì rs sẽ càng lớn và càng gần +1.

Nếu không có sự tương quan thì tất cả các cấp bậc sẽ bị trộn lẫn và sẽ không có

không có thư từ. Công thức được thiết kế sao cho trong trường hợp này rs sẽ gần bằng 0.

Trường hợp tương quan âm thứ hạng thấp của các môn học trên một cơ sở

cấp bậc cao trên cơ sở khác sẽ tương ứng và ngược lại. Sự chênh lệch càng lớn

giữa thứ hạng của đối tượng theo hai biến thì rs càng gần -1.

Trong trường hợp thứ hai (hai hồ sơ cá nhân), các cá nhân được xếp hạng

giá trị mà mỗi người trong số 2 đối tượng đạt được theo một giá trị nhất định (giống nhau đối với họ

cả hai) tập hợp các tính năng. Xếp hạng đầu tiên sẽ được trao cho tính năng có giá trị thấp nhất; hạng hai –

một dấu hiệu có giá trị cao hơn, v.v. Rõ ràng, tất cả các đặc điểm phải được đo lường trong

cùng một đơn vị, nếu không thì không thể xếp hạng được. Ví dụ, không thể

xếp hạng các chỉ số trên Bản kiểm kê tính cách Cattell (16PF), nếu chúng được thể hiện bằng

điểm "thô", vì phạm vi giá trị khác nhau đối với các yếu tố khác nhau: từ 0 đến 13, từ 0 đến

20 và từ 0 đến 26. Chúng ta không thể nói yếu tố nào sẽ chiếm vị trí đầu tiên trong

biểu thức cho đến khi chúng tôi đưa tất cả các giá trị vào một thang đo duy nhất (thường xuyên nhất đây là thang đo tường).

Nếu hệ thống phân cấp cá nhân của hai chủ thể có liên quan tích cực thì các dấu hiệu

có thứ hạng thấp ở một trong số họ sẽ có thứ hạng thấp ở người kia và ngược lại.

Ví dụ: nếu yếu tố E (ưu thế) của một đối tượng có thứ hạng thấp nhất thì

đối tượng thử nghiệm khác, nó sẽ có thứ hạng thấp nếu một đối tượng thử nghiệm có yếu tố C

(sự ổn định về mặt cảm xúc) có thứ hạng cao nhất thì đối tượng kia cũng phải có

yếu tố này có thứ hạng cao, v.v.

Trong trường hợp thứ ba (hai hồ sơ nhóm), các giá trị trung bình của nhóm được xếp hạng,

thu được ở 2 nhóm môn học theo một bộ cụ thể, giống hệt nhau cho cả hai nhóm

dấu hiệu. Trong phần tiếp theo, cách lập luận cũng giống như trong hai trường hợp trước.

Trường hợp 4 (hồ sơ cá nhân và nhóm) được xếp hạng riêng

giá trị riêng lẻ của chủ đề và giá trị trung bình của nhóm cho cùng một bộ

các dấu hiệu thu được, theo quy định, bằng cách loại trừ chủ đề riêng lẻ này - anh ấy

không tham gia vào hồ sơ nhóm trung bình mà hồ sơ cá nhân của anh ta sẽ được so sánh

hồ sơ. Tương quan xếp hạng sẽ cho phép bạn kiểm tra mức độ nhất quán của từng cá nhân và

hồ sơ nhóm.

Trong cả bốn trường hợp, tầm quan trọng của hệ số tương quan thu được đều được xác định

theo số lượng giá trị được xếp hạng N. Trong trường hợp đầu tiên, đại lượng này sẽ trùng với

cỡ mẫu n. Trong trường hợp thứ hai, số lượng quan sát sẽ là số lượng đặc điểm,

tạo nên hệ thống thứ bậc. Trong trường hợp thứ ba và thứ tư, N cũng là số lượng so sánh

đặc điểm chứ không phải số lượng đối tượng trong nhóm. Giải thích chi tiết được đưa ra trong các ví dụ. Nếu như

giá trị tuyệt đối của rs đạt hoặc vượt giá trị tới hạn, tương quan

đáng tin cậy.

Giả thuyết.

Có hai giả thuyết có thể xảy ra. Điều đầu tiên áp dụng cho trường hợp 1, điều thứ hai áp dụng cho ba trường hợp còn lại

Phiên bản đầu tiên của giả thuyết

H0: Tương quan giữa biến A và B không khác 0.

H2: Mối tương quan giữa biến A và B khác biệt đáng kể so với 0.

Phiên bản thứ hai của giả thuyết

H0: Mối tương quan giữa thứ bậc A và B không khác 0.

H2: Mối tương quan giữa thứ bậc A và B khác biệt đáng kể so với 0.

Hạn chế của hệ số tương quan thứ hạng

1. Đối với mỗi biến phải trình bày ít nhất 5 quan sát. Phía trên

ranh giới lấy mẫu được xác định bởi các bảng giá trị tới hạn có sẵn .

2. Hệ số tương quan xếp hạng của Spearman rs cho một số lượng lớn các từ giống nhau

xếp hạng cho một hoặc cả hai biến so sánh sẽ cho giá trị thô. Lý tưởng nhất

cả hai chuỗi tương quan phải đại diện cho hai chuỗi phân kỳ

các giá trị. Nếu điều kiện này không được đáp ứng thì phải sửa đổi

cùng cấp bậc.

Hệ số tương quan xếp hạng của Spearman được tính bằng công thức:

Nếu cả hai chuỗi thứ hạng được so sánh đều chứa các nhóm có cùng thứ hạng,

trước khi tính hệ số tương quan hạng cần hiệu chỉnh cho phù hợp

Ta và bậc truyền hình:

Ta = Σ(a3 – a)/12,

Тв = Σ(в3 – в)/12,

Ở đâu MỘT - khối lượng của mỗi nhóm cấp bậc giống hệt nhau trong dãy xếp hạng A, trong – khối lượng của mỗi

các nhóm có cấp bậc giống hệt nhau trong dãy cấp B.

Để tính giá trị thực nghiệm của rs, hãy sử dụng công thức:

38. Hệ số tương quan điểm-lưỡng kim.

Về mối tương quan nói chung, xem câu hỏi số 36 Với. 56 (64) 063.JPG

harchenko-korranaliz.pdf

Đặt biến X được đo trên thang đo mạnh và biến Y trên thang đo nhị phân. Hệ số tương quan song tiếp điểm rpb được tính theo công thức:

Ở đây x 1 là giá trị trung bình trên các đối tượng X có giá trị “một” trên Y;

x 0 – giá trị trung bình trên các đối tượng X có giá trị bằng 0 trên Y;

s x – độ lệch chuẩn của tất cả các giá trị dọc theo X;

n 1 – số đối tượng “một” trong Y, n 0 – số đối tượng “không” trong Y;

n = n 1 + n 0 – cỡ mẫu.

Hệ số tương quan song tiếp điểm cũng có thể được tính bằng các biểu thức tương đương khác:

đây x– giá trị trung bình chung của biến X.

Hệ số tương quan nhị phân điểm rpb thay đổi từ -1 đến +1. Giá trị của nó bằng 0 nếu các biến có một Y có mức trung bình Y, bằng giá trị trung bình của các biến có 0 trên Y.

Bài kiểm tra giả thuyết ý nghĩa hệ số tương quan nhị phân điểm là để kiểm tra giả thuyết vô giá trịh 0 về sự bằng nhau của hệ số tương quan chung với 0: ρ = 0, được thực hiện bằng cách sử dụng bài kiểm tra t của Học sinh. Ý nghĩa thực nghiệm

so sánh với các giá trị tới hạn t Một (df) về số bậc tự do df = N– 2

Nếu điều kiện | t| ≤ tα(df), giả thuyết không ρ = 0 không bị bác bỏ. Hệ số tương quan nhị phân điểm khác đáng kể so với 0 nếu giá trị thực nghiệm | t| rơi vào vùng tới hạn, nghĩa là nếu điều kiện | t| > tα(N– 2). Độ tin cậy của mối quan hệ được tính toán bằng hệ số tương quan nhị phân điểm rpb, cũng có thể được xác định bằng cách sử dụng tiêu chí χ 2 là số bậc tự do df= 2.

Tương quan nhị phân điểm

Sự sửa đổi tiếp theo của hệ số tương quan của tích mômen được phản ánh trong biểu thức nhị phân điểm r. Chỉ số này. cho thấy mối quan hệ giữa hai biến, một trong số đó được cho là liên tục và có phân phối chuẩn, còn biến kia là rời rạc theo nghĩa chặt chẽ của từ này. Hệ số tương quan song tiếp điểm được ký hiệu là r pbis Vì trong r pbis sự phân đôi phản ánh bản chất thực sự của biến rời rạc chứ không phải nhân tạo như trong trường hợp r bis, dấu của nó được xác định tùy ý. Vì vậy, cho tất cả các mục đích thực tế. bàn thắng r pbisđược xem xét trong khoảng từ 0,00 đến +1,00.

Cũng có trường hợp hai biến được giả định là liên tục và có phân phối chuẩn, nhưng cả hai đều bị phân đôi một cách giả tạo, như trong trường hợp tương quan song biến. Để đánh giá mối quan hệ giữa các biến đó, hệ số tương quan tetrachoric được sử dụng r Tết, cũng được Pearson lai tạo. Nền tảng (chính xác) công thức và thủ tục tính toán r Tết khá phức tạp. Vì vậy, với thực tiễn Phương pháp này sử dụng xấp xỉ r Tết, thu được trên cơ sở các thủ tục và bảng viết tắt.

/on-line/dictionary/dictionary.php?term=511

HỆ SỐ LƯỢNG ĐIỂM là hệ số tương quan giữa hai biến, một biến được đo theo thang đo nhị phân và biến kia được đo theo thang khoảng. Nó được sử dụng trong các bài kiểm tra cổ điển và hiện đại như một chỉ báo về chất lượng của nhiệm vụ kiểm tra - độ tin cậy và tính nhất quán với điểm kiểm tra tổng thể.

Để tương quan các biến đo lường trong thang đo phân đôi và khoảng sử dụng hệ số tương quan điểm-lưỡng kim.
Hệ số tương quan điểm-ngược dòng là phương pháp phân tích tương quan mối quan hệ của các biến, một trong số đó được đo theo thang tên và chỉ lấy 2 giá trị (ví dụ: nam/nữ, câu trả lời đúng/câu trả lời sai, đặc điểm hiện diện/không hiện diện) và thứ hai theo tỷ lệ thang đo hoặc thang đo khoảng. Công thức tính hệ số tương quan điểm-lưỡng kim:

Ở đâu:
m1 và m0 là các giá trị trung bình của X có giá trị 1 hoặc 0 trong Y.
σx – độ lệch chuẩn của tất cả các giá trị theo X
n1,n0 – số giá trị X từ 1 hoặc 0 đến Y.
n – tổng số cặp giá trị

Thông thường, loại hệ số tương quan này được sử dụng để tính toán mối quan hệ giữa các mục kiểm tra và tổng thang đo. Đây là một loại kiểm tra tính hợp lệ.

39. Hệ số tương quan bậc-lưỡng phân.

Về mối tương quan nói chung, xem câu hỏi số 36 Với. 56 (64) 063.JPG

harchenko-korranaliz.pdf p. 28

Xếp hạng hệ số tương quan hai chuỗi, sử dụng trong trường hợp một trong các biến ( X) được trình bày theo thang thứ tự và cái còn lại ( Y) – nhị phân, tính theo công thức

Đây là thứ hạng trung bình của các đối tượng có một trong Y; – thứ hạng trung bình của các đối tượng từ 0 đến Y, N- cỡ mẫu.

Bài kiểm tra giả thuyết ý nghĩa Hệ số tương quan bậc-lưỡng phân được thực hiện tương tự như hệ số tương quan nhị phân điểm bằng cách sử dụng phép thử của Sinh viên thay thế trong các công thức rpb TRÊN rrb.

Trong trường hợp một biến được đo lường theo thang đo nhị phân (biến X), và cái còn lại trong thang xếp hạng (biến Y), hệ số tương quan thứ hạng-lưỡng chuỗi được sử dụng. Chúng ta nhớ rằng biến X,được đo trên thang đo nhị phân, chỉ lấy hai giá trị (mã) 0 và 1. Chúng tôi đặc biệt nhấn mạnh: mặc dù thực tế là hệ số này thay đổi trong phạm vi từ –1 đến +1, dấu hiệu của nó không quan trọng đối với việc giải thích kết quả. Đây là một ngoại lệ khác đối với quy tắc chung.

Hệ số này được tính bằng công thức:

ở đâu ` X 1– thứ hạng trung bình cho các phần tử của biến Y, tương ứng với mã (dấu) 1 của biến X;

`X 0 – thứ hạng trung bình cho các phần tử của biến Y, tương ứng với mã (dấu) 0 trong biến X\

N - tổng số phần tử trong biến X.

Để áp dụng hệ số tương quan thứ hạng-lưỡng kim phải đáp ứng các điều kiện sau:

1. Các biến được so sánh phải được đo lường trên các thang đo khác nhau: một X –ở quy mô phân đôi; khác Y- trên thang xếp hạng.

2. Số đặc điểm khác nhau của các biến so sánh X Và Y nên giống nhau.

3. Để đánh giá mức độ tin cậy của hệ số tương quan bậc-ngược tiếp, bạn nên sử dụng công thức (11.9) và bảng giá trị tới hạn cho bài kiểm tra Sinh viên k = n – 2.

http://psystat.at.ua/publ/drugie_vidy_koehfficienta_korreljacii/1-1-0-38

Các trường hợp một trong các biến được biểu diễn trong thang phân đôi, và cái còn lại trong cấp bậc (thứ tự), yêu cầu ứng dụng hệ số tương quan cấp bậc-lưỡng dòng:

rpb=2 / n * (m1 - m0)

Ở đâu:
n – số lượng đối tượng đo
m1 và m0 - thứ hạng trung bình của các đối tượng có 1 hoặc 0 ở biến thứ hai.
Hệ số này cũng được sử dụng khi kiểm tra tính hợp lệ của các bài kiểm tra.

40. Hệ số tương quan tuyến tính.

Về tương quan nói chung (và tương quan tuyến tính nói riêng), xem câu hỏi số 36 Với. 56 (64) 063.JPG

HỆ SỐ HIỆU QUẢ CỦA Ông PEARSON

r-Lề (lề r) được sử dụng để nghiên cứu mối quan hệ giữa hai số liệucác biến khác nhau được đo trên cùng một mẫu. Có nhiều tình huống mà việc sử dụng nó là phù hợp. Trí thông minh có ảnh hưởng đến kết quả học tập ở những năm cuối đại học? Mức lương của một nhân viên có liên quan đến sự thân thiện của anh ta với đồng nghiệp không? Tâm trạng của học sinh có ảnh hưởng đến sự thành công khi giải một bài toán số học phức tạp không? Để trả lời những câu hỏi như vậy, nhà nghiên cứu phải đo lường hai chỉ số quan tâm đối với mỗi thành viên trong mẫu. Dữ liệu để nghiên cứu mối quan hệ sau đó được lập bảng, như trong ví dụ dưới đây.

VÍ DỤ 6.1

Bảng trình bày một ví dụ về dữ liệu ban đầu để đo lường hai chỉ số trí thông minh (bằng lời nói và phi ngôn ngữ) cho 20 học sinh lớp 8.

Mối quan hệ giữa các biến này có thể được mô tả bằng biểu đồ phân tán (xem Hình 6.3). Biểu đồ cho thấy có một số mối liên hệ giữa các chỉ số đo được: giá trị của trí thông minh ngôn ngữ càng lớn thì (hầu hết) giá trị của trí thông minh phi ngôn ngữ càng lớn.

Trước khi đưa ra công thức cho hệ số tương quan, chúng ta hãy thử tìm ra logic xuất hiện của nó bằng cách sử dụng dữ liệu từ ví dụ 6.1. Vị trí của mỗi /-điểm (đối tượng có số /) trên biểu đồ phân tán so với các điểm khác (Hình 6.3) có thể được xác định bằng các giá trị và dấu hiệu độ lệch của các giá trị biến tương ứng so với giá trị trung bình của chúng : (xj - MJ Và (tâm trí Tại ). Nếu dấu của những sai lệch này trùng nhau thì điều này cho thấy mối quan hệ tích cực (giá trị lớn hơn cho X giá trị lớn tương ứng với Tại hoặc giá trị thấp hơn X giá trị nhỏ hơn tương ứng với y).

Đối với môn số 1, độ lệch so với điểm trung bình X và bởi Tại tích cực, và đối với môn số 3 cả hai độ lệch đều là tiêu cực. Do đó, dữ liệu từ cả hai đều chỉ ra mối quan hệ tích cực giữa các tính trạng được nghiên cứu. Ngược lại, nếu có dấu hiệu sai lệch so với mức trung bình X và bởi Tại khác nhau, điều này sẽ chỉ ra mối quan hệ tiêu cực giữa các đặc điểm. Như vậy, đối với môn số 4, độ lệch so với điểm trung bình X là âm, bởi y - tích cực, và đối với môn số 9 - ngược lại.

Vì vậy, nếu tích của độ lệch (x,- M X ) X (tâm trí Tại ) tích cực thì dữ liệu của /-subject biểu thị mối quan hệ trực tiếp (tích cực) và nếu tiêu cực thì mối quan hệ ngược lại (tiêu cực). Theo đó, nếu Xwnăm năm thường liên quan theo tỷ lệ trực tiếp thì hầu hết các tích của độ lệch sẽ là dương, và nếu chúng liên hệ theo mối quan hệ nghịch đảo thì hầu hết các tích của độ lệch sẽ là âm. Do đó, chỉ số chung về cường độ và hướng của mối quan hệ có thể là tổng của tất cả các tích của độ lệch đối với một mẫu nhất định:

Với mối quan hệ tỷ lệ thuận trực tiếp giữa các biến, giá trị này lớn và dương - đối với hầu hết các đối tượng, độ lệch trùng dấu (giá trị lớn của một biến tương ứng với giá trị lớn của biến khác và ngược lại). Nếu như X Và Tại có phản hồi, thì đối với hầu hết các đối tượng, giá trị lớn hơn của một biến sẽ tương ứng với giá trị nhỏ hơn của biến khác, tức là dấu của các tích sẽ âm và tổng của các tích cũng sẽ lớn có giá trị tuyệt đối nhưng mang dấu âm. Nếu không có mối liên hệ có hệ thống giữa các biến, thì các số hạng dương (tích của độ lệch) sẽ được cân bằng bởi các số hạng âm và tổng của tất cả các tích của độ lệch sẽ gần bằng 0.

Để đảm bảo rằng tổng của các sản phẩm không phụ thuộc vào cỡ mẫu, việc lấy trung bình là đủ. Nhưng chúng tôi quan tâm đến thước đo kết nối không phải như một tham số chung mà như một ước tính được tính toán về nó - số liệu thống kê. Do đó, đối với công thức phân tán, trong trường hợp này chúng ta sẽ làm tương tự, chia tổng các tích của độ lệch không cho N, và trên TV - 1. Điều này dẫn đến thước đo kết nối, được sử dụng rộng rãi trong vật lý và khoa học kỹ thuật, được gọi là hiệp phương sai (hiệp đồng):

TRONG

Trong tâm lý học, không giống như vật lý, hầu hết các biến số được đo theo thang đo tùy ý, vì các nhà tâm lý học không quan tâm đến giá trị tuyệt đối của một dấu hiệu mà quan tâm đến vị trí tương đối của các đối tượng trong một nhóm. Ngoài ra, hiệp phương sai rất nhạy cảm với thang đo (phương sai) mà các tính trạng được đo lường trên đó. Để làm cho phép đo kết nối độc lập với đơn vị đo của cả hai đặc tính, việc chia hiệp phương sai thành độ lệch chuẩn tương ứng là đủ. Như vậy đã thu được vì-Con la của hệ số tương quan K. Pearson:

hoặc, sau khi thay thế các biểu thức cho o x và

Nếu giá trị của cả hai biến được chuyển đổi thành giá trị r bằng công thức

thì công thức tính hệ số tương quan r-Pearson trông đơn giản hơn (071.JPG):

/dict/xã hội học/article/soc/soc-0525.htm

TƯƠNG QUAN TUYẾN TÍNH- mối quan hệ tuyến tính thống kê có tính chất phi nhân quả giữa hai biến định lượng X Và Tại. Được đo bằng "hệ số K.L." Pearson, là kết quả của việc chia hiệp phương sai cho độ lệch chuẩn của cả hai biến:

Ở đâu S xy- hiệp phương sai giữa các biến X Và Tại;

S x , S y- độ lệch chuẩn cho các biến X Và Tại;

x Tôi , y Tôi- giá trị biến X Và Tại cho đối tượng có số Tôi;

x, y- trung bình số học cho các biến X Và Tại.

hệ số Pearson r có thể lấy các giá trị từ khoảng [-1; +1]. Nghĩa r = 0 có nghĩa là không có mối quan hệ tuyến tính giữa các biến X Và Tại(nhưng không loại trừ mối quan hệ thống kê phi tuyến tính). Giá trị hệ số dương ( r> 0) biểu thị kết nối tuyến tính trực tiếp; Giá trị của nó càng gần +1 thì mối quan hệ là đường thống kê càng mạnh. Giá trị hệ số âm ( r < 0) свидетельствуют об обратной линейной связи; чем ближе его значение к -1, тем сильнее обратная связь. Значения r= ±1 có nghĩa là có một kết nối tuyến tính hoàn chỉnh, trực tiếp hoặc ngược lại. Trong trường hợp kết nối hoàn chỉnh, tất cả các điểm có tọa độ ( x Tôi , y Tôi) nằm trên một đường thẳng y = Một + bx.

"Hệ số K.L." Pearson cũng được sử dụng để đo cường độ kết nối trong mô hình hồi quy tuyến tính theo cặp.

41. Ma trận tương quan và đồ thị tương quan.

Về mối tương quan nói chung, xem câu hỏi số 36 Với. 56 (64) 063.JPG

Ma trận tương quan. Thông thường, phân tích tương quan bao gồm việc nghiên cứu mối quan hệ giữa không phải hai mà là nhiều biến số được đo lường trên thang đo định lượng trong một mẫu. Trong trường hợp này, mối tương quan được tính toán cho từng cặp biến này. Việc tính toán thường được thực hiện trên máy tính và kết quả là ma trận tương quan.

Ma trận tương quan(Tương quan Ma trận) là kết quả tính toán mối tương quan của một loại cho mỗi cặp từ tập hợp R các biến được đo trên thang đo định lượng trong một mẫu.

VÍ DỤ

Giả sử chúng ta đang nghiên cứu mối quan hệ giữa 5 biến (vl, v2,..., v5; P= 5), được đo trên mẫu N=30 Nhân loại. Dưới đây là bảng dữ liệu nguồn và ma trận tương quan.

VÀ
dữ liệu tương tự:

Ma trận tương quan:

Dễ dàng nhận thấy ma trận tương quan là ma trận vuông, đối xứng theo đường chéo chính (takkak,y = /) y), với các đơn vị nằm trên đường chéo chính (vì G Và = Gu = 1).

Ma trận tương quan là quảng trường: số hàng và số cột bằng số biến. Cô ấy đối xứng so với đường chéo chính, vì mối tương quan X Với Tại tương quan bằng nhau Tại Với X. Các đơn vị được đặt trên đường chéo chính của nó, vì mối tương quan của đối tượng địa lý với chính nó bằng một. Do đó, không phải tất cả các phần tử của ma trận tương quan đều được phân tích mà chỉ những phần tử nằm trên hoặc dưới đường chéo chính.

Số lượng hệ số tương quan, Những đặc điểm cần phân tích khi nghiên cứu các mối quan hệ được xác định theo công thức: P(P- 1)/2. Trong ví dụ trên, số hệ số tương quan như vậy là 5(5 - 1)/2 = 10.

Nhiệm vụ chính của việc phân tích ma trận tương quan là xác định cấu trúc của mối quan hệ giữa nhiều tính năng. Trong trường hợp này, có thể phân tích trực quan thiên hà tương quan- hình ảnh đồ họa cấu trúc thống kênhững kết nối ý nghĩa, nếu không có nhiều kết nối như vậy (tối đa 10-15). Một cách khác là sử dụng các phương pháp đa biến: hồi quy bội, phân tích nhân tố hoặc cụm (xem phần “Phương pháp đa biến…”). Sử dụng phân tích nhân tố hoặc cụm, có thể xác định các nhóm biến có liên quan chặt chẽ với nhau hơn so với các biến khác. Sự kết hợp của các phương pháp này cũng rất hiệu quả, ví dụ, nếu có nhiều dấu hiệu và chúng không đồng nhất.

So sánh mối tương quan - một nhiệm vụ bổ sung là phân tích ma trận tương quan, có hai lựa chọn. Nếu cần so sánh mối tương quan ở một trong các hàng của ma trận tương quan (đối với một trong các biến), phương pháp so sánh đối với các mẫu phụ thuộc sẽ được sử dụng (tr. 148-149). Khi so sánh các mối tương quan cùng tên được tính toán cho các mẫu khác nhau, phương pháp so sánh cho các mẫu độc lập được sử dụng (tr. 147-148).

Phương pháp so sánh sự tương quan theo đường chéo ma trận tương quan (để đánh giá tính dừng của một quá trình ngẫu nhiên) và so sánh một số ma trận tương quan thu được từ các mẫu khác nhau (vì tính đồng nhất của chúng) tốn nhiều công sức và nằm ngoài phạm vi của cuốn sách này. Bạn có thể làm quen với những phương pháp này từ cuốn sách của G.V. Sukhodolsky 1.

Vấn đề về ý nghĩa thống kê của các mối tương quan. Vấn đề là quy trình kiểm tra giả thuyết thống kê giả định một-nhiều thử nghiệm được thực hiện trên một mẫu. Nếu áp dụng phương pháp tương tự nhiều lần, ngay cả khi liên quan đến các biến khác nhau, xác suất đạt được kết quả hoàn toàn ngẫu nhiên sẽ tăng lên. Nói chung, nếu chúng ta lặp lại phương pháp kiểm tra giả thuyết tương tự một lần liên quan đến các biến hoặc mẫu khác nhau, thì với giá trị đã thiết lập a, chúng tôi đảm bảo nhận được sự xác nhận về giả thuyết trong à ừ số trường hợp.

Giả sử một ma trận tương quan được phân tích cho 15 biến, tức là tính được 15(15-1)/2 = 105 hệ số tương quan. Để kiểm tra giả thuyết, mức a = 0,05 được đặt ra, bằng cách kiểm tra giả thuyết 105 lần, chúng ta sẽ nhận được xác nhận về giả thuyết đó năm lần (!), bất kể kết nối có thực sự tồn tại hay không. Biết được điều này và có 15 hệ số tương quan “có ý nghĩa thống kê”, liệu chúng ta có thể biết hệ số nào có được một cách tình cờ và hệ số nào phản ánh mối quan hệ thực sự không?

Nói một cách chính xác, để đưa ra quyết định thống kê cần phải giảm mức a xuống gấp nhiều lần số lượng giả thuyết đang được kiểm định. Nhưng điều này khó có thể được khuyến khích vì xác suất bỏ qua một kết nối thực sự hiện có (gây ra lỗi Loại II) tăng lên một cách khó lường.

Chỉ ma trận tương quan thôi thì chưa đủ cơ sởđể có kết luận thống kê về các hệ số riêng lẻ có trong đómối tương quan!

Chỉ có một cách thực sự thuyết phục để giải quyết vấn đề này: chia mẫu ngẫu nhiên thành hai phần và chỉ tính đến những mối tương quan có ý nghĩa thống kê ở cả hai phần của mẫu. Một giải pháp thay thế có thể là sử dụng các phương pháp đa biến (phân tích hồi quy nhân tố, cụm hoặc đa biến) để xác định và sau đó giải thích các nhóm biến có liên quan có ý nghĩa thống kê.

Vấn đề thiếu giá trị. Nếu thiếu các giá trị trong dữ liệu thì có thể có hai tùy chọn để tính toán ma trận tương quan: a) loại bỏ các giá trị theo từng hàng (Loại trừcác trường hợptheo danh sách); b) xóa từng cặp giá trị (Loại trừcác trường hợptheo cặp). Tại xóa từng dòng quan sát có giá trị bị thiếu, toàn bộ hàng cho một đối tượng (chủ đề) có ít nhất một giá trị bị thiếu cho một trong các biến sẽ bị xóa. Phương pháp này dẫn đến một ma trận tương quan “chính xác” theo nghĩa là tất cả các hệ số được tính từ cùng một tập đối tượng. Tuy nhiên, nếu các giá trị bị thiếu được phân phối ngẫu nhiên trong các biến, thì phương pháp này có thể dẫn đến thực tế là không còn một đối tượng nào trong tập dữ liệu đang được xem xét (sẽ có ít nhất một giá trị bị thiếu trong mỗi hàng) . Để tránh tình trạng này, hãy sử dụng một phương pháp khác gọi là loại bỏ theo cặp. Phương pháp này chỉ xem xét các khoảng trống trong từng cặp biến cột đã chọn và bỏ qua các khoảng trống trong các biến khác. Mối tương quan của một cặp biến được tính toán cho những đối tượng không có khoảng trống. Trong nhiều tình huống, đặc biệt là khi số lượng khoảng trống tương đối nhỏ, chẳng hạn 10% và các khoảng trống được phân bổ khá ngẫu nhiên, phương pháp này không dẫn đến lỗi nghiêm trọng. Tuy nhiên, đôi khi đây không phải là trường hợp. Ví dụ: sai lệch hệ thống (sự thay đổi) trong đánh giá có thể “che giấu” sự sắp xếp thiếu sót có hệ thống, đó là lý do dẫn đến sự khác biệt về hệ số tương quan được xây dựng cho các tập hợp con khác nhau (ví dụ: đối với các nhóm đối tượng khác nhau). Một vấn đề khác liên quan đến ma trận tương quan được tính bằng theo cặp việc loại bỏ các khoảng trống xảy ra khi sử dụng ma trận này trong các loại phân tích khác (ví dụ: trong hồi quy bội hoặc phân tích nhân tố). Họ cho rằng ma trận tương quan “chính xác” được sử dụng với mức độ nhất quán nhất định và “tuân thủ” các hệ số khác nhau. Việc sử dụng ma trận có ước tính “xấu” (sai lệch) dẫn đến thực tế là chương trình không thể phân tích ma trận đó hoặc kết quả sẽ bị sai. Do đó, nếu sử dụng phương pháp cặp đôi để loại trừ dữ liệu bị thiếu thì cần phải kiểm tra xem liệu có các mẫu hệ thống trong việc phân bổ dữ liệu bị thiếu hay không.

Nếu việc xóa từng cặp dữ liệu bị thiếu không dẫn đến bất kỳ sự thay đổi hệ thống nào về phương tiện và phương sai (độ lệch chuẩn), thì những thống kê này sẽ tương tự như những thống kê được tính bằng phương pháp xóa dữ liệu bị thiếu theo từng hàng. Nếu quan sát thấy sự khác biệt đáng kể thì có lý do để cho rằng có sự thay đổi trong ước tính. Ví dụ: nếu trung bình (hoặc độ lệch chuẩn) của các giá trị của một biến MỘT,được sử dụng để tính toán mối tương quan của nó với biến TRONG, nhỏ hơn nhiều so với giá trị trung bình (hoặc độ lệch chuẩn) của cùng một giá trị của biến MỘT,được sử dụng để tính toán mối tương quan của nó với biến C, thì có mọi lý do để kỳ vọng rằng hai mối tương quan này (A-Bchúng ta) dựa trên các tập hợp con dữ liệu khác nhau. Sẽ có sự sai lệch trong các mối tương quan gây ra bởi sự sắp xếp không ngẫu nhiên các khoảng trống trong các giá trị biến đổi.

Phân tích các thiên hà tương quan. Sau khi giải bài toán về ý nghĩa thống kê của các phần tử của ma trận tương quan, các mối tương quan có ý nghĩa thống kê có thể được biểu diễn bằng đồ họa dưới dạng thiên hà tương quan hoặc thiên hà. Thiên hà tương quan -Đây là một hình bao gồm các đỉnh và đường nối chúng. Các đỉnh tương ứng với đặc điểm và thường được ký hiệu bằng số - số thay đổi. Các đường tương ứng với các kết nối có ý nghĩa thống kê và biểu thị bằng đồ họa dấu hiệu và đôi khi là mức ý nghĩa j của kết nối.

Thiên hà tương quan có thể phản ánh Tất cả các kết nối có ý nghĩa thống kê của ma trận tương quan (đôi khi được gọi là đồ thị tương quan ) hoặc chỉ phần được lựa chọn có ý nghĩa (ví dụ tương ứng với một nhân tố theo kết quả phân tích nhân tố).

VÍ DỤ XÂY DỰNG PLEIADE TƯƠNG QUAN

Chuẩn bị cho chứng nhận cấp bang (cuối cùng) của sinh viên tốt nghiệp: hình thành cơ sở dữ liệu Kỳ thi cấp bang thống nhất (danh sách chung những người tham gia Kỳ thi cấp bang thống nhất thuộc tất cả các hạng mục, chỉ rõ các môn học) - có tính đến số ngày dự bị trong trường hợp cùng một môn học;

Kế hoạch làm việc (27)

Giải pháp

2. Hoạt động của cơ sở giáo dục nhằm nâng cao nội dung và đánh giá chất lượng các môn giáo dục khoa học và toán học Cơ sở giáo dục thành phố Trường trung học cơ sở số 4, Litvinovskaya, Chapaevskaya,

Trong trường hợp phép đo các đặc điểm đang nghiên cứu được thực hiện theo thang bậc hoặc dạng mối quan hệ khác với tuyến tính, việc nghiên cứu mối quan hệ giữa hai biến ngẫu nhiên được thực hiện bằng cách sử dụng các hệ số tương quan xếp hạng. Hãy xem xét hệ số tương quan xếp hạng Spearman. Khi tính toán cần xếp hạng (thứ tự) các phương án mẫu. Xếp hạng là việc nhóm dữ liệu thử nghiệm theo một thứ tự nhất định, tăng dần hoặc giảm dần.

Hoạt động xếp hạng được thực hiện theo thuật toán sau:

1. Giá trị thấp hơn được gán thứ hạng thấp hơn. Giá trị cao nhất được gán một thứ hạng tương ứng với số lượng giá trị được xếp hạng. Giá trị nhỏ nhất được gán thứ hạng 1. Ví dụ: nếu n=7 thì giá trị lớn nhất sẽ nhận được thứ hạng 7, ngoại trừ các trường hợp được quy định trong quy tắc thứ hai.

2. Nếu một số giá trị bằng nhau thì chúng sẽ được ấn định một thứ hạng bằng mức trung bình của các thứ hạng mà chúng sẽ nhận được nếu không bằng nhau. Ví dụ: hãy xem xét một mẫu có thứ tự tăng dần gồm 7 phần tử: 22, 23, 25, 25, 25, 28, 30. Các giá trị 22 và 23 xuất hiện một lần, do đó thứ hạng của chúng tương ứng là R22=1, và R23=2 . Giá trị 25 xuất hiện 3 lần. Nếu các giá trị này không được lặp lại thì thứ hạng của chúng sẽ là 3, 4, 5. Do đó, thứ hạng R25 của chúng bằng trung bình số học của 3, 4 và 5: . Giá trị 28 và 30 không lặp lại nên thứ hạng của chúng lần lượt là R28=6 và R30=7. Cuối cùng ta có sự tương ứng sau:

3. Tổng số thứ hạng phải trùng với số hạng tính được xác định theo công thức:

trong đó n là tổng số giá trị được xếp hạng.

Sự khác biệt giữa tổng thứ hạng thực tế và tính toán sẽ chỉ ra lỗi xảy ra khi tính thứ hạng hoặc tổng hợp chúng. Trong trường hợp này, bạn cần tìm và sửa lỗi.

Hệ số tương quan xếp hạng của Spearman là một phương pháp cho phép người ta xác định cường độ và hướng của mối quan hệ giữa hai tính trạng hoặc hai hệ thống phân cấp tính trạng. Việc sử dụng hệ số tương quan xếp hạng có một số hạn chế:

a) Sự phụ thuộc tương quan giả định phải đơn điệu.
b) Thể tích của mỗi mẫu phải lớn hơn hoặc bằng 5. Để xác định giới hạn trên của mẫu sử dụng bảng giá trị tới hạn (Bảng 3 của Phụ lục). Giá trị tối đa của n trong bảng là 40.
c) Trong quá trình phân tích, có thể xuất hiện một số lượng lớn các cấp bậc giống nhau. Trong trường hợp này, cần phải sửa đổi. Trường hợp thuận lợi nhất là khi cả hai mẫu được nghiên cứu đều đại diện cho hai chuỗi giá trị khác nhau.

Để tiến hành phân tích tương quan, nhà nghiên cứu phải có hai mẫu có thể xếp hạng được, ví dụ:

- hai đặc điểm được đo trong cùng một nhóm đối tượng;
- hai hệ thống phân cấp đặc điểm riêng lẻ được xác định ở hai đối tượng sử dụng cùng một bộ đặc điểm;
- hai hệ thống phân cấp nhóm đặc điểm;
- hệ thống phân cấp cá nhân và nhóm của các đặc điểm.

Chúng tôi bắt đầu tính toán bằng cách xếp hạng các chỉ số được nghiên cứu riêng biệt cho từng đặc điểm.

Chúng ta hãy phân tích một trường hợp có hai dấu hiệu được đo trong cùng một nhóm đối tượng. Đầu tiên, các giá trị riêng lẻ mà các đối tượng khác nhau thu được được xếp hạng theo đặc điểm thứ nhất, sau đó các giá trị riêng lẻ được xếp hạng theo đặc điểm thứ hai. Nếu thứ hạng thấp hơn của một chỉ số tương ứng với thứ hạng thấp hơn của chỉ số khác và thứ hạng cao hơn của một chỉ số tương ứng với thứ hạng cao hơn của chỉ số khác, thì hai đặc điểm này có mối quan hệ tích cực. Nếu thứ hạng cao hơn của một chỉ số tương ứng với thứ hạng thấp hơn của chỉ số khác thì hai đặc điểm này có mối quan hệ nghịch biến. Để tìm rs, chúng tôi xác định sự khác biệt giữa các cấp bậc (d) cho từng môn học. Sự khác biệt giữa các thứ hạng càng nhỏ thì hệ số tương quan thứ hạng rs sẽ càng gần với “+1”. Nếu không có mối quan hệ thì sẽ không có sự tương ứng giữa chúng, do đó rs sẽ gần bằng 0. Sự khác biệt giữa thứ hạng của các đối tượng theo hai biến càng lớn thì giá trị của hệ số rs sẽ càng gần với “-1”. Do đó, hệ số tương quan xếp hạng Spearman là thước đo cho bất kỳ mối quan hệ đơn điệu nào giữa hai đặc điểm đang được nghiên cứu.

Chúng ta hãy xem xét trường hợp có hai hệ thống phân cấp đặc điểm riêng lẻ được xác định ở hai đối tượng sử dụng cùng một bộ đặc điểm. Trong tình huống này, các giá trị riêng lẻ thu được của mỗi đối tượng trong số hai đối tượng được xếp hạng theo một bộ đặc điểm nhất định. Đặc điểm có giá trị thấp nhất phải xếp thứ nhất; đặc tính có giá trị cao hơn là hạng thứ hai, v.v. Cần đặc biệt chú ý để đảm bảo rằng tất cả các thuộc tính được đo bằng cùng đơn vị. Ví dụ: không thể xếp hạng các chỉ báo nếu chúng được biểu thị theo các điểm “giá” khác nhau, vì không thể xác định yếu tố nào sẽ chiếm vị trí đầu tiên về mức độ nghiêm trọng cho đến khi tất cả các giá trị được đưa về một thang đo duy nhất. Nếu các đặc điểm có thứ hạng thấp ở một trong các đối tượng này cũng có thứ hạng thấp ở một đối tượng khác và ngược lại, thì các hệ thống phân cấp riêng lẻ có liên quan tích cực.

Trong trường hợp có hai hệ thống phân cấp đặc điểm của nhóm, các giá trị nhóm trung bình thu được ở hai nhóm đối tượng được xếp hạng theo cùng một bộ đặc điểm cho các nhóm được nghiên cứu. Tiếp theo, chúng tôi làm theo thuật toán được đưa ra trong các trường hợp trước.

Chúng ta hãy phân tích một trường hợp với hệ thống phân cấp đặc điểm cá nhân và nhóm. Họ bắt đầu bằng cách xếp hạng riêng biệt các giá trị riêng lẻ của đối tượng và các giá trị trung bình của nhóm theo cùng một bộ đặc điểm thu được, loại trừ đối tượng không tham gia vào hệ thống phân cấp nhóm trung bình, vì hệ thống phân cấp cá nhân của anh ta sẽ so sánh với nó. Tương quan thứ hạng cho phép chúng ta đánh giá mức độ nhất quán của hệ thống phân cấp các đặc điểm cá nhân và nhóm.

Chúng ta hãy xem xét tầm quan trọng của hệ số tương quan được xác định như thế nào trong các trường hợp được liệt kê ở trên. Trong trường hợp có hai đặc điểm, nó sẽ được xác định bởi cỡ mẫu. Trong trường hợp có hai hệ thống phân cấp đối tượng riêng lẻ, tầm quan trọng phụ thuộc vào số lượng đối tượng có trong hệ thống phân cấp. Trong hai trường hợp cuối, tầm quan trọng được xác định bởi số lượng đặc điểm được nghiên cứu chứ không phải bởi số lượng nhóm. Như vậy, tầm quan trọng của rs trong mọi trường hợp được xác định bởi số giá trị được xếp hạng n.

Khi kiểm tra ý nghĩa thống kê của rs, các bảng giá trị tới hạn của hệ số tương quan xếp hạng được sử dụng, được biên soạn cho các số giá trị xếp hạng khác nhau và mức ý nghĩa khác nhau. Nếu giá trị tuyệt đối của rs đạt hoặc vượt quá giá trị tới hạn thì mối tương quan là đáng tin cậy.

Khi xem xét phương án thứ nhất (trường hợp có hai dấu hiệu được đo trong cùng một nhóm đối tượng), có thể xảy ra các giả thuyết sau.

H0: Tương quan giữa biến x và y không khác 0.

H1: Mối tương quan giữa biến x và y khác 0 đáng kể.

Nếu chúng ta xử lý bất kỳ trường hợp nào trong ba trường hợp còn lại thì cần phải đưa ra một cặp giả thuyết khác:

H0: Mối tương quan giữa các cấp bậc x và y không khác 0.

H1: Mối tương quan giữa các thứ bậc x và y khác biệt đáng kể so với 0.

Trình tự các thao tác khi tính hệ số tương quan xếp hạng Spearman rs như sau.

- Xác định hai đặc trưng hoặc hai phân cấp đặc trưng nào sẽ tham gia so sánh dưới dạng biến x và y.
- Xếp hạng các giá trị của biến x, gán hạng 1 cho giá trị nhỏ nhất, đúng quy tắc xếp hạng. Xếp thứ tự vào cột đầu tiên của bảng theo thứ tự đối tượng kiểm tra hoặc đặc điểm.
- Xếp hạng các giá trị của biến y. Xếp thứ hạng vào cột thứ hai của bảng theo thứ tự đối tượng kiểm tra hoặc đặc điểm.
- Tính chênh lệch d giữa các hạng x và y cho mỗi hàng của bảng. Đặt kết quả vào cột tiếp theo của bảng.
- Tính bình phương sai phân (d2). Đặt các giá trị kết quả vào cột thứ tư của bảng.
- Tính tổng các bình phương khác nhau? d2.
- Nếu xếp hạng giống nhau thì tính hiệu chỉnh:

trong đó tx là thể tích của từng nhóm cấp giống nhau trong mẫu x;

ty là thể tích của từng nhóm cấp giống nhau trong mẫu y.

Tính hệ số tương quan xếp hạng tùy thuộc vào sự hiện diện hay vắng mặt của các cấp bậc giống hệt nhau. Nếu không có cấp bậc giống nhau thì tính hệ số tương quan cấp bậc rs theo công thức:

Nếu có thứ hạng giống nhau thì tính hệ số tương quan thứ hạng rs theo công thức:

ở đâu?d2 là tổng bình phương của sự khác biệt giữa các cấp bậc;

Tx và Ty - hiệu chỉnh cho các cấp bậc bằng nhau;

n là số lượng đối tượng hoặc đặc điểm tham gia xếp hạng.

Xác định các giá trị tới hạn của rs từ Phụ lục Bảng 3 cho một số đối tượng n cho trước. Sẽ quan sát thấy sự khác biệt đáng kể so với 0 của hệ số tương quan với điều kiện rs không nhỏ hơn giá trị tới hạn.

là một đánh giá định lượng của nghiên cứu thống kê về mối quan hệ giữa các hiện tượng, được sử dụng trong các phương pháp phi tham số.

Chỉ báo cho thấy tổng chênh lệch bình phương giữa các cấp bậc thu được trong quá trình quan sát khác với trường hợp không có kết nối như thế nào.

Mục đích của dịch vụ. Sử dụng máy tính trực tuyến này, bạn có thể:

tính hệ số tương quan xếp hạng của Spearman;
tính khoảng tin cậy của hệ số và đánh giá tầm quan trọng của nó;

Hệ số tương quan xếp hạng của Spearmanđề cập đến các chỉ số để đánh giá mức độ gần gũi của giao tiếp. Đặc tính định tính về mức độ gần gũi của mối liên hệ của hệ số tương quan xếp hạng, cũng như các hệ số tương quan khác, có thể được đánh giá bằng thang đo Chaddock.

Tính hệ số bao gồm các bước sau:

Tính chất của hệ số tương quan xếp hạng Spearman

Khu vực ứng dụng. Hệ số tương quan xếp hạngđược sử dụng để đánh giá chất lượng giao tiếp giữa hai quần thể. Ngoài ra, ý nghĩa thống kê của nó được sử dụng khi phân tích dữ liệu về tính không đồng nhất.

Ví dụ. Dựa trên mẫu các biến quan sát X và Y:

tạo bảng xếp hạng;
tìm hệ số tương quan xếp hạng của Spearman và kiểm tra ý nghĩa của nó ở cấp độ 2a
đánh giá bản chất của sự phụ thuộc

Giải pháp. Hãy xếp hạng cho đặc điểm Y và yếu tố X.

X	Y	xếp hạng X, d x	hạng Y, d y
28	21	1	1
30	25	2	2
36	29	4	3
40	31	5	4
30	32	3	5
46	34	6	6
56	35	8	7
54	38	7	8
60	39	10	9
56	41	9	10
60	42	11	11
68	44	12	12
70	46	13	13
76	50	14	14

Ma trận xếp hạng.

xếp hạng X, d x	hạng Y, d y	(d x - d y) 2
1	1	0
2	2	0
4	3	1
5	4	1
3	5	4
6	6	0
8	7	1
7	8	1
10	9	1
9	10	1
11	11	0
12	12	0
13	13	0
14	14	0
105	105	10

Kiểm tra tính đúng đắn của ma trận dựa trên phép tính tổng kiểm tra:

Tổng các cột của ma trận bằng nhau và bằng tổng kiểm tra, nghĩa là ma trận được soạn chính xác.
Sử dụng công thức, chúng tôi tính hệ số tương quan xếp hạng Spearman.

Mối quan hệ giữa đặc điểm Y và yếu tố X rất chặt chẽ và trực tiếp
Ý nghĩa của hệ số tương quan xếp hạng Spearman
Để kiểm định giả thuyết không ở mức ý nghĩa α, hệ số tương quan xếp hạng tổng quát Spearman bằng 0 theo giả thuyết cạnh tranh Hi. p ≠ 0, chúng ta cần tính điểm tới hạn:

trong đó n là cỡ mẫu; ρ là hệ số tương quan xếp hạng Spearman mẫu: t(α, k) là điểm tới hạn của vùng tới hạn hai phía, được tìm thấy từ bảng điểm tới hạn của phân bố Sinh viên, theo mức ý nghĩa α và số bậc tự do k = n-2.
Nếu |p|< Т kp - нет оснований отвергнуть нулевую гипотезу. Ранговая корреляционная связь между качественными признаками не значима. Если |p| >T kp - giả thuyết không bị bác bỏ. Có một mối tương quan xếp hạng đáng kể giữa các đặc điểm chất lượng.
Sử dụng bảng Sinh viên ta tìm được t(α/2, k) = (0,1/2;12) = 1,782

Kể từ T kp< ρ , то отклоняем гипотезу о равенстве 0 коэффициента ранговой корреляции Спирмена. Другими словами, коэффициент ранговой корреляции статистически - значим и ранговая корреляционная связь между оценками по двум тестам значимая.

Máy tính dưới đây tính toán hệ số tương quan xếp hạng Spearman giữa hai biến ngẫu nhiên. Phần lý thuyết là phần truyền thống bên dưới máy tính.

thêm vào nhập khẩu xuất khẩu mode_edit xóa bỏ

Sự thay đổi của các biến ngẫu nhiên

	mũi tên_trở lênmũi tên_hướng xuống	mũi tên_trở lênmũi tên_hướng xuống
			mode_edit

Số mục trên mỗi trang: 5 10 20 50 100 chevron_left chevron_right

Sự thay đổi của các biến ngẫu nhiên

Nhập dữ liệu Lỗi nhập

"Một trong các ký tự sau dùng để phân tách các trường dữ liệu: tab, dấu chấm phẩy (;) hoặc dấu phẩy(,)" Mẫu: -50.5;-50.5

Nhập Trở lại Hủy bỏ

Chữ số sau dấu thập phân: 4

Tính toán

Hệ số tương quan Spearman

Cứu chia sẻ sự mở rộng

Phương pháp tính hệ số tương quan xếp hạng của Spearman thực ra khá đơn giản, nó giống như được thiết kế hệ số tương quan Pearson, nhưng không chỉ dùng để đo các biến ngẫu nhiên mà còn dùng cho chúng giá trị xếp hạng.

Chúng ta chỉ cần hiểu giá trị xếp hạng là gì và tại sao tất cả những điều này lại cần thiết.

Nếu các phần tử của một chuỗi biến thiên được sắp xếp theo thứ tự tăng dần hoặc giảm dần thì thứ hạng của phần tử sẽ là số của anh ta trong chuỗi có thứ tự.

Ví dụ: chúng tôi có một chuỗi khác nhau (17,26,5,14,21). Hãy sắp xếp các phần tử của nó theo thứ tự giảm dần (26,21,17,14,5). 26 có hạng 1, 21 - hạng 2, v.v. Chuỗi giá trị xếp hạng biến thiên sẽ như thế này (3,1,5,4,2).

I E. khi tính hệ số Spearman, chuỗi biến thiên ban đầu được chuyển đổi thành chuỗi biến thiên của các giá trị xếp hạng và sau đó áp dụng công thức Pearson cho chúng.
.
Có một sự tinh tế - thứ hạng của các giá trị lặp lại được lấy làm mức trung bình của các thứ hạng. Nghĩa là, đối với chuỗi xếp hạng (17, 15, 14, 15) sẽ có dạng (1, 2,5, 4, 2,5), vì phần tử đầu tiên là 15 có hạng 2 và phần tử thứ hai - hạng 3, Và.

Nếu bạn không có các giá trị lặp lại, tức là tất cả các giá trị của chuỗi xếp hạng - các số từ 1 đến n, thì công thức Pearson có thể được đơn giản hóa thành

Nhân tiện, công thức này thường được đưa ra làm công thức tính hệ số Spearman.

Bản chất của quá trình chuyển đổi từ chính các giá trị sang giá trị xếp hạng của chúng là gì?
Khi nghiên cứu mối tương quan của các giá trị xếp hạng, bạn có thể thấy mức độ phụ thuộc của hai biến được mô tả bằng hàm đơn điệu.

Dấu của hệ số cho biết hướng của mối quan hệ giữa các biến. Nếu dấu dương thì các giá trị của Y có xu hướng tăng khi tăng X. Nếu dấu âm thì các giá trị của Y có xu hướng giảm khi tăng X. Nếu hệ số bằng 0 thì thì không có xu hướng. Nếu hệ số bằng 1 hoặc -1 thì mối quan hệ giữa X và Y có dạng hàm đơn điệu, tức là. với X tăng thì Y cũng tăng và ngược lại.

Nghĩa là, không giống như hệ số tương quan Pearson, chỉ có thể phát hiện mối quan hệ tuyến tính của biến này với biến khác, hệ số tương quan của Spearman có thể phát hiện sự phụ thuộc đơn điệu, trong đó mối quan hệ tuyến tính trực tiếp không thể được tiết lộ.

Đây là một ví dụ.
Hãy để tôi giải thích bằng một ví dụ. Giả sử chúng ta kiểm tra hàm y=10/x.
Chúng ta có các số đo sau của X và Y
{{1,10}, {5,2}, {10,1}, {20,0.5}, {100,0.1}}
Đối với dữ liệu này, hệ số tương quan Pearson bằng -0,4686, tức là. mối quan hệ yếu hoặc vắng mặt. Và hệ số tương quan của Spearman hoàn toàn bằng -1, như thể nó gợi ý cho nhà nghiên cứu rằng Y có sự phụ thuộc đơn điệu âm mạnh vào X.

Hệ số tương quan xếp hạng, do K. Spearman đề xuất, đề cập đến thước đo phi tham số về mối quan hệ giữa các biến được đo trên thang xếp hạng. Khi tính hệ số này, không cần giả định về bản chất của sự phân bố các đặc điểm trong tổng thể. Hệ số này xác định mức độ gần gũi của mối liên hệ giữa các đặc điểm thứ tự, trong trường hợp này biểu thị cấp bậc của các đại lượng được so sánh.

Hệ số tương quan Spearman cũng nằm trong khoảng +1 và -1. Nó, giống như hệ số Pearson, có thể dương và âm, mô tả hướng của mối quan hệ giữa hai đặc điểm được đo trên thang xếp hạng.

Về nguyên tắc, số lượng đặc điểm được xếp hạng (phẩm chất, đặc điểm, v.v.) có thể là bất kỳ, nhưng quá trình xếp hạng hơn 20 đặc điểm rất khó khăn. Có thể đây là lý do tại sao bảng giá trị tới hạn của hệ số tương quan xếp hạng chỉ được tính cho bốn mươi tính năng được xếp hạng (n< 40, табл. 20 приложения 6).

Hệ số tương quan xếp hạng của Spearman được tính bằng công thức:

trong đó n là số đặc điểm được xếp hạng (chỉ số, đối tượng);

D là sự khác biệt giữa thứ hạng của hai biến đối với từng môn học;

Tổng chênh lệch thứ hạng bình phương.

Sử dụng hệ số tương quan xếp hạng, hãy xem xét ví dụ sau.

Ví dụ: Một nhà tâm lý học tìm hiểu xem các chỉ số cá nhân về mức độ sẵn sàng đi học, đạt được trước khi bắt đầu đi học của 11 học sinh lớp một, có mối liên hệ với nhau như thế nào và thành tích trung bình của các em vào cuối năm học.

Để giải quyết vấn đề này, trước tiên, chúng tôi xếp hạng giá trị trung bình của các chỉ số về mức độ sẵn sàng đi học khi nhập học và thứ hai là các chỉ số cuối cùng về kết quả học tập cuối năm của chính những học sinh này. Chúng tôi trình bày kết quả trong bảng. 13.

Bảng 13

Sinh viên số
Xếp hạng các chỉ số sẵn sàng đi học
Xếp hạng hiệu suất trung bình hàng năm

Chúng tôi thay thế dữ liệu thu được vào công thức và thực hiện phép tính. Chúng tôi nhận được:

Để tìm mức ý nghĩa, hãy tham khảo bảng. 20 của Phụ lục 6, trong đó hiển thị các giá trị tới hạn của các hệ số tương quan xếp hạng.

Chúng tôi nhấn mạnh điều đó trong bảng. 20 của Phụ lục 6, như trong bảng tương quan Pearson tuyến tính, tất cả các giá trị của hệ số tương quan đều được đưa ra ở giá trị tuyệt đối. Do đó, dấu của hệ số tương quan chỉ được tính đến khi diễn giải nó.

Việc tìm các mức ý nghĩa trong bảng này được thực hiện bằng số n, tức là bằng số lượng đối tượng. Trong trường hợp của chúng tôi n = 11. Với số này, chúng tôi tìm thấy:

0,61 cho P 0,05

0,76 cho P 0,01

Chúng ta xây dựng ``trục ý nghĩa'' tương ứng:

Hệ số tương quan thu được trùng với giá trị tới hạn ở mức ý nghĩa 1%. Do đó, có thể lập luận rằng các chỉ số về mức độ sẵn sàng đi học và điểm cuối kỳ của học sinh lớp một có mối tương quan dương - nói cách khác, chỉ số về mức độ sẵn sàng đi học càng cao thì việc học tập của học sinh lớp một càng tốt. Về mặt giả thuyết thống kê, nhà tâm lý học phải bác bỏ giả thuyết khống về sự tương đồng và chấp nhận giả thuyết thay thế về sự khác biệt, điều này cho thấy mối quan hệ giữa các chỉ số về mức độ sẵn sàng đi học và kết quả học tập trung bình là khác 0.

Trường hợp cấp bậc giống nhau (bằng nhau)

Nếu có các cấp bậc giống hệt nhau thì công thức tính hệ số tương quan tuyến tính Spearman sẽ hơi khác một chút. Trong trường hợp này, hai thuật ngữ mới được thêm vào công thức tính hệ số tương quan, có tính đến cùng thứ hạng. Chúng được gọi là hiệu chỉnh thứ hạng bằng nhau và được cộng vào tử số của công thức tính.

trong đó n là số cấp bậc giống nhau trong cột đầu tiên,

k là số cấp bậc giống nhau ở cột thứ hai.

Nếu có hai nhóm thứ hạng giống hệt nhau trong bất kỳ cột nào thì công thức hiệu chỉnh sẽ trở nên phức tạp hơn một chút:

trong đó n là số cấp bậc giống nhau trong nhóm đầu tiên của cột được xếp hạng,

k là số cấp bậc giống nhau trong nhóm thứ hai của cột xếp hạng. Việc sửa đổi công thức trong trường hợp tổng quát như sau:

Ví dụ: Một nhà tâm lý học, sử dụng bài kiểm tra phát triển trí tuệ (MDT), tiến hành nghiên cứu về trí thông minh ở 12 học sinh lớp 9. Đồng thời, ông yêu cầu các giáo viên dạy văn và toán xếp hạng những học sinh này theo các chỉ số phát triển trí tuệ. Nhiệm vụ là xác định các chỉ số khách quan về sự phát triển trí tuệ (dữ liệu SHTUR) và đánh giá của chuyên gia về giáo viên có liên quan với nhau như thế nào.

Chúng tôi trình bày dữ liệu thực nghiệm của bài toán này và các cột bổ sung cần thiết để tính hệ số tương quan Spearman dưới dạng bảng. 14.

Bảng 14

Sinh viên số	Xếp hạng kiểm tra bằng SHTURA	Đánh giá chuyên môn của giáo viên môn toán	Đánh giá chuyên môn của giáo viên về văn học	D (cột thứ hai và thứ ba)	D (cột thứ hai và thứ tư)	(cột thứ hai và thứ ba)	(cột thứ hai và thứ tư)

Vì các cấp bậc giống nhau đã được sử dụng trong bảng xếp hạng nên cần kiểm tra tính chính xác của thứ hạng ở cột thứ hai, thứ ba và thứ tư của bảng. Tổng từng cột này sẽ có tổng số như nhau - 78.

Chúng tôi kiểm tra bằng công thức tính toán. Việc kiểm tra cho thấy:

Cột thứ năm và thứ sáu của bảng hiển thị giá trị của sự khác biệt về thứ hạng giữa đánh giá của chuyên gia tâm lý học trong bài kiểm tra SHTUR đối với từng học sinh và giá trị đánh giá của chuyên gia giáo viên, tương ứng, trong toán học và văn học. Tổng các giá trị chênh lệch thứ hạng phải bằng 0. Tổng hợp các giá trị D ở cột thứ năm và thứ sáu cho kết quả như mong muốn. Vì vậy, việc trừ thứ hạng đã được thực hiện một cách chính xác. Việc kiểm tra tương tự phải được thực hiện mỗi khi tiến hành các loại xếp hạng phức tạp.

Trước khi bắt đầu tính toán bằng công thức, cần tính toán các hiệu chỉnh cho cùng thứ hạng cho cột thứ hai, thứ ba và thứ tư của bảng.

Trong trường hợp của chúng tôi, trong cột thứ hai của bảng có hai cấp giống hệt nhau, do đó, theo công thức, giá trị của hiệu chỉnh D1 sẽ là:

Cột thứ ba chứa ba cấp giống hệt nhau, do đó, theo công thức, giá trị của hiệu chỉnh D2 sẽ là:

Trong cột thứ tư của bảng có hai nhóm có ba cấp giống nhau, do đó, theo công thức, giá trị của hiệu chỉnh D3 sẽ là:

Trước khi tiến hành giải quyết vấn đề, chúng ta hãy nhớ lại rằng nhà tâm lý học đang làm rõ hai câu hỏi - các giá trị của thứ hạng trong bài kiểm tra SHTUR có liên quan như thế nào đến đánh giá của chuyên gia về toán học và văn học. Đó là lý do tại sao việc tính toán được thực hiện hai lần.

Chúng tôi tính hệ số xếp hạng đầu tiên có tính đến các chất phụ gia theo công thức. Chúng tôi nhận được:

Hãy tính toán mà không tính đến chất phụ gia:

Như chúng ta có thể thấy, sự khác biệt về giá trị của các hệ số tương quan hóa ra rất không đáng kể.

Chúng tôi tính hệ số xếp hạng thứ hai có tính đến các chất phụ gia theo công thức. Chúng tôi nhận được:

Hãy tính toán mà không tính đến chất phụ gia:

Một lần nữa, sự khác biệt là rất nhỏ. Vì số lượng học sinh trong cả hai trường hợp là như nhau nên theo Bảng. 20 Phụ lục 6 chúng tôi tìm thấy các giá trị tới hạn tại n = 12 cho cả hai hệ số tương quan cùng một lúc.

0,58 cho P 0,05

0,73 cho P 0,01

Chúng ta vẽ giá trị đầu tiên trên `` trục ý nghĩa '':

Trong trường hợp đầu tiên, hệ số tương quan xếp hạng thu được nằm trong vùng có ý nghĩa. Do đó, nhà tâm lý học phải bác bỏ giả thuyết khống cho rằng hệ số tương quan giống với 0 và chấp nhận giả thuyết thay thế rằng hệ số tương quan khác 0 đáng kể. Nói cách khác, kết quả thu được cho thấy rằng đánh giá chuyên môn của học sinh trong bài kiểm tra SHTUR càng cao thì đánh giá chuyên môn về toán học của học sinh càng cao.

Chúng ta vẽ giá trị thứ hai trên `` trục ý nghĩa '':

Trong trường hợp thứ hai, hệ số tương quan xếp hạng nằm trong vùng không chắc chắn. Do đó, nhà tâm lý học có thể chấp nhận Giả thuyết không cho rằng hệ số tương quan giống với 0 và bác bỏ Giả thuyết thay thế cho rằng hệ số tương quan khác 0 đáng kể. Trong trường hợp này, kết quả thu được cho thấy đánh giá của chuyên gia về bài kiểm tra SHTUR của học sinh không liên quan đến đánh giá của chuyên gia về văn học.

Để áp dụng hệ số tương quan Spearman, phải đáp ứng các điều kiện sau:

1. Các biến được so sánh phải được lấy theo thang đo thứ tự (thứ hạng), nhưng cũng có thể đo lường theo thang khoảng và thang tỷ lệ.

2. Bản chất của sự phân bố các đại lượng tương quan không thành vấn đề.

3. Số lượng đặc điểm khác nhau của các biến so sánh X và Y phải giống nhau.

Các bảng xác định giá trị tới hạn của hệ số tương quan Spearman (Bảng 20, Phụ lục 6) được tính từ số đặc trưng từ n = 5 đến n = 40 và với số lượng biến so sánh lớn hơn, bảng cho Nên sử dụng hệ số tương quan Pearson (Bảng 19, Phụ lục 6). Việc tìm các giá trị tới hạn được thực hiện tại k = n.