Phân tích tương quan Spearman, giao dịch thực tế trong các ví dụ. Một ví dụ về việc tìm kiếm hệ số tương quan thứ hạng Spearman

là một đánh giá định lượng của nghiên cứu thống kê về mối quan hệ giữa các hiện tượng, được sử dụng trong phương pháp phi tham số.

Chỉ báo cho biết tổng bình phương quan sát được giữa các cấp bậc khác nhau như thế nào so với trường hợp không có kết nối.

Phân công dịch vụ. Với máy tính trực tuyến này, bạn có thể:

  • tính toán hệ số tương quan thứ hạng của Spearman;
  • tính toán khoảng tin cậy cho hệ số và đánh giá mức độ ý nghĩa của nó;

Hệ số tương quan thứ hạng của Spearmanđề cập đến các chỉ số đánh giá mức độ gần gũi của giao tiếp. Một đặc tính định tính về mức độ chặt chẽ của mối quan hệ của hệ số tương quan thứ hạng, cũng như các hệ số tương quan khác, có thể được đánh giá bằng cách sử dụng thang đo Chaddock.

Hệ số tính toán bao gồm các bước sau:

Các thuộc tính của hệ số tương quan thứ hạng của Spearman

Khu vực ứng dụng. Hệ số tương quan thứ hạngđược sử dụng để đánh giá chất lượng giao tiếp giữa hai tập hợp. Ngoài ra, ý nghĩa thống kê của nó được sử dụng khi phân tích dữ liệu cho phương sai thay đổi.

Ví dụ. Trên mẫu dữ liệu của các biến quan sát X và Y:

  1. lập bảng xếp hạng;
  2. tìm hệ số tương quan thứ hạng của Spearman và kiểm tra ý nghĩa của nó ở mức 2a
  3. đánh giá bản chất của nghiện
Giải pháp. Gán cấp bậc cho đối tượng địa lý Y và yếu tố X.
XYxếp hạng X, dxxếp hạng Y, d y
28 21 1 1
30 25 2 2
36 29 4 3
40 31 5 4
30 32 3 5
46 34 6 6
56 35 8 7
54 38 7 8
60 39 10 9
56 41 9 10
60 42 11 11
68 44 12 12
70 46 13 13
76 50 14 14

Ma trận xếp hạng.
xếp hạng X, dxxếp hạng Y, d y(dx - dy) 2
1 1 0
2 2 0
4 3 1
5 4 1
3 5 4
6 6 0
8 7 1
7 8 1
10 9 1
9 10 1
11 11 0
12 12 0
13 13 0
14 14 0
105 105 10

Kiểm tra tính đúng đắn của việc biên dịch ma trận dựa trên việc tính toán tổng kiểm tra:

Tổng trên các cột của ma trận bằng nhau và tổng kiểm tra, có nghĩa là ma trận được cấu tạo chính xác.
Sử dụng công thức, chúng tôi tính toán hệ số tương quan cấp bậc của Spearman.


Mối quan hệ giữa tính trạng Y và yếu tố X là mạnh mẽ và trực tiếp
Ý nghĩa của hệ số tương quan thứ hạng của Spearman
Để kiểm định giả thuyết rỗng ở mức ý nghĩa α rằng hệ số tương quan cấp bậc Spearman tổng quát bằng 0 trong giả thuyết cạnh tranh H i. p ≠ 0, cần tính điểm tới hạn:

với n là cỡ mẫu; ρ là hệ số tương quan thứ hạng mẫu của Spearman: t (α, k) là điểm tới hạn của vùng tới hạn hai phía, được tìm thấy từ bảng các điểm tới hạn của phân phối Sinh viên, theo mức ý nghĩa α và số bậc tự do k = n-2.
Nếu | p |< Т kp - нет оснований отвергнуть нулевую гипотезу. Ранговая корреляционная связь между качественными признаками не значима. Если |p| >T kp - giả thuyết vô hiệu bị bác bỏ. Có một mối tương quan thứ hạng đáng kể giữa các đặc điểm định tính.
Theo bảng Student ta tìm được t (α / 2, k) = (0,1 / 2; 12) = 1,782

Kể từ khi T kp< ρ , то отклоняем гипотезу о равенстве 0 коэффициента ранговой корреляции Спирмена. Другими словами, коэффициент ранговой корреляции статистически - значим и ранговая корреляционная связь между оценками по двум тестам значимая.

37. Hệ số tương quan thứ hạng của Spearman.

S. 56 (64) 063.JPG

http://psystat.at.ua/publ/1-1-0-33

Hệ số tương quan thứ hạng của Spearman được sử dụng khi:
- biến có thang xếp hạngđo;
- phân phối dữ liệu quá khác với thông thường hoặc không biết gì cả
- mẫu nhỏ (N< 30).

Việc giải thích hệ số tương quan thứ hạng của Spearman không khác với hệ số của Pearson, nhưng ý nghĩa của nó có phần khác nhau. Để hiểu sự khác biệt giữa các phương pháp này và chứng minh một cách hợp lý các lĩnh vực ứng dụng của chúng, hãy so sánh các công thức của chúng.

Hệ số tương quan Pearson:

Hệ số tương quan của Spearman:

Như bạn có thể thấy, các công thức khác nhau đáng kể. So sánh công thức

Công thức tương quan Pearson sử dụng trung bình cộng và độ lệch chuẩn của chuỗi tương quan, trong khi công thức Spearman thì không. Do đó, để có được một kết quả thích hợp theo công thức Pearson, điều cần thiết là chuỗi tương quan phải gần với phân phối chuẩn (giá trị trung bình và độ lệch chuẩn là thông số phân phối chuẩn). Đối với công thức Spearman, điều này không liên quan.

Một yếu tố trong công thức của Pearson là tiêu chuẩn hóa của từng chuỗi trong điểm z.

Như bạn có thể thấy, việc chuyển đổi các biến sang thang đo Z có trong công thức hệ số tương quan Pearson. Theo đó, đối với hệ số Pearson, thang đo của dữ liệu hoàn toàn không liên quan: ví dụ, chúng ta có thể tương quan hai biến, một trong số đó có min. = 0 và tối đa. = 1 và phút thứ hai. = 100 và tối đa. = 1000. Bất kể phạm vi giá trị khác nhau như thế nào, tất cả chúng sẽ được chuyển đổi thành giá trị z tiêu chuẩn với cùng tỷ lệ.

Không có sự chuẩn hóa như vậy trong hệ số Spearman, vì vậy

ĐIỀU KIỆN XỬ LÝ ĐỂ SỬ DỤNG HIỆU SỐ TỐC ĐỘ LÀ BẰNG TÍCH PHÂN CỦA HAI BIẾN HÌNH.

Trước khi sử dụng hệ số Spearman cho chuỗi dữ liệu với các phạm vi khác nhau, cần phải cấp. Xếp hạng dẫn đến thực tế là các giá trị của chuỗi này có cùng giá trị nhỏ nhất = 1 (xếp hạng nhỏ nhất) và tối đa bằng số giá trị (lớn nhất, xếp hạng cuối cùng = N, tức là số trường hợp lớn nhất trong mẫu vật).

Trong những trường hợp có thể làm mà không cần xếp hạng

Đây là những trường hợp mà dữ liệu ban đầu là thang xếp hạng. Ví dụ, kiểm tra định hướng giá trị Rokeach.

Ngoài ra, đây là những trường hợp số lượng tùy chọn giá trị nhỏ và có cố định tối thiểu và tối đa trong mẫu. Ví dụ, trong vi phân ngữ nghĩa, tối thiểu = 1, tối đa = 7.

Ví dụ về tính toán hệ số tương quan cấp bậc Spearman

Thử nghiệm định hướng giá trị của Rokeach được thực hiện trên hai mẫu X và Y. Nhiệm vụ: tìm hiểu mức độ gần gũi của phân cấp giá trị của các mẫu này (theo nghĩa đen, chúng giống nhau như thế nào).

Giá trị kết quả r = 0,747 được kiểm tra bảng giá trị quan trọng. Theo bảng, tại N = 18, giá trị thu được là đáng tin cậy ở mức p<=0,005

Hệ số tương quan xếp hạng theo Spearman và Kendal

Đối với các biến thuộc thang đo thứ tự hoặc đối với các biến không tuân theo phân phối chuẩn, cũng như đối với các biến thuộc thang đo khoảng, tương quan thứ hạng của Spearman được tính toán thay vì hệ số Pearson. Để làm điều này, các giá trị riêng lẻ của các biến được chỉ định vị trí xếp hạng, sau đó được xử lý bằng cách sử dụng các công thức thích hợp. Để hiển thị mối tương quan xếp hạng, hãy bỏ chọn hộp kiểm tương quan Pearson mặc định trong hộp thoại Tương quan hai biến ... Thay vào đó, hãy kích hoạt tính toán tương quan Spearman. Phép tính này sẽ cho kết quả sau. Hệ số tương quan thứ hạng rất gần với các giá trị tương ứng của hệ số Pearson (các biến ban đầu có phân phối chuẩn).

titkova-matmetody.pdf p. 45

Phương pháp tương quan thứ hạng của Spearman cho phép bạn xác định độ chặt (sức mạnh) và hướng

mối tương quan giữa hai dấu hiệu hoặc hai cấu hình (phân cấp) dấu hiệu.

Để tính toán mối tương quan thứ hạng, cần phải có hai chuỗi giá trị,

mà có thể được xếp hạng. Các phạm vi giá trị này có thể là:

1) hai dấu hiệuđo trong cùng một tập đoànđối tượng kiểm tra;

2) hai phân cấp tính năng riêng lẻ,được xác định trong hai đối tượng cho cùng một

một tập hợp các tính năng;

3) hai phân cấp nhóm của các tính năng,

4) cá nhân và nhóm phân cấp tính năng.

Đầu tiên, các chỉ số được xếp hạng riêng biệt cho từng tính năng.

Theo quy luật, giá trị thấp hơn của một đối tượng địa lý được chỉ định một thứ hạng thấp hơn.

Trong trường hợp đầu tiên (hai tính năng), các giá trị riêng lẻ được xếp hạng theo

đặc điểm thu được bởi các đối tượng khác nhau, và sau đó là các giá trị riêng lẻ cho thứ hai

dấu hiệu.

Nếu hai dấu hiệu có quan hệ cùng chiều, thì các đối tượng có thứ hạng thấp trong

một trong số họ sẽ có thứ hạng thấp ở người kia, và những đối tượng có thứ hạng cao ở

một trong những đặc điểm này cũng sẽ có thứ hạng cao về đặc điểm kia. Để đếm rs

nó là cần thiết để xác định sự khác biệt (d) giữa các cấp bậc mà những đối tượng này có được trên cả hai

dấu hiệu. Sau đó, các chỉ số d này được biến đổi theo một cách nhất định và được trừ đi 1. Than

sự khác biệt giữa các cấp càng nhỏ, rs sẽ càng lớn, càng gần với +1.

Nếu không có mối tương quan, thì tất cả các cấp bậc sẽ bị trộn lẫn và sẽ không có

không có trận đấu. Công thức được thiết kế để trong trường hợp này, rs sẽ gần bằng 0.

Trong trường hợp tương quan nghịch thứ hạng thấp của các đối tượng trên một cơ sở

sẽ tương ứng với thứ hạng cao trên một thuộc tính khác và ngược lại. Càng không khớp

giữa các cấp bậc của đối tượng trong hai biến, rs càng gần -1.

Trong trường hợp thứ hai (hai hồ sơ cá nhân), cá nhân

giá trị thu được của mỗi trong số 2 đối tượng theo một nhất định (đối với họ như nhau

cả hai) một tập hợp các tính năng. Xếp hạng đầu tiên sẽ nhận được đặc điểm có giá trị thấp nhất; hạng hai -

một dấu hiệu có giá trị cao hơn, v.v. Rõ ràng, tất cả các tính năng phải được đo bằng

các đơn vị giống nhau, nếu không xếp hạng là không thể. Ví dụ, nó không thể

xếp hạng các chỉ số theo Bảng câu hỏi về tính cách Cattell (16PF), nếu chúng được thể hiện bằng

điểm "thô", vì các phạm vi giá trị khác nhau đối với các yếu tố khác nhau: từ 0 đến 13, từ 0 đến

20 và từ 0 đến 26. Chúng tôi không thể nói yếu tố nào sẽ chiếm vị trí đầu tiên về

mức độ nghiêm trọng, cho đến khi chúng tôi đưa tất cả các giá trị về một tỷ lệ duy nhất (thường xuyên nhất là tỷ lệ của các bức tường).

Nếu thứ bậc riêng lẻ của hai đối tượng có quan hệ tích cực với nhau, thì các dấu hiệu

có thứ hạng thấp ở một trong số họ sẽ có thứ hạng thấp ở thứ còn lại, và ngược lại.

Ví dụ: nếu đối với một chủ đề mà yếu tố E (ưu thế) có thứ hạng thấp nhất, thì đối với

môn khác xếp hạng thấp nếu một môn có hệ số C

(ổn định cảm xúc) có thứ hạng cao nhất thì chủ thể khác cũng phải có

yếu tố này có thứ hạng cao, v.v.

Trong trường hợp thứ ba (hai cấu hình nhóm), các giá trị nhóm trung bình được xếp hạng,

nhận trong 2 nhóm đối tượng theo một nhất định, giống hệt nhau cho hai nhóm, đặt

dấu hiệu. Trong những gì tiếp theo, dòng lập luận giống như trong hai trường hợp trước.

Trong trường hợp thứ 4 (hồ sơ cá nhân và nhóm), chúng được xếp hạng riêng biệt

giá trị riêng lẻ của chủ đề và giá trị nhóm trung bình cho cùng một tập hợp

các dấu hiệu thu được, như một quy luật, với việc loại trừ chủ thể cá nhân này - anh ta

không tham gia vào hồ sơ nhóm trung bình, trong đó cá nhân của anh ấy sẽ được so sánh

Hồ sơ. Tương quan thứ hạng sẽ cho phép bạn kiểm tra mức độ nhất quán của từng cá nhân và

hồ sơ nhóm.

Trong cả bốn trường hợp, ý nghĩa của hệ số tương quan thu được được xác định bởi

theo số lượng giá trị được xếp hạng N. Trong trường hợp đầu tiên, con số này sẽ trùng với

cỡ mẫu n. Trong trường hợp thứ hai, số lần quan sát sẽ là số lượng các đối tượng địa lý,

cấu thành một hệ thống phân cấp. Trong trường hợp thứ ba và thứ tư, N cũng là số lượng phù hợp

các dấu hiệu, không phải là số đối tượng trong các nhóm. Giải thích chi tiết được đưa ra trong các ví dụ. Nếu

giá trị tuyệt đối của rs đạt đến giá trị tới hạn hoặc vượt quá nó, mối tương quan

đáng tin cậy.

Các giả thuyết.

Có hai giả thuyết có thể xảy ra. Đầu tiên đề cập đến trường hợp 1, thứ hai đến ba trường hợp còn lại

Phiên bản đầu tiên của giả thuyết

H0: Tương quan giữa các biến A và B không khác 0.

H2: Mối tương quan giữa các biến A và B khác 0 có ý nghĩa.

Phiên bản thứ hai của giả thuyết

H0: Tương quan giữa phân cấp A và B không khác 0.

H2: Mối tương quan giữa phân cấp A và B khác 0 có ý nghĩa.

Hạn chế của hệ số tương quan thứ hạng

1. Ít nhất 5 quan sát phải được gửi cho mỗi biến. Phía trên

giới hạn lấy mẫu được xác định bởi các bảng có sẵn của các giá trị tới hạn .

2. Hệ số tương quan thứ hạng của Spearman rs với một số lượng lớn các điểm giống hệt nhau

xếp hạng cho một hoặc cả hai biến phù hợp cung cấp các giá trị thô. Lý tưởng

cả hai chuỗi tương quan phải là hai chuỗi không khớp

các giá trị. Nếu điều kiện này không được đáp ứng, phải điều chỉnh

cùng cấp bậc.

Hệ số tương quan thứ hạng của Spearman được tính theo công thức:

Nếu trong cả hai chuỗi xếp hạng được so sánh có các nhóm có cùng thứ hạng,

trước khi tính toán hệ số tương quan thứ hạng cần phải sửa lại cho giống

bậc Ta và Tv:

Ta \ u003d Σ (a3 - a) / 12,

TV \ u003d Σ (v3 - c) / 12,

ở đâu Nhưng - khối lượng của mỗi nhóm xếp hạng giống nhau trong chuỗi xếp hạng A, trong khối lượng của mỗi

các nhóm bậc bằng nhau trong dãy số hạng B.

Để tính giá trị thực nghiệm của rs, hãy sử dụng công thức:

38. Hệ số tương quan lưỡng tính chấm.

Về mối tương quan nói chung, hãy xem câu hỏi số 36 từ. 56 (64) 063.JPG

harchenko-korranaliz.pdf

Cho biến X được đo trên thang đo mạnh, và biến Y trên thang phân đôi. Hệ số tương quan lưỡng tính điểm rpb được tính theo công thức:

Ở đây x 1 là giá trị trung bình cho các đối tượng X với giá trị "một" cho Y;

x 0 - giá trị trung bình của đối tượng X với giá trị là "không" đối với Y;

s x - độ lệch chuẩn của tất cả các giá trị đối với X;

n 1 - số đối tượng "một" trong Y, n 0 - số đối tượng "không" trong Y;

n = n 1 + n 0 là cỡ mẫu.

Hệ số tương quan lưỡng tính điểm cũng có thể được tính bằng cách sử dụng các biểu thức tương đương khác:

Đây x là giá trị trung bình tổng thể cho biến X.

Hệ số tương quan điểm lưỡng tính rpb thay đổi từ –1 đến +1. Giá trị của nó bằng 0 trong trường hợp các biến có đơn vị cho Y có mức trung bình Y, bằng giá trị trung bình của các biến không có Y.

Kiểm tra giả thuyết ý nghĩa hệ số tương quan lưỡng tính điểm là để kiểm tra giả thuyết vô hiệuh 0 về đẳng thức của hệ số tương quan tổng quát về 0: ρ = 0, được thực hiện bằng cách sử dụng tiêu chí Sinh viên. Giá trị thực nghiệm

so với các giá trị quan trọng t Một (df) cho số bậc tự do df = n– 2

Nếu điều kiện | t| ≤ ta(df), giả thuyết rỗng ρ = 0 không bị bác bỏ. Hệ số tương quan lưỡng tính điểm khác 0 có ý nghĩa nếu giá trị thực nghiệm | t| rơi vào vùng quan trọng, tức là, nếu điều kiện | t| > ta(n- 2). Độ tin cậy của mối quan hệ được tính toán bằng cách sử dụng hệ số tương quan lưỡng tính điểm rpb, cũng có thể được xác định bằng cách sử dụng tiêu chí χ 2 cho số bậc tự do df= 2.

Tương quan điểm-lưỡng tính

Sự sửa đổi sau đó của hệ số tương quan của tích các khoảnh khắc được phản ánh trong dấu chấm-lưỡng tính r. Chỉ số này. cho thấy mối quan hệ giữa hai biến, một trong số đó được cho là liên tục và phân phối bình thường, trong khi biến còn lại là rời rạc theo nghĩa chính xác của từ này. Hệ số tương quan điểm-lưỡng tính được biểu thị bằng r pbis Bởi vì trong r pbis sự phân đôi phản ánh bản chất thực sự của biến số rời rạc, và không phải là giả tạo, như trong trường hợp r bis, dấu hiệu của nó được xác định tùy ý. Do đó, đối với tất cả các thực hành bàn thắng r pbisđược xem xét trong phạm vi từ 0,00 đến +1,00.

Cũng có một trường hợp như vậy khi hai biến được coi là liên tục và phân phối chuẩn, nhưng cả hai biến đều phân đôi một cách giả tạo, như trong trường hợp tương quan lưỡng tính. Để đánh giá mối quan hệ giữa các biến đó, hệ số tương quan tứ phân tử được sử dụng r ngày tết, cũng được lai tạo bởi Pearson. Chủ yếu (chính xác) các công thức và quy trình để tính toán r ngày tết khá phức tạp. Do đó, với pract. phương pháp này sử dụng các giá trị gần đúng r ngày tết thu được trên cơ sở các thủ tục và bảng rút gọn.

/online/dictionary/dictionary.php?term=511

HIỆU QUẢ BẤT NGỜ CỦA VIỆC THAM NHŨNG là hệ số tương quan giữa hai biến, một trong số đó được đo lường trên thang đo phân đôi và biến còn lại trên thang đo khoảng. Nó được sử dụng trong khảo nghiệm cổ điển và hiện đại như một chỉ số đánh giá chất lượng của nhiệm vụ kiểm tra - độ tin cậy-nhất quán với điểm tổng thể của bài kiểm tra.

Để tương quan các biến được đo bằng phân đôi và thang đo khoảng cách sử dụng hệ số tương quan điểm-lưỡng tính.
Hệ số tương quan điểm-lưỡng tính là một phương pháp phân tích tương quan tỷ lệ giữa các biến, một trong số đó được đo lường trong thang đo tên và chỉ lấy 2 giá trị (ví dụ: nam / nữ, câu trả lời đúng / câu trả lời không chính xác, có một dấu / không có dấu), và thứ hai trong các tỷ lệ thang đo hoặc thang đo khoảng cách. Công thức tính hệ số tương quan điểm-lưỡng tính:

Ở đâu:
m1 và m0 là giá trị trung bình của X với giá trị bằng 1 hoặc 0 trong Y.
σx là độ lệch chuẩn của tất cả các giá trị của X
n1, n0 - số giá trị X từ 1 hoặc 0 đến Y.
n là tổng số cặp giá trị

Thông thường, loại hệ số tương quan này được sử dụng để tính toán mối quan hệ của các hạng mục kiểm tra với thang điểm tóm tắt. Đây là một loại kiểm tra xác thực.

39. Hệ số tương quan thứ hạng-lưỡng tính.

Về mối tương quan nói chung, hãy xem câu hỏi số 36 từ. 56 (64) 063.JPG

harchenko-korranaliz.pdf p. 28

Hệ số tương quan thứ hạng-lưỡng tính được sử dụng khi một trong các biến ( X) được trình bày theo thang thứ tự, và cái kia ( Y) - lưỡng phân, được tính theo công thức

.

Đây là thứ hạng trung bình của các đối tượng có sự thống nhất trong Y; là thứ hạng trung bình của các đối tượng không có Y, n là kích thước mẫu.

Kiểm tra giả thuyết ý nghĩa Hệ số tương quan cấp bậc-lưỡng tính được thực hiện tương tự như hệ số tương quan lưỡng tính điểm bằng cách sử dụng kiểm định t của Sinh viên với sự thay thế trong công thức rpb trên rrb.

Khi một biến được đo lường trên thang đo phân đôi (biến x), và cái còn lại trong thang thứ hạng (biến Y), sử dụng hệ số tương quan thứ hạng-lưỡng tính. Chúng tôi nhớ rằng biến x,được đo bằng thang đo phân đôi, chỉ nhận hai giá trị (mã) 0 và 1. Đặc biệt chúng ta hãy nhấn mạnh rằng mặc dù thực tế là hệ số này thay đổi trong phạm vi từ –1 đến +1, dấu của nó không quan trọng để giải thích các kết quả. Đây là một ngoại lệ khác đối với quy tắc chung.

Việc tính toán hệ số này được thực hiện theo công thức:

ở đâu X 1 xếp hạng trung bình so với các yếu tố đó của biến Y, tương ứng với mã (tính năng) 1 trong biến X;

`X 0 - xếp hạng trung bình cho các phần tử đó của biến Y, tương ứng với mã (tính năng) 0 trong biến X \

N- tổng số phần tử trong biến x.

Để áp dụng hệ số tương quan thứ hạng, phải đáp ứng các điều kiện sau:

1. Các biến được so sánh phải được đo lường trên các thang đo khác nhau: một X- trong một quy mô phân đôi; khác Y– trong thang xếp hạng.

2. Số lượng các tính năng khác nhau trong các biến được so sánh XY nên giống nhau.

3. Để đánh giá mức độ tin cậy của hệ số tương quan thứ hạng-lưỡng tính, người ta nên sử dụng công thức (11.9) và bảng các giá trị tới hạn cho bài kiểm tra của Học sinh khi k = n - 2.

http://psystat.at.ua/publ/drugie_vidy_koehosystema_korreljacii/1-1-0-38

Các trường hợp mà một trong các biến có trong quy mô lưỡng phân, và cái khác trong xếp hạng (thứ tự), yêu cầu sử dụng hệ số tương quan cấp bậc-lưỡng tính:

rpb = 2 / n * (m1 - m0)

ở đâu:
n là số đối tượng đo lường
m1 và m0 - thứ hạng trung bình của các đối tượng bằng 1 hoặc 0 trong biến thứ hai.
Hệ số này cũng được sử dụng khi kiểm tra tính hợp lệ của các thử nghiệm.

40. Hệ số tương quan tuyến tính.

Về tương quan nói chung (và tương quan tuyến tính nói riêng), xem câu hỏi số 36 từ. 56 (64) 063.JPG

HIỆU QUẢ HỢP TÁC CỦA PEARSON

r-Lề (lề r) được sử dụng để nghiên cứu mối quan hệ giữa hai chỉ sốcác biến khác được đo trên cùng một mẫu. Có nhiều tình huống sử dụng nó là phù hợp. Trí thông minh có ảnh hưởng đến thành tích trong những năm cuối đại học không? Mức lương của một nhân viên có liên quan đến thiện chí của anh ta đối với đồng nghiệp không? Tâm trạng của học sinh có ảnh hưởng đến thành công khi giải một bài toán số học phức tạp không? Để trả lời những câu hỏi như vậy, nhà nghiên cứu phải đo lường hai chỉ số quan tâm đến từng thành viên của mẫu. Dữ liệu để nghiên cứu mối quan hệ sau đó được lập bảng, như trong ví dụ dưới đây.

VÍ DỤ 6.1

Bảng cho thấy một ví dụ về dữ liệu đo lường ban đầu cho hai chỉ số về trí thông minh (bằng lời nói và không bằng lời nói) ở 20 học sinh lớp 8.

Mối quan hệ giữa các biến này có thể được mô tả bằng biểu đồ phân tán (xem Hình 6.3). Biểu đồ cho thấy có một số mối quan hệ giữa các chỉ số đo lường: giá trị của trí thông minh bằng lời nói càng lớn thì (chủ yếu) giá trị của trí thông minh không lời càng lớn.

Trước khi đưa ra công thức cho hệ số tương quan, chúng ta hãy thử theo dõi logic của sự xuất hiện của nó, sử dụng dữ liệu của Ví dụ 6.1. Vị trí của mỗi /-điểm (đối tượng với số /) trên biểu đồ phân tán so với các điểm khác (Hình 6.3) có thể được cung cấp bởi độ lớn và dấu hiệu của độ lệch của các giá trị tương ứng của các biến so với giá trị trung bình: (xj - MJ (tâm trí tại ). Nếu các dấu hiệu của những sai lệch này trùng khớp, thì điều này cho thấy có lợi cho một mối quan hệ tích cực (các giá trị lớn đối với X tương ứng với các giá trị lớn tại hoặc các giá trị nhỏ hơn cho X tương ứng với các giá trị nhỏ hơn y).

Đối với môn số 1, độ lệch so với điểm trung bình X và bởi tại tích cực, và đối với chủ đề số 3, cả hai sai lệch đều là tiêu cực. Do đó, dữ liệu của cả hai đều chỉ ra mối quan hệ thuận chiều giữa các đặc điểm được nghiên cứu. Ngược lại, nếu các dấu hiệu sai lệch so với giá trị trung bình X và bởi tại khác nhau, điều này sẽ chỉ ra mối quan hệ tiêu cực giữa các dấu hiệu. Như vậy, đối với môn số 4, độ lệch so với điểm trung bình X là tiêu cực, theo y - tích cực, và đối với môn học số 9 - ngược lại.

Do đó, nếu tích của độ lệch (x, - M X ) X (tâm trí tại ) tích cực, thì dữ liệu của / -subject chỉ ra mối quan hệ trực tiếp (tích cực), và nếu phủ định, thì là mối quan hệ nghịch đảo (tiêu cực). Theo đó, nếu Xwy chủ yếu là tỷ lệ thuận, khi đó hầu hết các sản phẩm của các độ lệch sẽ là dương, và nếu chúng liên quan nghịch đảo, thì hầu hết các sản phẩm sẽ là âm. Do đó, tổng của tất cả các tích số của độ lệch đối với một mẫu nhất định có thể dùng làm chỉ số chung cho độ mạnh và hướng của mối quan hệ:

Với mối quan hệ tỷ lệ thuận giữa các biến, giá trị này lớn và dương - đối với hầu hết các đối tượng, độ lệch trùng dấu (giá trị lớn của một biến tương ứng với giá trị lớn của biến kia và ngược lại). Nếu Xtại có phản hồi, thì đối với hầu hết các đối tượng, giá trị lớn của một biến sẽ tương ứng với giá trị nhỏ hơn của biến khác, tức là dấu hiệu của sản phẩm sẽ âm và tổng của sản phẩm nói chung cũng sẽ lớn ở giá trị tuyệt đối, nhưng âm trong dấu. Nếu không có mối quan hệ hệ thống giữa các biến, thì các số hạng dương (sản phẩm của độ lệch) sẽ được cân bằng bởi các số hạng âm, và tổng của tất cả các tích số của độ lệch sẽ gần bằng không.

Sao cho tổng các sản phẩm không phụ thuộc vào cỡ mẫu thì lấy trung bình cộng là đủ. Nhưng chúng tôi quan tâm đến thước đo của mối quan hệ không phải là một tham số chung, mà là một ước tính có tính toán của nó - thống kê. Do đó, đối với công thức phân tán, trong trường hợp này chúng ta cũng làm như vậy, chúng ta chia tổng các tích của độ lệch không cho n, và trên TV - 1. Nó hóa ra một biện pháp giao tiếp, được sử dụng rộng rãi trong vật lý và khoa học kỹ thuật, được gọi là hiệp phương sai (Covahance):


TRONG tâm lý học, không giống như vật lý, hầu hết các biến được đo lường trên các thang tùy ý, vì các nhà tâm lý học không quan tâm đến giá trị tuyệt đối của đặc điểm, mà ở vị trí tương đối của các đối tượng trong nhóm. Ngoài ra, hiệp phương sai rất nhạy cảm với thang đo (độ phân tán) trong đó các đối tượng được đo. Để làm cho phép đo giao tiếp độc lập với các đơn vị đo của một trong hai thuộc tính, chỉ cần chia hiệp phương sai thành các độ lệch chuẩn tương ứng. Do đó, nó đã thu được vì-Hệ số tương quan của K. Pearson con la:

hoặc, sau khi thay thế các biểu thức cho o x và


Nếu giá trị của cả hai biến được chuyển đổi thành giá trị r bằng công thức


thì công thức hệ số tương quan r-Pearson trông đơn giản hơn (071.JPG):

/dict/sociology/article/soc/soc-0525.htm

TUYẾN TÍNH CORRELATION- mối quan hệ thống kê phi nhân quả tuyến tính giữa hai biến định lượng Xtại. Được đo bằng cách sử dụng "yếu tố K.L." Pearson, là kết quả của việc chia hiệp phương sai cho độ lệch chuẩn của cả hai biến:

,

ở đâu S xy- hiệp phương sai giữa các biến Xtại;

S x , S y- độ lệch chuẩn cho các biến Xtại;

x tôi , y tôi- giá trị biến Xtại cho số đối tượng tôi;

x, y- trung bình số học cho các biến Xtại.

Tỷ lệ Pearson r có thể nhận các giá trị từ khoảng [-1; +1]. Nghĩa r = 0 có nghĩa là không có mối quan hệ tuyến tính giữa các biến Xtại(nhưng không loại trừ mối quan hệ thống kê phi tuyến tính). Giá trị hệ số dương ( r> 0) chỉ ra mối quan hệ tuyến tính trực tiếp; giá trị của nó càng gần +1, mối quan hệ thống kê trực tiếp càng mạnh. Giá trị hệ số âm ( r < 0) свидетельствуют об обратной линейной связи; чем ближе его значение к -1, тем сильнее обратная связь. Значения r= ± 1 có nghĩa là sự hiện diện của kết nối tuyến tính đầy đủ, trực tiếp hoặc đảo ngược. Trong trường hợp kết nối hoàn chỉnh, tất cả các điểm có tọa độ ( x tôi , y tôi) nằm trên một đường thẳng y = Một + bx.

"Hệ số K.L." Pearson cũng được sử dụng để đo lường mức độ chặt chẽ của mối quan hệ trong mô hình hồi quy cặp tuyến tính.

41. Ma trận tương quan và đồ thị tương quan.

Về mối tương quan nói chung, hãy xem câu hỏi số 36 từ. 56 (64) 063.JPG

Ma trận tương quan. Thông thường, phân tích tương quan bao gồm việc nghiên cứu mối quan hệ không phải của hai mà của nhiều biến được đo lường trên thang định lượng trên một mẫu duy nhất. Trong trường hợp này, các mối tương quan được tính toán cho từng cặp của tập hợp các biến này. Các phép tính thường được thực hiện trên máy tính và kết quả là một ma trận tương quan.

Ma trận tương quan(tương quan ma trận) là kết quả của việc tính toán các mối tương quan cùng loại cho mỗi cặp từ tập hợp R các biến được đo lường trong thang đo định lượng trên một mẫu.

VÍ DỤ

Giả sử rằng chúng ta đang nghiên cứu mối quan hệ giữa 5 biến (vl, v2, ..., v5; P= 5), được đo trên một mẫu của N = 30 Nhân loại. Dưới đây là bảng dữ liệu ban đầu và ma trận tương quan.


dữ liệu liên quan:

Ma trận tương quan:

Dễ dàng nhận thấy rằng ma trận tương quan là hình vuông, đối xứng với đường chéo chính (takkakg, y = /) y), với các đơn vị trên đường chéo chính (vì G = Gu = 1).

Ma trận tương quan là Quảng trường: số hàng và số cột bằng số lượng biến. Bà ấy đối xứng so với đường chéo chính, vì mối tương quan X từ tại tương quan ngang bằng tại từ X. Các đơn vị nằm trên đường chéo chính của nó, vì mối tương quan của một đối tượng địa lý với chính nó bằng một. Do đó, không phải tất cả các yếu tố của ma trận tương quan đều phải phân tích, mà là những yếu tố nằm trên hoặc dưới đường chéo chính.

Số lượng hệ số tương quan, P đặc điểm cần phân tích trong nghiên cứu các mối quan hệ được xác định theo công thức: P (P- 1) / 2. Trong ví dụ trên, số lượng các hệ số tương quan như vậy là 5 (5 - 1) / 2 = 10.

Nhiệm vụ chính của việc phân tích ma trận tương quan là tiết lộ cấu trúc của các mối quan hệ qua lại của một tập hợp các đối tượng địa lý. Điều này cho phép phân tích trực quan lời cầu xin tương quan- hình ảnh đồ họa cấu trúc thống kêkết nối quan trọng nếu không có rất nhiều kết nối như vậy (lên đến 10-15). Một cách khác là sử dụng các phương pháp đa biến: hồi quy bội, giai thừa hoặc phân tích cụm (xem phần "Phương pháp đa biến ..."). Sử dụng phân tích giai thừa hoặc phân cụm, có thể xác định nhóm các biến có liên quan chặt chẽ với nhau hơn so với các biến khác. Sự kết hợp của các phương pháp này cũng rất hiệu quả, ví dụ, nếu có nhiều dấu hiệu và chúng không đồng nhất.

So sánh các mối tương quan - một nhiệm vụ bổ sung là phân tích ma trận tương quan, có hai lựa chọn. Nếu cần so sánh các mối tương quan ở một trong các hàng của ma trận tương quan (đối với một trong các biến), phương pháp so sánh cho các mẫu phụ thuộc được áp dụng (trang 148-149). Khi so sánh các mối tương quan của cùng một tên được tính toán cho các mẫu khác nhau, phương pháp so sánh cho các mẫu độc lập được sử dụng (trang 147-148).

Phương pháp so sánh mối tương quan theo đường chéo ma trận tương quan (để đánh giá tính ổn định của một quá trình ngẫu nhiên) và so sánh vài ma trận tương quan thu được đối với các mẫu khác nhau (về tính đồng nhất của chúng) tốn nhiều thời gian và nằm ngoài phạm vi của cuốn sách này. Bạn có thể làm quen với những phương pháp này từ cuốn sách của GV Sukhodolsky 1.

Vấn đề ý nghĩa thống kê của các mối tương quan. Vấn đề là thủ tục kiểm tra giả thuyết thống kê liên quan đến một-nhiều thử nghiệm được thực hiện trên một mẫu. Nếu áp dụng cùng một phương pháp nhiều lần, ngay cả khi liên quan đến các biến số khác nhau, thì xác suất đạt được một kết quả hoàn toàn do ngẫu nhiên sẽ tăng lên. Nói chung, nếu chúng ta lặp lại cùng một phương pháp kiểm tra giả thuyết đến lần liên quan đến các biến hoặc mẫu khác nhau, thì với giá trị đã thiết lập của a, chúng tôi đảm bảo nhận được xác nhận về giả thuyết trong àk số lượng các trường hợp.

Giả sử rằng ma trận tương quan cho 15 biến được phân tích, nghĩa là, 15 (15-1) / 2 = 105 hệ số tương quan được tính toán. Để kiểm tra các giả thuyết, mức a = 0,05 được đặt. Bằng cách kiểm tra giả thuyết 105 lần, chúng ta sẽ nhận được xác nhận của nó năm lần (!) Bất kể kết nối có thực sự tồn tại hay không. Biết điều này và đã nhận được, chẳng hạn, 15 hệ số tương quan "có ý nghĩa thống kê", chúng ta có thể cho biết hệ số nào trong số đó được thu thập một cách tình cờ, và hệ số nào phản ánh mối quan hệ thực sự?

Nói một cách chính xác, để đưa ra một quyết định thống kê, cần phải giảm mức a nhiều lần so với số lượng giả thuyết được kiểm tra. Nhưng điều này hầu như không được khuyến khích, vì xác suất bỏ qua một kết nối trong đời thực (tạo ra lỗi loại II) tăng lên một cách không thể đoán trước.

Chỉ riêng ma trận tương quan không phải là cơ sở đủcho các kết luận thống kê liên quan đến các hệ số riêng lẻ được bao gồm trong đócác mối tương quan!

Chỉ có một cách thực sự thuyết phục để giải quyết vấn đề này: chia ngẫu nhiên mẫu thành hai phần và chỉ tính đến những tương quan có ý nghĩa thống kê trong cả hai phần của mẫu. Một giải pháp thay thế có thể là sử dụng các phương pháp đa biến (phân tích giai thừa, cụm hoặc nhiều hồi quy) - để lựa chọn và giải thích tiếp theo các nhóm biến có liên quan có ý nghĩa thống kê.

Vấn đề thiếu giá trị. Nếu thiếu các giá trị trong dữ liệu, thì có thể có hai tùy chọn để tính toán ma trận tương quan: a) xóa từng dòng của các giá trị (loại trừcác trường hợptheo danh sách); b) xóa từng cặp các giá trị (loại trừcác trường hợpcó cặp). Tại xóa từng dòng quan sát có khoảng trống, toàn bộ dòng bị xóa đối với đối tượng (chủ đề) có ít nhất một giá trị bị thiếu cho một trong các biến. Phương pháp này dẫn đến một ma trận tương quan "đúng" theo nghĩa là tất cả các hệ số được tính toán từ cùng một tập đối tượng. Tuy nhiên, nếu các giá trị bị thiếu được phân phối ngẫu nhiên trong các biến, thì phương pháp này có thể dẫn đến thực tế là sẽ không còn đối tượng nào trong tập dữ liệu được xem xét (mỗi dòng sẽ chứa ít nhất một giá trị bị thiếu). Để tránh tình huống này, hãy sử dụng một phương pháp khác được gọi là loại bỏ theo cặp. Phương pháp này chỉ tính đến khoảng trống trong từng cặp cột biến đã chọn và bỏ qua khoảng trống trong các biến khác. Tương quan của một cặp biến được tính toán cho những đối tượng không có khoảng trống. Trong nhiều tình huống, đặc biệt là khi số lượng khoảng trống tương đối nhỏ, chẳng hạn như 10%, và các khoảng trống được phân bố khá ngẫu nhiên, phương pháp này không dẫn đến sai sót nghiêm trọng. Tuy nhiên, đôi khi không phải như vậy. Ví dụ, trong độ chệch hệ thống (dịch chuyển) của ước tính, vị trí có hệ thống của các khoảng trống có thể bị "ẩn", đó là lý do dẫn đến sự khác biệt về hệ số tương quan được xây dựng trên các tập con khác nhau (ví dụ, đối với các nhóm con khác nhau của các đối tượng ). Một vấn đề khác liên quan đến ma trận tương quan được tính toán với theo cặp loại bỏ khoảng cách xảy ra khi sử dụng ma trận này trong các loại phân tích khác (ví dụ, trong phân tích hồi quy bội hoặc phân tích nhân tố). Họ giả định rằng một ma trận tương quan "đúng" được sử dụng với một mức độ nhất quán nhất định và "sự tương ứng" của các hệ số khác nhau. Việc sử dụng một ma trận với các ước lượng "xấu" (sai lệch) dẫn đến thực tế là chương trình không thể phân tích một ma trận như vậy, hoặc kết quả sẽ bị sai. Do đó, nếu sử dụng phương pháp theo cặp để loại bỏ dữ liệu bị thiếu, thì cần phải kiểm tra xem có hoặc không có các mẫu hệ thống trong việc phân bố các khoảng trống.

Nếu việc loại bỏ từng cặp dữ liệu bị thiếu không dẫn đến bất kỳ sự thay đổi có hệ thống nào về phương tiện và phương sai (độ lệch chuẩn), thì những thống kê này sẽ tương tự như những thống kê được tính toán bằng phương pháp loại bỏ khoảng cách theo dòng khôn ngoan. Nếu có sự khác biệt đáng kể, thì có lý do để giả định rằng có sự thay đổi trong các ước tính. Ví dụ: nếu giá trị trung bình (hoặc độ lệch chuẩn) của các giá trị của biến NHƯNG,được sử dụng để tính toán mối tương quan của nó với biến TRONG,ít hơn nhiều so với giá trị trung bình (hoặc độ lệch chuẩn) của các giá trị tương tự của biến NHƯNG,được sử dụng để tính toán mối tương quan của nó với biến C, thì có mọi lý do để mong đợi rằng hai mối tương quan này (A-BCHÚNG TA) dựa trên các tập hợp con dữ liệu khác nhau. Sẽ có sự thay đổi trong các mối tương quan do vị trí không ngẫu nhiên của các khoảng trống trong giá trị của các biến.

Phân tích các khoảng tương quan. Sau khi giải quyết vấn đề về ý nghĩa thống kê của các yếu tố trong ma trận tương quan, các tương quan có ý nghĩa thống kê có thể được biểu diễn bằng đồ thị dưới dạng một toàn bộ hoặc nhiều mối tương quan. Thiên hà tương quan - nó là một hình bao gồm các đỉnh và các đoạn thẳng nối chúng. Các đỉnh tương ứng với các đối tượng địa lý và thường được ký hiệu bằng số - số của các biến. Các đường tương ứng với các mối quan hệ có ý nghĩa thống kê và biểu thị dấu hiệu bằng đồ thị, và đôi khi là mức ý nghĩa / j của mối quan hệ.

Thiên hà tương quan có thể phản ánh tất cả các mối quan hệ có ý nghĩa thống kê của ma trận tương quan (đôi khi được gọi là đồ thị tương quan ) hoặc chỉ phần được lựa chọn có ý nghĩa của chúng (ví dụ, tương ứng với một nhân tố theo kết quả phân tích nhân tố).

VÍ DỤ VỀ CẤU TẠO MỘT PLEIADI CORRELATION


Chuẩn bị cho chứng chỉ nhà nước (cuối cùng) của sinh viên tốt nghiệp: hình thành cơ sở dữ liệu USE (danh sách chung những người tham gia SỬ DỤNG thuộc tất cả các hạng mục, chỉ rõ các đối tượng) - có tính đến số ngày dự trữ trong trường hợp trùng hợp các đối tượng;

  • Kế hoạch làm việc (27)

    Giải pháp

    2. Các hoạt động của cơ sở giáo dục nhằm cải tiến nội dung và đánh giá chất lượng các môn học giáo dục tự nhiên và toán học MOU trường THCS số 4, Litvinovskaya, Chapaevskaya,

  • Trong trường hợp phép đo các đặc trưng nghiên cứu được thực hiện theo thang bậc, hoặc dạng của mối quan hệ khác với dạng tuyến tính, việc nghiên cứu mối quan hệ giữa hai biến ngẫu nhiên được thực hiện bằng cách sử dụng hệ số tương quan cấp bậc. Hãy xem xét hệ số tương quan thứ hạng của Spearman. Khi tính toán, cần phải xếp hạng (thứ tự) các phương án mẫu. Xếp hạng là nhóm dữ liệu thử nghiệm theo một thứ tự nhất định, tăng dần hoặc giảm dần.

    Hoạt động xếp hạng được thực hiện theo thuật toán sau:

    1. Giá trị thấp hơn được chỉ định một thứ hạng thấp hơn. Giá trị cao nhất được chỉ định một thứ hạng tương ứng với số lượng giá trị được xếp hạng. Giá trị thấp nhất được gán một thứ hạng bằng 1. Ví dụ: nếu n = 7, thì giá trị cao nhất sẽ nhận thứ hạng 7, ngoại trừ các trường hợp được cung cấp bởi quy tắc thứ hai.

    2. Nếu một số giá trị bằng nhau, thì chúng được gán một thứ hạng, là giá trị trung bình của những thứ hạng đó mà họ sẽ nhận được nếu chúng không bằng nhau. Ví dụ: hãy xem xét một mẫu tăng dần bao gồm 7 phần tử: 22, 23, 25, 25, 25, 28, 30. Các giá trị 22 và 23 xuất hiện một lần, vì vậy cấp bậc của chúng tương ứng bằng R22 = 1 và R23 = 2. Giá trị 25 xảy ra 3 lần. Nếu các giá trị này không lặp lại, thì thứ hạng của chúng sẽ bằng 3, 4, 5. Do đó, thứ hạng R25 của chúng bằng trung bình cộng của 3, 4 và 5:. Các giá trị 28 và 30 không lặp lại, vì vậy thứ hạng của chúng lần lượt là R28 = 6 và R30 = 7. Cuối cùng, chúng tôi có thư từ sau:

    3. Tổng số bậc phải phù hợp với bậc đã tính, được xác định theo công thức:

    với n là tổng số giá trị được xếp hạng.

    Sự khác biệt giữa số lượng thực tế và tính toán của các cấp bậc sẽ cho thấy một sai sót được thực hiện trong việc tính toán các cấp bậc hoặc tổng kết của chúng. Trong trường hợp này, bạn cần tìm và sửa lỗi.

    Hệ số tương quan thứ hạng của Spearman là một phương pháp cho phép bạn xác định sức mạnh và hướng của mối quan hệ giữa hai đối tượng địa lý hoặc hai phân cấp đối tượng địa lý. Việc sử dụng hệ số tương quan thứ hạng có một số hạn chế:

    • a) Mối tương quan mong đợi phải là đơn điệu.
    • b) Thể tích của mỗi mẫu phải lớn hơn hoặc bằng 5. Để xác định giới hạn trên của mẫu, sử dụng bảng giá trị tới hạn (Bảng 3 của Phụ lục). Giá trị lớn nhất của n trong bảng là 40.
    • c) Trong quá trình phân tích, có khả năng xảy ra một số lượng lớn các cấp bậc giống hệt nhau. Trong trường hợp này, cần phải sửa đổi. Trường hợp thuận lợi nhất là khi cả hai mẫu được nghiên cứu đại diện cho hai chuỗi giá trị không khớp.

    Để tiến hành phân tích tương quan, nhà nghiên cứu phải có hai mẫu có thể được xếp hạng, ví dụ:

    • - hai dấu hiệu được đo trong cùng một nhóm đối tượng;
    • - hai thứ bậc tính trạng riêng biệt được xác định ở hai đối tượng cho cùng một tập hợp các tính trạng;
    • - hai phân cấp nhóm của các tính năng;
    • - phân cấp cá nhân và nhóm của các thuộc tính.

    Chúng tôi bắt đầu tính toán với việc xếp hạng các chỉ số được nghiên cứu riêng biệt cho từng dấu hiệu.

    Chúng ta hãy phân tích một trường hợp có hai đặc điểm được đo trong cùng một nhóm đối tượng. Đầu tiên, các giá trị riêng lẻ được xếp hạng theo thuộc tính đầu tiên mà các đối tượng khác nhau có được, sau đó là các giá trị riêng lẻ theo thuộc tính thứ hai. Nếu thứ hạng thấp hơn của một chỉ số tương ứng với thứ hạng thấp hơn của chỉ số khác và thứ hạng cao hơn của một chỉ số tương ứng với thứ hạng cao hơn của chỉ số khác, thì hai đặc điểm này có liên quan tích cực với nhau. Nếu các cấp bậc cao hơn của một chỉ số tương ứng với các cấp bậc thấp hơn của một chỉ số khác, thì hai dấu hiệu có quan hệ tiêu cực với nhau. Để tìm rs, chúng tôi xác định sự khác biệt giữa các cấp bậc (d) cho mỗi đối tượng. Sự khác biệt giữa các cấp bậc càng nhỏ, hệ số tương quan cấp bậc rs sẽ càng gần với "+1". Nếu không có mối quan hệ, thì giữa chúng sẽ không có sự tương ứng, do đó rs sẽ gần bằng không. Sự khác biệt giữa cấp bậc của các đối tượng trong hai biến càng lớn thì giá trị của hệ số rs càng gần "-1". Do đó, hệ số tương quan thứ hạng Spearman là thước đo của bất kỳ mối quan hệ đơn điệu nào giữa hai đặc điểm đang được nghiên cứu.

    Hãy xem xét trường hợp với hai phân cấp tính năng riêng lẻ được xác định trong hai đối tượng cho cùng một tập hợp các tính năng. Trong tình huống này, các giá trị riêng lẻ thu được của mỗi đối tượng trong số hai đối tượng theo một tập hợp các đối tượng nhất định sẽ được xếp hạng. Đối tượng có giá trị thấp nhất nên được xếp hạng đầu tiên; thuộc tính có giá trị cao hơn - xếp hạng thứ hai, v.v. Cần cẩn thận để đảm bảo rằng tất cả các thuộc tính được đo bằng cùng một đơn vị. Ví dụ: không thể xếp hạng các chỉ số nếu chúng được biểu thị bằng các điểm có “giá” khác nhau, vì không thể xác định yếu tố nào sẽ chiếm vị trí đầu tiên về mức độ nghiêm trọng cho đến khi tất cả các giá trị được đưa về một tỉ lệ. Nếu các đối tượng địa lý có thứ hạng thấp ở một trong các đối tượng cũng có thứ hạng thấp ở đối tượng kia và ngược lại, thì các thứ bậc riêng lẻ có liên quan tích cực với nhau.

    Trong trường hợp có hai phân cấp nhóm đối tượng, các giá trị nhóm trung bình thu được trong hai nhóm đối tượng được xếp hạng theo cùng một nhóm đối tượng cho các nhóm được nghiên cứu. Tiếp theo, chúng tôi thực hiện theo thuật toán được đưa ra trong các trường hợp trước.

    Hãy để chúng tôi phân tích trường hợp với phân cấp cá nhân và nhóm các tính năng. Chúng bắt đầu bằng cách xếp hạng riêng biệt các giá trị riêng lẻ của đối tượng và các giá trị nhóm trung bình theo cùng một tập hợp các tính năng đã thu được, ngoại trừ đối tượng không tham gia vào hệ thống phân cấp nhóm trung bình, vì cá nhân của anh ta hệ thống phân cấp sẽ được so sánh với nó. Tương quan thứ hạng giúp có thể đánh giá mức độ nhất quán giữa hệ thống phân cấp tính năng của cá nhân và nhóm.

    Chúng ta hãy xem xét mức độ ý nghĩa của hệ số tương quan được xác định như thế nào trong các trường hợp được liệt kê ở trên. Trong trường hợp có hai đối tượng địa lý, nó sẽ được xác định bởi kích thước mẫu. Trong trường hợp có hai phân cấp tính năng riêng lẻ, ý nghĩa phụ thuộc vào số lượng tính năng được bao gồm trong phân cấp. Trong hai trường hợp cuối cùng, ý nghĩa được xác định bởi số lượng các tính trạng được nghiên cứu, chứ không phải bởi kích thước của các nhóm. Do đó, ý nghĩa của rs trong mọi trường hợp được xác định bởi số giá trị được xếp hạng n.

    Khi kiểm tra ý nghĩa thống kê của rs, các bảng giá trị tới hạn của hệ số tương quan thứ hạng được sử dụng, được biên soạn cho các số lượng giá trị được xếp hạng khác nhau và các mức ý nghĩa khác nhau. Nếu giá trị tuyệt đối của rs đạt đến giá trị tới hạn hoặc vượt quá nó, thì mối tương quan là có ý nghĩa.

    Khi xem xét phương án đầu tiên (trường hợp có hai đối tượng được đo trong cùng một nhóm đối tượng), các giả thuyết sau là có thể.

    H0: Tương quan giữa các biến x và y không khác 0.

    H1: Mối tương quan giữa các biến x và y khác 0 có ý nghĩa.

    Nếu chúng ta làm việc với bất kỳ trường hợp nào trong ba trường hợp còn lại, thì chúng ta cần đưa ra một cặp giả thuyết khác:

    H0: Tương quan giữa phân cấp x và y là khác không.

    H1: Tương quan giữa phân cấp x và y khác 0 có ý nghĩa.

    Trình tự các hành động trong việc tính toán hệ số tương quan cấp bậc Spearman rs như sau.

    • - Xác định hai đối tượng hoặc hai phân cấp đối tượng sẽ tham gia vào việc đối sánh dưới dạng các biến x và y.
    • - Xếp hạng các giá trị của biến x, gán hạng 1 cho giá trị nhỏ nhất, theo quy tắc xếp hạng. Đặt các thứ hạng vào cột đầu tiên của bảng theo thứ tự số lượng của các chủ đề hoặc dấu hiệu.
    • - Xếp hạng các giá trị của biến y. Đặt các thứ hạng vào cột thứ hai của bảng theo thứ tự số lượng của các đối tượng hoặc dấu hiệu.
    • - Tính chênh lệch d giữa các bậc x và y cho mỗi hàng của bảng. Kết quả được đặt trong cột tiếp theo của bảng.
    • - Tính các chênh lệch bình phương (d2). Đặt các giá trị thu được vào cột thứ tư của bảng.
    • - Tính tổng bình phương của các hiệu? d2.
    • - Nếu các cấp bậc giống nhau xảy ra, hãy tính các hiệu chỉnh:

    trong đó tx là thể tích của mỗi nhóm bậc bằng nhau trong mẫu x;

    ty là kích thước của mỗi nhóm cấp bậc bằng nhau trong mẫu y.

    Tính hệ số tương quan thứ hạng tùy thuộc vào sự hiện diện hay vắng mặt của các cấp bậc giống hệt nhau. Trong trường hợp không có các cấp bậc giống hệt nhau, hệ số tương quan cấp bậc rs được tính bằng công thức:

    Khi có cùng thứ hạng, hệ số tương quan thứ hạng rs được tính bằng công thức:

    d2 là tổng của sự khác biệt bình phương giữa các cấp bậc;

    Tx và Ty - hiệu chỉnh cho các cấp bậc giống nhau;

    n là số đối tượng hoặc tính năng đã tham gia xếp hạng.

    Xác định các giá trị tới hạn của rs từ bảng 3 của Phụ lục, cho một số đối tượng n nhất định. Một sự khác biệt đáng kể so với 0 của hệ số tương quan sẽ được quan sát với điều kiện rs không nhỏ hơn giá trị tới hạn.

    Một nhà tâm lý học sinh viên (nhà xã hội học, nhà quản lý, người quản lý, v.v.) thường quan tâm đến cách hai hoặc nhiều biến số được kết nối với nhau trong một hoặc nhiều nhóm nghiên cứu.

    Trong toán học, để mô tả mối quan hệ giữa các biến, khái niệm hàm F được sử dụng, liên kết mỗi giá trị cụ thể của biến độc lập X với một giá trị cụ thể của biến phụ thuộc Y. Kết quả phụ thuộc được ký hiệu là Y = F (X ).

    Đồng thời, các dạng tương quan giữa các đối tượng được đo có thể khác nhau: ví dụ, mối tương quan có thể là tuyến tính và phi tuyến tính, tích cực và tiêu cực. Nó là tuyến tính - nếu một biến X tăng hoặc giảm, thì trung bình, biến thứ hai Y cũng tăng hoặc giảm. Nó là phi tuyến tính nếu, với sự gia tăng của một giá trị, bản chất của sự thay đổi trong giá trị thứ hai không phải là tuyến tính, mà được mô tả bởi các định luật khác.

    Mối tương quan sẽ là dương nếu trung bình, với sự tăng lên của biến X, thì biến Y cũng tăng lên, và nếu về trung bình, biến Y có xu hướng giảm với mức tăng của X, thì họ nói rằng có giá trị âm tương quan. Một tình huống có thể xảy ra khi không thể thiết lập bất kỳ sự phụ thuộc nào giữa các biến. Trong trường hợp này, chúng tôi nói rằng không có mối tương quan.

    Nhiệm vụ của phân tích tương quan được giảm xuống thành việc thiết lập hướng (tích cực hoặc tiêu cực) và dạng (tuyến tính, phi tuyến tính) của mối quan hệ giữa các đối tượng địa lý khác nhau, đo lường mức độ chặt chẽ của nó, và cuối cùng, kiểm tra mức độ ý nghĩa của mối tương quan thu được các hệ số.

    Hệ số tương quan thứ hạng, do K. Spearman đề xuất, dùng để chỉ các chỉ số phi tham số về mối quan hệ giữa các biến được đo lường trên thang thứ hạng. Khi tính toán hệ số này, không cần có giả thiết nào về bản chất của sự phân bố các đối tượng địa lý trong tổng thể nói chung. Hệ số này xác định mức độ chặt chẽ của kết nối các đối tượng địa lý theo thứ tự, trong trường hợp này đại diện cho cấp bậc của các giá trị được so sánh.

    Hệ số tương quan tuyến tính của Spearman được tính theo công thức:

    trong đó n là số lượng các đối tượng địa lý (chỉ số, đối tượng) được xếp hạng;
    D là sự khác biệt giữa các cấp bậc trong hai biến số cho mỗi đối tượng;
    D2 là tổng bình phương của các chênh lệch thứ hạng.

    Các giá trị tới hạn của hệ số tương quan cấp bậc Spearman được trình bày dưới đây:

    Giá trị của hệ số tương quan tuyến tính của Spearman nằm trong khoảng +1 và -1. Hệ số tương quan tuyến tính của Spearman có thể dương hoặc âm, đặc trưng cho hướng của mối quan hệ giữa hai đối tượng địa lý được đo trên thang xếp hạng.

    Nếu hệ số tương quan modulo gần bằng 1, thì điều này tương ứng với mức độ quan hệ cao giữa các biến. Vì vậy, đặc biệt, khi một biến có tương quan với chính nó, giá trị của hệ số tương quan sẽ bằng +1. Mối quan hệ như vậy đặc trưng cho mối quan hệ tỷ lệ thuận. Nếu các giá trị của biến X được sắp xếp theo thứ tự tăng dần và các giá trị tương tự (bây giờ được chỉ định là biến Y) được sắp xếp theo thứ tự giảm dần, thì trong trường hợp này, mối tương quan giữa các biến X và Y sẽ chính xác. -1. Giá trị này của hệ số tương quan đặc trưng cho sự phụ thuộc tỷ lệ nghịch.

    Dấu hiệu của hệ số tương quan là rất quan trọng để giải thích mối quan hệ kết quả. Nếu dấu của hệ số tương quan tuyến tính là cộng, thì mối quan hệ giữa các đối tượng tương quan sao cho giá trị lớn hơn của một đối tượng (biến) tương ứng với giá trị lớn hơn của đối tượng khác (biến khác). Nói cách khác, nếu một chỉ tiêu (biến) tăng thì chỉ tiêu kia (biến) cũng tăng theo. Mối quan hệ này được gọi là mối quan hệ tỷ lệ thuận.

    Nếu nhận được dấu trừ, thì giá trị lớn hơn của một thuộc tính tương ứng với giá trị nhỏ hơn của thuộc tính kia. Nói cách khác, nếu có một dấu trừ, sự tăng lên của một biến (thuộc tính, giá trị) tương ứng với sự giảm xuống của một biến khác. Mối quan hệ này được gọi là mối quan hệ nghịch đảo. Trong trường hợp này, việc lựa chọn biến mà nhân vật (xu hướng) của mức tăng được quy cho là tùy ý. Đây có thể là biến X hoặc biến Y. Tuy nhiên, nếu biến X được coi là tăng, thì biến Y sẽ giảm tương ứng và ngược lại.

    Hãy xem xét ví dụ về mối tương quan của Spearman.

    Nhà tâm lý học tìm hiểu xem các chỉ số cá nhân về mức độ sẵn sàng đến trường của 11 học sinh lớp một và thành tích trung bình của chúng vào cuối năm học có mối liên hệ với nhau như thế nào.

    Để giải quyết vấn đề này, trước hết chúng tôi xếp hạng giá trị của các chỉ số đánh giá mức độ sẵn sàng đến trường thu được khi nhập học và thứ hai, chỉ số kết quả hoạt động cuối cùng vào cuối năm của những học sinh này trung bình. Kết quả được trình bày trong bảng:

    Chúng tôi thay thế dữ liệu thu được trong công thức trên và chúng tôi tính toán. Chúng tôi nhận được:

    Để tìm mức ý nghĩa, chúng ta chuyển sang bảng "Các giá trị tới hạn của hệ số tương quan cấp bậc Spearman", bảng này hiển thị các giá trị tới hạn cho các hệ số tương quan cấp bậc.

    Chúng tôi xây dựng "trục ý nghĩa" tương ứng:

    Hệ số tương quan kết quả trùng với giá trị tới hạn với mức ý nghĩa 1%. Do đó, có thể lập luận rằng các chỉ số về mức độ sẵn sàng đến trường và điểm số cuối cùng của học sinh lớp một có mối tương quan thuận - nói cách khác, chỉ số sẵn sàng đến trường càng cao thì học sinh lớp một càng học tốt. Về giả thuyết thống kê, nhà tâm lý học phải bác bỏ giả thuyết không (H0) về sự giống nhau và chấp nhận sự khác biệt thay thế (H1), điều này nói rằng mối quan hệ giữa sự sẵn sàng đi học và thành tích trung bình là khác không.

    Tương quan Spearman. Phân tích tương quan theo phương pháp Spearman. Spearman cấp bậc. Hệ số tương quan Spearman. Tương quan thứ hạng của Spearman

    Máy tính bên dưới sẽ tính toán hệ số tương quan thứ hạng Spearman giữa hai biến ngẫu nhiên. Phần lý thuyết, để không bị phân tâm khỏi máy tính, theo truyền thống được đặt dưới nó.

    cộng nhập khẩu xuất khẩu mode_edit xóa bỏ

    Thay đổi trong các biến ngẫu nhiên

    arrow_upwardarrow_downward Xarrow_upwardarrow_downward Y
    Kích thước trang: 5 10 20 50 100 chevron_left chevron_right

    Thay đổi trong các biến ngẫu nhiên

    Nhập dữ liệu Lỗi nhập khẩu

    Bạn có thể sử dụng một trong các ký tự này để phân tách các trường: Tab, ";" hoặc "," Ví dụ: -50,5; -50,5

    Nhập lại Hủy bỏ

    Phương pháp tính toán hệ số tương quan cấp bậc Spearman thực ra được mô tả rất đơn giản. Đây là cùng một hệ số tương quan Pearson, chỉ được tính toán không cho kết quả của các phép đo của các biến ngẫu nhiên, mà cho xếp hạng giá trị.

    I E,

    Nó vẫn chỉ để tìm ra các giá trị xếp hạng là gì và tại sao tất cả những điều này là cần thiết.

    Nếu các phần tử của chuỗi biến phân được sắp xếp theo thứ tự tăng dần hoặc giảm dần, thì cấp phần tử sẽ là số của nó trong chuỗi có thứ tự này.

    Ví dụ, giả sử chúng ta có một chuỗi biến thể (17,26,5,14,21). Sắp xếp các phần tử của nó theo thứ tự giảm dần (26,21,17,14,5). 26 có hạng 1, 21 có hạng 2, v.v. Chuỗi biến thể của các giá trị thứ hạng sẽ như thế này (3,1,5,4,2).

    Nghĩa là, khi tính toán hệ số Spearman, chuỗi biến thể ban đầu được chuyển đổi thành chuỗi biến thể của giá trị cấp bậc, sau đó công thức Pearson được áp dụng cho chúng.

    Có một điều tinh tế - thứ hạng của các giá trị lặp lại được lấy làm giá trị trung bình của các thứ hạng. Nghĩa là, đối với chuỗi (17, 15, 14, 15), chuỗi giá trị xếp hạng sẽ giống như (1, 2,5, 4, 2,5), vì phần tử đầu tiên bằng 15 có hạng là 2, và thứ hai - thứ hạng là 3, và.

    Nếu không có giá trị lặp lại, nghĩa là tất cả các giá trị của chuỗi xếp hạng đều là số trong phạm vi từ 1 đến n, công thức của Pearson có thể được đơn giản hóa thành

    Nhân tiện, công thức này thường được đưa ra làm công thức tính hệ số Spearman.

    Bản chất của việc chuyển đổi từ bản thân các giá trị sang các giá trị xếp hạng của chúng là gì?
    Và vấn đề là bằng cách kiểm tra mối tương quan của các giá trị thứ hạng, người ta có thể thiết lập mức độ phụ thuộc của hai biến được mô tả bởi một hàm đơn điệu.

    Dấu của hệ số cho biết hướng của mối quan hệ giữa các biến. Nếu dấu là dương, thì các giá trị Y có xu hướng tăng khi các giá trị X tăng; nếu dấu là âm, thì giá trị Y có xu hướng giảm khi giá trị X. tăng lên, nếu hệ số bằng 0 thì không có xu hướng. Nếu hệ số bằng 1 hoặc -1 thì quan hệ giữa X và Y có dạng một hàm đơn điệu - nghĩa là X tăng thì Y cũng tăng, hoặc ngược lại với X tăng thì Y tăng. giảm dần.

    Nghĩa là, không giống như hệ số tương quan Pearson, chỉ có thể tiết lộ sự phụ thuộc tuyến tính của một biến này vào một biến khác, hệ số tương quan Spearman có thể tiết lộ sự phụ thuộc đơn điệu, trong đó mối quan hệ tuyến tính trực tiếp không được tiết lộ.

    Hãy để tôi giải thích bằng một ví dụ. Giả sử rằng chúng ta khảo sát hàm y = 10 / x.
    Ta có kết quả đo X và Y sau
    {{1,10}, {5,2}, {10,1}, {20,0.5}, {100,0.1}}
    Đối với những dữ liệu này, hệ số tương quan Pearson là -0,4686, tức là mối quan hệ yếu hoặc không có. Nhưng hệ số tương quan Spearman hoàn toàn bằng -1, như nó đã gợi ý cho nhà nghiên cứu rằng Y có sự phụ thuộc đơn điệu âm chặt chẽ vào X.