Tính tự động chỉ tiêu T của sinh viên trực tuyến. Xác định tầm quan trọng của sự khác biệt bằng bài kiểm tra t của Sinh viên

Trong hầu hết các trường hợp, để so sánh giá trị trung bình của hai mẫu độc lập(tr. 91) áp dụng bài kiểm tra t của Học sinh. Vì bài kiểm tra của Học sinh là tham số nên chỉ có thể sử dụng nó nếu kết quả nghiên cứu được trình bày dưới dạng phép đo theo quy mô mối quan hệ(trang 90).

Bài kiểm tra t của sinh viên được ký hiệu t và được tính theo công thức*:

t = x1 – x2 / √ m1² + m2²

Trong trường hợp số lượng quan sát (n) lớn hơn 500, mức ý nghĩa tại p = 0,05 đạt được ở t = 1,96, mức ý nghĩa tại p = 0,01 hoặc p = 0,001 tương ứng đạt được ở t = 2,59 và t = 3,29.

Nếu số lượng quan sát nhỏ hơn 500 thì giá trị t yêu cầu đối với các mức ý nghĩa khác nhau được xác định từ Bảng 10.

Trước khi chuyển sang bảng cần xác định số bậc tự do. Thuật ngữ này đề cập đến số lượng đại lượng độc lập liên quan đến việc hình thành một tham số cụ thể (f). Các quy tắc xác định bậc tự do được trình bày trong nhiều sách hướng dẫn về thống kê toán học (Yu.K. Demyanenko, 1968). Khi tính bài kiểm tra t của Sinh viên, tổng số bậc tự do (f) sẽ bằng n1 + n2 - 2.

Vì vậy, ví dụ, khi so sánh kết quả của những người trượt tuyết của nhóm thử nghiệm và nhóm đối chứng trong việc hoàn thành quãng đường kiểm soát, thu được dữ liệu sau: chỉ số trung bình ở nhóm thử nghiệm (n = 12 người) là x = 34,6 giây, sai số có giá trị trung bình là m = 0,47 giây; ở nhóm đối chứng (n=14 người), các số liệu này lần lượt là x = 37,3 giây, m = 0,49 giây.

Thay các giá trị vào công thức, ta được giá trị của t.

t = 37,3 - 34,6 / √ V 0,49 2 + 0,47 2 = 2,7 / 0,68 = 3,97

Sau khi xác định số bậc tự do (f = 12 + 14 - 2 = 24), ta tìm giá trị của t từ bảng. Giá trị kết quả là 3,97 vượt quá giá trị bảng ở mức độ tin cậy 99%. Điều này có nghĩa là chúng ta có thể khẳng định rằng có sự khác biệt đáng kể giữa kết quả của hai nhóm được so sánh ở mức ý nghĩa p< 0,01.



Với số lượng phép đo tương đối lớn, người ta thường chấp nhận rằng nếu chênh lệch giữa các giá trị trung bình số học bằng hoặc nhiều hơn ba sai số của nó thì sự khác biệt được coi là đáng tin cậy. Trong trường hợp này, độ tin cậy của sự khác biệt được xác định theo phương trình sau:

Х E -Х К >3√ me + mк ²

Trong ví dụ trên, kết quả của những người tham gia vào các nhóm khác nhau được so sánh, nghĩa là các mẫu độc lập Trong trường hợp so sánh kết quả thu được khi bắt đầu và kết thúc thí nghiệm trong cùng một nhóm, nghĩa là khi mẫu phụ thuộc, tính bài kiểm tra của Học sinh bằng công thức thông thường nó bị cấm . Tiêu chí của Sinh viên trong trường hợp này phải được tính bằng công thức:

t = X 1 -X 2 / m1 2 + m2 2 - 2rm1 m2

Ở đâu r - hệ số tương quan giữa kết quả ban đầu và kết quả cuối cùng đối với đặc tính đang nghiên cứu.

Bảng 10

Giá trị giới hạn t (Bài kiểm tra t của học sinh)

f Mức độ tin cậy (P)
95% . 99% 99,9%
12,71 63.60
4.30 9.93 31.60
3.18 5.84 12.94
2.78 4.60 8.61
2.57 4.03 6.86
2.45 3.71 5.96
2.37 3.50 5.41
2.31 3.36 5,04
2.26 3.25 4.78
2.23 3.17 4.59
P 2.20 3.11 4.44
2.18 3.06 4.32
1.16 3.01 4.22
2.15 2,98 4,14
2.13 2.95 4.07
2.12 2,92 4.02
2.11 2.90 3.97
2.10 2.88 3.92
2.09 2.86 3.88
2.09 2.85 3.85
2.08 2,83 3.82
2.07 2.82 3.79
2.07 2.81 3,77
2.06 2.80 3.75
2,06 2.79 3.73
2.06 2.78 3.71
2.05 2.77 3.69
2.05 2.76 3.67
2.04 2.76 3.66
2.04 2,75 " 3.65
2.02 2,70 3.55
2.01 2.68 3,50
2.00 2.66 3.46
1.99 2.64 3.42
1.98 2.63 3.39
1.98 2,62 3.37
1.97 2.60 3.34
1.96 2,59 3.31
1.96 2.59 3.29
Mức ý nghĩa (p)
0,05 0,01 0,001

Xây dựng kết luận

(Phần kết luận)

Vào cuối công việc, kết luận được rút ra. Xây dựng kết luận, cùng với việc xây dựng phần giới thiệu, là một trong những giai đoạn khó khăn và quan trọng nhất trong quá trình chuẩn bị bất kỳ bài tập nào.

Các kết luận phải phản ánh những kết quả quan trọng nhất của nghiên cứu.

Có một số sai lầm phổ biến khi đưa ra kết luận. Thông thường, một sinh viên xây dựng một đề xuất sao cho nó giống như một lời tuyên bố về kết quả công việc mà mình đã làm (“đã nghiên cứu”, “đã phát triển”, v.v.). Ví dụ:

“Trong quá trình nghiên cứu đã xác định những nội dung cơ bản của phương pháp thực nghiệm…” hoặc “Xác định được các chỉ số giúp đánh giá kỹ năng giao tiếp của sinh viên các chuyên ngành sư phạm trong việc thực hiện công tác giáo dục thể chất và sức khỏe với học sinh... ”.

Để những kết luận trên có thể được kết luận, các cụm từ phải được cấu trúc như thế này: “Các quy định của phương pháp thử nghiệm mà chúng tôi đã xây dựng cho phép…” và theo đó: “Trong số các chỉ số được chọn, chỉ số có nhiều thông tin nhất, cho phép chúng tôi đánh giá trình độ kỹ năng giao tiếp của sinh viên chuyên ngành sư phạm, là..."

Một sai lầm phổ biến khác là học sinh nêu điều gì đó hiển nhiên trong một kết luận mà không cần nghiên cứu đặc biệt để thiết lập. Ví dụ:

“Trong các giờ thể dục với học sinh, cần tính đến đặc điểm phát triển của thanh thiếu niên ở độ tuổi này”.

Đôi khi kết luận hóa ra hoàn toàn vô nghĩa. Đây thường là kết luận đầu tiên mà học sinh đưa ra dựa trên việc phân tích tài liệu. Ví dụ:

“Một phân tích tài liệu khoa học và phương pháp luận đã chỉ ra rằng trong lý thuyết giáo dục thể chất, vấn đề sử dụng thiết bị mô phỏng trong huấn luyện thể thao cho vận động viên bơi lội vẫn chưa được giải quyết đầy đủ.”

Kết luận phải phản ánh một cách đầy đủ thông tin về công việc mà học sinh đã thực hiện nhưng không nên dài dòng.


YÊU CẦU ĐĂNG KÝ

CÔNG TRÌNH KHÓA HỌC

Công việc đủ điều kiện cuối cùng phải bao gồm các thành phần cấu trúc sau:

· trang tiêu đề;

· giới thiệu;

· văn bản chính(Chương 1, Chương 2);

· kết luận (kết luận);

· thư mục;

· các ứng dụng(nếu có nhu cầu về chúng).

Khối lượng bài tập tối ưu là 40-50 trang văn bản đánh máy sau 1 ,5 khoảng (bao gồm hình, bảng, đồ thị, thư mục và phụ lục).

Cỡ chữ 14 Times New Roman.

Tác phẩm được chuẩn bị dưới dạng máy tính hoặc viết tay (tùy chọn thứ hai ít được mong muốn hơn).

Trong phiên bản máy tính, văn bản của tác phẩm được in cách nhau một quãng rưỡi trên một mặt của tờ giấy A4 tiêu chuẩn (210x297 mm). Lề của trang làm việc phải có các kích thước sau: trái - 30 mm, phải - 10 mm, trên - 20 mm, dưới - 25 mm.

Các bảng, hình ảnh, hình vẽ, sơ đồ, đồ thị phải được thể hiện trên tờ giấy A4 tiêu chuẩn (210x297 mm). Chữ ký và giải thích phải ở mặt trước.

Tất cả các trang của tác phẩm chứng nhận cuối cùng, bao gồm cả hình ảnh minh họa và phụ lục, đều được đánh số theo thứ tự từ trang đầu đến trang cuối cùng, không bỏ sót hoặc lặp lại. Trang đầu tiên được coi là trang tiêu đề; số “1” không được đặt trên đó, số “2” được đặt trên trang tiếp theo, v.v. Số serial được đặt ở giữa lề dưới của trang.

Tất cả tài liệu của công trình chứng nhận cuối cùng theo mục lục (kế hoạch) được chia thành các đoạn. Tên các đoạn văn phải phù hợp với nội dung và được in dưới dạng tiêu đề bằng chữ thường, không gạch chân.

Trong công việc, các chữ viết tắt tiêu chuẩn thường được chấp nhận như “v.v.,” “v.v.,” “vv.”, v.v. đều được chấp nhận. "v.v.", "xem," "trang."

Mẫu thiết kế bảng biểu và hình minh họa được nêu tại Phụ lục 3.

Trang tiêu đề

Trang tiêu đề là thông tin về tác phẩm. Nó cho biết tên của tổ chức nơi công việc được thực hiện; họ, tên, chữ viết tắt của tác giả; Tên; họ, tên, họ, bằng cấp và chức danh học thuật của người hướng dẫn khoa học (tư vấn); thành phố, năm Trang tiêu đề của các tác phẩm được chứng nhận cuối cùng được thể hiện trong Hình 1.

Cơ quan giáo dục tự trị nhà nước liên bang

Giáo dục đại học

"Đại học bang Nizhny Novgorod được đặt theo tên. N.I. Lobachevsky"

chi nhánh Arzamas

Khoa Địa lý Tự nhiên

Khoa Giáo dục thể chất

Các môn học trong chuyên ngành

“Lý thuyết và phương pháp giáo dục thể chất”

về chủ đề:

“Đặc điểm phương pháp của các lớp học thể dục và sức khỏe

với trẻ mẫu giáo”

Hoàn thành:

Ivanov A.V.,

hướng dẫn sinh viên 034300 (49.03.01)

Văn hóa thể chất

Hồ sơ “Quản lý trong lĩnh vực

văn hóa thể chất”

hình thức giáo dục - thư từ

(toàn bộ thời gian học /

chương trình đào tạo cấp tốc)

1 (2) khóa học, nhóm 11(12)

Cố vấn khoa học:

Tiến sĩ, Phó giáo sư Sidorova T.V.

Arzamas

Cơm. 1. Mẫu trang tiêu đề của bài thi học kỳ

Trong các giấy tờ chứng nhận cuối cùng, từ “mục lục” được sử dụng chứ không phải “nội dung”. Mục lục là chỉ mục các tiêu đề (chương) của một tác phẩm, trong khi nội dung là danh mục tiêu đề của các tác phẩm khác nhau có trong ấn phẩm. Theo quan điểm của văn hóa đọc, mục lục được đặt ở phần đầu của tác phẩm: người đọc bắt đầu làm quen với việc nghiên cứu từ mục lục.

Khi thiết kế mục lục, mỗi tiêu đề phụ phải được thụt vào bên phải tiêu đề chính trước đó mà nó liên quan, đặt chữ số đầu tiên dưới chữ in hoa của tiêu đề mà nó liên quan trực tiếp. Tất cả các tiêu đề có cùng cấp độ phải bắt đầu từ cùng một đường thẳng đứng. Một kế hoạch như vậy cho phép bạn thấy rõ sự phụ thuộc của tất cả các vật liệu. Ví dụ:

Giới thiệu. . . . . . . . . . . . . . . . . . . . . . . .. . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Vấn đề phát triển kiến ​​thức ở học sinh nhằm tăng động cơ tham gia rèn luyện thể chất. . . . ……….. . . .
1. Văn hóa thể chất của học sinh ở giai đoạn hiện nay. . . . .……….
1.11.1 Thay đổi ưu tiên trong bài tập thể chất của học sinh những năm 20-90. . . . . . . . ………..
1.1 1.2 Định hướng giáo dục hiện đại cho học sinh môn thể dục. . . . . . . . …………
2. Hình thành động lực tham gia các hoạt động thể chất của học sinh. . . . . . . . . . . . . . . . . . . . ………
2.12.2 Thái độ của học sinh đối với việc rèn luyện thể chất.
Phần kết luận…………………………………………………………………… . 14
Thư mục………………………………………………………………
Các ứng dụng

Để các vết thụt trong mục lục giống nhau và căn chỉnh số trang, nên sử dụng định dạng bảng, các dòng được đặt trong tham số là không nhìn thấy được.

Trong các tác phẩm chứng nhận cuối cùng, việc đánh vần văn bản có tầm quan trọng rất lớn. Rubrics bộc lộ cấu trúc của văn bản, thể hiện sự liên kết, phụ thuộc lẫn nhau giữa các phần, tiểu mục.

Tiêu đề đoạn văn phải phản ánh chính xác nội dung văn bản liên quan đến chúng. Họ không nên giảm hoặc mở rộng lượng thông tin ngữ nghĩa chứa trong đó.

Tiêu đề của đoạn văn và tiểu đoạn nằm ở giữa một dòng riêng biệt và được in đậm, thẳng, viết thường, ngoại trừ chữ đầu tiên - chữ in hoa (Hình 2).

1.1. Khái niệm tư thế

Cơm. 2. Ví dụ về tiêu đề đoạn văn

Tiêu đề được phân cách với văn bản theo sau nó bằng một dấu cách (một ký tự không in được) và với văn bản trước đó bằng hai dấu cách (hai ký tự không in ở dưới ký tự kia). Tiêu đề không thể là dòng cuối cùng trên trang.

Thụt lề đoạn văn được đặt thông qua các tùy chọn “Định dạng” ® “Đoạn” ® “Thụt lề và khoảng cách” ® “Dòng đầu tiên” ® “Thụt lề” ® 1,25 cm (1,27 cm). Không thể thiết lập thụt lề đoạn văn bằng cách nhấn một phím!

Điểm nổi bật của phông chữ

Việc phân định nội dung trong một đoạn văn, việc phân định các phần và thành phần của văn bản theo ý nghĩa được chính thức hóa bằng cách sử dụng lựa chọn phông chữ (có độ dày khác nhau, với các nét chữ nghiêng, theo thứ tự chữ số).

Trong các công trình khoa học, người ta thường sử dụng phông chữ phụ (Bảng 11).

​ Bài kiểm tra t của Học sinh theo cặp là một trong những sửa đổi của phương pháp Học sinh, được sử dụng để xác định ý nghĩa thống kê của sự khác biệt trong các phép đo ghép đôi (lặp lại).

1. Lịch sử phát triển của t-test

t-test đã được phát triển William Gossettđể đánh giá chất lượng bia ở công ty Guinness. Do nghĩa vụ với công ty về việc không tiết lộ bí mật thương mại, bài báo của Gosset đã được xuất bản vào năm 1908 trên tạp chí Biometrics với bút danh "Sinh viên".

2. T-test của Học sinh ghép đôi dùng để làm gì?

Bài kiểm tra t của Học sinh ghép đôi được sử dụng để so sánh hai mẫu phụ thuộc (ghép đôi). Phụ thuộc là các phép đo được thực hiện trên cùng một bệnh nhân nhưng ở những thời điểm khác nhau, ví dụ như huyết áp ở bệnh nhân tăng huyết áp trước và sau dùng thuốc hạ huyết áp. Giả thuyết không cho rằng không có sự khác biệt giữa các mẫu được so sánh, giả thuyết thay thế cho rằng có sự khác biệt có ý nghĩa thống kê.

3. Trong trường hợp nào bạn có thể sử dụng t-test của Học sinh ghép đôi?

Điều kiện chính là sự phụ thuộc mẫu, nghĩa là các giá trị so sánh phải thu được từ các phép đo lặp lại của một tham số.

Giống như trong trường hợp so sánh các mẫu độc lập, để sử dụng phép thử t ghép đôi, dữ liệu gốc cần phải có phân phối bình thường. Nếu điều kiện này không được đáp ứng thì nên sử dụng phương pháp để so sánh trung bình mẫu thống kê phi tham số, chẳng hạn như Kiểm tra dấu hiệu GKiểm tra T Wilcoxon.

T-test ghép nối chỉ có thể được sử dụng khi so sánh hai mẫu. Nếu bạn cần so sánh ba hoặc nhiều hơn nên sử dụng các phép đo lặp lại ANOVA một chiều cho các biện pháp lặp lại.

4. Cách tính t-test của Học sinh ghép đôi?

Bài kiểm tra t của Học sinh được ghép đôi được tính bằng công thức sau:

Ở đâu Md - trung bình số học của sự khác biệt giữa các chỉ số được đo trước và sau, σd - độ lệch chuẩn của sự khác biệt trong các chỉ số, N - số môn học đã học

5. Làm thế nào để diễn giải giá trị t-test của Học sinh?

Việc giải thích giá trị t-test của Học sinh được ghép đôi thu được không khác với việc đánh giá t-test đối với các nhóm dân số không liên quan. Trước hết bạn cần tìm số bậc tự do f theo công thức sau:

f = n - 1

Sau đó, chúng tôi xác định giá trị tới hạn của bài kiểm tra t của Học sinh đối với mức ý nghĩa được yêu cầu (ví dụ: p<0,05) и при данном числе степеней свободы f theo bảng ( xem bên dưới).

Chúng tôi so sánh các giá trị quan trọng và được tính toán của tiêu chí:

  • Nếu giá trị tính toán của t-test của Học sinh được ghép nối bằng hoặc lớn hơn quan trọng, được tìm thấy từ bảng, chúng tôi kết luận rằng sự khác biệt giữa các giá trị được so sánh là có ý nghĩa thống kê.
  • Nếu giá trị t- test của Sinh viên được ghép đôi được tính toán ít hơn dạng bảng, nghĩa là sự khác biệt giữa các giá trị được so sánh không có ý nghĩa thống kê.

6. Ví dụ tính t-test của Sinh viên

Để đánh giá hiệu quả của thuốc hạ đường huyết mới, nồng độ đường huyết được đo ở bệnh nhân đái tháo đường trước và sau khi dùng thuốc. Kết quả là, dữ liệu sau đã thu được:

Giải pháp:

1. Tính hiệu của từng cặp giá trị ( d):

Bệnh nhân N Mức đường huyết, mmol/l Sự khác biệt (d)
trước khi dùng thuốc sau khi uống thuốc
1 9.6 5.7 3.9
2 8.1 5.4 2.7
3 8.8 6.4 2.4
4 7.9 5.5 2.4
5 9.2 5.3 3.9
6 8.0 5.2 2.8
7 8.4 5.1 3.3
8 10.1 6.9 3.2
9 7.8 7.5 2.3
10 8.1 5.0 3.1

2. Tìm giá trị trung bình cộng của các hiệu bằng công thức:

3. Tìm độ lệch chuẩn của chênh lệch so với mức trung bình bằng công thức:

4. Tính t-test của Học sinh được ghép đôi:

5. Chúng ta hãy so sánh giá trị thu được của t-test 8.6 của Sinh viên với giá trị trong bảng, với số bậc tự do f bằng 10 - 1 = 9 và mức ý nghĩa p=0,05 là 2,262. Vì giá trị thu được lớn hơn giá trị tới hạn nên chúng tôi kết luận rằng có sự khác biệt có ý nghĩa thống kê về mức đường huyết trước và sau khi dùng loại thuốc mới.

Nhiệm vụ phổ biến nhất trong nghiên cứu tâm lý là xác định sự khác biệt giữa hai hoặc nhiều nhóm đặc điểm. Việc xác định những khác biệt đó ở cấp độ phương tiện số học được xem xét trong quy trình phân tích số liệu thống kê sơ cấp. Tuy nhiên, câu hỏi đặt ra là mức độ tin cậy của những khác biệt này và liệu chúng có thể được mở rộng (ngoại suy) cho toàn bộ dân số hay không. Để giải quyết vấn đề này, họ thường sử dụng (giả sử phân phối bình thường hoặc gần với phân phối bình thường) tiêu chí t (Bài kiểm tra của sinh viên), nhằm mục đích tìm hiểu mức độ tin cậy của các chỉ số của một mẫu đối tượng này so với mẫu khác (ví dụ: khi các đối tượng nhận được kết quả kiểm tra của một nhóm cao hơn đại diện của nhóm kia). Đây là một tiêu chí tham số và có hai dạng chính:

1) không liên quan (lẻ) t - một bài kiểm tra được thiết kế để tìm hiểu xem liệu có sự khác biệt giữa điểm số đạt được khi sử dụng cùng một bài kiểm tra để kiểm tra hai nhóm được hình thành từ những người khác nhau hay không. Ví dụ, đây có thể là sự so sánh về mức độ thông minh hoặc sự ổn định về tâm thần kinh, sự lo lắng của những học sinh thành công và không thành công hoặc so sánh những học sinh thuộc các tầng lớp, lứa tuổi, cấp độ xã hội khác nhau, v.v. về những đặc điểm này. Có thể có các mẫu thuộc các giới tính khác nhau, các quốc tịch khác nhau, cũng như các mẫu phụ trong các mẫu đang nghiên cứu, được xác định theo một đặc điểm nhất định. Tiêu chí được gọi là “không liên quan” vì các nhóm được so sánh được hình thành từ những người khác nhau;

2) được kết nối (ghép nối) t - thử nghiệm được sử dụng để so sánh các chỉ số của hai nhóm, giữa các yếu tố có mối liên hệ cụ thể. Điều này có nghĩa là mỗi phần tử của nhóm thứ nhất tương ứng với một phần tử của nhóm thứ hai, tương tự với nó theo một thông số nhất định mà nhà nghiên cứu quan tâm. Thông thường, các thông số của cùng một cá nhân được so sánh trước và sau một sự kiện hoặc hành động nhất định (ví dụ: trong một nghiên cứu theo chiều dọc hoặc một thử nghiệm hình thành). Vì vậy, tiêu chí này được dùng để so sánh thành tích của cùng một cá nhân trước và sau một cuộc khảo sát, thử nghiệm hoặc sau một thời gian nhất định.

Nếu dữ liệu không tuân theo phân phối chuẩn, hãy sử dụng các thử nghiệm phi tham số tương đương với thử nghiệm t -: thử nghiệm Mann-Whitney, tương đương với thử nghiệm t lẻ và thử nghiệm Wilcoxon hai mẫu, tương đương với thử nghiệm t - ghép đôi.

Sử dụng t -tests và các giá trị tương đương không tham số của chúng, bạn chỉ có thể so sánh kết quả của hai nhóm thu được bằng cùng một thử nghiệm. Tuy nhiên, trong một số trường hợp, việc so sánh một số nhóm hoặc đánh giá thuộc nhiều loại là cần thiết. Điều này có thể được thực hiện theo từng giai đoạn, chia nhiệm vụ thành nhiều cặp so sánh (ví dụ: nếu bạn cần so sánh các nhóm A, B và Y theo kết quả của các bài kiểm tra X và Y, thì trước tiên bạn có thể so sánh bằng cách sử dụng bài kiểm tra t - nhóm A và B theo kết quả bài kiểm tra X, sau đó nhóm A và B dựa trên kết quả bài kiểm tra C, A và C dựa trên kết quả bài kiểm tra X, v.v.). Tuy nhiên, đây là một phương pháp tốn rất nhiều công sức nên họ phải dùng đến phương pháp phân tích phương sai phức tạp hơn.

Phương pháp đánh giá độ tin cậy của sự khác biệt trong các phương tiện số học bằng cách sử dụng bài kiểm tra tham số khá hiệu quả của Học sinh nhằm giải quyết một trong những vấn đề thường gặp nhất trong quá trình xử lý dữ liệu - xác định độ tin cậy của sự khác biệt giữa hai hoặc nhiều chuỗi giá trị. Việc đánh giá như vậy thường cần thiết trong phân tích so sánh các nhóm cực. chúng được phân biệt trên cơ sở các biểu hiện khác nhau của một dấu hiệu (đặc điểm) mục tiêu nhất định của hiện tượng đang được nghiên cứu. Theo quy định, phân tích bắt đầu bằng việc tính toán số liệu thống kê cơ bản của các nhóm được chọn, sau đó đánh giá tầm quan trọng của sự khác biệt. Tiêu chí của Học sinh được tính bằng công thức:

Giá trị bài kiểm tra của Học sinh về ba mức độ tin cậy (thống kê) có ý nghĩa (p) được đưa ra trong sách tham khảo về thống kê toán học. Số bậc tự do được xác định theo công thức:

Với cỡ mẫu giảm dần (n<10) критерий Стьюдента становится чувствительным к форме распределения исследуемого признака в генеральной совокупности. Поэтому в сомнительных случаях рекомендуют использовать непараметрические методы или сравнивать полученные значения с критическими (табл. 2.17) для высшего уровня значимости.

Quyết định về độ tin cậy của sự khác biệt được đưa ra nếu giá trị t tính toán vượt quá giá trị bảng đối với một số bậc tự do nhất định (d (v)). Các ấn phẩm hoặc báo cáo khoa học cho thấy mức độ quan trọng cao trong số ba: p<0,05; р <0,01; р <0,001.

Đối với bất kỳ giá trị bằng số nào của tiêu chí về độ tin cậy của sự khác biệt giữa các phương tiện, chỉ báo này không đánh giá mức độ khác biệt được xác định (nó được đánh giá bằng sự khác biệt giữa chính các phương tiện), mà chỉ đánh giá độ tin cậy thống kê của nó, nghĩa là, quyền mở rộng kết luận thu được trên cơ sở so sánh các mẫu về sự hiện diện của sự khác biệt đối với toàn bộ hiện tượng (toàn bộ quá trình). Tiêu chí khác biệt được tính toán thấp không thể dùng làm bằng chứng cho thấy không có sự khác biệt giữa hai đặc điểm (hiện tượng), bởi vì tầm quan trọng của nó (mức độ tin cậy) không chỉ phụ thuộc vào cỡ trung bình mà còn phụ thuộc vào số lượng mẫu được so sánh. Nó không chỉ ra rằng không có sự khác biệt, nhưng thực tế là với cỡ mẫu như vậy thì nó không đáng tin cậy về mặt thống kê: có khả năng rất cao là sự khác biệt trong các điều kiện này là ngẫu nhiên, xác suất về độ tin cậy của nó là rất thấp.

Bảng 2.17. Giới hạn tin cậy đối với bài kiểm tra của Sinh viên (t-test) đối với f bậc tự do

Sự thay đổi về thời gian trung bình để hoàn thành nhiệm vụ ở lần thử thứ hai (so với lần thử thứ nhất) là không đáng tin cậy.

Biểu thức này không tương đương với tuyên bố về tính đồng nhất thống kê của hai mẫu được so sánh. Ngoài ra, việc áp dụng tiêu chí của Sinh viên trong trường hợp các mẫu không bằng nhau như vậy không hoàn toàn chính xác về mặt toán học và tất nhiên sẽ ảnh hưởng đến độ không tin cậy cuối cùng của sự khác biệt giữa Хср = 9,1 và Хср = 8,5. Khi sử dụng tiêu chí này, người ta không đánh giá mức độ gần gũi của hai đường trung bình mà xem xét việc gán hoặc lưới tính ngẫu nhiên (ở một mức ý nghĩa nhất định). .

trong đó f là mức độ tự do, được định nghĩa là

Ví dụ . Hai nhóm sinh viên được đào tạo bằng hai phương pháp khác nhau. Khi kết thúc khóa đào tạo, họ được làm bài kiểm tra trong suốt khóa học. Cần phải đánh giá xem sự khác biệt trong kiến ​​thức thu được có ý nghĩa như thế nào. Kết quả thử nghiệm được trình bày trong Bảng 4.

Bảng 4

Hãy tính giá trị trung bình, phương sai và độ lệch chuẩn của mẫu:

Hãy xác định giá trị của t p bằng công thức t p = 0,45

Sử dụng Bảng 1 (xem phụ lục), chúng ta tìm được giá trị tới hạn t k cho mức ý nghĩa p = 0,01

Kết luận: do giá trị tính toán của tiêu chí nhỏ hơn giá trị tới hạn 0,45<2,88 гипотеза Но подтверждается и существенных различий в методиках обучения нет на уровне значимости 0,01.

Thuật toán tính t-test của Sinh viên cho các mẫu đo phụ thuộc

1. Xác định giá trị tính toán của t-test bằng công thức

, Ở đâu

2. Tính bậc tự do f

3. Xác định giá trị tới hạn của t-test theo Bảng 1 của Phụ lục.

4. So sánh giá trị tính toán và giá trị tới hạn của kiểm định t. Nếu giá trị tính toán lớn hơn hoặc bằng giá trị tới hạn thì giả thuyết về sự bằng nhau của các giá trị trung bình trong hai mẫu thay đổi bị bác bỏ (Ho). Trong tất cả các trường hợp khác, nó được chấp nhận ở mức ý nghĩa nhất định.

bạn- tiêu chuẩnma-na- Whitney

Mục đích của tiêu chí

Tiêu chí này nhằm đánh giá sự khác biệt giữa hai mẫu không tham số về mức độ của bất kỳ đặc tính nào được đo định lượng. Nó cho phép bạn xác định sự khác biệt giữa các mẫu nhỏ khi n< 30.

Mô tả tiêu chí

Phương pháp này xác định xem diện tích các giá trị chồng chéo giữa hai chuỗi có đủ nhỏ hay không. Diện tích này càng nhỏ thì càng có nhiều khả năng sự khác biệt là đáng kể. Giá trị thực nghiệm của tiêu chí U phản ánh mức độ phù hợp giữa các hàng. Do đó, U càng nhỏ thì càng có nhiều khả năng sự khác biệt là đáng kể.

giả thuyết

NHƯNG: Mức độ của đặc điểm ở nhóm 2 không thấp hơn mức độ của đặc điểm ở nhóm 1.

HI: Mức độ tính trạng ở nhóm 2 thấp hơn mức độ tính trạng ở nhóm 1.

Thuật toán tính tiêu chí Mann-Whitney (u)

    Chuyển tất cả dữ liệu của đối tượng thử nghiệm sang từng thẻ riêng lẻ.

    Đánh dấu các thẻ của các chủ đề trong mẫu 1 bằng một màu, chẳng hạn như màu đỏ, và tất cả các thẻ từ mẫu 2 bằng một màu khác, chẳng hạn như xanh lam.

    Sắp xếp tất cả các thẻ thành một hàng tùy theo mức độ tăng thuộc tính, bất kể chúng thuộc mẫu nào, như thể chúng ta đang làm việc với một mẫu lớn.


trong đó n 1 là số đối tượng trong mẫu 1;

n 2 – số đối tượng trong mẫu 2,

T x – số tiền lớn hơn trong hai giá trị;

n x – số đối tượng trong nhóm có tổng thứ hạng lớn hơn.

9. Xác định các giá trị tới hạn của U theo bảng 2 (xem phụ lục).

Nếu U em.> U cr0,05 thì giả thuyết But được chấp nhận. Nếu U emp.< U cr thì bị từ chối. Giá trị U càng nhỏ thì độ tin cậy của sự khác biệt càng cao.

Ví dụ. So sánh hiệu quả của hai phương pháp dạy học ở hai nhóm. Kết quả thử nghiệm được trình bày trong Bảng 5.

Bảng 5

Chuyển toàn bộ dữ liệu sang bảng khác, gạch chân dữ liệu của nhóm thứ 2 và xếp hạng tổng mẫu (xem thuật toán xếp hạng ở phần hướng dẫn task 3).

Giá trị

Hãy tìm tổng thứ hạng của hai mẫu và chọn mẫu lớn hơn: T x = 113

Hãy tính giá trị thực nghiệm của tiêu chí bằng công thức 2: Up p = 30.

Sử dụng bảng 2 trong phần phụ lục, chúng tôi xác định giá trị tới hạn của tiêu chí ở mức ý nghĩa p = 0,05: U k = 19.

Phần kết luận: vì giá trị tính toán của tiêu chíbạnlớn hơn tới hạn ở mức ý nghĩa p = 0,05 và 30 > 19 thì giả thuyết về sự bình đẳng về phương tiện được chấp nhận và sự khác biệt về phương pháp dạy học là không đáng kể.

Phương pháp này cho phép bạn kiểm tra giả thuyết rằng các giá trị trung bình của hai quần thể chung mà từ đó các quần thể so sánh được trích xuất sự phụ thuộc các mẫu khác nhau. Giả định về sự phụ thuộc thường có nghĩa là đặc điểm được đo lường trên cùng một mẫu hai lần, chẳng hạn như trước và sau can thiệp. Trong trường hợp chung, mỗi đại diện của một mẫu được gán một đại diện từ một mẫu khác (chúng được kết hợp theo cặp) sao cho hai chuỗi dữ liệu có mối tương quan thuận với nhau. Loại phụ thuộc mẫu yếu hơn: mẫu 1 - chồng, mẫu 2 - vợ của họ; mẫu 1 - trẻ một tuổi, mẫu 2 gồm các trẻ sinh đôi ở mẫu 1, v.v.

Giả thuyết thống kê có thể kiểm chứng được, như trong trường hợp trước, H 0: M1 = M2(giá trị trung bình ở mẫu 1 và 2 bằng nhau), nếu bác bỏ thì chấp nhận giả thuyết thay thế là M 1 nhiều ít) M 2.

Giả định ban đầuđể kiểm tra thống kê:

□ mỗi đại diện của một mẫu (từ một tổng thể chung) được liên kết với một đại diện của một mẫu khác (từ một tổng thể khác);

□ dữ liệu từ hai mẫu có mối tương quan thuận chiều (dạng cặp);

□ sự phân bố của đặc tính được nghiên cứu trong cả hai mẫu đều tuân theo quy luật chuẩn tắc.

Cấu trúc dữ liệu nguồn: có hai giá trị của đặc điểm được nghiên cứu cho từng đối tượng (cho mỗi cặp).

Những hạn chế: sự phân bố đặc tính trong cả hai mẫu không được khác biệt đáng kể so với bình thường; dữ liệu của hai phép đo tương ứng với cả hai mẫu có mối tương quan dương.

Các lựa chọn thay thế: Wilcoxon T-test, nếu phân bố của ít nhất một mẫu khác biệt đáng kể so với bình thường; t-Bài kiểm tra của học sinh đối với các mẫu độc lập - nếu dữ liệu của hai mẫu không có mối tương quan thuận chiều.

Công thức vì giá trị thực nghiệm của bài kiểm tra t của Sinh viên phản ánh thực tế rằng đơn vị phân tích sự khác biệt là sự khác biệt (sự thay đổi) các giá trị đặc trưng cho từng cặp quan sát. Theo đó, đối với mỗi N cặp giá trị thuộc tính, độ chênh lệch được tính trước tiên d tôi = x 1 tôi - x 2 tôi.

(3) trong đó M d - chênh lệch trung bình của các giá trị; σ d – độ lệch chuẩn của chênh lệch.

Ví dụ tính toán:

Giả sử, trong quá trình kiểm tra tính hiệu quả của việc đào tạo, mỗi người trong số 8 thành viên của nhóm được hỏi câu hỏi “Ý kiến ​​của bạn có thường trùng khớp với ý kiến ​​của nhóm không?” - hai lần, trước và sau đào tạo. Thang điểm 10 được sử dụng cho các câu trả lời: 1 - không bao giờ, 5 - một nửa thời gian, 10 - luôn luôn. Giả thuyết đã được kiểm tra là kết quả của quá trình đào tạo, lòng tự trọng về sự tuân thủ (mong muốn được giống những người khác trong nhóm) của những người tham gia sẽ tăng lên (α = 0,05). Hãy tạo một bảng để tính toán trung gian (Bảng 3).

bàn số 3

Trung bình số học của chênh lệch M d = (-6)/8= -0,75. Trừ giá trị này khỏi mỗi d (cột áp chót của bảng).

Công thức tính độ lệch chuẩn chỉ khác ở chỗ d xuất hiện trong đó thay vì X. Chúng ta thay thế tất cả các giá trị cần thiết và chúng ta nhận được

σ d = = 0,886.

Bước 1. Tính giá trị thực nghiệm của chỉ tiêu theo công thức (3): sai phân trung bình Md= -0,75; độ lệch chuẩn σd = 0,886; t e = 2,39; df = 7.

Bước 2. Sử dụng bảng giá trị tới hạn của tiêu chí t-Student, chúng ta xác định mức ý nghĩa p. Đối với df = 7, giá trị thực nghiệm nằm giữa các giá trị tới hạn của p = 0,05 và p - 0,01. Vì vậy, p< 0,05.

df R
0,05 0,01 0,001
2,365 3,499 5,408

Bước 3. Chúng tôi đưa ra quyết định thống kê và đưa ra kết luận. Giả thuyết thống kê về sự bình đẳng về phương tiện bị bác bỏ. Kết luận: chỉ số tự đánh giá sự phù hợp của học viên sau đào tạo tăng có ý nghĩa thống kê (ở mức ý nghĩa p< 0,05).

Các phương pháp tham số bao gồm so sánh phương sai của hai mẫu theo tiêu chí F-Fisher.Đôi khi phương pháp này dẫn đến những kết luận có giá trị và có ý nghĩa, và trong trường hợp so sánh các giá trị trung bình của các mẫu độc lập, việc so sánh phương sai là bắt buộc thủ tục.

Tính toán F em bạn cần tìm tỷ lệ phương sai của hai mẫu và sao cho phương sai lớn hơn nằm ở tử số và phương sai nhỏ hơn nằm ở mẫu số.

So sánh phương sai. Phương pháp này cho phép bạn kiểm tra giả thuyết rằng phương sai của hai quần thể mà từ đó các mẫu so sánh được lấy ra là khác nhau. Kiểm định giả thuyết thống kê H 0: σ 1 2 = σ 2 2 (phương sai ở mẫu 1 bằng phương sai ở mẫu 2). Nếu nó bị bác bỏ, giả thuyết thay thế được chấp nhận là phương sai này lớn hơn phương sai kia.

Giả định ban đầu: hai mẫu được lấy ngẫu nhiên từ các quần thể khác nhau có phân bố chuẩn của tính trạng đang được nghiên cứu.

Cấu trúc dữ liệu nguồn:đặc tính đang nghiên cứu được đo ở các đối tượng (chủ thể), mỗi đối tượng thuộc về một trong hai mẫu được so sánh.

Những hạn chế: sự phân bố tính trạng trong cả hai mẫu không khác biệt đáng kể so với bình thường.

Phương pháp thay thế: Thử nghiệm Levene, việc sử dụng thử nghiệm này không yêu cầu kiểm tra giả định về tính quy tắc (được sử dụng trong chương trình SPSS).

Công thứcđối với giá trị thực nghiệm của phép thử F của Fisher:

(4)

ở đâu σ 1 2 - độ phân tán lớn, và σ 2 2 - độ phân tán nhỏ hơn. Vì người ta không biết trước độ phân tán nào lớn hơn nên người ta sử dụng để xác định mức p Bảng các giá trị quan trọng cho các lựa chọn thay thế không định hướng. Nếu như F e > F Kp với số bậc tự do tương ứng thì R < 0,05 и статистическую гипотезу о равенстве дисперсий можно отклонить (для α = 0,05).

Ví dụ tính toán:

Những đứa trẻ được giao các bài toán số học thông thường, sau đó một nửa số học sinh được chọn ngẫu nhiên được thông báo rằng chúng đã trượt bài kiểm tra, và số còn lại được thông báo ngược lại. Sau đó, mỗi đứa trẻ được hỏi chúng sẽ mất bao nhiêu giây để giải quyết một vấn đề tương tự. Người làm thí nghiệm đã tính toán sự khác biệt giữa thời gian trẻ gọi và kết quả của nhiệm vụ đã hoàn thành (tính bằng giây). Người ta cho rằng thông điệp về sự thất bại sẽ gây ra sự thiếu tự tin nào đó ở trẻ. Giả thuyết đang được kiểm tra (ở mức α = 0,005) là phương sai của lòng tự trọng tổng hợp không phụ thuộc vào báo cáo thành công hay thất bại (H 0: σ 1 2 = σ 2 2).

Dữ liệu sau đây đã thu được:


Bước 1. Tính giá trị thực nghiệm của tiêu chí và số bậc tự do bằng công thức (4):

Bước 2. Theo bảng giá trị tới hạn của tiêu chí Fisher f cho vô hướng các lựa chọn thay thế chúng tôi tìm thấy giá trị quan trọng cho số df = 11; df biết= 11. Tuy nhiên, chỉ có giá trị tới hạn đối với số df= 10 và df biết = 12. Không thể lấy số bậc tự do lớn hơn nên ta lấy giá trị tới hạn của số df= 10: Đối với R = 0,05 F Kp = 3,526; Vì R = 0,01 F Kp = 5,418.

Bước 3. Đưa ra quyết định thống kê và kết luận có ý nghĩa. Vì giá trị thực nghiệm vượt quá giá trị tới hạn cho R= 0,01 (và thậm chí còn hơn thế nữa đối với p = 0,05), thì trong trường hợp này p< 0,01 и принимается альтернативная гипо­теза: дисперсия в группе 1 превышает дисперсию в группе 2 (R< 0,01). Hệ quả là, sau một thông điệp về sự thất bại, mức độ thiếu lòng tự trọng sẽ cao hơn sau một thông điệp về sự thành công.

/ thống kê thực tế / tài liệu tham khảo / giá trị t-test của sinh viên

Nghĩat -T-test của sinh viên ở các mức ý nghĩa 0,10, 0,05 và 0,01

ν - bậc tự do biến đổi

Giá trị t-test của Sinh viên Tiêu chuẩn

Số bậc tự do

Mức ý nghĩa

Số bậc tự do

Mức ý nghĩa

Bàn XI

Giá trị tiêu chuẩn thử nghiệm Fisher dùng để đánh giá tầm quan trọng của sự khác biệt giữa hai mẫu

Bậc tự do

Mức độ đáng kể

Bậc tự do

Mức độ đáng kể

Bài kiểm tra t của sinh viên

Bài kiểm tra t của sinh viên- tên chung cho một lớp phương pháp kiểm tra thống kê các giả thuyết (kiểm tra thống kê) dựa trên phân bố Sinh viên. Việc sử dụng phổ biến nhất của phép thử t liên quan đến việc kiểm tra sự bằng nhau của các giá trị trung bình trong hai mẫu.

t-thống kê thường được xây dựng theo nguyên tắc chung sau: tử số là biến ngẫu nhiên có kỳ vọng toán học bằng 0 (nếu giả thuyết null được thỏa mãn) và mẫu số là độ lệch chuẩn mẫu của biến ngẫu nhiên này, được lấy bằng căn bậc hai của ước tính phương sai không trộn lẫn.

Câu chuyện

Tiêu chí này được William Gossett phát triển để đánh giá chất lượng bia tại công ty Guinness. Liên quan đến nghĩa vụ với công ty về việc không tiết lộ bí mật thương mại (ban quản lý Guinness đã cân nhắc việc sử dụng bộ máy thống kê trong công việc của mình), bài báo của Gosset được xuất bản vào năm 1908 trên tạp chí Biometrics với bút danh “Sinh viên”.

Yêu cầu dữ liệu

Để áp dụng tiêu chí này, dữ liệu gốc cần có phân phối chuẩn. Trong trường hợp áp dụng phép thử hai mẫu cho các mẫu độc lập cũng cần phải tuân thủ điều kiện phương sai bằng nhau. Tuy nhiên, có những lựa chọn thay thế cho bài kiểm tra t của Học sinh đối với các tình huống có phương sai không bằng nhau.

Yêu cầu phân phối dữ liệu chuẩn là cần thiết để kiểm tra t (\displaystyle t) -chính xác. Tuy nhiên, ngay cả với các phân phối dữ liệu khác, vẫn có thể sử dụng t (\displaystyle t) -statistics. Trong nhiều trường hợp, thống kê này tiệm cận có phân phối chuẩn chuẩn - N (0, 1) (\displaystyle N(0,1)) , vì vậy có thể sử dụng phân vị của phân phối này. Tuy nhiên, ngay cả trong trường hợp này, các lượng tử thường không được sử dụng theo phân phối chuẩn chuẩn mà là phân bố Sinh viên tương ứng, như trong bài kiểm tra t (\displaystyle t) chính xác. Chúng tương đương nhau về mặt tiệm cận, nhưng trong các mẫu nhỏ, khoảng tin cậy của phân phối Sinh viên rộng hơn và đáng tin cậy hơn.

T-test một mẫu

Được sử dụng để kiểm định giả thuyết H 0: E (X) = m (\displaystyle H_(0):E(X)=m) về sự bằng nhau của kỳ vọng toán học E (X) (\displaystyle E(X)) đối với một số giá trị đã biết m ( \displaystyle m) .

Rõ ràng, nếu giả thuyết khống được thỏa mãn, E (X ¯) = m (\displaystyle E((\overline (X)))=m) . Có tính đến tính độc lập giả định của các quan sát, V (X ¯) = σ 2 / n (\displaystyle V((\overline (X)))=\sigma ^(2)/n) . Sử dụng ước tính phương sai không thiên vị s X 2 = ∑ t = 1 n (X t − X ¯) 2 / (n − 1) (\displaystyle s_(X)^(2)=\sum _(t=1)^( n )(X_(t)-(\overline (X)))^(2)/(n-1)) chúng ta thu được số liệu thống kê t sau:

t = X ¯ − m s X / n (\displaystyle t=(\frac ((\overline (X))-m)(s_(X)/(\sqrt (n)))))

Theo giả thuyết khống, phân bố của thống kê này là t (n − 1) (\displaystyle t(n-1)) . Do đó, nếu giá trị tuyệt đối của số liệu thống kê vượt quá giá trị tới hạn của một phân bố nhất định (ở mức ý nghĩa nhất định), giả thuyết không sẽ bị bác bỏ.

T-test hai mẫu cho các mẫu độc lập

Cho có hai mẫu độc lập của các tập n 1, n 2 (\displaystyle n_(1)~,~n_(2)) của các biến ngẫu nhiên phân bố chuẩn X 1, X 2 (\displaystyle X_(1),~X_(2 )). Cần phải kiểm tra giả thuyết khống về sự bằng nhau của các kỳ vọng toán học của các biến ngẫu nhiên H 0 này: M 1 = M 2 (\displaystyle H_(0):~M_(1)=M_(2)) bằng cách sử dụng dữ liệu mẫu.

Hãy xem xét sự khác biệt giữa các giá trị trung bình mẫu Δ = X ¯ 1 − X ¯ 2 (\displaystyle \Delta =(\overline (X))_(1)-(\overline (X))_(2)) . Rõ ràng, nếu giả thuyết khống là đúng thì E (Δ) = M 1 − M 2 = 0 (\displaystyle E(\Delta)=M_(1)-M_(2)=0) . Phương sai của chênh lệch này là bằng nhau, dựa trên tính độc lập của các mẫu: V (Δ) = σ 1 2 n 1 + σ 2 2 n 2 (\displaystyle V(\Delta)=(\frac (\sigma _(1 )^(2))( n_(1)))+(\frac (\sigma _(2)^(2))(n_(2)))) . Sau đó, sử dụng ước tính phương sai không chệch s 2 = ∑ t = 1 n (X t − X ¯) 2 n − 1 (\displaystyle s^(2)=(\frac (\sum _(t=1)^(n) ( X_(t)-(\overline (X)))^(2))(n-1))) chúng ta thu được ước tính không thiên vị về phương sai của chênh lệch giữa các trung bình mẫu: s Δ 2 = s 1 2 n 1 + s 2 2 n 2 (\ displaystyle s_(\Delta )^(2)=(\frac (s_(1)^(2))(n_(1)))+(\frac (s_(2)^( 2))(n_(2) ))) . Do đó, thống kê t để kiểm tra giả thuyết không là

T = X ¯ 1 − X ¯ 2 s 1 2 n 1 + s 2 2 n 2 (\displaystyle t=(\frac ((\overline (X))_(1)-(\overline (X))_( 2))(\sqrt ((\frac (s_(1)^(2))(n_(1)))+(\frac (s_(2)^(2))(n_(2))))) ))

Nếu giả thuyết khống là đúng thì thống kê này có phân bố t (d f) (\displaystyle t(df)), trong đó d f = (s 1 2 / n 1 + s 2 2 / n 2) 2 (s 1 2 / n 1) 2 / (n 1 − 1) + (s 2 2 / n 2) 2 / (n 2 − 1) (\displaystyle df=(\frac ((s_(1)^(2)/n_(1) +s_(2 )^(2)/n_(2))^(2))((s_(1)^(2)/n_(1))^(2)/(n_(1)-1)+ (s_(2 )^(2)/n_(2))^(2)/(n_(2)-1))))

Trường hợp phương sai bằng nhau

Nếu phương sai của các mẫu được coi là bằng nhau thì

V (Δ) = σ 2 (1 n 1 + 1 n 2) (\displaystyle V(\Delta)=\sigma ^(2)\left((\frac (1)(n_(1)))+(\ phân số (1)(n_(2)))\right))

Khi đó thống kê t là:

T = X ¯ 1 − X ¯ 2 s X 1 n 1 + 1 n 2 , s X = (n 1 − 1) s 1 2 + (n 2 − 1) s 2 2 n 1 + n 2 − 2 (\ kiểu hiển thị t=(\frac ((\overline (X))_(1)-(\overline (X))_(2))(s_(X)(\sqrt ((\frac (1)(n_(1 )))+(\frac (1)(n_(2)))))~,~~s_(X)=(\sqrt (\frac ((n_(1)-1)s_(1)^ ( 2)+(n_(2)-1)s_(2)^(2))(n_(1)+n_(2)-2))))

Thống kê này có phân phối t (n 1 + n 2 − 2) (\displaystyle t(n_(1)+n_(2)-2))

T-test hai mẫu cho các mẫu phụ thuộc

Để tính giá trị thực nghiệm của tiêu chí t (\displaystyle t) trong trường hợp kiểm tra một giả thuyết về sự khác biệt giữa hai mẫu phụ thuộc (ví dụ: hai mẫu của cùng một thử nghiệm với khoảng thời gian), công thức sau đây được sử dụng:

T = M d s d / n (\displaystyle t=(\frac (M_(d))(s_(d)/(\sqrt (n)))))

trong đó M d (\displaystyle M_(d)) là chênh lệch trung bình của các giá trị, s d (\displaystyle s_(d)) là độ lệch chuẩn của các chênh lệch và n là số lượng quan sát

Thống kê này có phân bố t (n − 1) (\displaystyle t(n-1)) .

Kiểm tra ràng buộc tuyến tính trên các tham số hồi quy tuyến tính

Kiểm định t cũng có thể kiểm tra ràng buộc tuyến tính (đơn) tùy ý trên các tham số của hồi quy tuyến tính được ước tính bằng bình phương tối thiểu thông thường. Cần phải kiểm tra giả thuyết H 0: c T b = a (\displaystyle H_(0):c^(T)b=a) . Rõ ràng, nếu giả thuyết không được thỏa mãn, E (c T b ^ − a) = c T E (b ^) − a = 0 (\displaystyle E(c^(T)(\hat (b))-a)= c^( T)E((\hat (b)))-a=0) . Ở đây chúng tôi sử dụng thuộc tính ước tính bình phương nhỏ nhất không thiên vị của các tham số mô hình E (b ^) = b (\displaystyle E((\hat (b)))=b) . Ngoài ra, V (c T b ^ − a) = c T V (b ^) c = σ 2 c T (X T X) − 1 c (\displaystyle V(c^(T)(\hat (b))-a )=c^(T)V((\hat (b)))c=\sigma ^(2)c^(T)(X^(T)X)^(-1)c) . Thay vì sử dụng phương sai chưa biết, ước tính không chệch của nó s 2 = E S S / (n − k) (\displaystyle s^(2)=ESS/(n-k)) chúng ta thu được số liệu thống kê t sau:

T = c T b ^ − a s c T (X T X) − 1 c (\displaystyle t=(\frac (c^(T)(\hat (b))-a)(s(\sqrt (c^(T) (X^(T)X)^(-1)c)))))

Thống kê này, khi giả thuyết khống được thỏa mãn, có phân phối t (n − k) (\displaystyle t(n-k)) , vì vậy nếu giá trị của thống kê cao hơn giá trị tới hạn, thì giả thuyết khống về ràng buộc tuyến tính bị từ chối.

Kiểm định giả thuyết về hệ số hồi quy tuyến tính

Một trường hợp đặc biệt của ràng buộc tuyến tính đang kiểm tra giả thuyết rằng hệ số hồi quy b j (\displaystyle b_(j)) bằng một giá trị nhất định a (\displaystyle a) . Trong trường hợp này, thống kê t tương ứng là:

T = b ^ j − a s b ^ j (\displaystyle t=(\frac ((\hat (b))_(j)-a)(s_((\hat (b))_(j)))))

trong đó s b ^ j (\displaystyle s_((\hat (b))_(j))) là sai số chuẩn của ước lượng hệ số - căn bậc hai của phần tử đường chéo tương ứng của ma trận hiệp phương sai của ước lượng hệ số.

Nếu giả thuyết khống là đúng thì phân bố của thống kê này là t (n − k) (\displaystyle t(n-k)) . Nếu giá trị tuyệt đối của thống kê cao hơn giá trị tới hạn thì chênh lệch giữa hệ số và a (\displaystyle a) có ý nghĩa thống kê (không ngẫu nhiên), nếu không thì không có ý nghĩa (ngẫu nhiên, nghĩa là hệ số thực là có thể bằng hoặc rất gần với giá trị ước tính của a (\ kiểu hiển thị a))

Bình luận

Kiểm tra một mẫu cho các kỳ vọng toán học có thể được giảm xuống thành kiểm tra ràng buộc tuyến tính đối với các tham số hồi quy tuyến tính. Trong thử nghiệm một mẫu, đây là "hồi quy" trên một hằng số. Do đó, s 2 (\displaystyle s^(2)) của hồi quy là ước lượng mẫu về phương sai của biến ngẫu nhiên đang được nghiên cứu, ma trận X T X (\displaystyle X^(T)X) bằng n (\displaystyle n ) và ước tính “hệ số” của mô hình bằng giá trị trung bình mẫu. Từ đây chúng ta thu được biểu thức của thống kê t nêu trên cho trường hợp tổng quát.

Tương tự, có thể chỉ ra rằng thử nghiệm hai mẫu với phương sai mẫu bằng nhau cũng giảm xuống việc thử nghiệm các ràng buộc tuyến tính. Trong thử nghiệm hai mẫu, đây là "hồi quy" trên một hằng số và một biến giả xác định mẫu con tùy thuộc vào giá trị (0 hoặc 1): y = a + b D (\displaystyle y=a+bD) . Giả thuyết về sự bằng nhau của các kỳ vọng toán học của các mẫu có thể được xây dựng dưới dạng giả thuyết về sự bằng nhau của hệ số b của mô hình này bằng 0. Có thể chỉ ra rằng thống kê t thích hợp để kiểm tra giả thuyết này bằng với thống kê t được đưa ra cho thử nghiệm hai mẫu.

Nó cũng có thể được giảm xuống để kiểm tra ràng buộc tuyến tính trong trường hợp có độ phân tán khác nhau. Trong trường hợp này, phương sai lỗi mô hình có hai giá trị. Từ đó, bạn cũng có thể thu được thống kê t tương tự như thống kê được đưa ra cho thử nghiệm hai mẫu.

Tương tự không tham số

Một dạng tương tự của thử nghiệm hai mẫu đối với các mẫu độc lập là thử nghiệm Mann-Whitney U. Đối với trường hợp các mẫu phụ thuộc, các phép tương tự là kiểm tra dấu hiệu và kiểm tra T Wilcoxon

Văn học

Học sinh. Lỗi có thể xảy ra của một giá trị trung bình. // Sinh trắc học. 1908. Số 6 (1). Trang 1-25.

Liên kết

Về tiêu chí kiểm định giả thuyết về tính đồng nhất của phương tiện trên trang web của Đại học Kỹ thuật Bang Novosibirsk