Tính toán tiêu chí của học sinh. Phân phối t-test của sinh viên để kiểm tra giả thuyết về giá trị trung bình và tính khoảng tin cậy trong MS Excel

Kiểm tra giả thuyết thống kê cho phép chúng ta đưa ra những suy luận chắc chắn về đặc điểm của dân số dựa trên dữ liệu mẫu. Có nhiều giả thuyết khác nhau. Một trong số đó là giả thuyết về giá trị trung bình (kỳ vọng toán học). Bản chất của nó là đưa ra kết luận chính xác, chỉ dựa trên mẫu có sẵn, về vị trí của mức trung bình chung có thể hoặc không (chúng tôi sẽ không bao giờ biết sự thật chính xác, nhưng chúng tôi có thể thu hẹp tìm kiếm).

Cách tiếp cận chung để kiểm tra các giả thuyết đã được mô tả, vì vậy hãy đi thẳng vào vấn đề. Đầu tiên chúng ta giả sử rằng mẫu được lấy từ một quần thể bình thường gồm các biến ngẫu nhiên. X với mức trung bình chung μ và phương sai σ 2(Tôi biết, tôi biết điều này sẽ không xảy ra, nhưng đừng làm phiền tôi!). Giá trị trung bình số học của mẫu này rõ ràng là một biến ngẫu nhiên. Nếu bạn trích xuất nhiều mẫu như vậy và tính giá trị trung bình của chúng thì chúng cũng sẽ có kỳ vọng toán học μ

Khi đó biến ngẫu nhiên

Câu hỏi đặt ra: liệu mức trung bình chung với xác suất 95% có nằm trong khoảng ±1,96 không? s x̅. Nói cách khác, là sự phân phối của các biến ngẫu nhiên

tương đương.

Câu hỏi này lần đầu tiên được đặt ra (và giải quyết) bởi một nhà hóa học làm việc tại nhà máy bia Guinness ở Dublin (Ireland). Tên nhà hóa học là William Seely Gossett và ông đã lấy mẫu bia để phân tích hóa học. Rõ ràng là ở một thời điểm nào đó, William bắt đầu bị dày vò bởi những nghi ngờ mơ hồ về sự phân bổ các con số trung bình. Hóa ra nó bị nhòe hơn một chút so với phân phối bình thường.

Sau khi thu thập cơ sở toán học và tính toán các giá trị của hàm phân phối mà ông phát hiện ra, nhà hóa học người Dublin, William Gosset, đã viết một ghi chú được đăng trên tạp chí Biometrics số tháng 3 năm 1908 (tổng biên tập - Karl Pearson). Bởi vì Guinness nghiêm cấm tiết lộ bí quyết nấu bia; Gossett đã ký với bút danh Sinh viên.

Mặc dù thực tế là K. Pearson đã phát minh ra phép phân phối, nhưng ý tưởng chung về tính quy chuẩn vẫn chiếm ưu thế. Không ai có thể nghĩ rằng sự phân bổ điểm mẫu có thể không bình thường. Vì vậy, bài viết của W. Gosset thực tế vẫn không được chú ý và bị lãng quên. Và chỉ có Ronald Fisher đánh giá cao khám phá của Gosset. Fischer đã sử dụng bản phân phối mới trong công việc của mình và đặt tên cho nó Phân phối t của sinh viên. Tiêu chí để kiểm định các giả thuyết, theo đó, đã trở thành Bài kiểm tra t của sinh viên. Đây là cách một “cuộc cách mạng” xảy ra trong thống kê, bước sang kỷ nguyên phân tích dữ liệu mẫu. Đây là một chuyến tham quan ngắn vào lịch sử.

Hãy xem W. Gosset có thể thấy gì. Hãy tạo 20 nghìn mẫu bình thường từ 6 quan sát với giá trị trung bình ( ) 50 và độ lệch chuẩn ( σ ) 10. Sau đó chúng ta chuẩn hóa phương tiện mẫu bằng cách sử dụng phương sai chung:

Chúng tôi sẽ nhóm 20 nghìn kết quả trung bình thành các khoảng có độ dài 0,1 và tính tần số. Chúng ta hãy mô tả trên sơ đồ sự phân bố tần số thực tế (Định mức) và lý thuyết (ENorm) của các phương tiện mẫu.

Các điểm (tần số quan sát được) thực tế trùng với đường thẳng (tần số lý thuyết). Điều này có thể hiểu được vì dữ liệu được lấy từ cùng một nhóm dân số nói chung và sự khác biệt chỉ là lỗi lấy mẫu.

Hãy tiến hành một thí nghiệm mới. Chúng tôi bình thường hóa mức trung bình bằng cách sử dụng phương sai mẫu.

Hãy đếm lại tần số và vẽ chúng trên sơ đồ dưới dạng điểm, để lại đường phân phối chuẩn chuẩn để so sánh. Chúng ta hãy biểu thị tần suất thực nghiệm của các giá trị trung bình bằng chữ cái t.

Có thể thấy sự phân bổ lần này không trùng khớp lắm. Gần, có, nhưng không giống nhau. Những chiếc đuôi đã trở nên “nặng nề” hơn.

Gosset-Student không có phiên bản MS Excel mới nhất, nhưng đây chính xác là hiệu ứng mà anh ấy nhận thấy. Lý do tại sao điều này xảy ra? Lời giải thích là biến ngẫu nhiên

không chỉ phụ thuộc vào sai số lấy mẫu (tử số) mà còn phụ thuộc vào sai số chuẩn của giá trị trung bình (mẫu số), đây cũng là một biến ngẫu nhiên.

Chúng ta hãy xem xét một chút sự phân bố của một biến ngẫu nhiên như vậy. Đầu tiên, bạn sẽ phải nhớ (hoặc học) điều gì đó từ thống kê toán học. Có định lý Fisher, trong đó phát biểu rằng trong một mẫu từ phân phối chuẩn:

1. vừa và phương sai mẫu s 2 là các đại lượng độc lập;

2. tỷ lệ phương sai mẫu và tổng thể nhân với số bậc tự do có phân phối χ 2(chi-square) có cùng số bậc tự do, tức là

Ở đâu k– số bậc tự do (bằng tiếng Anh bậc tự do (d.f.))

Nhiều kết quả khác trong thống kê của các mô hình chuẩn tắc đều dựa trên định luật này.

Hãy quay lại phân phối giá trị trung bình. Chia tử số và mẫu số của biểu thức

TRÊN σ X̅. Chúng tôi nhận được

Tử số là một biến ngẫu nhiên chuẩn tắc tiêu chuẩn (chúng ta biểu thị ξ (xi)). Chúng ta hãy biểu thị mẫu số từ định lý Fisher.

Khi đó biểu thức ban đầu sẽ có dạng

Đây là những gì nó có ở dạng chung (Mối quan hệ sinh viên). Bạn có thể rút ra hàm phân phối của nó một cách trực tiếp, bởi vì sự phân bố của cả hai biến ngẫu nhiên trong biểu thức này đều đã biết. Hãy để niềm vui này cho các nhà toán học.

Hàm phân phối t của Sinh viên có một công thức khá khó hiểu nên không có ích gì khi phân tích nó. Dù sao thì cũng không có ai sử dụng nó, bởi vì... xác suất được đưa ra trong các bảng đặc biệt của phân phối Sinh viên (đôi khi được gọi là bảng hệ số Sinh viên) hoặc được bao gồm trong các công thức PC.

Vì vậy, được trang bị kiến ​​thức mới này, bạn có thể hiểu định nghĩa chính thức về phân phối Sinh viên.
Một biến ngẫu nhiên tuân theo phân phối Sinh viên với k bậc tự do là tỷ lệ của các biến ngẫu nhiên độc lập

Ở đâu ξ được phân phối theo luật thông thường tiêu chuẩn, và χ 2 k tuân theo phân phối χ 2 c k bậc tự do.

Do đó, công thức kiểm tra t của Học sinh cho giá trị trung bình số học

Có một trường hợp đặc biệt trong mối quan hệ sinh viên

Từ công thức và định nghĩa, ta suy ra rằng phân bố của bài kiểm tra t của Sinh viên chỉ phụ thuộc vào số bậc tự do.

Tại k> 30 t-test thực tế không khác biệt với phân phối chuẩn chuẩn.

Không giống như chi bình phương, kiểm định t có thể là một đuôi hoặc hai đuôi. Thông thường họ sử dụng hai mặt, giả định rằng độ lệch có thể xảy ra theo cả hai hướng so với mức trung bình. Nhưng nếu điều kiện bài toán chỉ cho phép sai lệch theo một hướng thì việc sử dụng tiêu chí một phía là hợp lý. Điều này làm tăng sức mạnh một chút, bởi vì... ở mức ý nghĩa cố định, giá trị tới hạn tiến gần đến 0 một chút.

Điều kiện sử dụng t-test của Sinh viên

Mặc dù thực tế là khám phá của Sinh viên đã từng cách mạng hóa số liệu thống kê, bài kiểm tra t vẫn còn khá hạn chế về khả năng ứng dụng, bởi vì bản thân nó xuất phát từ giả định về phân phối chuẩn của dữ liệu gốc. Nếu dữ liệu không bình thường (thường là như vậy), thì bài kiểm tra t sẽ không còn phân phối Sinh viên nữa. Tuy nhiên, do tác động của định lý giới hạn trung tâm, giá trị trung bình ngay cả đối với dữ liệu bất thường cũng nhanh chóng có được phân bố hình chuông.

Ví dụ: hãy xem xét dữ liệu rõ ràng bị lệch sang phải, chẳng hạn như phân bố chi bình phương với 5 bậc tự do.

Bây giờ, hãy tạo 20 nghìn mẫu và quan sát cách phân bổ giá trị trung bình thay đổi tùy thuộc vào khối lượng của chúng.

Sự khác biệt khá dễ nhận thấy ở những mẫu nhỏ lên tới 15-20 quan sát. Nhưng sau đó nó nhanh chóng biến mất. Vì vậy, tính không chuẩn của phân phối tất nhiên là không tốt nhưng không nghiêm trọng.

Trên hết, t-test là “sợ” các ngoại lệ, tức là. những sai lệch bất thường. Hãy lấy 20 nghìn mẫu bình thường, mỗi mẫu có 15 quan sát và thêm một ngoại lệ ngẫu nhiên vào một số mẫu đó.

Hình ảnh trở nên ảm đạm. Tần số thực tế của các giá trị trung bình rất khác so với tần số lý thuyết. Sử dụng phân phối t trong tình huống như vậy sẽ trở thành một công việc rất rủi ro.

Vì vậy, trong các mẫu không quá nhỏ (từ 15 quan sát), t-test tương đối chống lại sự phân bố không chuẩn của dữ liệu gốc. Nhưng các ngoại lệ trong dữ liệu làm sai lệch đáng kể sự phân bố của thử nghiệm t, do đó, có thể dẫn đến sai sót trong suy luận thống kê, do đó cần loại bỏ các quan sát bất thường. Thông thường, tất cả các giá trị nằm trong phạm vi ±2 độ lệch chuẩn so với giá trị trung bình sẽ bị xóa khỏi mẫu.

Ví dụ kiểm định giả thuyết về kỳ vọng toán học bằng t-test của Sinh viên trong MS Excel

Excel có một số hàm liên quan đến phân phối t. Hãy nhìn vào chúng.

STUDENT.DIST – Phân phối t Sinh viên “cổ điển” bên trái. Đầu vào là giá trị tiêu chí t, số bậc tự do và tùy chọn (0 hoặc 1) xác định những gì cần tính: mật độ hoặc giá trị hàm. Ở đầu ra, chúng ta tương ứng thu được mật độ hoặc xác suất biến ngẫu nhiên sẽ nhỏ hơn tiêu chí t được chỉ định trong đối số.

STUDENT.DIST.2X – phân phối hai chiều. Đối số là giá trị tuyệt đối (modulo) của phép thử t và số bậc tự do. Kết quả là chúng ta có được xác suất đạt được giá trị tiêu chí t bằng hoặc thậm chí lớn hơn, tức là mức ý nghĩa thực tế (p-level).

STUDENT.DIST.PH – phân phối t bên phải. Vì vậy, 1-Student.DIST(2;5;1) = STUDENT.DIST.PH(2;5) = 0,05097. Nếu kiểm định t dương tính thì xác suất thu được là mức p.

STUDENT.INR – được sử dụng để tính nghịch đảo bên trái của phân phối t. Đối số là xác suất và số bậc tự do. Ở đầu ra, chúng ta thu được giá trị tiêu chí t tương ứng với xác suất này. Số xác suất ở bên trái. Vì vậy, đuôi bên trái yêu cầu bản thân mức ý nghĩa α , và cho cái đúng 1 - α .

STUDENT.OBR.2X – giá trị nghịch đảo của phân phối Sinh viên hai mặt, tức là. giá trị kiểm định t (modulo). Mức ý nghĩa cũng được cung cấp cho đầu vào α . Chỉ lần này việc đếm được thực hiện đồng thời từ cả hai bên, do đó xác suất được phân bổ thành hai đuôi. Vì vậy, STUDENT.ARV(1-0,025;5) = STUDENT.ARV.2X(0,05;5) = 2,57058

STUDENT.TEST là một hàm để kiểm tra giả thuyết về sự bằng nhau của các kỳ vọng toán học trong hai mẫu. Thay thế một loạt các phép tính, bởi vì Chỉ cần chỉ định hai phạm vi có dữ liệu và một vài tham số nữa là đủ. Đầu ra là mức p.

CONFIDENCE.STUDENT – tính toán khoảng tin cậy của giá trị trung bình có tính đến phân phối t.

Hãy xem xét ví dụ đào tạo này. Tại doanh nghiệp, xi măng được đóng trong bao 50 kg. Do tính ngẫu nhiên, cho phép có một số sai lệch so với khối lượng dự kiến ​​trong một túi, nhưng mức trung bình chung phải duy trì là 50 kg. Bộ phận kiểm tra chất lượng cân ngẫu nhiên 9 bao và thu được kết quả: trọng lượng trung bình ( ) là 50,3 kg, độ lệch chuẩn ( S) – 0,5kg.

Kết quả này có phù hợp với giả thuyết không rằng giá trị trung bình chung là 50 kg không? Nói cách khác, liệu có thể đạt được kết quả như vậy một cách ngẫu nhiên nếu thiết bị hoạt động bình thường và tạo ra khối lượng đổ đầy trung bình là 50 kg? Nếu giả thuyết không bị bác bỏ, thì chênh lệch thu được sẽ phù hợp với phạm vi dao động ngẫu nhiên, nhưng nếu giả thuyết bị bác bỏ thì rất có thể đã xảy ra trục trặc trong cài đặt của máy đổ đầy túi. Nó cần phải được kiểm tra và cấu hình.

Một điều kiện ngắn trong ký hiệu được chấp nhận rộng rãi trông như thế này.

H0: μ = 50 kg

H1: μ ≠ 50 kg

Có lý do để giả định rằng việc phân phối bao đầy tuân theo phân phối chuẩn (hoặc không khác lắm so với phân phối đó). Điều này có nghĩa là để kiểm tra giả thuyết về kỳ vọng toán học, bạn có thể sử dụng bài kiểm tra t của Sinh viên. Những sai lệch ngẫu nhiên có thể xảy ra theo bất kỳ hướng nào, điều đó có nghĩa là cần phải có phép thử t hai phía.

Đầu tiên, chúng ta sẽ sử dụng các phương pháp cổ xưa: tính toán tiêu chí t theo cách thủ công và so sánh nó với giá trị bảng quan trọng. T-test được tính toán:

Bây giờ hãy xác định xem số kết quả có vượt quá mức tới hạn ở mức ý nghĩa hay không α = 0,05. Hãy sử dụng bảng phân phối t của Sinh viên (có sẵn trong bất kỳ sách giáo khoa thống kê nào).

Các cột hiển thị xác suất ở phía bên phải của phân phối và các hàng hiển thị số bậc tự do. Chúng tôi quan tâm đến phép thử t hai phía với mức ý nghĩa 0,05, tương đương với giá trị t cho một nửa mức ý nghĩa ở bên phải: 1 - 0,05/2 = 0,975. Số bậc tự do là cỡ mẫu trừ đi 1, tức là 9 - 1 = 8. Tại giao điểm chúng ta tìm thấy giá trị trong bảng của kiểm định t - 2,306. Nếu chúng ta sử dụng phân phối chuẩn chuẩn thì điểm tới hạn sẽ là 1,96, nhưng ở đây nó lớn hơn, bởi vì Phân bố t trong các mẫu nhỏ có vẻ phẳng hơn.

Hãy so sánh giá trị thực tế (1.8) và giá trị bảng (2.306). Tiêu chí được tính toán hóa ra lại nhỏ hơn tiêu chí được lập bảng. Do đó, dữ liệu hiện có không mâu thuẫn với giả thuyết H 0 rằng trung bình chung là 50 kg (nhưng cũng không chứng minh được điều đó). Đó là tất cả những gì chúng ta có thể học bằng cách sử dụng bảng. Tất nhiên, bạn cũng có thể cố gắng tìm mức p, nhưng nó sẽ mang tính gần đúng. Và, như một quy luật, cấp độ p được sử dụng để kiểm tra các giả thuyết. Vì vậy, tiếp theo chúng ta chuyển sang Excel.

Không có hàm tạo sẵn để tính t-test trong Excel. Nhưng điều này không đáng sợ, vì công thức t-test của Học sinh khá đơn giản và có thể dễ dàng xây dựng ngay trong ô Excel.

Chúng tôi có cùng 1,8. Đầu tiên chúng ta hãy tìm giá trị tới hạn. Chúng tôi lấy alpha 0,05, tiêu chí là hai mặt. Chúng ta cần hàm phân phối t nghịch đảo cho giả thuyết hai phía STUDENT.OBR.2X.

Giá trị kết quả cắt bỏ vùng quan trọng. Kiểm định t được quan sát không rơi vào đó nên giả thuyết không bị bác bỏ.

Tuy nhiên, đây cũng là cách kiểm tra giả thuyết bằng cách sử dụng giá trị bảng. Sẽ có nhiều thông tin hơn nếu tính mức p, tức là xác suất đạt được độ lệch quan sát được hoặc thậm chí lớn hơn so với mức trung bình 50 kg, nếu giả thuyết này là đúng. Bạn sẽ cần hàm phân phối Sinh viên cho giả thuyết hai phía STUDENT.DIST.2X.

Mức P là 0,1096, lớn hơn mức ý nghĩa chấp nhận được là 0,05 – chúng tôi không bác bỏ giả thuyết. Nhưng bây giờ chúng ta có thể đánh giá mức độ bằng chứng. Mức P hóa ra khá gần với mức khi giả thuyết bị bác bỏ và điều này dẫn đến những suy nghĩ khác nhau. Ví dụ: mẫu quá nhỏ để phát hiện độ lệch đáng kể.

Sau một thời gian, hãy để bộ phận kiểm soát quyết định lại việc kiểm tra xem tiêu chuẩn đóng bao đang được duy trì như thế nào. Lần này, để có độ tin cậy cao hơn, không phải 9 mà là 25 túi được chọn. Bằng trực giác, rõ ràng là độ chênh lệch của giá trị trung bình sẽ giảm, và do đó, khả năng tìm ra lỗi trong hệ thống sẽ lớn hơn.

Giả sử các giá trị trung bình và độ lệch chuẩn của mẫu thu được giống như lần đầu tiên (lần lượt là 50,3 và 0,5). Hãy tính t-test.


Giá trị tới hạn của 24 bậc tự do và α = 0,05 là 2,064. Hình ảnh dưới đây cho thấy t-test nằm trong phạm vi bác bỏ giả thuyết.

Chúng ta có thể kết luận rằng với xác suất tin cậy hơn 95%, mức trung bình chung khác với 50 kg. Để thuyết phục hơn, chúng ta hãy nhìn vào cấp độ p (dòng cuối cùng trong bảng). Xác suất đạt được mức trung bình có cùng độ lệch hoặc thậm chí lớn hơn so với 50, nếu giả thuyết đúng, là 0,0062 hoặc 0,62%, điều này thực tế là không thể thực hiện được chỉ với một phép đo duy nhất. Nói chung, chúng tôi bác bỏ giả thuyết là không thể.

Tính khoảng tin cậy bằng phân phối t của học sinh

Một phương pháp thống kê khác có liên quan chặt chẽ đến việc kiểm tra giả thuyết - tính toán khoảng tin cậy. Nếu khoảng kết quả chứa một giá trị tương ứng với giả thuyết không, thì điều này tương đương với thực tế là giả thuyết không bị bác bỏ. Ngược lại, giả thuyết bị bác bỏ với mức độ tin cậy tương ứng. Trong một số trường hợp, các nhà phân tích hoàn toàn không kiểm tra các giả thuyết ở dạng cổ điển mà chỉ tính khoảng tin cậy. Cách tiếp cận này cho phép bạn trích xuất nhiều thông tin hữu ích hơn.

Hãy tính khoảng tin cậy cho giá trị trung bình của 9 và 25 quan sát. Để làm điều này, chúng ta sẽ sử dụng hàm Excel CONFIDENT.STUDENT. Ở đây, kỳ lạ thay, mọi thứ khá đơn giản. Các đối số của hàm chỉ cần cho biết mức ý nghĩa α , độ lệch chuẩn mẫu và cỡ mẫu. Ở đầu ra, chúng ta nhận được một nửa độ rộng của khoảng tin cậy, nghĩa là giá trị cần được đặt ở cả hai phía của mức trung bình. Sau khi thực hiện các tính toán và vẽ sơ đồ trực quan, chúng tôi nhận được những điều sau đây.

Như bạn có thể thấy, với mẫu gồm 9 quan sát, giá trị 50 nằm trong khoảng tin cậy (giả thuyết không bị bác bỏ) và với 25 quan sát, giá trị đó không nằm trong khoảng tin cậy (giả thuyết bị bác bỏ). Hơn nữa, trong một thử nghiệm với 25 túi, có thể khẳng định rằng với xác suất 97,5% thì trung bình chung vượt quá 50,1 kg (giới hạn dưới của khoảng tin cậy là 50,094 kg). Và đây là thông tin khá có giá trị.

Vì vậy, chúng tôi đã giải quyết vấn đề tương tự theo ba cách:

1. Sử dụng phương pháp cổ xưa, so sánh các giá trị được tính toán và lập bảng của kiểm định t
2. Hiện đại hơn, bằng cách tính mức p, thêm mức độ tin cậy khi bác bỏ giả thuyết.
3. Thậm chí còn nhiều thông tin hơn bằng cách tính khoảng tin cậy và thu được giá trị tối thiểu của mức trung bình chung.

Điều quan trọng cần nhớ là t-test đề cập đến các phương pháp tham số, bởi vì dựa trên phân phối chuẩn (nó có hai tham số: giá trị trung bình và phương sai). Do đó, để ứng dụng thành công, điều quan trọng là ít nhất tính chuẩn mực gần đúng của dữ liệu ban đầu và sự vắng mặt của các ngoại lệ là rất quan trọng.

Cuối cùng, tôi khuyên bạn nên xem video về cách thực hiện các phép tính liên quan đến bài kiểm tra t của Học sinh trong Excel.

Trong suốt ví dụ, chúng tôi sẽ sử dụng thông tin hư cấu để người đọc có thể tự mình thực hiện các chuyển đổi cần thiết.

Vì vậy, giả sử trong quá trình nghiên cứu, chúng tôi đã nghiên cứu tác dụng của thuốc A đến hàm lượng chất B (tính bằng mmol/g) trong mô C và nồng độ chất D trong máu (tính bằng mmol/l) ở bệnh nhân. chia theo tiêu chí E nào đó thành 3 nhóm có thể tích bằng nhau (n=10). Kết quả của một nghiên cứu hư cấu như vậy được thể hiện trong bảng:

Hàm lượng chất B, mmol/g

Chất D, mmol/l

tăng nồng độ


Chúng tôi muốn cảnh báo bạn rằng chúng tôi coi các mẫu cỡ 10 để dễ trình bày và tính toán dữ liệu; trong thực tế, cỡ mẫu như vậy thường không đủ để đưa ra kết luận thống kê.

Ví dụ: hãy xem xét dữ liệu ở cột đầu tiên của bảng.

Thống kê mô tả

Giá trị trung bình mẫu

Giá trị trung bình số học, thường được gọi đơn giản là "trung bình", có được bằng cách cộng tất cả các giá trị và chia tổng đó cho số giá trị trong tập hợp. Điều này có thể được chứng minh bằng cách sử dụng một công thức đại số. Một tập hợp n quan sát của một biến x có thể được biểu diễn dưới dạng x 1 , x 2 , x 3 , ..., x n

Công thức xác định giá trị trung bình số học của các quan sát (phát âm là “X có một dòng”):

= (X 1 + X 2 + ... + X n) / n

= (12 + 13 + 14 + 15 + 14 + 13 + 13 + 10 + 11 + 16) / 10 = 13,1;

Phương sai mẫu

Một cách để đo độ phân tán của dữ liệu là xác định mức độ sai lệch của mỗi quan sát so với giá trị trung bình số học. Rõ ràng, độ lệch càng lớn thì độ biến động, biến thiên của các quan sát càng lớn. Tuy nhiên, chúng ta không thể sử dụng giá trị trung bình của những độ lệch này như một thước đo độ phân tán, vì độ lệch dương bù cho độ lệch âm (tổng của chúng bằng 0). Để giải quyết vấn đề này, chúng ta bình phương từng độ lệch và tìm giá trị trung bình của các độ lệch bình phương; đại lượng này được gọi là sự biến thiên hoặc độ phân tán. Hãy thực hiện n quan sát x 1, x 2, x 3, ..., x n, trung bình bằng với. Tính phương sai điều này, thường được gọi làs2,những quan sát này:

Phương sai mẫu của chỉ tiêu này là s 2 = 3,2.

Độ lệch chuẩn

Độ lệch chuẩn (bình phương trung bình) là căn bậc hai dương của phương sai. Lấy n quan sát làm ví dụ, nó trông như thế này:

Chúng ta có thể coi độ lệch chuẩn là một loại độ lệch trung bình của các quan sát so với giá trị trung bình. Nó được tính toán theo cùng đơn vị (kích thước) với dữ liệu gốc.

s = sqrt (s 2) = sqrt (3,2) = 1,79.

Hệ số biến thiên

Nếu bạn chia độ lệch chuẩn cho giá trị trung bình số học và biểu thị kết quả dưới dạng phần trăm, bạn sẽ nhận được hệ số biến thiên.

CV = (1,79 / 13,1) * 100% = 13,7

Lỗi trung bình mẫu

1,79/m2(10) = 0,57;

Hệ số t của sinh viên (t-test một mẫu)

Dùng để kiểm định giả thuyết về sự khác biệt giữa giá trị trung bình và một số giá trị đã biết m

Số bậc tự do được tính là f=n-1.

Trong trường hợp này, khoảng tin cậy của giá trị trung bình nằm giữa ranh giới 11,87 và 14,39.

Đối với mức độ tin cậy 95% m=11,87 hoặc m=14,39, tức là= |13,1-11,82| = |13,1-14,38| = 1,28

Theo đó, trong trường hợp này, với số bậc tự do f = 10 - 1 = 9 và độ tin cậy 95% t = 2,26.

Hộp thoại Thống kê cơ bản và bảng

Trong mô-đun Thống kê và bảng cơ bản Cùng lựa chọn nào Thống kê mô tả.

Một hộp thoại sẽ mở ra Thống kê mô tả.

Trong lĩnh vực Biến Cùng lựa chọn nào Nhóm 1.

Nhấn ĐƯỢC RỒI, ta thu được bảng kết quả có thống kê mô tả của các biến được chọn.

Một hộp thoại sẽ mở ra T-test một mẫu.

Giả sử chúng ta biết hàm lượng trung bình của chất B trong mô C là 11.

Bảng kết quả thống kê mô tả và t-test của Sinh viên như sau:

Chúng ta phải bác bỏ giả thuyết cho rằng hàm lượng trung bình của chất B trong mô C là 11.

Vì giá trị tính toán của tiêu chí lớn hơn giá trị được lập bảng (2.26), nên giả thuyết không bị bác bỏ ở mức ý nghĩa đã chọn và sự khác biệt giữa mẫu và giá trị đã biết được coi là có ý nghĩa thống kê. Do đó, kết luận về sự tồn tại của sự khác biệt được đưa ra bằng bài kiểm tra t của Học sinh được xác nhận bằng phương pháp này.

​ T-test của Học sinh là tên gọi chung của một lớp phương pháp kiểm tra thống kê các giả thuyết (kiểm tra thống kê) dựa trên phân phối Học sinh. Việc sử dụng phổ biến nhất của phép thử t liên quan đến việc kiểm tra sự bằng nhau của các giá trị trung bình trong hai mẫu.

1. Lịch sử phát triển của t-test

Tiêu chí này được phát triển William Gossettđể đánh giá chất lượng bia ở công ty Guinness. Do nghĩa vụ với công ty về việc không tiết lộ bí mật thương mại, bài báo của Gosset đã được xuất bản vào năm 1908 trên tạp chí Biometrics với bút danh "Sinh viên".

2. Bài kiểm tra t của Học sinh dùng để làm gì?

Bài kiểm tra t của học sinh được sử dụng để xác định ý nghĩa thống kê của sự khác biệt về phương tiện. Có thể sử dụng cả trong trường hợp so sánh các mẫu độc lập ( ví dụ, nhóm bệnh nhân tiểu đường và nhóm khỏe mạnh) và khi so sánh các quần thể liên quan ( ví dụ, nhịp tim trung bình ở cùng một bệnh nhân trước và sau khi dùng thuốc chống loạn nhịp tim).

3. T-test của Học sinh có thể được sử dụng trong trường hợp nào?

Để áp dụng bài kiểm tra t của Sinh viên, dữ liệu gốc cần phải có phân phối bình thường. Trong trường hợp áp dụng tiêu chí hai mẫu cho các mẫu độc lập cũng cần phải thỏa mãn điều kiện sự bình đẳng (tính đồng nhất) của phương sai.

Nếu những điều kiện này không được đáp ứng thì nên sử dụng các phương pháp tương tự khi so sánh các giá trị trung bình của mẫu. thống kê phi tham số, trong đó nổi tiếng nhất là Phép thử Mann-Whitney U(dưới dạng thử nghiệm hai mẫu cho các mẫu độc lập) và tiêu chí ký tênthử nghiệm Wilcoxon(dùng trong trường hợp mẫu phụ thuộc).

4. Cách tính t-test của Sinh viên?

Để so sánh các giá trị trung bình, t-test của Học sinh được tính bằng công thức sau:

Ở đâu M 1- trung bình số học của dân số so sánh đầu tiên (nhóm), M 2- trung bình số học của dân số so sánh thứ hai (nhóm), tôi 1- sai số trung bình của giá trị trung bình số học đầu tiên, m 2- sai số trung bình của giá trị trung bình số học thứ hai.

5. Làm thế nào để diễn giải giá trị t-test của Học sinh?

Giá trị t-test của Học sinh thu được phải được diễn giải chính xác. Để làm được điều này, chúng ta cần biết số lượng đối tượng trong mỗi nhóm (n 1 và n 2). Tìm số bậc tự do f theo công thức sau:

f = (n 1 + n 2) - 2

Sau đó, chúng tôi xác định giá trị tới hạn của bài kiểm tra t của Học sinh đối với mức ý nghĩa được yêu cầu (ví dụ: p = 0,05) và đối với một số bậc tự do nhất định f theo bảng ( xem bên dưới).

Chúng tôi so sánh các giá trị quan trọng và được tính toán của tiêu chí:

  • Nếu giá trị tính toán của t-test của Sinh viên bằng hoặc lớn hơn quan trọng, được tìm thấy từ bảng, chúng tôi kết luận rằng sự khác biệt giữa các giá trị được so sánh là có ý nghĩa thống kê.
  • Nếu giá trị t-test của Sinh viên được tính ít hơn dạng bảng, nghĩa là sự khác biệt giữa các giá trị được so sánh không có ý nghĩa thống kê.

6. Ví dụ tính t-test của Sinh viên

Để nghiên cứu hiệu quả của một chế phẩm sắt mới, hai nhóm bệnh nhân bị thiếu máu đã được chọn. Ở nhóm đầu tiên, bệnh nhân được dùng một loại thuốc mới trong hai tuần và ở nhóm thứ hai, họ được dùng giả dược. Sau đó, nồng độ hemoglobin trong máu ngoại vi được đo. Ở nhóm đầu tiên, mức huyết sắc tố trung bình là 115,4±1,2 g/l và ở nhóm thứ hai - 103,7±2,3 g/l (dữ liệu được trình bày ở dạng M±m), các quần thể được so sánh có phân phối chuẩn. Số lượng của nhóm đầu tiên là 34 và nhóm thứ hai - 40 bệnh nhân. Cần đưa ra kết luận về ý nghĩa thống kê của sự khác biệt thu được và hiệu quả của việc chuẩn bị sắt mới.

Giải pháp:Để đánh giá tầm quan trọng của sự khác biệt, chúng tôi sử dụng bài kiểm tra t của Sinh viên, được tính bằng chênh lệch về giá trị trung bình chia cho tổng các sai số bình phương:

Sau khi thực hiện tính toán, giá trị t-test là 4,51. Chúng tôi tìm thấy số bậc tự do là (34 + 40) - 2 = 72. Chúng tôi so sánh giá trị t-test của Sinh viên là 4,51 với giá trị tới hạn tại p = 0,05 được chỉ ra trong bảng: 1,993. Do giá trị tính toán của tiêu chí lớn hơn giá trị tới hạn nên chúng tôi kết luận rằng sự khác biệt quan sát được là có ý nghĩa thống kê (mức ý nghĩa p<0,05).

T-test của Học sinh có thể được sử dụng trong trường hợp nào?

Để áp dụng bài kiểm tra t của Sinh viên, dữ liệu gốc cần phải có phân phối bình thường. Trong trường hợp áp dụng tiêu chí hai mẫu cho các mẫu độc lập cũng cần phải thỏa mãn điều kiện sự bình đẳng (tính đồng nhất) của phương sai.

Nếu những điều kiện này không được đáp ứng thì nên sử dụng các phương pháp tương tự khi so sánh các giá trị trung bình của mẫu. thống kê phi tham số, trong đó nổi tiếng nhất là Phép thử Mann-Whitney U(dưới dạng thử nghiệm hai mẫu cho các mẫu độc lập) và tiêu chí ký tênthử nghiệm Wilcoxon(dùng trong trường hợp mẫu phụ thuộc).

Để so sánh các giá trị trung bình, t-test của Học sinh được tính bằng công thức sau:

Ở đâu M 1- trung bình số học của dân số so sánh đầu tiên (nhóm), M 2- trung bình số học của dân số so sánh thứ hai (nhóm), tôi 1- sai số trung bình của giá trị trung bình số học đầu tiên, m 2- sai số trung bình của giá trị trung bình số học thứ hai.

Làm thế nào để diễn giải giá trị t-test của Học sinh?

Giá trị t-test của Học sinh thu được phải được diễn giải chính xác. Để làm được điều này, chúng ta cần biết số lượng đối tượng trong mỗi nhóm (n 1 và n 2). Tìm số bậc tự do f theo công thức sau:

f = (n 1 + n 2) - 2

Sau đó, chúng tôi xác định giá trị tới hạn của bài kiểm tra t của Học sinh đối với mức ý nghĩa được yêu cầu (ví dụ: p = 0,05) và đối với một số bậc tự do nhất định f theo bảng ( xem bên dưới).

Chúng tôi so sánh các giá trị quan trọng và được tính toán của tiêu chí:

· Nếu tính giá trị t-test của Sinh viên bằng hoặc lớn hơn quan trọng, được tìm thấy từ bảng, chúng tôi kết luận rằng sự khác biệt giữa các giá trị được so sánh là có ý nghĩa thống kê.

· Nếu giá trị t-test của Sinh viên được tính ít hơn dạng bảng, nghĩa là sự khác biệt giữa các giá trị được so sánh không có ý nghĩa thống kê.

Ví dụ về tính toán t-test của Sinh viên

Để nghiên cứu hiệu quả của một chế phẩm sắt mới, hai nhóm bệnh nhân bị thiếu máu đã được chọn. Ở nhóm đầu tiên, bệnh nhân được dùng một loại thuốc mới trong hai tuần và ở nhóm thứ hai, họ được dùng giả dược. Sau đó, nồng độ hemoglobin trong máu ngoại vi được đo. Ở nhóm đầu tiên, mức huyết sắc tố trung bình là 115,4±1,2 g/l và ở nhóm thứ hai - 103,7±2,3 g/l (dữ liệu được trình bày ở dạng M±m), các quần thể được so sánh có phân phối chuẩn. Số lượng của nhóm đầu tiên là 34 và nhóm thứ hai - 40 bệnh nhân. Cần đưa ra kết luận về ý nghĩa thống kê của sự khác biệt thu được và hiệu quả của việc chuẩn bị sắt mới.

Giải pháp:Để đánh giá tầm quan trọng của sự khác biệt, chúng tôi sử dụng bài kiểm tra t của Sinh viên, được tính bằng chênh lệch về giá trị trung bình chia cho tổng các sai số bình phương:

Sau khi thực hiện tính toán, giá trị t-test là 4,51. Chúng tôi tìm thấy số bậc tự do là (34 + 40) - 2 = 72. Chúng tôi so sánh giá trị t-test của Sinh viên là 4,51 với giá trị tới hạn tại p = 0,05 được chỉ ra trong bảng: 1,993. Do giá trị tính toán của tiêu chí lớn hơn giá trị tới hạn nên chúng tôi kết luận rằng sự khác biệt quan sát được là có ý nghĩa thống kê (mức ý nghĩa p<0,05).

Phân phối Fisher là phân phối của một biến ngẫu nhiên

các biến ngẫu nhiên ở đâu X 1X 2độc lập và có phân phối chi bình phương với số bậc tự do k 1k 2 tương ứng. Cùng lúc đó, cặp đôi (k 1 , k 2)– một cặp “bậc tự do” của phân phối Fisher, cụ thể là, k 1 là số bậc tự do của tử số và k 2- số bậc tự do của mẫu số. Phân phối một biến ngẫu nhiên Fđược đặt theo tên của nhà thống kê vĩ đại người Anh R. Fisher (1890-1962), người đã tích cực sử dụng nó trong các tác phẩm của mình.

Phân phối Fisher được sử dụng khi kiểm tra các giả thuyết về tính đầy đủ của mô hình trong phân tích hồi quy, sự bằng nhau của các phương sai và trong các vấn đề khác của thống kê ứng dụng.

Bảng giá trị quan trọng của Sinh viên.

Sự bắt đầu của hình thức

Số bậc tự do, f Giá trị t-test của sinh viên tại p=0,05
12.706
4.303
3.182
2.776
2.571
2.447
2.365
2.306
2.262
2.228
2.201
2.179
2.160
2.145
2.131
2.120
2.110
2.101
2.093
2.086
2.080
2.074
2.069
2.064
2.060
2.056
2.052
2.048
2.045
2.042
2.040
2.037
2.035
2.032
2.030
2.028
2.026
2.024
40-41 2.021
42-43 2.018
44-45 2.015
46-47 2.013
48-49 2.011
50-51 2.009
52-53 2.007
54-55 2.005
56-57 2.003
58-59 2.002
60-61 2.000
62-63 1.999
64-65 1.998
66-67 1.997
68-69 1.995
70-71 1.994
72-73 1.993
74-75 1.993
76-77 1.992
78-79 1.991
80-89 1.990
90-99 1.987
100-119 1.984
120-139 1.980
140-159 1.977
160-179 1.975
180-199 1.973
1.972
1.960

Bảng phân bổ sinh viên

Bảng tích phân xác suất được sử dụng cho các mẫu lớn từ một quần thể vô cùng lớn. Nhưng đã ở (n)< 100 получается Несоответствие между

dữ liệu dạng bảng và xác suất giới hạn; tại (n)< 30 погрешность становится значительной. Несоответствие вызывается главным образом характером распределения единиц генеральной совокупности. При большом объеме выборки особенность распределения в гене-

dân số nói chung không thành vấn đề, vì sự phân bố độ lệch của chỉ báo mẫu so với đặc điểm chung với một mẫu lớn luôn là bình thường.

danh nghĩa. Trong các mẫu nhỏ (n)< 30 характер распределения генеральной совокупности сказывается на распределении ошибок выборки. Поэтому для расчета ошибки выборки при небольшом объеме наблюдения (уже менее 100 единиц) отбор должен проводиться из со-

dân số có phân bố chuẩn. Lý thuyết về các mẫu nhỏ được phát triển bởi nhà thống kê người Anh W. Gosset (người viết dưới bút danh Sinh viên) vào đầu thế kỷ 20. TRONG

Năm 1908, ông đã xây dựng một phân bố đặc biệt cho phép, ngay cả với các mẫu nhỏ, có mối tương quan giữa (t) và xác suất tin cậy F(t). Với (n) > 100, bảng phân phối Sinh viên cho kết quả tương tự như bảng tích phân xác suất Laplace cho 30< (n ) <

100 sự khác biệt là không đáng kể. Do đó, các mẫu nhỏ thực tế bao gồm các mẫu có thể tích dưới 30 đơn vị (tất nhiên, mẫu có thể tích lớn hơn 100 đơn vị được coi là lớn).

Việc sử dụng mẫu nhỏ trong một số trường hợp là do tính chất của đối tượng được khảo sát. Vì vậy, trong công tác chăn nuôi, kinh nghiệm “thuần túy” sẽ dễ dàng đạt được hơn với một số lượng nhỏ.

lô. Việc thử nghiệm sản xuất và kinh tế liên quan đến chi phí kinh tế cũng được thực hiện trên một số lượng thử nghiệm nhỏ. Như đã lưu ý, trong trường hợp mẫu nhỏ, cả xác suất tin cậy và giới hạn tin cậy của giá trị trung bình chung chỉ có thể được tính cho dân số có phân bố chuẩn.

Mật độ xác suất của phân phối Sinh viên được mô tả bằng hàm.

1 + t2

f(t,n) :=Bn

n-1

t - biến hiện tại; n - cỡ mẫu;

B là đại lượng chỉ phụ thuộc vào (n).

Phân phối Sinh viên chỉ có một tham số: (d.f.) - số bậc tự do (đôi khi được ký hiệu là (k)). Phân bố này, giống như phân bố chuẩn, đối xứng qua điểm (t) = 0, nhưng phẳng hơn. Khi kích thước mẫu tăng lên và do đó số bậc tự do tăng lên, phân phối Sinh viên nhanh chóng đạt đến mức bình thường. Số bậc tự do bằng số giá trị đặc trưng riêng lẻ cần được phân phối

Giả sử để xác định đặc tính mong muốn. Vì vậy, để tính phương sai, phải biết giá trị trung bình. Vì vậy, khi tính phương sai, hãy sử dụng (d.f.) = n - 1.

Bảng phân bố sinh viên được xuất bản với hai phiên bản:

1. Tương tự như bảng tích phân xác suất, các giá trị ( t ) và tương ứng

xác suất hiện tại F(t) đối với các số bậc tự do khác nhau;

2. các giá trị (t) được đưa ra cho các xác suất tin cậy được sử dụng phổ biến nhất

0,70; 0,75; 0,80; 0,85; 0,90; 0,95 và 0,99 hoặc cho 1 - 0,70 = 0,3; 1 - 0,80 = 0,2; …… 1 - 0,99 = 0,01.

3. với số bậc tự do khác nhau. Loại bảng này được đưa ra trong phần phụ lục

(Bảng 1 - 20), cũng như giá trị (t) - Bài kiểm tra của học sinh ở mức ý nghĩa 0,7