Kiểm tra giả thuyết về phân bố chuẩn của dân số bằng tiêu chí Pearson. Tiêu chí về mức độ phù hợp của phân phối

​ Thử nghiệm tương quan Pearson là một phương pháp thống kê tham số cho phép bạn xác định sự hiện diện hay vắng mặt của mối quan hệ tuyến tính giữa hai chỉ số định lượng, cũng như đánh giá mức độ gần gũi và ý nghĩa thống kê của nó. Nói cách khác, kiểm tra tương quan Pearson cho phép bạn xác định liệu có mối quan hệ tuyến tính giữa những thay đổi về giá trị của hai biến hay không. Trong các tính toán và suy luận thống kê, hệ số tương quan thường được ký hiệu là r xy hoặc Rxy.

1. Lịch sử phát triển của tiêu chí tương quan

Thử nghiệm tương quan Pearson được phát triển bởi một nhóm các nhà khoa học người Anh, đứng đầu là Karl Pearson(1857-1936) vào những năm 90 của thế kỷ 19, để đơn giản hóa việc phân tích hiệp phương sai của hai biến ngẫu nhiên. Ngoài Karl Pearson, người ta còn nghiên cứu về tiêu chuẩn tương quan Pearson Francis EdgeworthRaphael Weldon.

2. Phép thử tương quan Pearson dùng để làm gì?

Kiểm tra tương quan Pearson cho phép bạn xác định mức độ gần gũi (hoặc cường độ) của mối tương quan giữa hai chỉ số được đo trên thang định lượng. Bằng cách sử dụng các phép tính bổ sung, bạn cũng có thể xác định mức độ quan trọng về mặt thống kê của mối quan hệ được xác định.

Ví dụ: sử dụng tiêu chí tương quan Pearson, bạn có thể trả lời câu hỏi liệu có mối liên hệ giữa nhiệt độ cơ thể và hàm lượng bạch cầu trong máu khi bị nhiễm trùng đường hô hấp cấp tính, giữa chiều cao và cân nặng của bệnh nhân, giữa hàm lượng florua trong nước uống và tỷ lệ mắc bệnh sâu răng trong dân số.

3. Điều kiện và hạn chế áp dụng phép kiểm chi bình phương Pearson

  1. Các chỉ số so sánh phải được đo lường bằng quy mô định lượng(ví dụ: nhịp tim, nhiệt độ cơ thể, số lượng bạch cầu trên 1 ml máu, huyết áp tâm thu).
  2. Sử dụng thử nghiệm tương quan Pearson, chúng tôi chỉ có thể xác định sự hiện diện và sức mạnh của mối quan hệ tuyến tính giữa các đại lượng. Các đặc điểm khác của mối quan hệ, bao gồm hướng (trực tiếp hoặc ngược lại), bản chất của những thay đổi (tuyến thẳng hoặc đường cong), cũng như sự phụ thuộc của một biến này vào biến khác, được xác định bằng cách sử dụng phân tích hồi quy.
  3. Số lượng đại lượng so sánh phải bằng hai. Trong trường hợp phân tích mối quan hệ của ba tham số trở lên nên sử dụng phương pháp phân tích nhân tố.
  4. Kiểm định tương quan Pearson là tham số, và do đó điều kiện để sử dụng nó là phân phối bình thường các biến so sánh. Nếu cần thực hiện phân tích tương quan của các chỉ số có phân bố khác với bình thường, bao gồm cả những chỉ số được đo theo thang thứ tự, thì nên sử dụng hệ số tương quan xếp hạng của Spearman.
  5. Cần phân biệt rõ ràng các khái niệm về sự phụ thuộc và tương quan. Sự phụ thuộc của các đại lượng quyết định sự hiện diện của mối tương quan giữa chúng chứ không phải ngược lại.

Ví dụ, chiều cao của một đứa trẻ phụ thuộc vào độ tuổi của nó, tức là trẻ càng lớn thì càng cao. Nếu chúng ta lấy hai đứa trẻ ở các độ tuổi khác nhau thì khả năng cao là tốc độ tăng trưởng của đứa lớn sẽ cao hơn đứa nhỏ. Hiện tượng này được gọi là nghiện, ngụ ý mối quan hệ nhân quả giữa các chỉ số. Tất nhiên giữa họ cũng có kết nối tương quan, nghĩa là những thay đổi ở một chỉ báo này sẽ kéo theo những thay đổi ở một chỉ báo khác.

Trong một tình huống khác, hãy xem xét mối quan hệ giữa chiều cao và nhịp tim (HR) của trẻ. Như đã biết, cả hai giá trị này đều phụ thuộc trực tiếp vào độ tuổi, vì vậy trong hầu hết các trường hợp, trẻ có chiều cao lớn hơn (và do đó lớn hơn) sẽ có giá trị nhịp tim thấp hơn. Đó là, kết nối tương quan sẽ được quan sát và có thể có mật độ khá cao. Tuy nhiên, nếu chúng ta đưa bọn trẻ băng tuổi, Nhưng độ cao khác nhau, thì rất có thể nhịp tim của họ sẽ khác nhau không đáng kể, và do đó chúng ta có thể kết luận rằng Sự độc lập Nhịp tim từ độ cao.

Ví dụ trên cho thấy tầm quan trọng của việc phân biệt giữa các khái niệm cơ bản trong thống kê. thông tin liên lạcsự phụ thuộc chỉ số để rút ra kết luận đúng.

4. Cách tính hệ số tương quan Pearson?

Hệ số tương quan Pearson được tính bằng công thức sau:

5. Giải thích giá trị hệ số tương quan Pearson như thế nào?

Các giá trị hệ số tương quan Pearson được diễn giải dựa trên giá trị tuyệt đối của chúng. Các giá trị có thể có của hệ số tương quan thay đổi từ 0 đến ±1. Giá trị tuyệt đối của r xy càng lớn thì mối quan hệ giữa hai đại lượng càng gần nhau. r xy = 0 biểu thị sự thiếu giao tiếp hoàn toàn. r xy = 1 – biểu thị sự hiện diện của kết nối (chức năng) tuyệt đối. Nếu giá trị của tiêu chí tương quan Pearson lớn hơn 1 hoặc nhỏ hơn -1 thì đã xảy ra lỗi trong tính toán.

Để đánh giá mức độ chặt chẽ hoặc độ mạnh của mối tương quan, các tiêu chí được chấp nhận chung thường được sử dụng, theo đó các giá trị tuyệt đối của r xy< 0.3 свидетельствуют о yếu đuối kết nối, giá trị r xy ​​từ 0,3 đến 0,7 - về kết nối trung bìnhđộ kín, giá trị r xy > 0,7 - o mạnh thông tin liên lạc.

Có thể đạt được ước tính chính xác hơn về cường độ của mối tương quan nếu bạn sử dụng Bàn Chaddock:

Cấp ý nghĩa thống kê Hệ số tương quan r xy được thực hiện bằng phép thử t, được tính theo công thức sau:

Giá trị t thu được được so sánh với giá trị tới hạn ở một mức ý nghĩa nhất định và số bậc tự do n-2. Nếu tr vượt quá t crit thì rút ra kết luận về ý nghĩa thống kê của mối tương quan đã xác định.

6. Ví dụ tính hệ số tương quan Pearson

Mục đích của nghiên cứu là nhằm xác định, xác định mức độ gần gũi và có ý nghĩa thống kê về mối tương quan giữa hai chỉ tiêu định lượng: nồng độ testosterone trong máu (X) và tỷ lệ khối lượng cơ trong cơ thể (Y). Số liệu ban đầu cho một mẫu gồm 5 đối tượng (n=5) được tóm tắt trong bảng.

Trong một số trường hợp, nhà nghiên cứu không biết trước chính xác các giá trị quan sát được của đặc tính đang nghiên cứu được phân bố theo quy luật nào. Nhưng anh ta có thể có những lý do khá chính đáng để cho rằng việc phân phối tuân theo quy luật này hay quy luật khác, chẳng hạn như quy luật chuẩn mực hoặc quy luật đồng nhất. Trong trường hợp này, các giả thuyết thống kê chính và thay thế thuộc loại sau được đưa ra:

    H 0: sự phân bố của đặc tính quan sát tuân theo quy luật phân phối MỘT,

    H 1: sự phân bố của đặc tính được quan sát khác với MỘT;

trong khi MỘT luật phân phối này hoặc luật phân phối khác có thể xuất hiện: bình thường, đồng đều, hàm mũ, v.v.

Việc kiểm tra giả thuyết về quy luật phân phối kỳ vọng được thực hiện bằng cách sử dụng tiêu chí được gọi là mức độ phù hợp. Có một số tiêu chí để thỏa thuận. Tiêu chí phổ biến nhất trong số đó là tiêu chí Pearson, vì nó có thể áp dụng cho bất kỳ loại phân phối nào.

-Tiêu chí Pearson

Thông thường, tần số thực nghiệm và lý thuyết khác nhau. Sự khác biệt tần số có phải là ngẫu nhiên không? Tiêu chí Pearson đưa ra câu trả lời cho câu hỏi này; tuy nhiên, giống như bất kỳ tiêu chí thống kê nào, nó không chứng minh tính hợp lệ của giả thuyết theo nghĩa toán học chặt chẽ mà chỉ thiết lập sự đồng tình hay không đồng tình của nó với dữ liệu quan sát ở một mức ý nghĩa nhất định.

Vì vậy, hãy lấy phân phối thống kê các giá trị thuộc tính từ một mẫu khối, các giá trị thuộc tính được quan sát ở đâu và tần số tương ứng:

Bản chất của tiêu chí Pearson là tính tiêu chí bằng công thức sau:

trong đó là số chữ số của các giá trị quan sát được và là tần số lý thuyết của các giá trị tương ứng.

Rõ ràng là sự khác biệt càng nhỏ thì phân bố thực nghiệm càng gần với phân bố thực nghiệm, do đó, giá trị của tiêu chí càng thấp thì càng có thể khẳng định chắc chắn rằng phân bố thực nghiệm và phân bố lý thuyết tuân theo cùng một quy luật.

Thuật toán tiêu chí Pearson

Thuật toán tiêu chí Pearson rất đơn giản và bao gồm việc thực hiện các bước sau:

Vì vậy, hành động không hề tầm thường duy nhất trong thuật toán này là xác định tần số lý thuyết. Tất nhiên, chúng phụ thuộc vào luật phân phối và do đó được định nghĩa khác nhau đối với các luật khác nhau.

tiêu chí Pearson

tiêu chí Pearson, hoặc phép thử χ2- tiêu chí được sử dụng thường xuyên nhất để kiểm tra giả thuyết về luật phân phối. Trong nhiều bài toán thực tế, luật phân phối chính xác vẫn chưa được biết, tức là nó là một giả thuyết cần được xác minh bằng thống kê.

Chúng ta hãy ký hiệu X là biến ngẫu nhiên đang được nghiên cứu. Giả sử chúng ta muốn kiểm tra một giả thuyết H 0 rằng biến ngẫu nhiên này tuân theo quy luật phân phối F(x) . Để kiểm tra giả thuyết, chúng ta sẽ tạo một mẫu gồm n quan sát độc lập của biến ngẫu nhiên X. Sử dụng mẫu này, chúng ta có thể xây dựng một phân bố thực nghiệm F * (x) của biến ngẫu nhiên đang nghiên cứu. So sánh thực nghiệm F * (x) và phân phối lý thuyết được thực hiện bằng cách sử dụng một biến ngẫu nhiên được chọn đặc biệt - tiêu chí mức độ phù hợp. Một trong những tiêu chí này là tiêu chí Pearson.

Thống kê tiêu chí

Để kiểm tra tiêu chí, số liệu thống kê được nhập:

Ở đâu - ước tính xác suất trúng Tôi-khoảng, - giá trị thực nghiệm tương ứng, N Tôi- số phần tử mẫu từ Tôi-khoảng thứ.

Đại lượng này lần lượt là ngẫu nhiên (do tính chất ngẫu nhiên của X) và phải tuân theo phân bố χ 2.

Quy tắc tiêu chí

Trước khi xây dựng quy tắc chấp nhận hoặc bác bỏ một giả thuyết, cần phải tính đến rằng Tiêu chuẩn Pearson có vùng tới hạn bên phải.

Luật lệ.
Nếu số liệu thống kê thu được vượt quá phân vị của luật phân bố của một mức ý nghĩa nhất định có hoặc có bậc tự do, trong đó k là số quan sát hoặc số khoảng (đối với trường hợp chuỗi biến thiên theo khoảng), và p là số tham số ước lượng của luật phân phối thì giả thuyết bị bác bỏ. Ngược lại, giả thuyết được chấp nhận ở mức ý nghĩa xác định.

Văn học

  • Kendall M., Stewart A. Suy luận thống kê và kết nối. - M.: Nauka, 1973.

Xem thêm

  • Tiêu chí Pearson trên website của Đại học bang Novosibirsk
  • Các bài kiểm tra Chi bình phương trên trang web của Đại học Kỹ thuật Bang Novosibirsk (Khuyến nghị tiêu chuẩn hóa R 50.1.033–2001)
  • Về việc chọn số khoảng trên trang web của Đại học Kỹ thuật Bang Novosibirsk
  • Về tiêu chí Nikulin trên trang web của Đại học Kỹ thuật Bang Novosibirsk

Quỹ Wikimedia. 2010.

Xem “tiêu chí Pearson” là gì trong các từ điển khác:

    Bài kiểm tra Pearson, hay bài kiểm tra χ² (Chi bình phương) là tiêu chí được sử dụng phổ biến nhất để kiểm tra giả thuyết về quy luật phân phối. Trong nhiều bài toán thực tế, luật phân phối chính xác vẫn chưa được biết, tức là giả thuyết cho rằng ... ... Wikipedia

    Hoặc bài kiểm tra mức độ phù hợp của Kolmogorov Smirnov là một bài kiểm tra thống kê được sử dụng để xác định xem hai phân phối thực nghiệm có tuân theo cùng một quy luật hay không, hoặc liệu phân phối kết quả có tuân theo mô hình giả định hay không... ... Wikipedia

    - (tiêu chí maximin) một trong những tiêu chí để ra quyết định trong điều kiện không chắc chắn. Tiêu chí của sự bi quan cực độ. Lịch sử Tiêu chí Wald được đề xuất bởi Abraham Wald vào năm 1955 cho các mẫu có kích thước bằng nhau, sau đó được mở rộng sang ... Wikipedia

    Phép thử Wallis được thiết kế để kiểm tra sự bằng nhau của các trung vị của một số mẫu. Tiêu chí này là sự khái quát hóa đa chiều của phép thử Wilcoxon-Mann-Whitney. Tiêu chí Kruskal Wallis là một tiêu chí xếp hạng, vì vậy nó bất biến đối với bất kỳ... ... Wikipedia

    - (Kiểm tra F, kiểm tra φ*, kiểm tra sự khác biệt nhỏ nhất có ý nghĩa) một kiểm tra thống kê hậu nghiệm được sử dụng để so sánh phương sai của hai chuỗi biến thể, nghĩa là để xác định sự khác biệt đáng kể giữa các trung bình nhóm trong ... ... Wikipedia

    Thử nghiệm Cochran được sử dụng khi so sánh ba hoặc nhiều mẫu có cùng kích thước. Sự khác biệt giữa các phương sai được coi là ngẫu nhiên ở mức ý nghĩa đã chọn nếu: ở đâu là lượng tử của biến ngẫu nhiên với số tổng... ... Wikipedia

    Một bài kiểm tra thống kê được đặt theo tên của Hubert Lilliefors, giáo sư thống kê tại Đại học George Washington, là một sửa đổi của bài kiểm tra Kolmogorov–Smirnov. Được sử dụng để kiểm tra giả thuyết không rằng mẫu... ... Wikipedia

    Để cải thiện bài viết này, điều mong muốn là gì?: Tìm và sắp xếp dưới dạng chú thích cuối trang, liên kết đến các nguồn có thẩm quyền xác nhận những gì đã được viết. Thêm hình ảnh minh họa. T Crete ... Wikipedia

    Trong thống kê, bài kiểm tra mức độ phù hợp của Kolmogorov (còn được gọi là bài kiểm tra mức độ phù hợp của Kolmogorov-Smirnov) được sử dụng để xác định xem hai phân phối thực nghiệm có tuân theo cùng một định luật hay không, hoặc để xác định liệu ... ... Wikipedia

    tiêu chí độc lập- đối với các bảng dự phòng, kiểm tra giả thuyết rằng các biến hàng và cột là độc lập. Các tiêu chí đó bao gồm phép kiểm tra tính độc lập chi bình phương (Pearson) và phép kiểm tra chính xác của Fisher... Từ điển thống kê xã hội học

Sách

  • Tiêu chí để kiểm tra độ lệch của phân bố so với quy luật thống nhất. Hướng dẫn sử dụng: chuyên khảo, Lemeshko B.Yu.. Cuốn sách dành cho các chuyên gia, ở mức độ này hay mức độ khác, đang phải đối mặt với các vấn đề trong hoạt động của họ về phân tích dữ liệu thống kê với việc xử lý kết quả thử nghiệm, ứng dụng...

Kiểm tra thống kê

Quy tắc theo đó giả thuyết I0 bị bác bỏ hay chấp nhận được gọi là tiêu chí thống kê. Tên của tiêu chí, theo quy tắc, chứa một chữ cái biểu thị đặc điểm được biên soạn đặc biệt từ khoản 2 của thuật toán kiểm tra giả thuyết thống kê (xem khoản 4.1), được tính toán trong tiêu chí. Trong các điều kiện của thuật toán này, tiêu chí sẽ được gọi là "V-tiêu chuẩn".

Khi kiểm định các giả thuyết thống kê, có thể xảy ra hai loại lỗi:

  • - Lỗi loại I(bạn có thể bác bỏ giả thuyết I 0 khi nó thực sự đúng);
  • - Lỗi loại II(bạn có thể chấp nhận giả thuyết I 0 khi nó thực sự không đúng).

Xác suất MỘT mắc lỗi loại đầu tiên được gọi là mức ý nghĩa tiêu chí.

Nếu cho R biểu thị xác suất mắc lỗi loại thứ hai, khi đó (l - R) - xác suất không mắc lỗi loại thứ hai, được gọi là sức mạnh của tiêu chí

Kiểm tra mức độ phù hợp x 2 của Pearson

Có một số loại giả thuyết thống kê:

  • - về quy luật phân phối;
  • - tính đồng nhất của mẫu;
  • - giá trị số của các tham số phân phối, v.v.

Chúng ta sẽ xem xét giả thuyết về quy luật phân phối bằng cách sử dụng ví dụ về phép thử mức độ phù hợp x 2 của Pearson.

Tiêu chí thỏa thuậnđược gọi là tiêu chí thống kê để kiểm tra giả thuyết không về quy luật giả định của một phân phối chưa biết.

Thử nghiệm mức độ phù hợp của Pearson dựa trên sự so sánh tần suất quan sát thực nghiệm (được quan sát) và lý thuyết được tính toán theo giả định của một quy luật phân phối nhất định. Giả thuyết số 0 ở đây được xây dựng như sau: theo đặc điểm đang được nghiên cứu, dân số có phân bố chuẩn.

Thuật toán kiểm tra giả thuyết thống kê số 0 cho tiêu chí x 1 Lề:

  • 1) chúng tôi đưa ra giả thuyết I 0 - theo đặc điểm đang được nghiên cứu, dân số nói chung có phân bố chuẩn;
  • 2) tính giá trị trung bình mẫu và độ lệch chuẩn mẫu V;

3) theo cỡ mẫu có sẵn P chúng tôi tính toán một đặc tính được biên soạn đặc biệt,

trong đó: i là tần số thực nghiệm, - tần số lý thuyết,

P - cỡ mẫu,

h- kích thước của khoảng (sự khác biệt giữa hai tùy chọn liền kề),

Giá trị chuẩn hóa của đặc tính được quan sát,

- chức năng bảng. Ngoài ra tần số lý thuyết

có thể được tính bằng hàm MS Excel tiêu chuẩn NORMIDIST bằng công thức;

4) bằng cách sử dụng phân phối mẫu, chúng tôi xác định giá trị tới hạn của đặc tính được biên dịch đặc biệt xl P

5) khi giả thuyết số 0 bị bác bỏ, khi giả thuyết số 0 được chấp nhận.

Ví dụ. Chúng ta hãy xem xét dấu hiệu X- giá trị của các chỉ số kiểm tra đối với người bị kết án ở một trong các khu cải huấn về một số đặc điểm tâm lý, được trình bày dưới dạng chuỗi biến thiên:

Với mức ý nghĩa 0,05, hãy kiểm định giả thuyết về phân bố chuẩn của tổng thể.

1. Dựa trên phân bố thực nghiệm, có thể đưa ra giả thuyết H 0: theo tiêu chí nghiên cứu “giá trị của chỉ số kiểm tra đối với một đặc điểm tâm lý nhất định”, dân số nói chung

dự kiến ​​được phân phối bình thường. Giả thuyết thay thế 1: theo tiêu chí được nghiên cứu “giá trị của chỉ số kiểm tra đối với một đặc điểm tâm lý nhất định”, dân số chung của những người bị kết án không được phân phối bình thường.

2. Hãy tính các đặc tính mẫu số:

Khoảng thời gian

x g y

X) học

3. Hãy tính đặc tính được biên dịch đặc biệt j 2 . Để làm điều này, ở cột áp chót của bảng trước, chúng ta tìm thấy tần số lý thuyết bằng cách sử dụng công thức và ở cột cuối cùng

Hãy tính đặc điểm % 2. Chúng tôi nhận được x 2 = 0,185.

Để rõ ràng, chúng tôi sẽ xây dựng một đa giác phân bố theo kinh nghiệm và một đường cong chuẩn tắc dựa trên tần số lý thuyết (Hình 6).

Cơm. 6.

4. Xác định số bậc tự do S: k = 5, t = 2, s = 5-2-1 = 2.

Theo bảng hoặc sử dụng hàm MS Excel chuẩn “HI20BR” cho số bậc tự do 5=2 và mức ý nghĩa một = 0,05 chúng ta sẽ tìm được giá trị tới hạn của tiêu chí xl P.=5,99. Về mức ý nghĩa MỘT= 0,01 giá trị tiêu chí quan trọng X%. = 9,2.

5. Giá trị tiêu chí quan sát X=0,185 nhỏ hơn tất cả các giá trị tìm thấy Hk R.-> do đó, giả thuyết I 0 được chấp nhận ở cả hai mức ý nghĩa. Sự khác biệt giữa tần số thực nghiệm và lý thuyết là không đáng kể. Do đó, dữ liệu quan sát phù hợp với giả thuyết về phân bố dân số bình thường. Do đó, theo tiêu chí được nghiên cứu “giá trị của chỉ số kiểm tra đối với một đặc điểm tâm lý nhất định”, dân số chung của những người bị kết án được phân bổ bình thường.

  • 1. Koryachko A.V., Kulichenko A.G. Toán cao cấp và các phương pháp toán trong tâm lý học: hướng dẫn các lớp học thực hành cho sinh viên Khoa Tâm lý học. Ryazan, 1994.
  • 2. Nasledov A.D. Phương pháp toán học nghiên cứu tâm lý học. Phân tích và giải thích dữ liệu: Sách giáo khoa, sổ tay. St Petersburg, 2008.
  • 3. Sidorenko E.V. Các phương pháp xử lý toán học trong tâm lý học. St Petersburg, 2010.
  • 4. Soshnikova L.A. và những nội dung khác Phân tích thống kê đa biến trong kinh tế học: Sách giáo khoa, cẩm nang dành cho đại học. M., 1999.
  • 5. Sukhodolsky E.V. Phương pháp toán học trong tâm lý học. Kharkov, 2004.
  • 6. Shmoilova R.A., Minashkin V.E., Sadovnikova N.A. Hội thảo lý thuyết thống kê: Sách giáo khoa, sổ tay. M., 2009.
  • Gmurman V.E. Lý thuyết xác suất và thống kê toán học. P. 465.

Tiêu chí Pearson để kiểm định giả thuyết về dạng luật phân phối của một biến ngẫu nhiên. Kiểm tra các giả thuyết về phân phối chuẩn, hàm mũ và đồng đều bằng tiêu chí Pearson. Tiêu chuẩn Kolmogorov. Một phương pháp gần đúng để kiểm tra tính chuẩn của phân phối, liên quan đến ước tính hệ số độ lệch và độ nhọn.

Trong bài giảng trước, các giả thuyết đã được xem xét trong đó quy luật phân bố của dân số được cho là đã biết. Bây giờ chúng ta sẽ bắt đầu kiểm tra các giả thuyết về quy luật phân phối chưa biết được cho là, nghĩa là chúng ta sẽ kiểm tra giả thuyết khống rằng dân số được phân phối theo một số quy luật đã biết. Thông thường, các bài kiểm tra thống kê để kiểm tra các giả thuyết như vậy được gọi là bài kiểm tra mức độ phù hợp.

Ưu điểm của tiêu chí Pearson là tính phổ quát của nó: nó có thể được sử dụng để kiểm tra các giả thuyết về các quy luật phân phối khác nhau.

1. Kiểm định giả thuyết phân phối chuẩn.

Lấy một mẫu đủ lớn P với một số lượng lớn các tùy chọn ý nghĩa khác nhau. Để thuận tiện cho việc xử lý, chúng tôi chia khoảng từ giá trị nhỏ nhất đến giá trị lớn nhất của tùy chọn thành S phần bằng nhau và chúng ta sẽ giả sử rằng các giá trị khác nhau

số kiến ​​rơi vào mỗi khoảng xấp xỉ bằng số lượng kiến ​​ở giữa khoảng đó. Bằng cách đếm số lượng tùy chọn rơi vào từng khoảng, chúng ta sẽ tạo ra một mẫu được gọi là mẫu được nhóm:

tùy chọn X 1 X 2 x s

tần số P 1 P 2 n s ,

Ở đâu x tôi- giá trị của phần giữa của các khoảng và và tôi- số lượng tùy chọn bao gồm trong Tôi-khoảng (tần số thực nghiệm).

Từ dữ liệu thu được, bạn có thể tính giá trị trung bình mẫu và độ lệch chuẩn mẫu σ B. Hãy kiểm tra giả định rằng dân số được phân phối theo luật chuẩn với các tham số M(X) = , D(X) = . Sau đó, bạn có thể tìm thấy số lượng từ kích thước mẫu P, phải nằm trong mỗi khoảng theo giả định này (nghĩa là tần số lý thuyết). Để làm điều này, sử dụng bảng giá trị của hàm Laplace, chúng ta tìm được xác suất lọt vào Tôi khoảng thứ:

,

Ở đâu và tôitôi- ranh giới Tôi-khoảng thứ. Bằng cách nhân xác suất thu được với cỡ mẫu n, chúng ta tìm được tần số lý thuyết: p tôi =n?p tôi. Mục tiêu của chúng tôi là so sánh tần số thực nghiệm và lý thuyết, tất nhiên, khác nhau và tìm hiểu xem những khác biệt này có đáng kể hay không, không bác bỏ giả thuyết về phân phối chuẩn của biến ngẫu nhiên đang nghiên cứu, hay chúng thực sự là như vậy. lớn đến mức chúng mâu thuẫn với giả thuyết này. Với mục đích này, tiêu chí ở dạng biến ngẫu nhiên được sử dụng

. (20.1)

Ý nghĩa của nó rất rõ ràng: các phần mà bình phương độ lệch của tần số thực nghiệm so với tần số lý thuyết tạo thành từ tần số lý thuyết tương ứng được tổng hợp lại. Có thể chứng minh rằng, bất chấp quy luật phân phối thực của tổng thể, quy luật phân phối của biến ngẫu nhiên (20.1) đều hướng tới quy luật phân phối (xem bài 12) với số bậc tự do k = s - 1 - r, Ở đâu r- số tham số của phân bố kỳ vọng được ước lượng từ dữ liệu mẫu. Phân phối chuẩn được đặc trưng bởi hai tham số, do đó k = s - 3. Đối với tiêu chí đã chọn, vùng tới hạn bên phải được xây dựng, xác định bởi điều kiện


(20.2)

Ở đâu α - mức độ đáng kể. Do đó, vùng tới hạn được cho bởi bất đẳng thức và diện tích chấp nhận giả thuyết là .

Vì vậy, để kiểm tra giả thuyết không N 0: dân số có phân phối chuẩn - bạn cần tính giá trị quan sát được của tiêu chí từ mẫu:

, (20.1`)

và sử dụng bảng điểm tới hạn của phân bố χ 2, tìm điểm tới hạn bằng cách sử dụng các giá trị đã biết của α và k = s - 3. Nếu - giả thuyết không được chấp nhận, nếu nó bị bác bỏ.

2. Kiểm định giả thuyết phân bố đều.

Khi sử dụng tiêu chí Pearson để kiểm định giả thuyết về sự phân bố đồng đều của tổng thể với mật độ xác suất ước lượng

Cần phải tính toán giá trị từ mẫu có sẵn để ước tính các tham số MỘTb theo các công thức:

Ở đâu MỘT*b*- đánh giá MỘTb. Thật vậy, để phân phối đồng đều M(X) = , , nơi bạn có thể có được một hệ thống để xác định MỘT*b*: , nghiệm của nó là biểu thức (20.3).

Sau đó, giả sử rằng , bạn có thể tìm thấy tần số lý thuyết bằng cách sử dụng các công thức

Đây S- số khoảng thời gian mà mẫu được chia.

Giá trị quan sát của tiêu chí Pearson được tính bằng công thức (20.1`) và giá trị tới hạn được tính bằng bảng, có tính đến thực tế là số bậc tự do k = s - 3. Sau đó, ranh giới của vùng tới hạn được xác định theo cách tương tự như để kiểm tra giả thuyết về phân bố chuẩn.

3. Kiểm định giả thuyết về phân bố mũ.

Trong trường hợp này, sau khi chia mẫu hiện có thành các khoảng có độ dài bằng nhau, chúng tôi xem xét chuỗi các tùy chọn, cách đều nhau (chúng tôi giả định rằng tất cả các tùy chọn rơi vào Tôi khoảng thứ, lấy giá trị trùng với điểm giữa của nó) và tần số tương ứng của chúng và tôi(số lượng tùy chọn mẫu có trong Tôi-khoảng thứ). Chúng ta hãy tính toán từ những dữ liệu này và lấy ước tính của tham số λ kích cỡ. Sau đó, tần số lý thuyết được tính bằng công thức

Sau đó, giá trị quan sát được và giá trị tới hạn của tiêu chí Pearson được so sánh, có tính đến thực tế là số bậc tự do k = s - 2.