Khoảng tin cậy cho kỳ vọng toán học. Mẫu và khoảng tin cậy

Khoảng tin cậy cho kỳ vọng toán học - đây là khoảng được tính toán từ dữ liệu, với xác suất đã biết, chứa kỳ vọng toán học của tổng thể nói chung. Ước tính tự nhiên cho kỳ vọng toán học là giá trị trung bình số học của các giá trị quan sát được của nó. Vì vậy, xuyên suốt bài học chúng ta sẽ sử dụng các thuật ngữ “trung bình” và “giá trị trung bình”. Trong các bài toán tính khoảng tin cậy, câu trả lời thường được yêu cầu nhất là “Khoảng tin cậy của số trung bình [giá trị trong một bài toán cụ thể] là từ [giá trị nhỏ hơn] đến [giá trị lớn hơn]”. Sử dụng khoảng tin cậy, bạn có thể đánh giá không chỉ các giá trị trung bình mà còn cả tỷ lệ của một đặc điểm cụ thể của dân số nói chung. Các giá trị trung bình, độ phân tán, độ lệch chuẩn và sai số, qua đó chúng ta sẽ đi đến các định nghĩa và công thức mới, sẽ được thảo luận trong bài học Đặc điểm của mẫu và dân số .

Ước tính điểm và khoảng của giá trị trung bình

Nếu giá trị trung bình của tổng thể được ước tính bằng một số (điểm), thì giá trị trung bình cụ thể, được tính từ một mẫu quan sát, sẽ được lấy làm ước tính giá trị trung bình chưa biết của tổng thể. Trong trường hợp này, giá trị trung bình của mẫu - một biến ngẫu nhiên - không trùng với giá trị trung bình của tổng thể nói chung. Vì vậy, khi chỉ ra giá trị trung bình mẫu, bạn phải đồng thời chỉ ra sai số lấy mẫu. Thước đo sai số lấy mẫu là sai số chuẩn, được biểu thị bằng cùng đơn vị với giá trị trung bình. Vì vậy, ký hiệu sau thường được sử dụng: .

Nếu ước tính giá trị trung bình cần gắn liền với một xác suất nhất định thì tham số quan tâm trong tổng thể phải được đánh giá không phải bằng một con số mà bằng một khoảng. Khoảng tin cậy là khoảng trong đó, với một xác suất nhất định P giá trị của chỉ số dân số ước tính được tìm thấy. Khoảng tin cậy trong đó có thể xảy ra P = 1 - α biến ngẫu nhiên được tìm thấy, được tính như sau:

,

α = 1 - P, có thể tìm thấy trong phần phụ lục của hầu hết mọi cuốn sách về thống kê.

Trong thực tế, trung bình và phương sai của tổng thể không được biết, do đó phương sai tổng thể được thay thế bằng phương sai mẫu và trung bình tổng thể được thay thế bằng trung bình mẫu. Do đó, khoảng tin cậy trong hầu hết các trường hợp được tính như sau:

.

Công thức khoảng tin cậy có thể được sử dụng để ước lượng giá trị trung bình của tổng thể nếu

  • độ lệch chuẩn của tổng thể đã biết;
  • hoặc độ lệch chuẩn của tổng thể chưa được biết nhưng cỡ mẫu lớn hơn 30.

Giá trị trung bình mẫu là ước tính không thiên vị của giá trị trung bình tổng thể. Ngược lại, phương sai mẫu không phải là một ước tính không chệch của phương sai tổng thể. Để có được ước tính không thiên vị về phương sai tổng thể trong công thức phương sai mẫu, cỡ mẫu N nên được thay thế bằng N-1.

Ví dụ 1. Thông tin được thu thập từ 100 quán cà phê được chọn ngẫu nhiên ở một thành phố nhất định cho thấy số lượng nhân viên trung bình ở đó là 10,5 với độ lệch chuẩn là 4,6. Xác định khoảng tin cậy 95% cho số lượng nhân viên quán cà phê.

đâu là giá trị tới hạn của phân phối chuẩn chuẩn hóa đối với mức ý nghĩa α = 0,05 .

Như vậy, khoảng tin cậy 95% cho số lượng nhân viên quán cà phê trung bình dao động từ 9,6 đến 11,4.

Ví dụ 2.Đối với một mẫu ngẫu nhiên từ tổng thể gồm 64 quan sát, tổng giá trị sau đã được tính:

tổng giá trị trong các quan sát,

tổng độ lệch bình phương của các giá trị so với giá trị trung bình .

Tính khoảng tin cậy 95% cho kỳ vọng toán học.

Hãy tính độ lệch chuẩn:

,

Hãy tính giá trị trung bình:

.

Chúng tôi thay thế các giá trị vào biểu thức cho khoảng tin cậy:

đâu là giá trị tới hạn của phân phối chuẩn chuẩn hóa đối với mức ý nghĩa α = 0,05 .

Chúng tôi nhận được:

Do đó, khoảng tin cậy 95% cho kỳ vọng toán học của mẫu này nằm trong khoảng từ 7,484 đến 11,266.

Ví dụ 3.Đối với một mẫu dân số ngẫu nhiên gồm 100 quan sát, giá trị trung bình được tính toán là 15,2 và độ lệch chuẩn là 3,2. Tính khoảng tin cậy 95% cho giá trị mong đợi, sau đó là khoảng tin cậy 99%. Nếu công suất mẫu và độ biến thiên của nó không thay đổi và hệ số tin cậy tăng lên thì khoảng tin cậy sẽ thu hẹp hay mở rộng?

Chúng tôi thay thế các giá trị này vào biểu thức cho khoảng tin cậy:

đâu là giá trị tới hạn của phân phối chuẩn chuẩn hóa đối với mức ý nghĩa α = 0,05 .

Chúng tôi nhận được:

.

Như vậy, khoảng tin cậy 95% cho giá trị trung bình của mẫu này dao động từ 14,57 đến 15,82.

Chúng tôi lại thay thế các giá trị này vào biểu thức cho khoảng tin cậy:

đâu là giá trị tới hạn của phân phối chuẩn chuẩn hóa đối với mức ý nghĩa α = 0,01 .

Chúng tôi nhận được:

.

Do đó, khoảng tin cậy 99% cho giá trị trung bình của mẫu này dao động từ 14,37 đến 16,02.

Như chúng ta thấy, khi hệ số tin cậy tăng lên, giá trị tới hạn của phân bố chuẩn chuẩn hóa cũng tăng lên, và do đó, điểm bắt đầu và điểm kết thúc của khoảng nằm xa giá trị trung bình hơn, và do đó khoảng tin cậy cho kỳ vọng toán học tăng lên. .

Ước tính điểm và khoảng của trọng lượng riêng

Tỷ lệ của một số thuộc tính mẫu có thể được hiểu là ước tính điểm của tỷ lệ P có cùng đặc điểm trong dân số nói chung. Nếu giá trị này cần được liên kết với xác suất thì phải tính khoảng tin cậy của trọng lượng riêng Pđặc trưng trong dân số với xác suất P = 1 - α :

.

Ví dụ 4.Ở một thành phố nào đó có hai ứng cử viên MỘTBđang tranh cử thị trưởng. 200 cư dân thành phố được khảo sát ngẫu nhiên, trong đó 46% trả lời rằng họ sẽ bỏ phiếu cho ứng cử viên MỘT, 26% - dành cho ứng viên B và 28% không biết họ sẽ bầu cho ai. Xác định khoảng tin cậy 95% cho tỷ lệ người dân thành phố ủng hộ ứng cử viên MỘT.

Hướng dẫn

Xin lưu ý rằng khoảng thời gian(l1 hoặc l2), khu vực trung tâm của nó sẽ là ước tính l* và cũng là nơi chứa giá trị thực của tham số, sẽ là độ tin cậy khoảng thời gian om hoặc giá trị tương ứng của xác suất tin cậy alpha. Trong trường hợp này, chính l* sẽ đề cập đến ước tính điểm. Ví dụ: dựa trên kết quả của bất kỳ giá trị mẫu nào có giá trị ngẫu nhiên X (x1, x2,..., xn), cần phải tính toán tham số chưa biết của chỉ báo l, mà sự phân bố sẽ phụ thuộc vào đó. Trong trường hợp này, việc ước tính một tham số l* đã cho sẽ bao gồm thực tế là đối với mỗi mẫu sẽ cần phải gán một giá trị nhất định của tham số, nghĩa là tạo ra một hàm về kết quả quan sát của chỉ báo Q , giá trị của nó sẽ được lấy bằng giá trị ước tính của tham số l* dưới dạng công thức : l*=Q*(x1, x2,..., xn).

Xin lưu ý rằng bất kỳ chức năng nào dựa trên kết quả quan sát đều được gọi là thống kê. Hơn nữa, nếu nó mô tả đầy đủ tham số (hiện tượng) đang xét thì gọi là thống kê đầy đủ. Và vì kết quả quan sát là ngẫu nhiên nên l* cũng sẽ là một biến ngẫu nhiên. Nhiệm vụ tính toán số liệu thống kê phải được thực hiện có tính đến các tiêu chí về chất lượng của nó. Ở đây cần phải tính đến quy luật phân phối của ước tính khá xác định, phân bố mật độ xác suất W(x, l).

Bạn có thể tính toán sự tin cậy khoảng thời gian khá đơn giản nếu bạn biết luật về phân bổ đánh giá. Ví dụ, một người được ủy thác khoảng thời gianước tính liên quan đến kỳ vọng toán học (giá trị trung bình của một giá trị ngẫu nhiên) mx* =(1/n)*(x1+x2+ …+xn) . Ước tính này sẽ không thiên vị, nghĩa là kỳ vọng toán học hoặc giá trị trung bình của chỉ báo sẽ bằng giá trị thực của tham số (M(mx*) = mx).

Bạn có thể thiết lập rằng phương sai của ước tính dựa trên kỳ vọng toán học là: bx*^2=Dx/n. Dựa vào định lý trung tâm giới hạn, chúng ta có thể rút ra kết luận tương ứng rằng luật phân phối của ước lượng này là Gaussian (chuẩn mực). Do đó, để thực hiện các phép tính, bạn có thể sử dụng chỉ báo Ф(z) - tích phân của xác suất. Trong trường hợp này, chọn độ dài của độ tin cậy khoảng thời gian và 2ld, do đó bạn nhận được: alpha = P(mx-ld (sử dụng tính chất tích phân xác suất theo công thức: Ф(-z)=1- Ф(z)).

Xây dựng lòng tin khoảng thời gianước lượng kỳ vọng toán học: - tìm giá trị của công thức (alpha + 1)/2; - chọn từ bảng tích phân xác suất một giá trị bằng lд/sqrt(Dx/n); - lấy ước tính độ phân tán thực: Dx *=(1/n)*( (x1 - mx*)^2+(x2 - mx*)^2+…+(xn - mx*)^2); - xác định ld; - tìm độ tin cậy khoảng thời gian theo công thức: (mx*-ld, mx*+ld).

Khoảng tin cậy(CI; trong tiếng Anh, khoảng tin cậy - CI) thu được trong một nghiên cứu với một mẫu đưa ra thước đo về độ chính xác (hoặc độ không chắc chắn) của kết quả nghiên cứu để đưa ra kết luận về dân số của tất cả các bệnh nhân đó (dân số nói chung). Định nghĩa chính xác về CI 95% có thể được xây dựng như sau: 95% các khoảng như vậy sẽ chứa giá trị thực trong tổng thể. Cách giải thích này có phần kém chính xác hơn: CI là phạm vi giá trị mà bạn có thể chắc chắn 95% rằng nó chứa giá trị thực. Khi sử dụng CI, trọng tâm là xác định tác động định lượng, trái ngược với giá trị P là kết quả của việc kiểm tra ý nghĩa thống kê. Giá trị P không ước tính bất kỳ đại lượng nào mà đóng vai trò như thước đo độ mạnh của bằng chứng chống lại giả thuyết khống về “không có tác dụng”. Bản thân giá trị của P không cho chúng ta biết bất cứ điều gì về độ lớn của sự khác biệt, hoặc thậm chí về hướng của nó. Vì vậy, giá trị P độc lập hoàn toàn không mang tính thông tin trong các bài viết hoặc tóm tắt. Ngược lại, CI chỉ ra cả mức độ ảnh hưởng của lợi ích trước mắt, chẳng hạn như lợi ích của việc điều trị, và sức mạnh của bằng chứng. Vì vậy, DI liên quan trực tiếp đến việc thực hành EBM.

Phương pháp ước tính để phân tích thống kê, được minh họa bằng CI, nhằm mục đích đo lường mức độ ảnh hưởng được quan tâm (độ nhạy của xét nghiệm chẩn đoán, tỷ lệ các trường hợp được dự đoán, mức giảm rủi ro tương đối khi điều trị, v.v.) và cũng để đo lường mức độ không chắc chắn trong đó tác dụng. Thông thường, CI là phạm vi giá trị ở hai bên của ước tính trong đó giá trị thực có khả năng nằm và bạn có thể chắc chắn 95% về giá trị đó. Thỏa thuận sử dụng xác suất 95% là tùy ý, cũng như giá trị P.<0,05 для оценки статистической значимости, и авторы иногда используют 90% или 99% ДИ. Заметим, что слово «интервал» означает диапазон величин и поэтому стоит в единственном числе. Две величины, которые ограничивают интервал, называются «доверительными пределами».

CI dựa trên ý tưởng rằng cùng một nghiên cứu được thực hiện trên các mẫu bệnh nhân khác nhau sẽ không tạo ra kết quả giống nhau mà kết quả của họ sẽ được phân bổ xung quanh một giá trị thực nhưng chưa xác định. Nói cách khác, CI mô tả nó là “sự biến thiên phụ thuộc vào mẫu”. CI không phản ánh sự không chắc chắn bổ sung do các lý do khác; đặc biệt, nó không bao gồm tác động của việc mất việc theo dõi có chọn lọc, việc tuân thủ kém hoặc đo lường kết quả không chính xác, thiếu sự mù quáng, v.v. Do đó, CI luôn đánh giá thấp tổng mức độ không chắc chắn.

Tính toán khoảng tin cậy

Bảng A1.1. Sai số chuẩn và khoảng tin cậy cho các phép đo lâm sàng được chọn

Thông thường, CI được tính từ ước tính quan sát được của một đại lượng, chẳng hạn như chênh lệch (d) giữa hai tỷ lệ và sai số chuẩn (SE) trong ước tính chênh lệch đó. Khoảng tin cậy 95% thu được theo cách này là d ± 1,96 SE. Công thức thay đổi tùy theo bản chất của thước đo kết quả và phạm vi của CI. Ví dụ, trong một thử nghiệm ngẫu nhiên, có đối chứng giả dược về vắc-xin ho gà vô bào, 72 trong số 1670 (4,3%) trẻ sơ sinh được tiêm vắc-xin đã phát triển bệnh ho gà và 240 trong số 1665 (14,4%) ở nhóm đối chứng. Tỷ lệ phần trăm chênh lệch, được gọi là mức giảm rủi ro tuyệt đối, là 10,1%. SE của chênh lệch này là 0,99%. Theo đó, CI 95% là 10,1% + 1,96 x 0,99%, tức là từ 8,2 đến 12,0.

Mặc dù các cách tiếp cận triết học khác nhau, CI và các bài kiểm tra ý nghĩa thống kê có liên quan chặt chẽ về mặt toán học.

Do đó, giá trị P là “có ý nghĩa”, tức là R<0,05 соответствует 95% ДИ, который исключает величину эффекта, указывающую на отсутствие различия. Например, для различия между двумя средними пропорциями это ноль, а для относительного риска или отношения шансов - единица. При некоторых обстоятельствах эти два подхода могут быть не совсем эквивалентны. Преобладающая точка зрения: оценка с помощью ДИ - предпочтительный подход к суммированию результатов исследования, но ДИ и величина Р взаимодополняющи, и во многих статьях используются оба способа представления результатов.

Độ không đảm bảo (không chính xác) của ước tính, được biểu thị bằng CI, phần lớn liên quan đến căn bậc hai của cỡ mẫu. Các mẫu nhỏ cung cấp ít thông tin hơn các mẫu lớn và CI tương ứng sẽ rộng hơn trong mẫu nhỏ hơn. Ví dụ, một bài báo so sánh hiệu suất của ba xét nghiệm được sử dụng để chẩn đoán nhiễm Helicobacter pylori đã báo cáo độ nhạy của xét nghiệm urê trong hơi thở là 95,8% (KTC 95% 75–100). Trong khi con số 95,8% là ấn tượng, mẫu nhỏ gồm 24 bệnh nhân người lớn nhiễm J. pylori có nghĩa là có sự không chắc chắn đáng kể trong ước tính này, như được thể hiện bởi CI rộng. Thật vậy, giới hạn dưới 75% thấp hơn nhiều so với ước tính 95,8%. Nếu độ nhạy tương tự được quan sát thấy trong một mẫu gồm 240 người thì khoảng tin cậy 95% sẽ là 92,5–98,0, mang lại sự đảm bảo hơn rằng xét nghiệm có độ nhạy cao.

Trong các thử nghiệm ngẫu nhiên có đối chứng (RCT), các kết quả không có ý nghĩa (tức là những kết quả có P >0,05) đặc biệt dễ bị hiểu sai. CI đặc biệt hữu ích ở đây vì nó cho thấy kết quả phù hợp như thế nào với tác dụng thực sự hữu ích trên lâm sàng. Ví dụ, trong một RCT so sánh khâu nối đại tràng và khâu nối chủ yếu, nhiễm trùng vết thương phát triển ở 10,9% và 13,5% bệnh nhân tương ứng (P = 0,30). CI 95% cho sự khác biệt này là 2,6% (−2 đến +8). Ngay cả trong nghiên cứu 652 bệnh nhân này, vẫn có khả năng có sự khác biệt khiêm tốn về tỷ lệ nhiễm trùng do hai thủ thuật. Càng ít nghiên cứu, độ không chắc chắn càng lớn. Sung và cộng sự. đã thực hiện RCT để so sánh truyền octreotide với liệu pháp xơ cứng cấp tính đối với xuất huyết do giãn tĩnh mạch cấp tính ở 100 bệnh nhân. Ở nhóm octreotide, tỷ lệ kiểm soát chảy máu là 84%; trong nhóm điều trị xơ cứng - 90%, cho P = 0,56. Lưu ý rằng tỷ lệ chảy máu liên tục cũng tương tự như tỷ lệ nhiễm trùng vết thương trong nghiên cứu đã đề cập. Tuy nhiên, trong trường hợp này, khoảng tin cậy 95% cho sự khác biệt giữa các biện pháp can thiệp là 6% (−7 đến +19). Phạm vi này khá rộng so với mức chênh lệch 5% có thể được quan tâm về mặt lâm sàng. Rõ ràng, nghiên cứu không loại trừ sự khác biệt đáng kể về hiệu quả. Vì vậy, kết luận của tác giả “truyền octreotide và liệu pháp xơ cứng đều có hiệu quả như nhau trong điều trị chảy máu do giãn tĩnh mạch” chắc chắn là không có căn cứ. Trong những trường hợp như thế này, như ở đây, CI 95% để giảm rủi ro tuyệt đối (ARR) bao gồm 0, CI cho NNT (số cần điều trị) khá khó diễn giải. NPL và CI của nó được lấy từ các nghịch đảo của ACP (nhân với 100 nếu các giá trị này được đưa ra dưới dạng phần trăm). Ở đây chúng tôi nhận được NPL = 100: 6 = 16,6 với CI 95% là -14,3 đến 5,3. Như có thể thấy từ chú thích “d” trong bảng. A1.1, CI này bao gồm các giá trị NPL từ 5,3 đến vô cùng và NPL từ 14,3 đến vô cùng.

CI có thể được xây dựng cho các ước tính hoặc so sánh thống kê được sử dụng phổ biến nhất. Đối với RCT, nó bao gồm sự khác biệt giữa tỷ lệ trung bình, rủi ro tương đối, tỷ lệ chênh lệch và NLR. Tương tự, có thể thu được CI cho tất cả các ước tính chính được thực hiện trong các nghiên cứu về độ chính xác của xét nghiệm chẩn đoán—độ nhạy, độ đặc hiệu, giá trị tiên đoán dương (tất cả đều là tỷ lệ đơn giản) và tỷ lệ khả năng—các ước tính thu được trong phân tích tổng hợp và so sánh với kiểm soát học. Một chương trình máy tính cá nhân bao gồm nhiều cách sử dụng MDI này có sẵn trong ấn bản thứ hai của Thống kê đáng tin cậy. Macro để tính CI cho các tỷ lệ được cung cấp miễn phí cho Excel và các chương trình thống kê SPSS và Minitab tại http://www.uwcm.ac.uk/study/medicine/epidemiology_statistics/research/statistics/proportions, htm.

Nhiều ước tính về hiệu quả điều trị

Mặc dù CI là cần thiết cho các kết quả nghiên cứu cơ bản nhưng chúng không cần thiết cho tất cả các kết quả. CI liên quan đến những so sánh quan trọng về mặt lâm sàng. Ví dụ: khi so sánh hai nhóm, CI chính xác là CI được xây dựng cho sự khác biệt giữa các nhóm, như thể hiện trong các ví dụ trên chứ không phải CI có thể được xây dựng cho ước tính trong mỗi nhóm. Việc cung cấp các TCTD riêng biệt cho các ước tính trong mỗi nhóm không những không hữu ích mà cách trình bày này còn có thể gây hiểu nhầm. Tương tự, cách tiếp cận đúng khi so sánh hiệu quả điều trị ở các phân nhóm khác nhau là so sánh trực tiếp hai (hoặc nhiều) phân nhóm. Sẽ không chính xác khi cho rằng một phương pháp điều trị chỉ có hiệu quả ở một nhóm nhỏ nếu CI của nó loại trừ giá trị tương ứng với việc không có tác dụng còn các nhóm khác thì không. CI cũng hữu ích khi so sánh kết quả giữa nhiều nhóm con. Trong bộ lễ phục. Hình 1.1 cho thấy nguy cơ tương đối sản giật ở phụ nữ bị tiền sản giật trong các phân nhóm phụ nữ từ RCT magie sulfat đối chứng giả dược.

Cơm. A1.2. Sơ đồ rừng cho thấy kết quả của 11 thử nghiệm lâm sàng ngẫu nhiên về vắc xin rotavirus ở bò để phòng ngừa tiêu chảy so với giả dược. Khoảng tin cậy 95% được sử dụng để ước tính nguy cơ tương đối của bệnh tiêu chảy. Kích thước của hình vuông màu đen tỷ lệ thuận với lượng thông tin. Ngoài ra, ước tính tóm tắt về hiệu quả điều trị và khoảng tin cậy 95% (được biểu thị bằng hình thoi) cũng được hiển thị. Phân tích tổng hợp sử dụng mô hình hiệu ứng ngẫu nhiên lớn hơn một số mô hình được chỉ định trước; ví dụ: đây có thể là cỡ được sử dụng để tính cỡ mẫu. Tiêu chí nghiêm ngặt hơn yêu cầu toàn bộ phạm vi CI phải thể hiện lợi ích lớn hơn mức tối thiểu được xác định trước.

Chúng ta đã thảo luận về sai lầm khi coi việc thiếu ý nghĩa thống kê là dấu hiệu cho thấy hai phương pháp điều trị đều có hiệu quả như nhau. Điều quan trọng không kém là không đánh đồng ý nghĩa thống kê với tầm quan trọng về mặt lâm sàng. Tầm quan trọng lâm sàng có thể được thừa nhận khi kết quả có ý nghĩa thống kê và mức độ ước tính hiệu quả điều trị

Các nghiên cứu có thể chỉ ra liệu kết quả có ý nghĩa thống kê và kết quả nào quan trọng về mặt lâm sàng và kết quả nào không. Trong bộ lễ phục. A1.2 cho thấy kết quả của bốn thử nghiệm, trong đó toàn bộ CI<1, т.е. их результаты статистически значимы при Р <0,05 , . После высказанного предположения о том, что клинически важным различием было бы сокращение риска диареи на 20% (ОР = 0,8), все эти испытания показали клинически значимую оценку сокращения риска, и лишь в исследовании Treanor весь 95% ДИ меньше этой величины. Два других РКИ показали клинически важные результаты, которые не были статистически значимыми. Обратите внимание, что в трёх испытаниях точечные оценки эффективности лечения были почти идентичны, но ширина ДИ различалась (отражает размер выборки). Таким образом, по отдельности доказательная сила этих РКИ различна.

Giả sử chúng ta có một số lượng lớn các mặt hàng có phân bố chuẩn về một số đặc điểm (ví dụ: một kho đầy đủ các loại rau cùng loại, kích thước và trọng lượng của chúng khác nhau). Bạn muốn biết đặc điểm trung bình của cả lô hàng nhưng bạn không có thời gian cũng như không muốn đo, cân từng loại rau. Bạn hiểu rằng điều này là không cần thiết. Nhưng cần phải lấy bao nhiêu mảnh để kiểm tra tại chỗ?

Trước khi đưa ra một số công thức hữu ích cho tình huống này, chúng ta hãy nhớ lại một số ký hiệu.

Thứ nhất, nếu chúng ta đo toàn bộ kho rau (tập hợp các yếu tố này được gọi là tổng thể), thì chúng ta sẽ biết với tất cả độ chính xác có sẵn về trọng lượng trung bình của cả lô. Hãy gọi đây là mức trung bình X trung bình .g vi . - trung bình chung. Chúng ta đã biết cái gì được xác định hoàn toàn nếu biết giá trị trung bình và độ lệch s của nó . Đúng, mặc dù chúng tôi không thuộc thế hệ X trung bình. S Chúng tôi không biết dân số nói chung. Chúng ta chỉ có thể lấy một mẫu nhất định, đo các giá trị cần thiết và tính toán cho mẫu này cả giá trị trung bình X trung bình và độ lệch chuẩn S chọn.

Được biết, nếu kiểm tra mẫu của chúng tôi chứa một số lượng lớn các phần tử (thường n lớn hơn 30) và chúng được lấy thực sự ngẫu nhiên, thì s dân số nói chung sẽ hầu như không khác biệt với lựa chọn S ..

Ngoài ra, đối với trường hợp phân phối chuẩn chúng ta có thể sử dụng các công thức sau:

Với xác suất 95%


Với xác suất 99%



Nói chung, với xác suất P (t)


Mối quan hệ giữa giá trị t và giá trị xác suất P (t), mà chúng ta muốn biết khoảng tin cậy, có thể được lấy từ bảng sau:


Vì vậy, chúng tôi đã xác định được giá trị trung bình của tổng thể nằm trong phạm vi nào (với xác suất cho trước).

Trừ khi chúng ta có mẫu đủ lớn, chúng ta không thể nói rằng tổng thể có s = chọn Ngoài ra, trong trường hợp này độ gần của mẫu với phân bố chuẩn là có vấn đề. Trong trường hợp này chúng ta cũng sử dụng S select thay thế s trong công thức:




nhưng giá trị của t với xác suất cố định P(t) sẽ phụ thuộc vào số phần tử trong mẫu n. N càng lớn thì khoảng tin cậy thu được sẽ càng gần với giá trị được cho bởi công thức (1). Các giá trị t trong trường hợp này được lấy từ một bảng khác (T-test của Sinh viên), mà chúng tôi trình bày bên dưới:

Giá trị t-test của sinh viên cho xác suất 0,95 và 0,99


Ví dụ 3. 30 người được chọn ngẫu nhiên từ các nhân viên của công ty. Theo mẫu, hóa ra mức lương trung bình (mỗi tháng) là 30 nghìn rúp với độ lệch chuẩn là 5 nghìn rúp. Xác định mức lương trung bình trong công ty với xác suất 0,99.

Giải pháp: Theo điều kiện ta có n = 30, X trung bình. =30000, S=5000, P = 0,99. Để tìm khoảng tin cậy, chúng ta sẽ sử dụng công thức tương ứng với bài kiểm tra t của Sinh viên. Từ bảng cho n = 30 và P = 0,99, chúng ta tìm thấy t = 2,756, do đó,


những thứ kia. người được ủy thác được săn đón khoảng 27484< Х ср.ген < 32516.

Vì vậy, với xác suất 0,99, chúng ta có thể nói rằng khoảng (27484; 32516) chứa trong đó mức lương trung bình trong công ty.

Chúng tôi hy vọng rằng bạn sẽ sử dụng phương pháp này và không nhất thiết lúc nào bạn cũng phải có bàn bên mình. Tính toán có thể được thực hiện tự động trong Excel. Khi đang ở trong tệp Excel, hãy nhấp vào nút fx ở menu trên cùng. Sau đó, chọn loại “thống kê” trong số các chức năng và từ danh sách được đề xuất trong cửa sổ - STUDAR DISCOVER. Sau đó, tại dấu nhắc, đặt con trỏ vào trường “xác suất”, nhập giá trị của xác suất nghịch đảo (tức là trong trường hợp của chúng tôi, thay vì xác suất 0,95, bạn cần nhập xác suất 0,05). Rõ ràng, bảng tính được thiết kế theo cách mà kết quả trả lời cho câu hỏi chúng ta có khả năng sai như thế nào. Tương tự, trong trường Mức độ Tự do, nhập giá trị (n-1) cho mẫu của bạn.

Trí tuệ không chỉ bao gồm kiến ​​thức mà còn ở khả năng vận dụng kiến ​​thức vào thực tế. (Aristotle)

Khoảng tin cậy

xem xét chung

Bằng cách lấy mẫu từ tổng thể, chúng ta thu được ước tính điểm của tham số quan tâm và tính sai số chuẩn để chỉ ra độ chính xác của ước tính.

Tuy nhiên, trong hầu hết các trường hợp, sai số tiêu chuẩn như vậy là không thể chấp nhận được. Sẽ hữu ích hơn nhiều khi kết hợp thước đo độ chính xác này với ước tính khoảng cho tham số tổng thể.

Điều này có thể được thực hiện bằng cách sử dụng kiến ​​thức về phân bố xác suất lý thuyết của thống kê mẫu (tham số) để tính khoảng tin cậy (CI - Khoảng tin cậy, CI - Khoảng tin cậy) cho tham số.

Nói chung, khoảng tin cậy mở rộng các ước tính theo cả hai hướng theo bội số nhất định của sai số chuẩn (của một tham số nhất định); hai giá trị (giới hạn tin cậy) xác định khoảng thường được phân tách bằng dấu phẩy và được đặt trong dấu ngoặc đơn.

Khoảng tin cậy cho giá trị trung bình

Sử dụng phân phối chuẩn

Giá trị trung bình mẫu có phân phối chuẩn nếu cỡ mẫu lớn, vì vậy bạn có thể áp dụng kiến ​​thức về phân phối chuẩn khi xem xét giá trị trung bình mẫu.

Cụ thể, 95% phân bố của giá trị trung bình mẫu nằm trong khoảng 1,96 độ lệch chuẩn (SD) của giá trị trung bình tổng thể.

Khi chỉ có một mẫu, chúng tôi gọi đó là sai số chuẩn của giá trị trung bình (SEM) và tính khoảng tin cậy 95% cho giá trị trung bình như sau:

Nếu chúng ta lặp lại thí nghiệm này nhiều lần, khoảng thời gian sẽ chứa giá trị trung bình thực của tổng thể trong 95% thời gian.

Thông thường, đây là khoảng tin cậy, chẳng hạn như khoảng giá trị trong đó trung bình tổng thể thực sự (trung bình chung) nằm với xác suất tin cậy 95%.

Mặc dù nó không hoàn toàn nghiêm ngặt (trung bình tổng thể là một giá trị cố định và do đó không thể có xác suất gắn liền với nó) để diễn giải khoảng tin cậy theo cách này, nhưng về mặt khái niệm thì dễ hiểu hơn.

Cách sử dụng t- phân bổ

Bạn có thể sử dụng phân phối chuẩn nếu bạn biết giá trị của phương sai trong tổng thể. Ngoài ra, khi cỡ mẫu nhỏ, giá trị trung bình mẫu tuân theo phân phối chuẩn nếu dữ liệu tổng thể cơ bản có phân phối chuẩn.

Nếu dữ liệu cơ bản của tổng thể không có phân phối chuẩn và/hoặc phương sai của tổng thể không xác định thì giá trị trung bình mẫu sẽ tuân theo Phân phối t của sinh viên.

Chúng tôi tính toán khoảng tin cậy 95% cho giá trị trung bình của tổng thể như sau:

Điểm phần trăm (phần trăm) ở đâu t- Phân phối t của sinh viên với (n-1) bậc tự do, cho xác suất hai phía là 0,05.

Nói chung, nó cung cấp phạm vi rộng hơn so với sử dụng phân bố chuẩn vì nó tính đến độ không đảm bảo bổ sung được đưa ra bằng cách ước tính độ lệch chuẩn tổng thể và/hoặc do cỡ mẫu nhỏ.

Khi cỡ mẫu lớn (vào khoảng 100 hoặc hơn), sự khác biệt giữa hai phân bố ( t-Sinh viên và bình thường) là không đáng kể. Tuy nhiên, họ luôn sử dụng t- phân phối khi tính khoảng tin cậy, ngay cả khi cỡ mẫu lớn.

Thông thường, CI 95% được báo cáo. Các khoảng tin cậy khác có thể được tính toán, chẳng hạn như khoảng tin cậy 99% cho giá trị trung bình.

Thay vì tích của sai số chuẩn và giá trị trong bảng t- phân phối, tương ứng với xác suất hai mặt là 0,05, nhân nó (sai số chuẩn) với giá trị tương ứng với xác suất hai mặt là 0,01. Đây là khoảng tin cậy rộng hơn khoảng tin cậy 95% vì nó phản ánh độ tin cậy ngày càng tăng rằng khoảng tin cậy thực sự bao gồm giá trị trung bình của tổng thể.

Khoảng tin cậy cho tỷ lệ

Phân phối tỷ lệ lấy mẫu có phân phối nhị thức. Tuy nhiên, nếu cỡ mẫu N lớn hợp lý thì phân phối mẫu của tỷ lệ này xấp xỉ chuẩn với giá trị trung bình .

Chúng tôi đánh giá theo tỷ lệ chọn lọc p=r/n(Ở đâu r- số lượng cá thể trong mẫu có các đặc điểm đặc trưng mà chúng tôi quan tâm) và sai số chuẩn được ước tính:

Khoảng tin cậy 95% cho tỷ lệ này được ước tính:

Nếu cỡ mẫu nhỏ (thường là khi n.p. hoặc n(1-p)ít hơn 5 ), thì cần sử dụng phân phối nhị thức để tính khoảng tin cậy chính xác.

Lưu ý rằng nếu Pđược biểu thị dưới dạng phần trăm, sau đó (1-p) thay thế bởi (100-tr).

Giải thích khoảng tin cậy

Khi diễn giải khoảng tin cậy, chúng ta quan tâm đến các câu hỏi sau:

Khoảng tin cậy rộng bao nhiêu?

Khoảng tin cậy rộng cho thấy ước tính này không chính xác; hẹp cho thấy ước tính chính xác.

Độ rộng của khoảng tin cậy phụ thuộc vào độ lớn của sai số chuẩn, do đó lại phụ thuộc vào cỡ mẫu và khi xem xét một biến số, độ biến thiên của dữ liệu tạo ra khoảng tin cậy rộng hơn so với các nghiên cứu về một tập dữ liệu lớn có ít biến. .

CI có bao gồm bất kỳ giá trị nào được quan tâm cụ thể không?

Bạn có thể kiểm tra xem giá trị có thể có của tham số tổng thể có nằm trong khoảng tin cậy hay không. Nếu vậy, kết quả sẽ phù hợp với giá trị có thể xảy ra này. Nếu không, thì khó có khả năng (đối với khoảng tin cậy 95%, khả năng là gần 5%) thông số đó có giá trị đó.