Mức độ tin cậy. ABC của thống kê y tế

Hãy xây dựng một khoảng tin cậy trong MS EXCEL để ước tính giá trị trung bình của phân phối trong trường hợp một giá trị đã biết của phương sai.

Tất nhiên là sự lựa chọn mức độ tin cậy hoàn toàn phụ thuộc vào nhiệm vụ trong tầm tay. Do đó, mức độ tin cậy của hành khách hàng không vào độ tin cậy của máy bay, tất nhiên, phải cao hơn mức độ tin cậy của người mua vào độ tin cậy của bóng đèn.

Công thức nhiệm vụ

Hãy giả sử rằng từ dân sốđã lấy mẫu vật kích thước n. Nó được cho rằng độ lệch chuẩn sự phân phối này được biết đến. Cần thiết trên cơ sở này mẫuđánh giá những điều chưa biết trung bình phân phối(μ,) và xây dựng song phương mức độ tin cậy.

Ước tính điểm

Như được biết từ số liệu thống kê(hãy gọi nó X cf) là một ước tính không thiên vị về giá trị trung bình cái này dân số và có phân phối N (μ; σ 2 / n).

Ghi chú: Nếu bạn cần xây dựng thì sao mức độ tin cậy trong trường hợp phân phối, không phải thông thường? Trong trường hợp này, hãy đến giải cứu, nói rằng với kích thước đủ lớn mẫu n từ phân phối không thông thường, lấy mẫu phân phối thống kê Х av sẽ xấp xỉ trao đổi thư tín phân phối bình thường với tham số N (μ; σ 2 / n).

Cho nên, ước tính điểm ở giữa giá trị phân phối chúng tôi có là ý nghĩa mẫu, I E. X cf. Bây giờ chúng ta hãy bận rộn mức độ tin cậy.

Xây dựng khoảng tin cậy

Thông thường, khi biết phân phối và các tham số của nó, chúng ta có thể tính xác suất mà một biến ngẫu nhiên sẽ nhận một giá trị từ khoảng chúng ta đã chỉ định. Bây giờ chúng ta hãy làm ngược lại: tìm khoảng thời gian mà biến ngẫu nhiên rơi vào với một xác suất cho trước. Ví dụ, từ các thuộc tính phân phối bình thường biết rằng với xác suất 95%, một biến ngẫu nhiên có phân phối trên luật bình thường, sẽ nằm trong khoảng +/- 2 từ giá trị trung bình(xem bài viết về). Khoảng thời gian này sẽ đóng vai trò là nguyên mẫu của chúng tôi cho mức độ tin cậy.

Bây giờ chúng ta hãy xem nếu chúng ta biết phân phối , để tính khoảng này? Để trả lời câu hỏi, chúng ta phải xác định dạng phân phối và các tham số của nó.

Chúng tôi biết hình thức phân phối là phân phối bình thường(hãy nhớ rằng chúng ta đang nói về phân phối lấy mẫu số liệu thống kê X cf).

Chúng tôi không biết tham số μ (nó chỉ cần được ước tính bằng cách sử dụng mức độ tin cậy), nhưng chúng tôi có ước tính của nó X cf,được tính toán dựa trên mẫu vật, mà có thể được sử dụng.

Tham số thứ hai là độ lệch chuẩn trung bình của mẫu sẽ được biết, nó bằng σ / √n.

Tại vì chúng ta không biết μ, thì chúng ta sẽ xây dựng khoảng +/- 2 độ lệch chuẩn không phải từ giá trị trung bình, nhưng từ ước tính đã biết của nó X cf. Những thứ kia. khi tính toán mức độ tin cậy chúng tôi sẽ KHÔNG cho rằng X cf sẽ rơi vào khoảng +/- 2 độ lệch chuẩn từ μ với xác suất 95%, và chúng tôi sẽ giả định rằng khoảng thời gian là +/- 2 độ lệch chuẩn từ X cf với xác suất 95% sẽ bao phủ μ - mức trung bình của dân số chung, từ đó mẫu vật. Hai câu lệnh này tương đương nhau, nhưng câu lệnh thứ hai cho phép chúng ta xây dựng mức độ tin cậy.

Ngoài ra, chúng tôi tinh chỉnh khoảng thời gian: một biến ngẫu nhiên được phân phối trên luật bình thường, với xác suất 95% nằm trong khoảng +/- 1.960 độ lệch chuẩn, không phải +/- 2 độ lệch chuẩn. Điều này có thể được tính bằng công thức \ u003d NORM.ST.OBR ((1 + 0,95) / 2), cm. tệp mẫu Khoảng cách trang tính.

Bây giờ chúng ta có thể xây dựng một tuyên bố xác suất sẽ giúp chúng ta hình thành mức độ tin cậy:
"Xác suất mà dân số trung bình nằm từ trung bình mẫu trong vòng 1.960 " độ lệch chuẩn của mẫu có nghĩa là ", bằng 95%.

Giá trị xác suất được đề cập trong câu lệnh có tên đặc biệt , được liên kết với mức ý nghĩa α (alpha) bằng một biểu thức đơn giản mức độ tin cậy =1 . Trong trường hợp của chúng ta mức độ đáng kể α =1-0,95=0,05 .

Bây giờ, dựa trên câu lệnh xác suất này, chúng tôi viết một biểu thức để tính toán mức độ tin cậy:

trong đó Zα / 2 Tiêu chuẩn phân phối bình thường(chẳng hạn như một giá trị của một biến ngẫu nhiên z, Cái gì P(z>=Zα / 2 ) = α / 2).

Ghi chú: Định lượng α / 2 trên xác định chiều rộng mức độ tin cậy trong độ lệch chuẩn trung bình của mẫu. Định lượng α / 2 trên Tiêu chuẩn phân phối bình thường luôn luôn lớn hơn 0, điều này rất thuận tiện.

Trong trường hợp của chúng tôi, tại α = 0,05, trên α / 2-quantile bằng 1.960. Đối với các mức ý nghĩa khác α (10%; 1%) trên α / 2-quantile Zα / 2 có thể được tính bằng công thức \ u003d NORM.ST.OBR (1-α / 2) hoặc nếu biết mức độ tin cậy, = NORM.ST.OBR ((1 + mức độ tin cậy) / 2).

Thông thường khi xây dựng khoảng tin cậy để ước tính giá trị trung bình chỉ sử dụng trên α/2-lượng tử và không sử dụng hạ α/2-lượng tử. Điều này là có thể bởi vì Tiêu chuẩn phân phối bình thườngđối xứng về trục x ( mật độ phân bố của nóđối xứng về trung bình, tức là 0). Do đó, không cần tính toán α / 2-quantile thấp hơn(nó được gọi đơn giản là α / 2-số lượng), tại vì nó bằng nhau trên α/2-lượng tử bằng dấu trừ.

Nhớ lại rằng, bất kể hình dạng của phân phối x, biến ngẫu nhiên tương ứng X cf phân phối xấp xỉ tốt N (μ; σ 2 / n) (xem bài viết về). Do đó, nói chung, biểu thức trên cho mức độ tin cậy chỉ là gần đúng. Nếu x được phân phối trên luật bình thường N (μ; σ 2 / n), thì biểu thức cho mức độ tin cậy là chính xác.

Tính toán khoảng tin cậy trong MS EXCEL

Hãy giải quyết vấn đề.
Thời gian đáp ứng của một thành phần điện tử đối với tín hiệu đầu vào là một đặc tính quan trọng của một thiết bị. Một kỹ sư muốn vẽ một khoảng tin cậy cho thời gian phản hồi trung bình ở mức độ tin cậy là 95%. Từ kinh nghiệm trước đây, kỹ sư biết rằng độ lệch chuẩn của thời gian phản hồi là 8 ms. Được biết, kỹ sư đã thực hiện 25 phép đo để ước tính thời gian phản hồi, giá trị trung bình là 78 ​​ms.

Quyết định: Một kỹ sư muốn biết thời gian phản hồi của một thiết bị điện tử, nhưng anh ta hiểu rằng thời gian phản hồi không cố định, mà là một biến ngẫu nhiên có phân phối riêng của nó. Vì vậy, điều tốt nhất anh ta có thể hy vọng là xác định các thông số và hình dạng của sự phân bố này.

Thật không may, từ điều kiện của vấn đề, chúng tôi không biết dạng phân phối thời gian phản hồi (nó không nhất thiết phải thông thường). , phân phối này cũng không rõ. Chỉ anh ấy được biết độ lệch chuẩnσ = 8. Do đó, mặc dù chúng ta không thể tính toán các xác suất và xây dựng mức độ tin cậy.

Tuy nhiên, mặc dù chúng tôi không biết sự phân phối thời gian phản hồi riêng biệt, chúng tôi biết rằng theo CPT, phân phối lấy mẫu thời gian phản hồi trung bình xấp xỉ thông thường(chúng tôi sẽ giả định rằng các điều kiện CPTđược thực hiện, bởi vì kích cỡ mẫuđủ lớn (n = 25)) .

Hơn nữa, Trung bình phân phối này bằng giá trị trung bình phân phối phản hồi đơn vị, tức là μ. NHƯNG độ lệch chuẩn của phân phối này (σ / √n) có thể được tính bằng công thức = 8 / ROOT (25).

Được biết, kỹ sư đã nhận ước tính điểm tham số μ bằng 78 ms (X cf). Do đó, bây giờ chúng ta có thể tính toán các xác suất, bởi vì chúng tôi biết hình thức phân phối ( thông thường) và các tham số của nó (Х ср và σ / √n).

Kỹ sư muốn biết gia trị được ki vọngμ của phân bố thời gian phản hồi. Như đã nêu ở trên, μ này bằng kỳ vọng về phân phối mẫu của thời gian phản hồi trung bình. Nếu chúng ta sử dụng phân phối bình thường N (X cf; σ / √n), thì μ mong muốn sẽ nằm trong khoảng +/- 2 * σ / √n với xác suất xấp xỉ 95%.

Mức độ đáng kể bằng 1-0,95 = 0,05.

Cuối cùng, tìm đường viền bên trái và bên phải mức độ tin cậy.
Đường viền bên trái: \ u003d 78-NORM.ST.INR (1-0,05 / 2) * 8 / ROOT (25) = 74,864
Đường viền bên phải: \ u003d 78 + NORM. ST. OBR (1-0,05 / 2) * 8 / ROOT (25) \ u003d 81.136

Đường viền bên trái: = NORM.INV (0,05 / 2, 78, 8 / SQRT (25))
Đường viền bên phải: = NORM.INV (1-0,05 / 2, 78, 8 / SQRT (25))

Trả lời: mức độ tin cậy tại Mức độ tin cậy 95% và σ=8msec bằng 78 +/- 3,136ms

TẠI tệp ví dụ trên trang tính Sigmađược biết đã tạo ra một biểu mẫu để tính toán và xây dựng song phương mức độ tin cậy cho tùy ý mẫu với một σ cho trước và mức độ đáng kể.

Hàm CONFIDENCE.NORM ()

Nếu các giá trị mẫu nằm trong phạm vi B20: B79 , một mức độ đáng kể bằng 0,05; thì công thức MS EXCEL:
= AVERAGE (B20: B79) -CONFIDENCE (0,05, σ, COUNT (B20: B79))
sẽ trả lại đường viền bên trái mức độ tin cậy.

Ranh giới tương tự có thể được tính bằng công thức:
= AVERAGE (B20: B79) -NORM.ST.INV (1-0,05 / 2) * σ / SQRT (COUNT (B20: B79))

Ghi chú: Hàm TRUST.NORM () xuất hiện trong MS EXCEL 2010. Các phiên bản trước của MS EXCEL đã sử dụng hàm TRUST ().

Khoảng tin cậy ( Tiếng Anh Khoảng tin cậy) một trong những loại ước lượng khoảng được sử dụng trong thống kê, được tính toán cho một mức ý nghĩa nhất định. Chúng cho phép chúng tôi đưa ra tuyên bố rằng giá trị thực của một tham số thống kê chưa biết của tổng thể chung nằm trong khoảng giá trị thu được với xác suất được đưa ra bởi mức ý nghĩa thống kê đã chọn.

Phân phối bình thường

Khi biết phương sai (σ 2) của tập hợp dữ liệu, điểm số z có thể được sử dụng để tính giới hạn tin cậy (điểm biên của khoảng tin cậy). So với việc sử dụng phân phối t, sử dụng điểm số z sẽ không chỉ cung cấp khoảng tin cậy hẹp hơn mà còn cung cấp các ước tính đáng tin cậy hơn về giá trị trung bình và độ lệch chuẩn (σ), vì điểm số Z dựa trên phân phối chuẩn.

Công thức

Để xác định các điểm biên của khoảng tin cậy, với điều kiện là đã biết độ lệch chuẩn của tập hợp dữ liệu, công thức sau được sử dụng

L = X - Z α / 2 σ
√n

Ví dụ

Giả sử rằng cỡ mẫu là 25 quan sát, trung bình của mẫu là 15 và độ lệch chuẩn của tổng thể là 8. Với mức ý nghĩa α = 5%, điểm số Z là Z α / 2 = 1,96. Trong trường hợp này, giới hạn dưới và giới hạn trên của khoảng tin cậy sẽ là

L = 15 - 1,96 8 = 11,864
√25
L = 15 + 1,96 8 = 18,136
√25

Do đó, chúng ta có thể phát biểu rằng với xác suất 95%, kỳ vọng toán học của dân số chung sẽ nằm trong khoảng từ 11,864 đến 18,136.

Các phương pháp thu hẹp khoảng tin cậy

Giả sử phạm vi quá rộng cho mục đích nghiên cứu của chúng tôi. Có hai cách để giảm khoảng tin cậy.

  1. Giảm mức ý nghĩa thống kê α.
  2. Tăng kích thước mẫu.

Giảm mức ý nghĩa thống kê xuống α = 10%, chúng ta nhận được điểm số Z bằng Z α / 2 = 1,64. Trong trường hợp này, giới hạn dưới và giới hạn trên của khoảng thời gian sẽ là

L = 15 - 1,64 8 = 12,376
√25
L = 15 + 1,64 8 = 17,624
√25

Và bản thân khoảng tin cậy có thể được viết là

Trong trường hợp này, chúng ta có thể đưa ra giả thiết rằng với xác suất 90%, kỳ vọng toán học của dân số chung sẽ rơi vào khoảng.

Nếu chúng ta muốn giữ mức ý nghĩa thống kê α, thì giải pháp thay thế duy nhất là tăng kích thước mẫu. Tăng nó lên 144 quan sát, chúng tôi thu được các giá trị sau của giới hạn tin cậy

L = 15 - 1,96 8 = 13,693
√144
L = 15 + 1,96 8 = 16,307
√144

Khoảng tin cậy chính nó sẽ trông như thế này:

Do đó, việc thu hẹp khoảng tin cậy mà không làm giảm mức ý nghĩa thống kê chỉ có thể thực hiện được bằng cách tăng cỡ mẫu. Nếu không thể tăng cỡ mẫu, thì việc thu hẹp khoảng tin cậy có thể đạt được chỉ bằng cách giảm mức ý nghĩa thống kê.

Xây dựng khoảng tin cậy cho phân phối không chuẩn

Nếu độ lệch chuẩn của tổng thể không được biết hoặc phân phối không chuẩn, thì phân phối t được sử dụng để xây dựng khoảng tin cậy. Kỹ thuật này bảo thủ hơn, được thể hiện trong khoảng tin cậy rộng hơn, so với kỹ thuật dựa trên điểm Z.

Công thức

Các công thức sau được sử dụng để tính toán giới hạn dưới và giới hạn trên của khoảng tin cậy dựa trên phân phối t

L = X - tα σ
√n

Phân phối của Student hoặc phân phối t chỉ phụ thuộc vào một tham số - số bậc tự do, bằng số giá trị đặc trưng riêng lẻ (số lượng quan sát trong mẫu). Giá trị của phép thử t của Student đối với một số bậc tự do (n) nhất định và mức ý nghĩa thống kê α có thể được tìm thấy trong các bảng tra cứu.

Ví dụ

Giả sử rằng cỡ mẫu là 25 giá trị riêng lẻ, giá trị trung bình của mẫu là 50 và độ lệch chuẩn của mẫu là 28. Bạn cần xây dựng khoảng tin cậy cho mức ý nghĩa thống kê α = 5%.

Trong trường hợp của chúng ta, số bậc tự do là 24 (25-1), do đó, giá trị dạng bảng tương ứng của phép thử t của Student cho mức ý nghĩa thống kê α = 5% là 2,064. Do đó, giới hạn dưới và giới hạn trên của khoảng tin cậy sẽ là

L = 50 - 2,064 28 = 38,442
√25
L = 50 + 2.064 28 = 61,558
√25

Và bản thân khoảng thời gian đó có thể được viết là

Do đó, chúng ta có thể phát biểu rằng với xác suất 95%, kỳ vọng toán học của dân số chung sẽ nằm trong khoảng.

Sử dụng phân phối t cho phép bạn thu hẹp khoảng tin cậy, bằng cách giảm ý nghĩa thống kê hoặc bằng cách tăng kích thước mẫu.

Giảm ý nghĩa thống kê từ 95% xuống 90% trong các điều kiện của ví dụ của chúng tôi, chúng tôi nhận được giá trị dạng bảng tương ứng của thử nghiệm t của Student 1.711.

L = 50 - 1,711 28 = 40,418
√25
L = 50 + 1,711 28 = 59,582
√25

Trong trường hợp này, chúng ta có thể nói rằng với xác suất 90%, kỳ vọng toán học của dân số chung sẽ nằm trong khoảng.

Nếu chúng ta không muốn giảm ý nghĩa thống kê, thì giải pháp thay thế duy nhất là tăng cỡ mẫu. Giả sử rằng đó là 64 quan sát riêng lẻ chứ không phải 25 như trong điều kiện ban đầu của ví dụ. Giá trị dạng bảng của phép thử t của Student cho 63 bậc tự do (64-1) và mức ý nghĩa thống kê α = 5% là 1,998.

L = 50 - 1,998 28 = 43,007
√64
L = 50 + 1,998 28 = 56,993
√64

Điều này cho chúng ta cơ hội để khẳng định rằng với xác suất 95%, kỳ vọng toán học của dân số chung sẽ nằm trong khoảng.

Mẫu lớn

Các mẫu lớn là mẫu từ một tập hợp dữ liệu với hơn 100 quan sát riêng lẻ. Các nghiên cứu thống kê đã chỉ ra rằng các mẫu lớn hơn có xu hướng được phân phối bình thường, ngay cả khi phân bố của tổng thể không bình thường. Ngoài ra, đối với các mẫu như vậy, việc sử dụng điểm số z và phân phối t cho kết quả gần giống nhau khi xây dựng khoảng tin cậy. Do đó, đối với các mẫu lớn, có thể chấp nhận sử dụng điểm số z cho phân phối chuẩn thay vì phân phối t.

Tổng hợp

Mức độ tin cậy(CI; trong tiếng Anh, khoảng tin cậy - CI) thu được trong nghiên cứu tại mẫu cho phép đo độ chính xác (hoặc độ không chắc chắn) của kết quả nghiên cứu, để đưa ra kết luận về dân số của tất cả những bệnh nhân đó (dân số chung ). Định nghĩa đúng về KTC 95% có thể được xây dựng như sau: 95% khoảng thời gian như vậy sẽ chứa giá trị thực trong tổng thể. Cách diễn giải này hơi kém chính xác hơn: CI là phạm vi giá trị mà bạn có thể chắc chắn 95% rằng nó chứa giá trị thực. Khi sử dụng CI, trọng tâm là xác định ảnh hưởng định lượng, trái ngược với giá trị P, thu được từ kết quả của thử nghiệm về ý nghĩa thống kê. Giá trị P không đánh giá bất kỳ số lượng nào, mà được dùng như một thước đo độ mạnh của bằng chứng chống lại giả thuyết vô hiệu là "không có hiệu lực". Giá trị của P tự nó không cho chúng ta biết bất cứ điều gì về độ lớn của sự khác biệt, hoặc thậm chí về hướng của nó. Do đó, các giá trị độc lập của P hoàn toàn không được thông tin trong các bài báo hoặc phần tóm tắt. Ngược lại, CI cho biết cả mức độ ảnh hưởng của mối quan tâm tức thời, chẳng hạn như tính hữu ích của phương pháp điều trị và mức độ mạnh mẽ của bằng chứng. Do đó, DI liên quan trực tiếp đến việc thực hành DM.

Cách tiếp cận cho điểm đối với phân tích thống kê, được minh họa bởi CI, nhằm mục đích đo lường mức độ ảnh hưởng của sự quan tâm (độ nhạy của xét nghiệm chẩn đoán, tỷ lệ dự đoán, giảm rủi ro tương đối khi điều trị, v.v.) và đo lường mức độ không chắc chắn trong ảnh hưởng đó. Thông thường, CI là phạm vi giá trị ở hai bên của ước tính mà giá trị thực có khả năng nằm trong đó và bạn có thể chắc chắn 95% về giá trị đó. Quy ước sử dụng xác suất 95% là tùy ý, cũng như giá trị của P<0,05 для оценки статистической значимости, и авторы иногда используют 90% или 99% ДИ. Заметим, что слово «интервал» означает диапазон величин и поэтому стоит в единственном числе. Две величины, которые ограничивают интервал, называются «доверительными пределами».

CI dựa trên ý tưởng rằng cùng một nghiên cứu được thực hiện trên các nhóm bệnh nhân khác nhau sẽ không tạo ra kết quả giống hệt nhau, nhưng kết quả của họ sẽ được phân phối xung quanh giá trị thực nhưng chưa biết. Nói cách khác, CI mô tả điều này là "độ biến thiên phụ thuộc vào mẫu". CI không phản ánh sự không chắc chắn bổ sung do các nguyên nhân khác; đặc biệt, nó không bao gồm các tác động của việc mất chọn lọc bệnh nhân theo dõi, tuân thủ kém hoặc đo lường kết quả không chính xác, thiếu mù lòa, v.v. Do đó, CI luôn đánh giá thấp tổng mức độ không đảm bảo.

Tính toán khoảng tin cậy

Bảng A1.1. Sai số tiêu chuẩn và khoảng tin cậy cho một số phép đo lâm sàng

Thông thường, CI được tính toán từ một ước tính quan sát của một thước đo định lượng, chẳng hạn như sự khác biệt (d) giữa hai tỷ lệ và sai số chuẩn (SE) trong ước tính của sự khác biệt đó. Do đó, khoảng CI 95% thu được là d ± 1,96 SE. Công thức thay đổi tùy theo bản chất của thước đo kết quả và mức độ phù hợp của CI. Ví dụ, trong một thử nghiệm ngẫu nhiên, có đối chứng với giả dược về vắc-xin ho gà nội bào, bệnh ho gà đã phát triển ở 72 trong số 1670 (4,3%) trẻ được tiêm vắc-xin và 240 trong số 1665 (14,4%) ở nhóm đối chứng. Phần trăm chênh lệch, được gọi là mức giảm rủi ro tuyệt đối, là 10,1%. SE của sự khác biệt này là 0,99%. Theo đó, KTC 95% là 10,1% + 1,96 x 0,99%, tức là từ 8,2 đến 12,0.

Mặc dù các cách tiếp cận triết học khác nhau, CI và các bài kiểm tra ý nghĩa thống kê có liên quan chặt chẽ về mặt toán học.

Do đó, giá trị của P là "đáng kể", tức là R<0,05 соответствует 95% ДИ, который исключает величину эффекта, указывающую на отсутствие различия. Например, для различия между двумя средними пропорциями это ноль, а для относительного риска или отношения шансов - единица. При некоторых обстоятельствах эти два подхода могут быть не совсем эквивалентны. Преобладающая точка зрения: оценка с помощью ДИ - предпочтительный подход к суммированию результатов исследования, но ДИ и величина Р взаимодополняющи, и во многих статьях используются оба способа представления результатов.

Độ không đảm bảo (không chính xác) của ước lượng, được biểu thị bằng CI, phần lớn liên quan đến căn bậc hai của cỡ mẫu. Các mẫu nhỏ cung cấp ít thông tin hơn các mẫu lớn, và các CI tương ứng rộng hơn trong các mẫu nhỏ hơn. Ví dụ, một bài báo so sánh hiệu suất của ba xét nghiệm được sử dụng để chẩn đoán nhiễm Helicobacter pylori đã báo cáo độ nhạy xét nghiệm hơi thở urê là 95,8% (95% CI 75-100). Mặc dù con số 95,8% có vẻ ấn tượng, nhưng kích thước mẫu nhỏ của 24 bệnh nhân H. pylori trưởng thành có nghĩa là có sự không chắc chắn đáng kể trong ước tính này, như được chỉ ra bởi CI rộng. Thật vậy, giới hạn dưới 75% thấp hơn nhiều so với ước tính 95,8%. Nếu cùng một độ nhạy được quan sát trong một mẫu gồm 240 người, thì KTC 95% sẽ là 92,5-98,0, đảm bảo hơn rằng xét nghiệm có độ nhạy cao.

Trong các thử nghiệm ngẫu nhiên có đối chứng (RCT), các kết quả không có ý nghĩa (tức là những người có P> 0,05) đặc biệt dễ bị hiểu sai. CI đặc biệt hữu ích ở đây vì nó cho biết mức độ tương thích của kết quả với hiệu quả thực sự hữu ích trên lâm sàng. Ví dụ, trong một RCT so sánh khâu nối và khâu nối bằng kim khâu ở ruột kết, nhiễm trùng vết mổ phát triển lần lượt ở 10,9% và 13,5% bệnh nhân (P = 0,30). KTC 95% cho sự khác biệt này là 2,6% (-2 đến +8). Ngay cả trong nghiên cứu này, bao gồm 652 bệnh nhân, vẫn có khả năng có sự khác biệt khiêm tốn về tỷ lệ nhiễm trùng do hai thủ thuật gây ra. Nghiên cứu càng nhỏ thì độ không chắc chắn càng lớn. Sung và cộng sự. thực hiện một RCT so sánh truyền octreotide với liệu pháp xơ hóa khẩn cấp cho chảy máu tĩnh mạch cấp tính ở 100 bệnh nhân. Ở nhóm octreotide, tỷ lệ ngừng chảy máu là 84%; ở nhóm liệu pháp xơ hóa - 90%, cho P = 0,56. Lưu ý rằng tỷ lệ chảy máu tiếp tục tương tự như tỷ lệ nhiễm trùng vết thương trong nghiên cứu đã đề cập. Tuy nhiên, trong trường hợp này, KTC 95% cho sự khác biệt giữa các can thiệp là 6% (-7 đến +19). Phạm vi này khá rộng so với mức chênh lệch 5% sẽ được quan tâm về mặt lâm sàng. Rõ ràng là nghiên cứu không loại trừ sự khác biệt đáng kể về hiệu quả. Do đó, kết luận của các tác giả "truyền octreotide và liệu pháp xơ hóa có hiệu quả như nhau trong điều trị chảy máu do giãn tĩnh mạch" chắc chắn là không có giá trị. Trong những trường hợp như thế này mà KTC 95% để giảm thiểu rủi ro tuyệt đối (ARR) bao gồm số 0, như ở đây, KTC cho NNT (số cần thiết để điều trị) là khá khó để diễn giải. NLP và CI của nó có được từ các nghịch đảo của ACP (nhân chúng với 100 nếu các giá trị này được cho dưới dạng phần trăm). Ở đây chúng tôi nhận được NPP = 100: 6 = 16,6 với KTC 95% là -14,3 đến 5,3. Như có thể thấy từ chú thích "d" trong Bảng. A1.1, CI này bao gồm các giá trị cho NTPP từ 5,3 đến vô cùng và NTLP từ 14,3 đến vô cùng.

CI có thể được xây dựng cho các ước tính hoặc so sánh thống kê được sử dụng phổ biến nhất. Đối với RCT, nó bao gồm sự khác biệt giữa tỷ lệ trung bình, rủi ro tương đối, tỷ lệ chênh lệch và NRR. Tương tự, có thể thu được CIs cho tất cả các ước tính chính được thực hiện trong các nghiên cứu về độ chính xác của xét nghiệm chẩn đoán — độ nhạy, độ đặc hiệu, giá trị dự đoán dương tính (tất cả đều là tỷ lệ đơn giản) và tỷ lệ khả năng xảy ra — ước tính thu được trong phân tích tổng hợp và so sánh đối chứng học. Một chương trình máy tính cá nhân bao gồm nhiều cách sử dụng DI có sẵn với ấn bản thứ hai của Thống kê với độ tin cậy. Macro để tính toán CI cho tỷ lệ có sẵn miễn phí cho Excel và các chương trình thống kê SPSS và Minitab tại http://www.uwcm.ac.uk/study/medicine/epidemiology_stosystem/research/stosystem/proportions, htm.

Nhiều đánh giá về hiệu quả điều trị

Mặc dù việc xây dựng các CI là mong muốn cho các kết quả chính của một nghiên cứu, chúng không bắt buộc đối với tất cả các kết quả. CI quan tâm đến các so sánh quan trọng về mặt lâm sàng. Ví dụ: khi so sánh hai nhóm, CI chính xác là CI được xây dựng cho sự khác biệt giữa các nhóm, như thể hiện trong các ví dụ trên, chứ không phải CI có thể được xây dựng cho ước tính trong mỗi nhóm. Không chỉ vô ích khi đưa ra các CI riêng biệt cho điểm số trong mỗi nhóm, cách trình bày này có thể gây hiểu nhầm. Tương tự, cách tiếp cận đúng khi so sánh hiệu quả điều trị ở các phân nhóm khác nhau là so sánh trực tiếp hai (hoặc nhiều) phân nhóm. Sẽ không đúng khi cho rằng điều trị chỉ có hiệu quả trong một nhóm con nếu CI của nó loại trừ giá trị tương ứng với không có tác dụng, trong khi những nhóm khác thì không. CI cũng hữu ích khi so sánh kết quả giữa nhiều nhóm con. Trên hình. A1.1 cho thấy nguy cơ tương đối của sản giật ở phụ nữ bị tiền sản giật trong các phân nhóm phụ nữ từ RCT magiê sulfat có kiểm soát giả dược.

Cơm. A1.2. Biểu đồ rừng cho thấy kết quả của 11 thử nghiệm lâm sàng ngẫu nhiên về vắc-xin rotavirus ở bò để phòng ngừa tiêu chảy so với giả dược. Khoảng tin cậy 95% được sử dụng để ước tính nguy cơ tương đối của bệnh tiêu chảy. Kích thước của hình vuông màu đen tỷ lệ thuận với lượng thông tin. Ngoài ra, ước tính tóm tắt về hiệu quả điều trị và khoảng tin cậy 95% (được chỉ định bởi một viên kim cương) được hiển thị. Phân tích tổng hợp đã sử dụng mô hình hiệu ứng ngẫu nhiên vượt quá một số mô hình được thiết lập trước; ví dụ, nó có thể là kích thước được sử dụng để tính kích thước mẫu. Theo một tiêu chí nghiêm ngặt hơn, toàn bộ phạm vi CI phải cho thấy lợi ích vượt quá mức tối thiểu được xác định trước.

Chúng ta đã thảo luận về sự sai lầm khi coi việc không có ý nghĩa thống kê như một dấu hiệu cho thấy hai phương pháp điều trị có hiệu quả như nhau. Điều quan trọng không kém là không đánh đồng ý nghĩa thống kê với ý nghĩa lâm sàng. Tầm quan trọng lâm sàng có thể được giả định khi kết quả có ý nghĩa thống kê và mức độ của đáp ứng điều trị

Các nghiên cứu có thể chỉ ra liệu kết quả có ý nghĩa thống kê hay không và kết quả nào quan trọng về mặt lâm sàng và kết quả nào không. Trên hình. A1.2 cho thấy kết quả của bốn thử nghiệm mà toàn bộ CI<1, т.е. их результаты статистически значимы при Р <0,05 , . После высказанного предположения о том, что клинически важным различием было бы сокращение риска диареи на 20% (ОР = 0,8), все эти испытания показали клинически значимую оценку сокращения риска, и лишь в исследовании Treanor весь 95% ДИ меньше этой величины. Два других РКИ показали клинически важные результаты, которые не были статистически значимыми. Обратите внимание, что в трёх испытаниях точечные оценки эффективности лечения были почти идентичны, но ширина ДИ различалась (отражает размер выборки). Таким образом, по отдельности доказательная сила этих РКИ различна.

Và những người khác. Tất cả chúng đều là ước tính của các đối chứng lý thuyết của chúng, có thể thu được nếu không có mẫu mà là tổng thể chung. Nhưng than ôi, dân số nói chung rất đắt và thường không có sẵn.

Khái niệm về ước lượng khoảng thời gian

Bất kỳ ước tính mẫu nào cũng có một số phân tán, bởi vì là một biến ngẫu nhiên phụ thuộc vào các giá trị trong một mẫu cụ thể. Do đó, để có những suy luận thống kê đáng tin cậy hơn, người ta không chỉ nên biết ước tính điểm mà còn cả khoảng thời gian, với xác suất cao γ (gamma) bao gồm chỉ báo ước tính θ (theta).

Về mặt hình thức, đây là hai giá trị như vậy (thống kê) T1 (X)T2 (X), Cái gì T1< T 2 , mà ở một mức xác suất nhất định γ điều kiện được đáp ứng:

Trong ngắn hạn, nó có khả năng γ trở lên giá trị thực nằm giữa các điểm T1 (X)T2 (X), được gọi là giới hạn dưới và giới hạn trên mức độ tin cậy.

Một trong những điều kiện để xây dựng khoảng tin cậy là độ hẹp tối đa của nó, tức là nó phải càng ngắn càng tốt. Mong muốn là khá tự nhiên, bởi vì. nhà nghiên cứu cố gắng xác định vị trí chính xác hơn việc tìm kiếm tham số mong muốn.

Theo đó, khoảng tin cậy phải bao hàm các xác suất tối đa của phân phối. và bản thân điểm số là trung tâm.

Có nghĩa là, xác suất sai lệch (của chỉ số thực so với ước tính) trở lên bằng xác suất sai lệch xuống dưới. Cũng cần lưu ý rằng đối với các phân phối lệch, khoảng bên phải không bằng khoảng bên trái.

Hình trên cho thấy rõ ràng rằng mức độ tin cậy càng lớn thì khoảng - mối quan hệ trực tiếp càng rộng.

Đây là một giới thiệu nhỏ về lý thuyết ước lượng khoảng của các tham số chưa biết. Hãy chuyển sang việc tìm giới hạn tin cậy cho kỳ vọng toán học.

Khoảng tin cậy cho kỳ vọng toán học

Nếu dữ liệu gốc được phân phối nhiều hơn, thì giá trị trung bình sẽ là một giá trị bình thường. Điều này tuân theo quy tắc rằng kết hợp tuyến tính của các giá trị chuẩn cũng có phân phối chuẩn. Do đó, để tính toán xác suất, chúng ta có thể sử dụng công cụ toán học của luật phân phối chuẩn.

Tuy nhiên, điều này sẽ yêu cầu kiến ​​thức về hai tham số - giá trị kỳ vọng và phương sai, thường không được biết đến. Tất nhiên, bạn có thể sử dụng ước tính thay vì tham số (trung bình số học và), nhưng khi đó phân phối của giá trị trung bình sẽ không hoàn toàn bình thường, nó sẽ bị làm phẳng một chút. Công dân William Gosset của Ireland đã đặc biệt ghi nhận thực tế này khi ông công bố khám phá của mình trên tạp chí Biometrica tháng 3 năm 1908. Vì mục đích bí mật, Gosset đã ký với Student. Đây là cách phân phối t của Student xuất hiện.

Tuy nhiên, phân phối chuẩn của dữ liệu, được K. Gauss sử dụng trong phân tích sai số trong các quan sát thiên văn, là cực kỳ hiếm trong cuộc sống trên cạn và khá khó để thiết lập điều này (để có độ chính xác cao, cần khoảng 2.000 quan sát). Do đó, tốt nhất là bỏ giả định về tính chuẩn mực và sử dụng các phương pháp không phụ thuộc vào sự phân phối của dữ liệu gốc.

Câu hỏi đặt ra: phân phối của trung bình cộng là gì nếu nó được tính toán từ dữ liệu của một phân phối chưa biết? Câu trả lời được đưa ra bởi lý thuyết xác suất nổi tiếng Định lý giới hạn trung tâm(CPT). Trong toán học, có một số phiên bản của nó (các công thức đã được tinh chỉnh qua nhiều năm), nhưng tất cả chúng, nói một cách đại khái, đi đến phát biểu rằng tổng của một số lượng lớn các biến ngẫu nhiên độc lập tuân theo luật phân phối chuẩn.

Khi tính giá trị trung bình cộng, tổng các biến ngẫu nhiên được sử dụng. Từ đó nó chỉ ra rằng trung bình số học có phân phối chuẩn, trong đó giá trị kỳ vọng là giá trị kỳ vọng của dữ liệu ban đầu và phương sai là.

Những người thông minh biết cách chứng minh CLT, nhưng chúng tôi sẽ xác minh điều này với sự trợ giúp của một thử nghiệm được thực hiện trong Excel. Hãy mô phỏng một mẫu gồm 50 biến ngẫu nhiên được phân phối đồng đều (sử dụng hàm RANDOMBETWEEN trong Excel). Sau đó, chúng tôi sẽ tạo ra 1000 mẫu như vậy và tính giá trị trung bình cộng cho mỗi mẫu. Hãy nhìn vào sự phân bố của chúng.

Có thể thấy rằng phân phối của số trung bình là gần với quy luật thông thường. Nếu khối lượng mẫu và số lượng của chúng càng lớn, thì độ giống nhau càng tốt.

Bây giờ chúng ta đã tự mình thấy tính hợp lệ của CLT, chúng ta có thể, bằng cách sử dụng, tính toán khoảng tin cậy cho giá trị trung bình số học, bao gồm giá trị trung bình thực sự hoặc kỳ vọng toán học với một xác suất nhất định.

Để thiết lập giới hạn trên và giới hạn dưới, cần phải biết các tham số của phân phối chuẩn. Do đó, theo quy luật, chúng không được sử dụng: trung bình cộngphương sai mẫu. Một lần nữa, phương pháp này chỉ đưa ra giá trị gần đúng cho các mẫu lớn. Khi các mẫu nhỏ, thường nên sử dụng phân phối của Student. Đừng tin! Phân phối của Student cho giá trị trung bình chỉ xảy ra khi dữ liệu gốc có phân phối chuẩn, tức là hầu như không bao giờ. Do đó, tốt hơn là ngay lập tức đặt thanh tối thiểu cho lượng dữ liệu cần thiết và sử dụng các phương pháp tiệm cận đúng. Họ nói rằng 30 quan sát là đủ. Lấy 50 - bạn không thể sai.

T 1,2 là giới hạn dưới và giới hạn trên của khoảng tin cậy

- trung bình cộng mẫu

s0- độ lệch chuẩn mẫu (không thiên vị)

N - cỡ mẫu

γ - mức độ tin cậy (thường bằng 0,9, 0,95 hoặc 0,99)

c γ = Φ -1 ((1 + γ) / 2) là nghịch đảo của hàm phân phối chuẩn chuẩn. Nói một cách dễ hiểu, đây là số lỗi tiêu chuẩn từ trung bình cộng đến giới hạn dưới hoặc giới hạn trên (ba xác suất được chỉ ra tương ứng với các giá trị \ u200b \ u200bof 1,64, 1,96 và 2,58).

Bản chất của công thức là giá trị trung bình số học được lấy và sau đó một số tiền nhất định được tách ra khỏi nó ( với γ) lỗi tiêu chuẩn ( s 0 / √n). Mọi thứ đều đã biết, hãy nắm lấy nó và tính toán.

Trước khi sử dụng hàng loạt PC, họ đã sử dụng các giá trị của hàm phân phối chuẩn và nghịch đảo của nó. Chúng vẫn được sử dụng, nhưng sẽ hiệu quả hơn nếu chuyển sang các công thức Excel tạo sẵn. Tất cả các phần tử từ công thức trên (và) có thể được tính toán dễ dàng trong Excel. Nhưng cũng có một công thức làm sẵn để tính khoảng tin cậy - BÃO MẬT. Cú pháp của nó như sau.

THÔNG TIN MẬT MÃ (alpha, standard_dev, size)

alpha- mức ý nghĩa hoặc mức độ tin cậy, trong ký hiệu trên bằng 1-γ, tức là xác suất mà toán họckỳ vọng sẽ nằm ngoài khoảng tin cậy. Với mức độ tin cậy là 0,95, alpha là 0,05, v.v.

standard_off là độ lệch chuẩn của dữ liệu mẫu. Bạn không cần tính sai số chuẩn, Excel sẽ chia cho căn bậc n.

kích cỡ- cỡ mẫu (n).

Kết quả của hàm CONFIDENCE.NORM là số hạng thứ hai từ công thức tính khoảng tin cậy, tức là nửa khoảng. Theo đó, điểm dưới và điểm trên là giá trị trung bình ± giá trị thu được.

Như vậy, có thể xây dựng một thuật toán phổ quát để tính khoảng tin cậy cho giá trị trung bình cộng, thuật toán này không phụ thuộc vào sự phân bố của dữ liệu ban đầu. Cái giá phải trả cho tính phổ quát là bản chất tiệm cận của nó, tức là nhu cầu sử dụng mẫu tương đối lớn. Tuy nhiên, trong thời đại công nghệ hiện đại, việc thu thập lượng dữ liệu phù hợp thường không khó.

Kiểm tra các giả thuyết thống kê bằng cách sử dụng khoảng tin cậy

(mô-đun 111)

Một trong những vấn đề chính được giải quyết trong thống kê là. Tóm lại, bản chất của nó là thế này. Ví dụ, một giả định được đặt ra rằng kỳ vọng của dân số chung là bằng một giá trị nào đó. Sau đó, sự phân bố của các phương tiện mẫu được xây dựng, có thể được quan sát với một kỳ vọng nhất định. Tiếp theo, chúng ta xem xét vị trí trong phân phối có điều kiện này, giá trị trung bình thực nằm ở đâu. Nếu nó vượt quá giới hạn cho phép, thì việc xuất hiện một giá trị trung bình như vậy là rất khó xảy ra, và với một lần lặp lại thí nghiệm thì điều đó gần như là không thể, điều này mâu thuẫn với giả thuyết đã đưa ra, vốn đã bị bác bỏ thành công. Nếu giá trị trung bình không vượt quá mức tới hạn, thì giả thuyết không bị bác bỏ (nhưng nó cũng không được chứng minh!).

Vì vậy, với sự trợ giúp của khoảng tin cậy, trong trường hợp của chúng tôi đối với kỳ vọng, bạn cũng có thể kiểm tra một số giả thuyết. Nó rất dễ dàng để làm. Giả sử giá trị trung bình cộng của một số mẫu là 100. Giả thuyết đang được kiểm tra rằng giá trị kỳ vọng là 90. Nghĩa là, nếu chúng ta đặt câu hỏi một cách ban đầu, nó có vẻ như thế này: nó có thể là với giá trị thực của trung bình bằng 90, trung bình quan sát được là 100?

Để trả lời câu hỏi này, thông tin bổ sung về độ lệch chuẩn và cỡ mẫu sẽ được yêu cầu. Giả sử độ lệch chuẩn là 30 và số lượng quan sát là 64 (để dễ dàng trích xuất gốc). Khi đó, sai số tiêu chuẩn của giá trị trung bình là 30/8 hoặc 3,75. Để tính toán khoảng tin cậy 95%, bạn sẽ cần phải dành hai sai số tiêu chuẩn ở cả hai phía của giá trị trung bình (chính xác hơn là 1,96). Khoảng tin cậy sẽ xấp xỉ 100 ± 7,5, hoặc từ 92,5 đến 107,5.

Lý luận sâu hơn như sau. Nếu giá trị được kiểm tra nằm trong khoảng tin cậy, thì nó không mâu thuẫn với giả thuyết, vì phù hợp với giới hạn của dao động ngẫu nhiên (với xác suất 95%). Nếu điểm được kiểm tra nằm ngoài khoảng tin cậy thì xác suất của sự kiện như vậy là rất nhỏ, trong mọi trường hợp đều dưới mức có thể chấp nhận được. Do đó, giả thuyết bị bác bỏ vì mâu thuẫn với dữ liệu quan sát. Trong trường hợp của chúng ta, giả thuyết kỳ vọng nằm ngoài khoảng tin cậy (giá trị 90 đã kiểm định không nằm trong khoảng 100 ± 7,5), do đó nên bác bỏ nó. Trả lời câu hỏi cơ bản ở trên, người ta nên nói: không, nó không thể, trong mọi trường hợp, điều này cực kỳ hiếm khi xảy ra. Thông thường, điều này chỉ ra một xác suất cụ thể của việc bác bỏ giả thuyết (mức p), và không phải là một mức nhất định, theo đó khoảng tin cậy được xây dựng, nhưng nhiều hơn vào thời điểm khác.

Như bạn thấy, không khó để xây dựng khoảng tin cậy cho giá trị trung bình (hoặc kỳ vọng toán học). Điều chính là để nắm bắt bản chất, và sau đó mọi thứ sẽ đi. Trong thực tế, hầu hết sử dụng khoảng tin cậy 95%, khoảng hai sai số chuẩn ở hai bên của giá trị trung bình.

Đó là tất cả cho bây giờ. Tất cả những gì tốt nhất!

CAN THIỆP BẢO MẬT ĐỐI VỚI CÁC TẦN SỐ VÀ CÁC BỘ PHẬN

© 2008

Viện Y tế Công cộng Quốc gia, Oslo, Na Uy

Bài báo mô tả và thảo luận về việc tính toán khoảng tin cậy cho tần số và tỷ lệ bằng phương pháp Wald, Wilson, Klopper-Pearson, sử dụng phép biến đổi góc và phương pháp Wald với hiệu chỉnh Agresti-Cowll. Tài liệu được trình bày cung cấp thông tin chung về các phương pháp tính khoảng tin cậy cho tần số và tỷ lệ và nhằm khơi dậy sự quan tâm của độc giả tạp chí không chỉ trong việc sử dụng khoảng tin cậy khi trình bày kết quả nghiên cứu của chính họ mà còn trong việc đọc các tài liệu chuyên ngành trước đây. bắt đầu công việc trên các ấn phẩm trong tương lai.

Từ khóa: khoảng tin cậy, tần số, tỷ lệ

Trong một trong những xuất bản trước đây, mô tả dữ liệu định tính đã được đề cập ngắn gọn và có báo cáo rằng ước lượng khoảng của chúng thích hợp hơn ước tính điểm để mô tả tần suất xuất hiện của đặc điểm được nghiên cứu trong dân số chung. Thật vậy, vì các nghiên cứu được thực hiện bằng cách sử dụng dữ liệu mẫu, nên việc dự báo kết quả trên tổng thể chung phải chứa một yếu tố không chính xác trong ước lượng mẫu. Khoảng tin cậy là thước đo độ chính xác của tham số ước tính. Điều thú vị là trong một số cuốn sách về những điều cơ bản của thống kê cho các bác sĩ, chủ đề về khoảng tin cậy cho tần số hoàn toàn bị bỏ qua. Trong bài viết này, chúng tôi sẽ xem xét một số cách tính khoảng tin cậy cho các tần số, giả định các đặc điểm của mẫu như tính không lặp lại và tính đại diện, cũng như tính độc lập của các quan sát với nhau. Tần suất trong bài viết này không được hiểu là một con số tuyệt đối cho biết số lần giá trị này hoặc giá trị kia xuất hiện trong tổng thể, mà là một giá trị tương đối xác định tỷ lệ người tham gia nghiên cứu có đặc điểm đang được nghiên cứu.

Trong nghiên cứu y sinh, khoảng tin cậy 95% được sử dụng phổ biến nhất. Khoảng tin cậy này là vùng trong đó tỷ lệ thực giảm 95%. Nói cách khác, có thể nói chắc chắn 95% rằng giá trị thực của tần suất xuất hiện một tính trạng trong tổng thể chung sẽ nằm trong khoảng tin cậy 95%.

Hầu hết các sách giáo khoa thống kê cho các nhà nghiên cứu y tế báo cáo rằng lỗi tần số được tính bằng công thức

trong đó p là tần suất xuất hiện của đối tượng trong mẫu (giá trị từ 0 đến 1). Trong hầu hết các bài báo khoa học trong nước, giá trị của tần suất xuất hiện của một đối tượng trong mẫu (p) được chỉ ra, cũng như (các) sai số của nó ở dạng p ± s. Tuy nhiên, việc đưa ra khoảng tin cậy 95% cho tần suất xuất hiện của một đặc điểm trong tổng thể chung sẽ dễ hiểu hơn, khoảng tin cậy này sẽ bao gồm các giá trị từ

trước.

Trong một số sách giáo khoa, đối với các mẫu nhỏ, nên thay giá trị 1,96 bằng giá trị của t cho N - 1 bậc tự do, trong đó N là số quan sát trong mẫu. Giá trị của t được tìm thấy trong bảng phân phối t, có sẵn trong hầu hết các sách giáo khoa về thống kê. Việc sử dụng phân phối t cho phương pháp Wald không mang lại lợi thế rõ ràng so với các phương pháp khác được thảo luận dưới đây, và do đó không được một số tác giả hoan nghênh.

Phương pháp trên để tính khoảng tin cậy cho tần số hoặc phân số được đặt theo tên của Abraham Wald (Abraham Wald, 1902–1950), vì nó bắt đầu được sử dụng rộng rãi sau khi Wald và Wolfowitz xuất bản năm 1939. Tuy nhiên, bản thân phương pháp này đã được Pierre Simon Laplace (1749–1827) đề xuất sớm nhất là vào năm 1812.

Phương pháp Wald rất phổ biến, nhưng ứng dụng của nó có liên quan đến các vấn đề đáng kể. Phương pháp này không được khuyến nghị cho các cỡ mẫu nhỏ, cũng như trong trường hợp tần suất xuất hiện của một đối tượng địa lý có xu hướng bằng 0 hoặc 1 (0% hoặc 100%) và đơn giản là không thể thực hiện được đối với các tần số 0 và 1. Ngoài ra, xấp xỉ phân phối chuẩn, được sử dụng khi tính toán lỗi, "không hoạt động" trong trường hợp n p< 5 или n · (1 – p) < 5 . Более консервативные статистики считают, что n · p и n · (1 – p) должны быть не менее 10 . Более детальное рассмотрение метода Вальда показало, что полученные с его помощью доверительные интервалы в большинстве случаев слишком узки, то есть их применение ошибочно создает слишком оптимистичную картину, особенно при удалении частоты встречаемости признака от 0,5, или 50 % . К тому же при приближении частоты к 0 или 1 доверительный интревал может принимать отрицательные значения или превышать 1, что выглядит абсурдно для частот. Многие авторы совершенно справедливо не рекомендуют применять данный метод не только в уже упомянутых случаях, но и тогда, когда частота встречаемости признака менее 25 % или более 75 % . Таким образом, несмотря на простоту расчетов, метод Вальда может применяться лишь в очень ограниченном числе случаев. Зарубежные исследователи более категоричны в своих выводах и однозначно рекомендуют не применять этот метод для небольших выборок , а ведь именно с такими выборками часто приходится иметь дело исследователям-медикам.

Vì biến mới được phân phối bình thường, giới hạn dưới và giới hạn trên của khoảng tin cậy 95% cho biến φ sẽ là φ-1,96 và φ + 1,96left ">

Thay vì 1,96 đối với các mẫu nhỏ, nên thay giá trị của t cho N - 1 bậc tự do. Phương pháp này không cung cấp các giá trị âm và cho phép bạn ước tính chính xác hơn khoảng tin cậy cho các tần số so với phương pháp Wald. Ngoài ra, nó được mô tả trong nhiều sách tham khảo trong nước về thống kê y tế, tuy nhiên, điều này không dẫn đến việc nó được sử dụng rộng rãi trong nghiên cứu y học. Tính toán khoảng tin cậy bằng cách sử dụng biến đổi góc không được khuyến nghị cho các tần số gần bằng 0 hoặc 1.

Đây là lúc mà phần mô tả các phương pháp ước tính khoảng tin cậy trong hầu hết các sách về cơ bản về thống kê dành cho các nhà nghiên cứu y học thường kết thúc, và vấn đề này là điển hình không chỉ cho tài liệu trong nước mà còn cho cả tài liệu nước ngoài. Cả hai phương pháp đều dựa trên định lý giới hạn trung tâm, ngụ ý một mẫu lớn.

Xem xét những thiếu sót của việc ước lượng khoảng tin cậy bằng các phương pháp trên, Clopper (Clopper) và Pearson (Pearson) đã đề xuất vào năm 1934 một phương pháp tính toán cái gọi là khoảng tin cậy chính xác, có tính đến phân phối nhị thức của đặc điểm được nghiên cứu. Phương pháp này có sẵn trong nhiều máy tính trực tuyến, tuy nhiên, khoảng tin cậy thu được theo cách này trong hầu hết các trường hợp là quá rộng. Đồng thời, phương pháp này được khuyến khích sử dụng trong các trường hợp cần ước tính thận trọng. Mức độ thận trọng của phương pháp tăng lên khi kích thước mẫu giảm, đặc biệt là đối với N< 15 . описывает применение функции биномиального распределения для анализа качественных данных с использованием MS Excel, в том числе и для определения доверительных интервалов, однако расчет последних для частот в электронных таблицах не «затабулирован» в удобном для пользователя виде, а потому, вероятно, и не используется большинством исследователей.

Theo nhiều nhà thống kê, ước tính tối ưu nhất của khoảng tin cậy cho các tần số được thực hiện bằng phương pháp Wilson, được đề xuất từ ​​năm 1927, nhưng thực tế không được sử dụng trong nghiên cứu y sinh trong nước. Phương pháp này không chỉ giúp ước tính khoảng tin cậy cho cả tần số rất nhỏ và tần số rất cao, mà còn có thể áp dụng cho một số lượng nhỏ các quan sát. Nói chung, khoảng tin cậy theo công thức Wilson có dạng từ



trong đó nó nhận giá trị 1,96 khi tính khoảng tin cậy 95%, N là số lần quan sát và p là tần suất của đối tượng trong mẫu. Phương pháp này có sẵn trong máy tính trực tuyến, vì vậy ứng dụng của nó không có vấn đề gì. và không khuyến khích sử dụng phương pháp này cho n p< 4 или n · (1 – p) < 4 по причине слишком грубого приближения распределения р к нормальному в такой ситуации, однако зарубежные статистики считают метод Уилсона применимым и для малых выборок .

Ngoài phương pháp Wilson, phương pháp Wald hiệu chỉnh theo Agresti – Caull cũng được cho là cung cấp một ước lượng tối ưu về khoảng tin cậy cho các tần số. Hiệu chỉnh Agresti-Coulle là sự thay thế trong công thức Wald cho tần suất xuất hiện của một đặc điểm trong mẫu (p) bằng p`, khi tính toán nào 2 được thêm vào tử số và 4 được thêm vào mẫu số, nghĩa là , p` = (X + 2) / (N + 4), trong đó X là số người tham gia nghiên cứu có đặc điểm đang nghiên cứu và N là cỡ mẫu. Việc sửa đổi này tạo ra kết quả rất giống với kết quả của công thức Wilson, ngoại trừ khi tỷ lệ sự kiện tiến đến 0% hoặc 100% và mẫu nhỏ. Ngoài các phương pháp trên để tính khoảng tin cậy cho tần số, các hiệu chỉnh cho tính liên tục đã được đề xuất cho cả phương pháp Wald và phương pháp Wilson cho các mẫu nhỏ, nhưng các nghiên cứu đã chỉ ra rằng việc sử dụng chúng là không phù hợp.

Xem xét việc áp dụng các phương pháp trên để tính khoảng tin cậy bằng cách sử dụng hai ví dụ. Trong trường hợp đầu tiên, chúng tôi nghiên cứu một mẫu lớn gồm 1.000 người tham gia nghiên cứu được chọn ngẫu nhiên, trong đó 450 người có đặc điểm đang được nghiên cứu (nó có thể là yếu tố nguy cơ, kết quả hoặc bất kỳ đặc điểm nào khác), tần suất là 0,45, hoặc 45%. Trong trường hợp thứ hai, nghiên cứu được thực hiện bằng cách sử dụng một mẫu nhỏ, chẳng hạn chỉ 20 người và chỉ 1 người tham gia (5%) có đặc điểm được nghiên cứu. Khoảng tin cậy cho phương pháp Wald, cho phương pháp Wald với hiệu chỉnh Agresti-Coll, cho phương pháp Wilson được tính bằng máy tính trực tuyến do Jeff Sauro phát triển (http://www./wald.htm). Khoảng tin cậy Wilson hiệu chỉnh liên tục được tính bằng máy tính được cung cấp bởi Wassar Stats: Web Site for Statistical Computation (http://faculty.vassar.edu/lowry/prop1.html). Các phép tính sử dụng phép biến đổi góc Fisher được thực hiện "thủ công" bằng cách sử dụng giá trị tới hạn của t tương ứng với 19 và 999 bậc tự do. Kết quả tính toán được trình bày trong bảng cho cả hai ví dụ.

Khoảng tin cậy được tính theo sáu cách khác nhau cho hai ví dụ được mô tả trong văn bản

Phương pháp tính toán khoảng tin cậy

P = 0,0500 hoặc 5%

KTC 95% cho X = 450, N = 1000, P = 0,4500 hoặc 45%

–0,0455–0,2541

Walda với hiệu chỉnh Agresti-Coll

<,0001–0,2541

Wilson với hiệu chỉnh liên tục

"Phương pháp chính xác" của Klopper-Pearson

Biến đổi góc

<0,0001–0,1967

Như có thể thấy trong bảng, ví dụ đầu tiên, khoảng tin cậy được tính bằng phương pháp Wald "được chấp nhận chung" đi vào vùng âm, không thể là trường hợp của tần số. Thật không may, những sự cố như vậy không phải là hiếm trong văn học Nga. Cách truyền thống biểu diễn dữ liệu dưới dạng tần số và lỗi của nó phần nào che dấu vấn đề này. Ví dụ, nếu tần suất xuất hiện của một đặc điểm (tính bằng phần trăm) được trình bày là 2,1 ± 1,4, thì điều này không “gây khó chịu” bằng 2,1% (KTC 95%: –0,7; 4,9), mặc dù và có nghĩa là như nhau. Phương pháp Wald với hiệu chỉnh Agresti-Coulle và tính toán bằng cách sử dụng phép biến đổi góc đưa ra giới hạn dưới có xu hướng bằng không. Phương pháp Wilson với hiệu chỉnh liên tục và "phương pháp chính xác" cho khoảng tin cậy rộng hơn phương pháp Wilson. Đối với ví dụ thứ hai, tất cả các phương pháp đều đưa ra khoảng tin cậy xấp xỉ như nhau (sự khác biệt chỉ xuất hiện ở phần nghìn), điều này không có gì đáng ngạc nhiên, vì tần suất của sự kiện trong ví dụ này không chênh lệch nhiều so với 50% và kích thước mẫu là khá lớn. .

Đối với những độc giả quan tâm đến vấn đề này, chúng tôi có thể giới thiệu các công trình của R. G. Newcombe và Brown, Cai và Dasgupta, đưa ra ưu và nhược điểm của việc sử dụng 7 và 10 phương pháp khác nhau để tính khoảng tin cậy tương ứng. Từ các sách hướng dẫn trong nước, cuốn sách và được giới thiệu, trong đó, ngoài phần mô tả chi tiết lý thuyết, phương pháp Wald và Wilson được trình bày, cũng như phương pháp tính khoảng tin cậy, có tính đến phân bố tần số nhị thức. Ngoài các máy tính trực tuyến miễn phí (http://www./wald.htm và http://faculty.vassar.edu/lowry/prop1.html), khoảng tin cậy cho tần số (và không chỉ!) Có thể được tính bằng cách sử dụng Chương trình CIA (Phân tích khoảng tin cậy), có thể tải xuống từ http: // www. trường trung cấp. soton. AC. uk / cia /.

Bài tiếp theo sẽ xem xét các cách đơn biến để so sánh dữ liệu định tính.

Thư mục

Banerjee A. Thống kê y tế bằng ngôn ngữ đơn giản: một khóa học nhập môn / A. Banerzhi. - M.: Y học thực hành, 2007. - 287 tr. Thống kê y tế /. - M.: Cơ quan Thông tin Y tế, 2007. - 475 tr. Glanz S. Thống kê y học-sinh học / S. Glants. - M.: Thực hành, 1998. Kiểu dữ liệu, xác minh phân bố và thống kê mô tả // Sinh thái học con người - 2008. - Số 1. - Tr 52–58. Zhizhin K.S.. Thống kê y tế: SGK /. - Rostov n / D: Phoenix, 2007. - 160 tr. Thống kê Y tế Ứng dụng /,. - Xanh Pê-téc-bua. : Folio, 2003. - 428 tr. Lakin G. F. Sinh trắc học /. - M.: Cao học, 1990. - 350 tr. Medic V. A. Thống kê toán học trong y học / ,. - M.: Tài chính và thống kê, 2007. - 798 tr. Thống kê toán học trong nghiên cứu lâm sàng / ,. - M.: GEOTAR-MED, 2001. - 256 tr. Junkerov V. . Xử lý thống kê y học của dữ liệu nghiên cứu y tế / ,. - Xanh Pê-téc-bua. : VmedA, 2002. - 266 tr. Agresti A.Ước tính gần đúng tốt hơn là chính xác để ước lượng khoảng thời gian của tỷ lệ nhị thức / A. Agresti, B. Coull // Nhà thống kê người Mỹ. - 1998. - N 52. - S. 119-126. Altman D. Thống kê với độ tin cậy // D. Altman, D. Machin, T. Bryant, M. J. Gardner. - Luân Đôn: BMJ Books, 2000. - 240 tr. Brown L.D.Ước lượng khoảng cho một tỷ lệ nhị thức / L. D. Brown, T. T. Cai, A. Dasgupta // Khoa học thống kê. - 2001. - N 2. - Tr 101-133. Clopper C.J. Việc sử dụng độ tin cậy hoặc giới hạn fiducial được minh họa trong trường hợp của nhị thức / C. J. Clopper, E. S. Pearson // Biometrika. - Năm 1934. - N 26. - Tr 404-413. Garcia-Perez M. A. Về khoảng tin cậy cho tham số nhị thức / M. A. Garcia-Perez // Chất lượng và số lượng. - 2005. - N 39. - Tr 467-481. Motulsky H. Thống kê sinh học trực quan // H. Motulsky. - Oxford: Nhà xuất bản Đại học Oxford, 1995. - 386 tr. Newcombe R.G. Khoảng tin cậy hai mặt cho tỷ lệ đơn: So sánh bảy phương pháp / R. G. Newcombe // Thống kê trong y học. - 1998. - N. 17. - Tr 857–872. Sauro J.Ước tính tỷ lệ hoàn thành từ các mẫu nhỏ sử dụng khoảng tin cậy nhị thức: so sánh và khuyến nghị / J. Sauro, J. R. Lewis // Kỷ yếu cuộc họp thường niên của các nhân tố con người và xã hội thái học. - Orlando, FL, 2005. Wald A. Giới hạn tin cậy cho hàm phân phối liên tục // A. Wald, J. Wolfovitz // Biên niên sử về thống kê toán học. - 1939. - N 10. - Tr 105–118. Wilson E. B. Suy luận xác suất, quy luật kế thừa và suy luận thống kê / E. B. Wilson // Tạp chí Hiệp hội Thống kê Hoa Kỳ. - Năm 1927. - N 22. - Tr 209-212.

PHỎNG VẤN BÍ MẬT ĐỐI VỚI CÁC GIAI ĐOẠN

MỘT. M. Grjibovski

Viện Y tế Công cộng Quốc gia, Oslo, Na Uy

Bài báo trình bày một số phương pháp tính toán khoảng tin cậy cho tỷ lệ nhị thức, cụ thể là, phương pháp Wald, Wilson, arcsine, Agresti-Coull và Clopper-Pearson chính xác. Bài báo chỉ giới thiệu chung về vấn đề ước lượng khoảng tin cậy của một tỷ lệ nhị thức và mục đích của nó không chỉ là kích thích người đọc sử dụng khoảng tin cậy khi trình bày kết quả nghiên cứu thực nghiệm mà còn khuyến khích họ tham khảo sách thống kê trước khi phân tích dữ liệu riêng và chuẩn bị bản thảo.

từ khóa: khoảng tin cậy, tỷ lệ

Thông tin liên lạc:

Cố vấn cấp cao, Viện Y tế Công cộng Quốc gia, Oslo, Na Uy