Güven aralığı. Tıbbi istatistiklerin ABC'si

Varyansın bilinen bir değeri durumunda dağılımın ortalama değerini tahmin etmek için MS EXCEL'de bir güven aralığı oluşturalım.

tabii ki seçim güven seviyesi tamamen eldeki göreve bağlıdır. Bu nedenle, hava yolcusunun uçağın güvenilirliğine olan güven derecesi, elbette, alıcının ampulün güvenilirliğine olan güven derecesinden daha yüksek olmalıdır.

Sorun bildirimi

den olduğunu varsayalım nüfus almış örneklem beden tahmin ediliyor ki standart sapma bu dağılım biliniyor. Bu esasa göre gerekli örnekler bilinmeyeni değerlendirmek dağılım ortalaması(μ, ) ve karşılık gelen yapıyı oluşturun iki taraflı güven aralığı.

Puan Tahmini

den bilindiği gibi İstatistik(hadi diyelim X bkz.) dır-dir ortalamanın tarafsız tahmini Bu nüfus ve N(μ;σ 2 /n) dağılımına sahiptir.

Not: Peki ya inşa etmeniz gerekiyorsa güven aralığı dağıtım durumunda, hangi değil normal? Bu durumda, yeterince büyük bir boyutta olduğunu söyleyen kurtarmaya gelir. örnekler dağıtımdan n olmayan normal, istatistiklerin örnekleme dağılımı Х av olacak yaklaşık olarak karşılık normal dağılım N(μ;σ 2 /n) parametreleriyle.

Yani, Nokta tahmini orta dağıtım değerleri bizde var örnek ortalama, yani X bkz.. Şimdi meşgul olalım güven aralığı.

Bir güven aralığı oluşturma

Genellikle, dağılımı ve parametrelerini bilerek, rastgele bir değişkenin belirli bir aralıktan bir değer alma olasılığını hesaplayabiliriz. Şimdi tersini yapalım: belirli bir olasılıkla rastgele değişkenin düştüğü aralığı bulun. Örneğin, mülklerden normal dağılım% 95 olasılıkla, rastgele bir değişkenin dağıtıldığı bilinmektedir. normal hukuk, yaklaşık +/- 2 aralığına düşecektir ortalama değer(hakkında makaleye bakın). Bu aralık bizim prototipimiz olarak hizmet edecek. güven aralığı.

Şimdi dağılımı bilip bilmediğimize bakalım. , Bu aralığı hesaplamak için? Soruyu cevaplamak için dağılım biçimini ve parametrelerini belirtmeliyiz.

Dağılım biçimini biliyoruz normal dağılım(bahsettiğimizi unutmayın örnekleme dağılımı İstatistik X bkz.).

μ parametresi bizim için bilinmiyor (sadece kullanılarak tahmin edilmesi gerekiyor güven aralığı), ancak tahminimiz var X bkz. dayalı olarak hesaplanır örneklem, hangi kullanılabilir.

İkinci parametre örnek ortalama standart sapma bilinecek, σ/√n'ye eşittir.

Çünkü μ bilmiyoruz, o zaman +/- 2 aralığını oluşturacağız Standart sapma kimden değil ortalama değer, ancak bilinen tahmininden X bkz.. Şunlar. hesaplarken güven aralığı bunu varsaymayacağız X bkz.+/- 2 aralığına girer Standart sapmaμ üzerinde %95 olasılıkla ve aralığın +/- 2 olduğunu varsayacağız Standart sapma itibaren X bkz.%95 olasılıkla μ'yi kapsayacaktır - genel nüfusun ortalaması, olan örneklem. Bu iki ifade eşdeğerdir, ancak ikinci ifade oluşturmamıza izin verir. güven aralığı.

Ek olarak, aralığı daraltırız: dağıtılmış rastgele bir değişken normal hukuk, %95 olasılıkla +/- 1.960 aralığına girer Standart sapma,+/- 2 değil Standart sapma. Bu formül kullanılarak hesaplanabilir \u003d NORM.ST.OBR ((1 + 0.95) / 2), santimetre. örnek dosya Sayfa Aralığı.

Şimdi oluşturmamıza hizmet edecek olasılıksal bir ifade formüle edebiliriz. güven aralığı:
"Olasılık nüfus ortalaması konumundan örnek ortalama 1.960" içinde örnek ortalamanın standart sapmaları", %95'e eşittir.

İfadede belirtilen olasılık değerinin özel bir adı vardır. ile ilişkili olan basit bir ifade ile önem düzeyi α (alfa) güven seviyesi =1 . bizim durumumuzda önem düzeyi α =1-0,95=0,05 .

Şimdi, bu olasılık ifadesine dayanarak, hesaplamak için bir ifade yazıyoruz. güven aralığı:

nerede Zα/2 standart normal dağılım(rastgele bir değişkenin böyle bir değeri z, ne P(z>=Za/2 )=α/2).

Not: Üst α/2-kantil genişliği tanımlar güven aralığı içinde Standart sapma örnek ortalama. Üst α/2-kantil standart normal dağılım her zaman 0'dan büyüktür, bu çok uygundur.

Bizim durumumuzda, α=0.05'te, üst α/2-kuantil 1.960'a eşittir. Diğer anlamlılık seviyeleri için α (%10; %1) üst α/2-kuantil Za/2 = NORM.ST.OBR (1-α / 2) formülü kullanılarak veya biliniyorsa hesaplanabilir güven seviyesi, =NORM.ST.OBR((1+güven düzeyi)/2).

Genellikle inşa ederken ortalamayı tahmin etmek için güven aralıkları sadece kullan üst α/2-çeyreklik ve kullanma alt α/2-çeyreklik. Bu mümkün çünkü standart normal dağılım x eksenine göre simetrik ( dağılımının yoğunluğu yaklaşık simetrik ortalama, yani 0). Bu nedenle hesaplamaya gerek yoktur. alt α/2-kuantil(sadece α denir /2-kuantil), çünkü bu eşittir üst α/2-çeyreklik eksi işaretiyle.

x'in dağılımının şekline rağmen, karşılık gelen rastgele değişkenin X bkz. dağıtılmış yaklaşık olarak iyi N(μ;σ 2 /n) (hakkındaki makaleye bakın). Bu nedenle, genel olarak, yukarıdaki ifade için güven aralığı sadece yaklaşıktır. x dağıtılırsa normal hukuk N(μ;σ 2 /n), sonra ifade güven aralığı doğru.

MS EXCEL'de güven aralığının hesaplanması

Hadi sorunu çözelim.
Bir elektronik bileşenin bir giriş sinyaline tepki süresi, bir cihazın önemli bir özelliğidir. Bir mühendis, ortalama yanıt süresi için %95'lik bir güven düzeyinde bir güven aralığı çizmek istiyor. Önceki deneyimlerden mühendis, yanıt süresinin standart sapmasının 8 ms olduğunu bilir. Mühendisin tepki süresini tahmin etmek için 25 ölçüm yaptığı biliniyor, ortalama değer 78 ms idi.

Çözüm: Bir mühendis, bir elektronik cihazın tepki süresini bilmek ister, ancak tepki süresinin sabit olmadığını, kendi dağılımına sahip rastgele bir değişken olduğunu anlar. Bu yüzden umabileceği en iyi şey, bu dağılımın parametrelerini ve şeklini belirlemektir.

Ne yazık ki, sorunun durumundan, yanıt süresinin dağılımının biçimini bilmiyoruz (olması gerekmez). normal). , bu dağılım da bilinmiyor. Sadece o biliniyor standart sapmaσ=8. Bu nedenle, olasılıkları hesaplayamaz ve inşa edemezken güven aralığı.

dağılımını bilmesek de zaman ayrı yanıt göre biliyoruz CPT, örnekleme dağılımı ortalama tepki süresi yaklaşık olarak normal(koşulların CPT gerçekleştirilir, çünkü boyut örnekler yeterince büyük (n=25)) .

Üstelik, ortalama bu dağılım eşittir ortalama değer birim yanıt dağılımları, yani μ. ANCAK standart sapma bu dağılımın (σ/√n) değeri =8/ROOT(25) formülü kullanılarak hesaplanabilir.

Mühendisin aldığı da bilinmektedir. Nokta tahmini parametre μ 78 ms'ye eşittir (X cf). Bu nedenle, şimdi olasılıkları hesaplayabiliriz, çünkü dağıtım formunu biliyoruz ( normal) ve parametreleri (Х ср ve σ/√n).

Mühendis bilmek istiyor beklenen değer tepki süresi dağılımının μ'si. Yukarıda belirtildiği gibi, bu μ eşittir ortalama yanıt süresinin örnek dağılımının beklentisi. eğer kullanırsak normal dağılım N(X cf; σ/√n), o zaman istenen μ yaklaşık %95 olasılıkla +/-2*σ/√n aralığında olacaktır.

Önem düzeyi 1-0.95=0.05'e eşittir.

Son olarak, sol ve sağ sınırı bulun güven aralığı.
Sol kenarlık: \u003d 78-NORM.ST.INR (1-0.05 / 2) * 8 / KÖK (25) = 74,864
Sağ kenarlık: \u003d 78 + NORM ST OBR (1-0.05 / 2) * 8 / KÖK (25) \u003d 81.136

Sol kenarlık: =NORM.INV(0.05/2, 78, 8/SQRT(25))
Sağ kenarlık: =NORM.INV(1-0.05/2, 78, 8/SQRT(25))

Cevap: güven aralığı de %95 güven seviyesi ve σ=8msn eşittir 78+/-3.136 ms

AT Sigma sayfasındaki örnek dosya bilinen hesaplama ve inşaat için bir form oluşturdu iki taraflı güven aralığı keyfi için örnekler verilen bir σ ve önem düzeyi.

GÜVENİLİRLİK.NORM() işlevi

eğer değerler örnekler menzilde B20:B79 , a önem düzeyi 0,05'e eşit; sonra MS EXCEL formülü:
=ORTALAMA(B20:B79)-GÜVEN(0,05;σ, SAYI(B20:B79))
sol kenarlığı döndürür güven aralığı.

Aynı sınır aşağıdaki formül kullanılarak hesaplanabilir:
=ORTALAMA(B20:B79)-NORM.ST.INV(1-0.05/2)*σ/SQRT(COUNT(B20:B79))

Not: TRUST.NORM() işlevi MS EXCEL 2010'da göründü. MS EXCEL'in önceki sürümlerinde TRUST() işlevi kullanılıyordu.

Güvenilirlik aralığı ( ingilizce Güvenilirlik aralığı) belirli bir önem düzeyi için hesaplanan istatistiklerde kullanılan aralık tahmin türlerinden biri. Genel popülasyonun bilinmeyen bir istatistiksel parametresinin gerçek değerinin, seçilen istatistiksel anlamlılık düzeyi tarafından verilen bir olasılıkla elde edilen değerler aralığında olduğuna dair bir açıklama yapmayı mümkün kılarlar.

Normal dağılım

Veri popülasyonunun varyansı (σ 2 ) bilindiğinde, güven sınırlarını (güven aralığının sınır noktaları) hesaplamak için bir z-skoru kullanılabilir. Bir t-dağılımı kullanmakla karşılaştırıldığında, bir z-skoru kullanmak sadece daha dar bir güven aralığı sağlamakla kalmayacak, aynı zamanda Z-skoru normal bir dağılıma dayalı olduğundan, ortalama ve standart sapma (σ) hakkında daha güvenilir tahminler de sağlayacaktır.

formül

Veri popülasyonunun standart sapması biliniyorsa, güven aralığının sınır noktalarını belirlemek için aşağıdaki formül kullanılır.

L = X - Z α/2 σ
√n

Örnek

Örneklem boyutunun 25 gözlem olduğunu, örneklem ortalamasının 15 olduğunu ve popülasyon standart sapmasının 8 olduğunu varsayın. Bu durumda güven aralığının alt ve üst sınırları

L = 15 - 1,96 8 = 11,864
√25
L = 15 + 1.96 8 = 18,136
√25

Böylece genel popülasyonun matematiksel beklentisinin %95 olasılıkla 11.864 ile 18.136 aralığına düşeceğini söyleyebiliriz.

Güven aralığını daraltma yöntemleri

Aralığın çalışmamızın amaçları için çok geniş olduğunu varsayalım. Güven aralığı aralığını azaltmanın iki yolu vardır.

  1. İstatistiksel anlamlılık düzeyini azaltın α.
  2. Örnek boyutunu artırın.

İstatistiksel anlamlılık düzeyini α=%10'a indirgeyerek, Z α/2 =1.64'e eşit bir Z-puanı elde ederiz. Bu durumda, aralığın alt ve üst sınırları olacaktır.

L = 15 - 1.64 8 = 12,376
√25
L = 15 + 1.64 8 = 17,624
√25

Ve güven aralığının kendisi şu şekilde yazılabilir:

Bu durumda, genel popülasyonun matematiksel beklentisinin %90 olasılıkla aralığa düşeceği varsayımını yapabiliriz.

α istatistiksel anlamlılık seviyesini korumak istiyorsak, o zaman tek alternatif örneklem büyüklüğünü arttırmaktır. 144 gözleme çıkararak, aşağıdaki güven sınırlarının değerlerini elde ederiz.

L = 15 - 1,96 8 = 13,693
√144
L = 15 + 1.96 8 = 16,307
√144

Güven aralığının kendisi şöyle görünecektir:

Bu nedenle istatistiksel anlamlılık düzeyini düşürmeden güven aralığını daraltmak ancak örneklem büyüklüğünü artırmakla mümkündür. Örnek boyutunu artırmak mümkün değilse, güven aralığının daraltılması yalnızca istatistiksel anlamlılık düzeyinin azaltılmasıyla sağlanabilir.

Normal olmayan bir dağılım için bir güven aralığı oluşturma

Popülasyonun standart sapması bilinmiyorsa veya dağılım normal değilse, bir güven aralığı oluşturmak için t-dağılımı kullanılır. Bu teknik, Z-skoruna dayalı tekniğe kıyasla daha geniş güven aralıklarında ifade edilen daha tutucudur.

formül

t dağılımına dayalı güven aralığının alt ve üst sınırlarını hesaplamak için aşağıdaki formüller kullanılır.

L = X - ta σ
√n

Öğrenci dağılımı veya t-dağılımı yalnızca bir parametreye bağlıdır - bireysel özellik değerlerinin sayısına eşit olan serbestlik derecesi sayısı (örnekteki gözlem sayısı). Belirli bir serbestlik derecesi (n) için Student t-testinin değeri ve istatistiksel anlamlılık düzeyi α, arama tablolarında bulunabilir.

Örnek

Örnek boyutunun 25 ayrı değer olduğunu, örneğin ortalamasının 50 olduğunu ve örneğin standart sapmasının 28 olduğunu varsayın. İstatistiksel anlamlılık düzeyi α=%5 için bir güven aralığı oluşturmanız gerekir.

Bizim durumumuzda, serbestlik derecesi sayısı 24'tür (25-1), bu nedenle, istatistiksel anlamlılık düzeyi α=%5 için Student t-testinin karşılık gelen tablo değeri 2.064'tür. Bu nedenle, güven aralığının alt ve üst sınırları

L = 50 - 2.064 28 = 38,442
√25
L = 50 + 2.064 28 = 61,558
√25

Ve aralığın kendisi şu şekilde yazılabilir:

Böylece genel popülasyonun matematiksel beklentisinin %95 olasılıkla aralığında olacağını söyleyebiliriz.

Bir t-dağılımı kullanmak, istatistiksel anlamlılığı azaltarak veya örnek boyutunu artırarak güven aralığını daraltmanıza olanak tanır.

Örneğimizin koşullarında istatistiksel anlamlılığı %95'ten %90'a düşürerek, Student's t-test 1.711'in ilgili tablo değerini elde ederiz.

L = 50 - 1.711 28 = 40,418
√25
L = 50 + 1.711 28 = 59,582
√25

Bu durumda genel popülasyonun matematiksel beklentisinin %90 olasılıkla aralığında olacağını söyleyebiliriz.

İstatistiksel anlamlılığı azaltmak istemiyorsak, tek alternatif örneklem büyüklüğünü arttırmaktır. Diyelim ki, örneğin ilk koşulundaki gibi 25 değil, 64 bireysel gözlem. Student's t-testinin 63 serbestlik derecesi (64-1) ve istatistiksel anlamlılık düzeyi α=5 için tablo değeri 1.998'dir.

L = 50 - 1.998 28 = 43,007
√64
L = 50 + 1.998 28 = 56,993
√64

Bu bize, genel popülasyonun matematiksel beklentisinin %95 olasılıkla aralıkta olacağını iddia etme fırsatı verir.

Büyük Örnekler

Büyük örnekler, 100'den fazla bireysel gözleme sahip bir veri popülasyonundan alınan örneklerdir.İstatistiksel çalışmalar, popülasyonun dağılımı normal olmasa bile daha büyük örneklerin normal dağılma eğiliminde olduğunu göstermiştir. Ek olarak, bu tür örnekler için, z-skoru ve t-dağılımı kullanımı, güven aralıkları oluşturulurken yaklaşık olarak aynı sonuçları verir. Bu nedenle, büyük örnekler için, t-dağılımı yerine normal dağılım için bir z-skorunun kullanılması kabul edilebilir.

Özetliyor

Güven aralığı(CI; İngilizce'de, güven aralığı - CI) örneklemdeki çalışmada elde edilen, bu tür tüm hastaların popülasyonu (genel popülasyon) hakkında sonuçlar çıkarmak için çalışma sonuçlarının doğruluğunun (veya belirsizliğinin) bir ölçüsünü verir. ). %95 GA'nın doğru tanımı şu şekilde formüle edilebilir: Bu tür aralıkların %95'i popülasyondaki gerçek değeri içerecektir. Bu yorum biraz daha az doğrudur: CI, gerçek değeri içerdiğinden %95 emin olabileceğiniz değer aralığıdır. CI kullanılırken, istatistiksel anlamlılık testi sonucunda elde edilen P değerinin aksine nicel etkinin belirlenmesine vurgu yapılır. P değeri herhangi bir miktarı değerlendirmez, bunun yerine "etki yok" sıfır hipotezine karşı kanıtın gücünün bir ölçüsü olarak hizmet eder. P'nin değeri tek başına bize farkın büyüklüğü ve hatta yönü hakkında hiçbir şey söylemez. Bu nedenle, bağımsız P değerleri makalelerde veya özetlerde kesinlikle bilgi vermez. Buna karşılık, CI hem bir tedavinin faydası gibi acil ilginin etkisinin miktarını hem de kanıtın gücünü gösterir. Bu nedenle DI, DM uygulamasıyla doğrudan ilişkilidir.

CI ile gösterilen istatistiksel analize yönelik tahmin yaklaşımı, ilgi etkisinin büyüklüğünü (tanısal testin duyarlılığı, öngörülen insidans, tedavi ile göreceli risk azalması, vb.) ve aynı zamanda bu konudaki belirsizliğin ölçümünü ölçmeyi amaçlar. Efekt. Çoğu zaman, CI, tahminin her iki tarafında gerçek değerin bulunması muhtemel olan değer aralığıdır ve bundan %95 emin olabilirsiniz. %95 olasılığı kullanma kuralı, P değerinin yanı sıra keyfidir.<0,05 для оценки статистической значимости, и авторы иногда используют 90% или 99% ДИ. Заметим, что слово «интервал» означает диапазон величин и поэтому стоит в единственном числе. Две величины, которые ограничивают интервал, называются «доверительными пределами».

CI, farklı hasta grupları üzerinde gerçekleştirilen aynı çalışmanın aynı sonuçları vermeyeceği, ancak sonuçlarının gerçek ancak bilinmeyen değer etrafında dağıtılacağı fikrine dayanmaktadır. Başka bir deyişle, CI bunu "örneğe bağlı değişkenlik" olarak tanımlar. CI, diğer nedenlerden kaynaklanan ek belirsizliği yansıtmaz; özellikle, seçici hasta kaybının izleme, zayıf uyum veya yanlış sonuç ölçümü, körleme eksikliği vb. üzerindeki etkilerini içermez. Bu nedenle CI, toplam belirsizlik miktarını her zaman hafife alır.

Güven Aralığı Hesaplaması

Tablo A1.1. Bazı klinik ölçümler için standart hatalar ve güven aralıkları

Tipik olarak, CI, iki oran arasındaki fark (d) ve bu farkın tahminindeki standart hata (SE) gibi nicel bir ölçümün gözlemlenen bir tahmininden hesaplanır. Bu şekilde elde edilen yaklaşık %95 GA d ± 1.96 SE'dir. Formül, sonuç ölçüsünün niteliğine ve CI'nin kapsamına göre değişir. Örneğin, randomize, plasebo kontrollü bir aselüler boğmaca aşısı denemesinde, aşı alan 1670 bebekten 72'sinde (%4.3) ve kontrol grubunda 1665 bebekten 240'ında (%14.4) boğmaca gelişti. Mutlak risk azalması olarak bilinen yüzde farkı %10,1'dir. Bu farkın GD'si %0.99'dur. Buna göre, %95 GA %10,1 + %1,96 x %0,99'dur, yani. 8.2'den 12.0'a.

Farklı felsefi yaklaşımlara rağmen, CI'ler ve istatistiksel anlamlılık testleri matematiksel olarak yakından ilişkilidir.

Bu nedenle, P'nin değeri "anlamlıdır", yani. R<0,05 соответствует 95% ДИ, который исключает величину эффекта, указывающую на отсутствие различия. Например, для различия между двумя средними пропорциями это ноль, а для относительного риска или отношения шансов - единица. При некоторых обстоятельствах эти два подхода могут быть не совсем эквивалентны. Преобладающая точка зрения: оценка с помощью ДИ - предпочтительный подход к суммированию результатов исследования, но ДИ и величина Р взаимодополняющи, и во многих статьях используются оба способа представления результатов.

CI cinsinden ifade edilen tahminin belirsizliği (yanlışlığı), büyük ölçüde örneklem boyutunun karekökü ile ilgilidir. Küçük örnekler, büyük örneklerden daha az bilgi sağlar ve CI'ler daha küçük örneklerde buna bağlı olarak daha geniştir. Örneğin, Helicobacter pylori enfeksiyonunu teşhis etmek için kullanılan üç testin performansını karşılaştıran bir makale, üre nefes testi duyarlılığının %95,8 (%95 CI 75-100) olduğunu bildirdi. %95,8'lik rakam etkileyici görünse de, 24 yetişkin H. pylori hastasının küçük örneklem büyüklüğü, geniş CI ile gösterildiği gibi, bu tahminde önemli bir belirsizlik olduğu anlamına gelir. Gerçekten de, %75'lik alt sınır, %95,8 tahmininden çok daha düşüktür. 240 kişilik bir örneklemde aynı duyarlılık gözlemlenirse, %95 GA 92.5-98,0 olur ve bu da testin yüksek düzeyde duyarlı olduğuna dair daha fazla güvence verir.

Randomize kontrollü çalışmalarda (RCT'ler), anlamlı olmayan sonuçlar (yani, P > 0.05 olanlar) özellikle yanlış yorumlamaya açıktır. CI, sonuçların klinik olarak yararlı gerçek etkiyle ne kadar uyumlu olduğunu gösterdiği için burada özellikle yararlıdır. Örneğin, kolonda sütür ile zımba anastomozu karşılaştıran bir RKÇ'de, hastaların sırasıyla %10.9 ve %13.5'inde yara enfeksiyonu gelişmiştir (P = 0.30). Bu fark için %95 GA %2,6'dır (-2 ila +8). 652 hastayı içeren bu çalışmada bile, iki prosedürden kaynaklanan enfeksiyon insidansında küçük bir fark olması muhtemeldir. Çalışma ne kadar küçük olursa, belirsizlik o kadar büyük olur. Sung et al. 100 hastada akut varis kanaması için oktreotid infüzyonunu acil skleroterapi ile karşılaştıran bir RKÇ gerçekleştirdi. Oktreotid grubunda kanamayı durdurma oranı %84; skleroterapi grubunda - %90, bu da P = 0.56 verir. Bahsedilen çalışmada devam eden kanama oranlarının yara enfeksiyonu oranlarına benzer olduğuna dikkat edin. Ancak bu durumda, müdahalelerdeki fark için %95 GA %6'dır (-7 ila +19). Bu aralık, klinik açıdan ilgi çekici olabilecek %5'lik bir farkla karşılaştırıldığında oldukça geniştir. Çalışmanın etkinlik açısından önemli bir farkı dışlamadığı açıktır. Bu nedenle yazarların "oktreotid infüzyonu ve skleroterapi varis kanamalarının tedavisinde eşit derecede etkilidir" sonucu kesinlikle geçerli değildir. Mutlak risk azaltma (ARR) için %95 CI'nin sıfır içerdiği bu gibi durumlarda, burada olduğu gibi NNT için CI'yi (tedavi edilmesi gereken sayı) yorumlamak oldukça zordur. NLP ve CI, ACP'nin karşılıklarından (bu değerler yüzde olarak verilirse 100 ile çarpılarak) elde edilir. Burada NPP = 100: 6 = 16,6 ve %95 CI -14,3 ila 5,3 elde ederiz. Tablodaki "d" dipnotundan da anlaşılacağı gibi. A1.1, bu CI, 5,3'ten sonsuza kadar NTPP ve 14.3'ten sonsuza kadar NTLP değerlerini içerir.

CI'ler en sık kullanılan istatistiksel tahminler veya karşılaştırmalar için oluşturulabilir. RCT'ler için ortalama oranlar, göreceli riskler, olasılık oranları ve NRR'ler arasındaki farkı içerir. Benzer şekilde, tanısal test doğruluğu çalışmalarında yapılan tüm ana tahminler için (duyarlılık, özgüllük, pozitif tahmin değeri (tümü basit oranlardır) ve olabilirlik oranları) meta-analizlerde ve karşılaştırmadan kontrole elde edilen tahminler için CI'ler elde edilebilir. çalışmalar. DI'nin bu kullanımlarının çoğunu kapsayan bir kişisel bilgisayar programı, Statistics with Confidence'ın ikinci baskısında mevcuttur. Oranlar için CI hesaplama makroları Excel için ve SPSS ve Minitab istatistik programları için http://www.uwcm.ac.uk/study/medicine/epidemiology_statistics/research/statistics/proportions, htm adresinde ücretsiz olarak mevcuttur.

Tedavi etkisinin çoklu değerlendirmeleri

Bir çalışmanın birincil sonuçları için CI'lerin oluşturulması arzu edilirken, tüm sonuçlar için gerekli değildir. CI, klinik olarak önemli karşılaştırmalarla ilgilidir. Örneğin, iki grubu karşılaştırırken, doğru CI, yukarıdaki örneklerde gösterildiği gibi gruplar arasındaki fark için oluşturulandır ve her grupta tahmin için oluşturulabilecek CI değil. Her gruptaki puanlar için ayrı CI'ler vermek yararsız olmakla kalmaz, bu sunum yanıltıcı olabilir. Benzer şekilde, farklı alt gruplarda tedavi etkinliğini karşılaştırırken doğru yaklaşım, iki (veya daha fazla) alt grubu doğrudan karşılaştırmaktır. Tedavinin sadece bir alt grupta etkili olduğunu varsaymak, CI'si hiçbir etkiye karşılık gelen değeri hariç tutarken diğerleri hariç tutuyorsa yanlıştır. CI'ler, sonuçları birden çok alt grup arasında karşılaştırırken de yararlıdır. Şek. A1.1, plasebo kontrollü bir RKÇ magnezyum sülfattan kadın alt gruplarında preeklampsili kadınlarda göreceli eklampsi riskini göstermektedir.

Pirinç. A1.2. Orman Grafiği, ishalin önlenmesi için sığır rotavirüs aşısının plaseboya karşı 11 randomize klinik çalışmasının sonuçlarını göstermektedir. Göreceli diyare riskini tahmin etmek için %95 güven aralığı kullanıldı. Siyah karenin boyutu bilgi miktarıyla orantılıdır. Ek olarak, tedavi etkinliğinin özet bir tahmini ve %95'lik bir güven aralığı (bir elmasla gösterilir) gösterilir. Meta-analiz, önceden belirlenmiş olanlardan bazılarını aşan bir rastgele etkiler modeli kullandı; örneğin, örnek boyutunun hesaplanmasında kullanılan boyut olabilir. Daha katı bir kriter altında, tüm CI aralığı önceden belirlenmiş bir minimumu aşan bir fayda göstermelidir.

İstatistiksel anlamlılığın yokluğunu iki tedavinin eşit derecede etkili olduğunun bir göstergesi olarak almanın yanlışlığını daha önce tartışmıştık. İstatistiksel anlamlılığı klinik anlamlılık ile eşitlememek de aynı derecede önemlidir. Sonuç istatistiksel olarak anlamlı olduğunda ve tedavi yanıtının büyüklüğü olduğunda klinik önem varsayılabilir.

Çalışmalar, sonuçların istatistiksel olarak anlamlı olup olmadığını ve hangilerinin klinik olarak önemli olup hangilerinin önemsiz olduğunu gösterebilir. Şek. A1.2, tüm CI'nin kullanıldığı dört denemenin sonuçlarını gösterir.<1, т.е. их результаты статистически значимы при Р <0,05 , . После высказанного предположения о том, что клинически важным различием было бы сокращение риска диареи на 20% (ОР = 0,8), все эти испытания показали клинически значимую оценку сокращения риска, и лишь в исследовании Treanor весь 95% ДИ меньше этой величины. Два других РКИ показали клинически важные результаты, которые не были статистически значимыми. Обратите внимание, что в трёх испытаниях точечные оценки эффективности лечения были почти идентичны, но ширина ДИ различалась (отражает размер выборки). Таким образом, по отдельности доказательная сила этих РКИ различна.

Ve diğerleri.Hepsi, bir örneklem değil, genel popülasyon olsaydı elde edilebilecek teorik muadillerinin tahminleridir. Ama ne yazık ki, genel nüfus çok pahalı ve çoğu zaman ulaşılamıyor.

Aralık tahmini kavramı

Herhangi bir örnek tahmininde bir miktar dağılım vardır, çünkü belirli bir örnekteki değerlere bağlı olarak rastgele bir değişkendir. Bu nedenle, daha güvenilir istatistiksel çıkarımlar için, yalnızca nokta tahmini değil, aynı zamanda olasılığı yüksek olan aralığı da bilmek gerekir. γ (gama) tahmini göstergeyi kapsar θ (teta).

Resmen, bunlar böyle iki değerdir (istatistikler) T1(X) ve T2(X), ne T1< T 2 , bunun için belirli bir olasılık düzeyinde γ koşul karşılandı:

kısacası büyük ihtimalle γ veya daha fazla gerçek değer noktalar arasındadır T1(X) ve T2(X) alt ve üst sınırlar olarak adlandırılan güven aralığı.

Güven aralıkları oluşturmanın koşullarından biri, maksimum darlığıdır, yani. mümkün olduğunca kısa olmalıdır. Arzu oldukça doğaldır, çünkü. araştırmacı, istenen parametrenin bulgusunu daha doğru bir şekilde yerelleştirmeye çalışır.

Güven aralığının, dağılımın maksimum olasılıklarını kapsaması gerektiği sonucu çıkar. ve değerlendirmenin kendisi merkezde olmalıdır.

Yani, (tahminden gerçek göstergenin) yukarı doğru sapma olasılığı, aşağı doğru sapma olasılığına eşittir. Ayrıca çarpık dağılımlar için sağdaki aralığın soldaki aralığa eşit olmadığına da dikkat edilmelidir.

Yukarıdaki şekil, güven düzeyi ne kadar büyük olursa, aralığın o kadar geniş olduğunu açıkça göstermektedir - doğrudan bir ilişki.

Bu, bilinmeyen parametrelerin aralık tahmini teorisine küçük bir girişti. Matematiksel beklenti için güven sınırlarını bulmaya devam edelim.

Matematiksel beklenti için güven aralığı

Orijinal veriler dağıtılırsa, ortalama normal bir değer olacaktır. Bu, normal değerlerin doğrusal bir kombinasyonunun da normal bir dağılıma sahip olduğu kuralından kaynaklanır. Bu nedenle, olasılıkları hesaplamak için normal dağılım yasasının matematiksel aygıtını kullanabiliriz.

Bununla birlikte, bu, genellikle bilinmeyen beklenen değer ve varyans olmak üzere iki parametrenin bilgisini gerektirecektir. Elbette, parametreler (aritmetik ortalama ve ) yerine tahminleri kullanabilirsiniz, ancak o zaman ortalamanın dağılımı oldukça normal olmayacak, biraz düzleşecektir. İrlanda Vatandaşı William Gosset, keşfini Biometrica'nın Mart 1908 sayısında yayınlarken ustaca bu gerçeğe dikkat çekti. Gizlilik amacıyla Gosset, Student ile imzaladı. Student'in t-dağılımı bu şekilde ortaya çıktı.

Ancak, K. Gauss'un astronomik gözlemlerdeki hataların analizinde kullandığı verilerin normal dağılımı, karasal yaşamda son derece nadirdir ve bunu tespit etmek oldukça zordur (yüksek doğruluk için yaklaşık 2 bin gözlem gereklidir). Bu nedenle, normallik varsayımını bırakmak ve orijinal verilerin dağılımına bağlı olmayan yöntemler kullanmak en iyisidir.

Soru ortaya çıkıyor: bilinmeyen bir dağılımın verilerinden hesaplanırsa aritmetik ortalamanın dağılımı nedir? Cevap, olasılık teorisinde iyi bilinen tarafından verilir. Merkezi Limit Teoremi(CPT). Matematikte, bunun birkaç versiyonu vardır (formülasyonlar yıllar içinde rafine edilmiştir), ancak hepsi, kabaca konuşursak, çok sayıda bağımsız rastgele değişkenin toplamının normal dağılım yasasına uyduğu ifadesine gelir.

Aritmetik ortalama hesaplanırken rastgele değişkenlerin toplamı kullanılır. Bundan, aritmetik ortalamanın, beklenen değerin ilk verilerin beklenen değeri ve varyansın olduğu normal bir dağılıma sahip olduğu ortaya çıkıyor.

Akıllı insanlar CLT'yi nasıl kanıtlayacağını bilirler, ancak bunu Excel'de yapılan bir deney yardımıyla doğrulayacağız. 50 tekdüze dağıtılmış rastgele değişkenin bir örneğini simüle edelim (RANDOMBETWEEN Excel işlevini kullanarak). Sonra 1000 tane örnek yapacağız ve her biri için aritmetik ortalamayı hesaplayacağız. dağılımlarına bakalım.

Ortalamanın dağılımının normal yasaya yakın olduğu görülebilir. Numunelerin hacmi ve sayıları daha da büyük yapılırsa, benzerlik daha da iyi olacaktır.

Artık CLT'nin geçerliliğini kendimiz gördüğümüze göre, belirli bir olasılıkla gerçek ortalamayı veya matematiksel beklentiyi kapsayan aritmetik ortalama için güven aralıklarını kullanarak hesaplayabiliriz.

Alt ve üst sınırları belirlemek için normal dağılımın parametrelerini bilmek gerekir. Kural olarak, bunlar değildir, bu nedenle tahminler kullanılır: aritmetik ortalama ve örnek varyans. Yine, bu yöntem yalnızca büyük örnekler için iyi bir yaklaşıklık verir. Örnekler küçük olduğunda, genellikle Student dağılımının kullanılması önerilir. İnanma! Öğrencinin ortalama dağılımı, yalnızca orijinal veri normal bir dağılıma sahip olduğunda, yani neredeyse hiçbir zaman gerçekleşir. Bu nedenle, gerekli veri miktarı için minimum çubuğu hemen ayarlamak ve asimptotik olarak doğru yöntemleri kullanmak daha iyidir. 30 gözlemin yeterli olduğunu söylüyorlar. 50 al - yanlış gidemezsin.

1.2 güven aralığının alt ve üst sınırlarıdır

– örnek aritmetik ortalama

s0– örnek standart sapma (tarafsız)

n - örnek boyut

γ – güven düzeyi (genellikle 0,9, 0,95 veya 0,99'a eşittir)

c γ =Φ -1 ((1+γ)/2) standart normal dağılım fonksiyonunun tersidir. Basit bir ifadeyle, bu, aritmetik ortalamadan alt veya üst sınıra kadar olan standart hataların sayısıdır (belirtilen üç olasılık, 1.64, 1.96 ve 2.58 değerlerine karşılık gelir).

Formülün özü, aritmetik ortalamanın alınması ve ardından ondan belirli bir miktarın ayrılmasıdır ( y ile) standart hatalar ( s 0 /√n). Her şey biliniyor, al ve say.

PC'lerin toplu kullanımından önce, normal dağılım fonksiyonunun ve tersinin değerlerini elde etmek için kullandılar. Hala kullanılıyorlar, ancak hazır Excel formüllerine dönmek daha verimli. Yukarıdaki formüldeki tüm öğeler ( , ve ) Excel'de kolayca hesaplanabilir. Ancak güven aralığını hesaplamak için hazır bir formül de var - GÜVEN NORMASI. Sözdizimi aşağıdaki gibidir.

GÜVEN NORM(alfa, standart_dev, boyut)

alfa– yukarıdaki gösterimde 1-γ'ye eşit olan anlamlılık düzeyi veya güven düzeyi, yani. matematiksel olma olasılığıbeklenti güven aralığının dışında olacaktır. 0,95 güven düzeyiyle alfa 0,05'tir vb.

standart_offörnek verilerin standart sapmasıdır. Standart hatayı hesaplamanıza gerek yok, Excel n'nin köküne böler.

boyut– numune boyutu (n).

GÜVENİLİRLİK.NORM işlevinin sonucu, güven aralığını hesaplamak için formüldeki ikinci terimdir, yani. yarı aralık. Buna göre alt ve üst noktalar ortalama ± elde edilen değerdir.

Böylece, ilk verilerin dağılımına bağlı olmayan aritmetik ortalama için güven aralıklarını hesaplamak için evrensel bir algoritma oluşturmak mümkündür. Evrenselliğin bedeli asimptotik doğasıdır, yani. nispeten büyük örnekler kullanma ihtiyacı. Ancak, modern teknoloji çağında, doğru miktarda veri toplamak genellikle zor değildir.

Bir Güven Aralığı Kullanarak İstatistiksel Hipotezleri Test Etme

(modül 111)

İstatistikte çözülen temel sorunlardan biri. Özetle özü budur. Örneğin, genel nüfusun beklentisinin bir değere eşit olduğu varsayımı yapılır. Daha sonra, belirli bir beklenti ile gözlemlenebilen örnek ortalamaların dağılımı oluşturulur. Ardından, bu koşullu dağılımda gerçek ortalamanın nerede olduğuna bakacağız. İzin verilen sınırların ötesine geçerse, böyle bir ortalamanın ortaya çıkması pek olası değildir ve deneyin tek bir tekrarı ile neredeyse imkansızdır, bu da başarıyla reddedilen öne sürülen hipotezle çelişir. Ortalama kritik seviyenin ötesine geçmezse, hipotez reddedilmez (ancak kanıtlanmaz!).

Bu nedenle, güven aralıklarının yardımıyla, bizim durumumuzda beklenti için bazı hipotezleri de test edebilirsiniz. Bunu yapmak çok kolay. Bir örnek için aritmetik ortalamanın 100 olduğunu varsayalım. Hipotez, beklentinin 90 olduğu yönünde test ediliyor. Yani, soruyu ilkel olarak koyarsak, kulağa şöyle geliyor: ortalamanın gerçek değeri ile olabilir mi? 90'a eşit, gözlemlenen ortalamanın 100 olduğu ortaya çıktı?

Bu soruyu cevaplamak için standart sapma ve örneklem büyüklüğü hakkında ek bilgi gerekli olacaktır. Diyelim ki standart sapma 30 ve gözlem sayısı 64 (kökünü kolayca çıkarmak için). O zaman ortalamanın standart hatası 30/8 veya 3.75'tir. %95 güven aralığını hesaplamak için, ortalamanın her iki tarafında iki standart hata ayırmanız gerekecektir (daha doğrusu 1,96). Güven aralığı yaklaşık 100 ± 7,5 veya 92,5 ila 107,5 olacaktır.

Daha fazla akıl yürütme aşağıdaki gibidir. Test edilen değer güven aralığı içindeyse, hipotezle çelişmez, çünkü rastgele dalgalanmaların sınırlarına uyuyor (%95 olasılıkla). Test edilen nokta güven aralığının dışındaysa, böyle bir olayın olasılığı çok küçüktür, her durumda kabul edilebilir seviyenin altındadır. Bu nedenle, hipotez, gözlemlenen verilerle çeliştiği için reddedilir. Bizim durumumuzda beklenti hipotezi güven aralığının dışındadır (test edilen 90 değeri 100±7,5 aralığına dahil değildir), bu nedenle reddedilmelidir. Yukarıdaki ilkel soruyu cevaplayarak şunu söylemeliyiz: hayır, her durumda olamaz, bu çok nadiren olur. Genellikle, bu, güven aralığının oluşturulduğu belirli bir düzeyi değil, hipotezin (p düzeyi) hatalı bir şekilde reddedilme olasılığını gösterir, ancak daha fazlası başka bir zamanda.

Gördüğünüz gibi, ortalama (veya matematiksel beklenti) için bir güven aralığı oluşturmak zor değil. Ana şey özü yakalamak ve sonra işler gidecek. Pratikte çoğu, ortalamanın her iki tarafında yaklaşık iki standart hata olan %95 güven aralığını kullanır.

Şimdilik bu kadar. Herşey gönlünce olsun!

FREKANS VE PARÇALAR İÇİN GÜVEN ARALIKLARI

© 2008

Ulusal Halk Sağlığı Enstitüsü, Oslo, Norveç

Makale, Wald, Wilson, Klopper-Pearson yöntemlerini, açısal dönüşüm ve Wald yöntemini ve Agresti-Coll düzeltmesini kullanarak frekanslar ve oranlar için güven aralıklarının hesaplanmasını açıklar ve tartışır. Sunulan materyal, frekanslar ve oranlar için güven aralıklarını hesaplama yöntemleri hakkında genel bilgiler sağlar ve dergi okuyucularının yalnızca kendi araştırmalarının sonuçlarını sunarken güven aralıklarını kullanmaya değil, aynı zamanda daha önce özel literatürü okumaya olan ilgisini uyandırmayı amaçlar. gelecekteki yayınlar üzerinde çalışmaya başlamak.

anahtar kelimeler: güven aralığı, sıklık, orantı

Önceki yayınlardan birinde, nitel verilerin tanımından kısaca bahsedildi ve genel popülasyonda çalışılan özelliğin ortaya çıkma sıklığını tanımlamak için nokta tahminine göre aralıklı tahminlerinin tercih edildiği bildirildi. Gerçekten de, çalışmalar örnek veriler kullanılarak yürütüldüğünden, sonuçların genel popülasyona yansıtılması, örneklem tahmininde bir yanlışlık unsuru içermelidir. Güven aralığı, tahmin edilen parametrenin doğruluğunun bir ölçüsüdür. Hekimler için istatistiğin temelleri üzerine bazı kitaplarda, frekanslar için güven aralıkları konusunun tamamen göz ardı edilmesi ilginçtir. Bu makalede, tekrarlamama ve temsiliyet gibi örnek özelliklerin yanı sıra gözlemlerin birbirinden bağımsız olduğunu varsayarak, frekanslar için güven aralıklarını hesaplamanın birkaç yolunu ele alacağız. Bu makaledeki sıklık, şu veya bu değerin toplamda kaç kez meydana geldiğini gösteren mutlak bir sayı olarak değil, çalışılan özelliğe sahip çalışma katılımcılarının oranını belirleyen göreli bir değer olarak anlaşılmıştır.

Biyomedikal araştırmalarda en yaygın olarak %95 güven aralığı kullanılır. Bu güven aralığı, gerçek oranın zamanın %95'inde düştüğü bölgedir. Başka bir deyişle, bir özelliğin genel popülasyonda görülme sıklığının gerçek değerinin %95 güven aralığında olacağı %95 kesinlikle söylenebilir.

Tıp araştırmacıları için çoğu istatistiksel ders kitabı, frekans hatasının formül kullanılarak hesaplandığını bildirmektedir.

burada p, örnekteki özelliğin görülme sıklığıdır (0'dan 1'e kadar olan değer). Yerli bilimsel makalelerin çoğunda, örnekte (p) bir özelliğin ortaya çıkma sıklığının değeri ve hata (lar) p ± s şeklinde belirtilir. Bununla birlikte, genel popülasyonda bir özelliğin ortaya çıkma sıklığı için %95'lik bir güven aralığı sunmak daha uygundur;

önceki.

Bazı ders kitaplarında, küçük örnekler için, N - 1 serbestlik derecesi için 1,96 değerinin t değeriyle değiştirilmesi önerilir, burada N, örnekteki gözlem sayısıdır. t değeri, hemen hemen tüm istatistik ders kitaplarında bulunan t-dağılımı tablolarında bulunur. Wald yöntemi için t dağılımının kullanılması, aşağıda tartışılan diğer yöntemlere göre görünür avantajlar sağlamaz ve bu nedenle bazı yazarlar tarafından hoş karşılanmaz.

Frekanslar veya oranlar için güven aralıklarını hesaplamak için yukarıdaki yöntem, 1939'da Wald ve Wolfowitz'in yayınlanmasından sonra yaygın olarak kullanılmaya başlandığı için Abraham Wald'un (Abraham Wald, 1902–1950) adını almıştır. Ancak, yöntemin kendisi Pierre Simon Laplace (1749-1827) tarafından 1812 gibi erken bir tarihte önerildi.

Wald yöntemi çok popülerdir, ancak uygulaması önemli problemlerle ilişkilidir. Yöntem, küçük örneklem boyutları için ve bir özelliğin ortaya çıkma sıklığının 0 veya 1 (%0 veya %100) olma eğiliminde olduğu ve 0 ve 1 frekansları için basitçe mümkün olmadığı durumlarda önerilmez. hata hesaplanırken kullanılan normal dağılım yaklaşımı, n p olduğu durumlarda "çalışmaz"< 5 или n · (1 – p) < 5 . Более консервативные статистики считают, что n · p и n · (1 – p) должны быть не менее 10 . Более детальное рассмотрение метода Вальда показало, что полученные с его помощью доверительные интервалы в большинстве случаев слишком узки, то есть их применение ошибочно создает слишком оптимистичную картину, особенно при удалении частоты встречаемости признака от 0,5, или 50 % . К тому же при приближении частоты к 0 или 1 доверительный интревал может принимать отрицательные значения или превышать 1, что выглядит абсурдно для частот. Многие авторы совершенно справедливо не рекомендуют применять данный метод не только в уже упомянутых случаях, но и тогда, когда частота встречаемости признака менее 25 % или более 75 % . Таким образом, несмотря на простоту расчетов, метод Вальда может применяться лишь в очень ограниченном числе случаев. Зарубежные исследователи более категоричны в своих выводах и однозначно рекомендуют не применять этот метод для небольших выборок , а ведь именно с такими выборками часто приходится иметь дело исследователям-медикам.

Yeni değişken normal olarak dağıldığından, φ değişkeni için %95 güven aralığının alt ve üst sınırları φ-1.96 ve φ+1.96left">

Küçük numuneler için 1,96 yerine, N - 1 serbestlik derecesi yerine t değerinin değiştirilmesi önerilir. Bu yöntem negatif değerler vermez ve frekanslar için güven aralıklarını Wald yöntemine göre daha doğru bir şekilde tahmin etmenizi sağlar. Ek olarak, tıbbi istatistiklerle ilgili birçok yerli referans kitabında açıklanmıştır, ancak bu, tıbbi araştırmalarda yaygın olarak kullanılmasına yol açmamıştır. 0 veya 1'e yaklaşan frekanslar için bir açı dönüşümü kullanarak güven aralıklarının hesaplanması önerilmez.

Bu, tıp araştırmacıları için istatistiğin temelleri üzerine çoğu kitapta güven aralıklarını tahmin etme yöntemlerinin açıklamasının genellikle sona erdiği yerdir ve bu sorun sadece yerli değil, aynı zamanda yabancı literatür için de tipiktir. Her iki yöntem de büyük bir örneklem anlamına gelen merkezi limit teoremine dayanmaktadır.

Yukarıdaki yöntemleri kullanarak güven aralıklarını tahmin etmenin eksiklikleri göz önüne alındığında, Clopper (Clopper) ve Pearson (Pearson), 1934'te, incelenen özelliğin binom dağılımını hesaba katarak sözde kesin güven aralığını hesaplamak için bir yöntem önerdi. Bu yöntem birçok çevrimiçi hesap makinesinde mevcuttur, ancak bu şekilde elde edilen güven aralıkları çoğu durumda çok geniştir. Aynı zamanda, ihtiyatlı bir tahminin gerekli olduğu durumlarda bu yöntemin kullanılması önerilir. Yöntemin konservatiflik derecesi, özellikle N için örneklem büyüklüğü azaldıkça artar.< 15 . описывает применение функции биномиального распределения для анализа качественных данных с использованием MS Excel, в том числе и для определения доверительных интервалов, однако расчет последних для частот в электронных таблицах не «затабулирован» в удобном для пользователя виде, а потому, вероятно, и не используется большинством исследователей.

Birçok istatistikçiye göre, frekanslar için en uygun güven aralıkları tahmini, 1927'de önerilen, ancak pratik olarak yerel biyomedikal araştırmalarda kullanılmayan Wilson yöntemiyle gerçekleştirilir. Bu yöntem yalnızca hem çok küçük hem de çok yüksek frekanslar için güven aralıklarının tahmin edilmesini mümkün kılmakla kalmaz, aynı zamanda az sayıda gözleme de uygulanabilir. Genel olarak, Wilson formülüne göre güven aralığı şu şekildedir:



%95 güven aralığını hesaplarken 1,96 değerini aldığı yerde N gözlem sayısı ve p örnekteki özelliğin frekansıdır. Bu yöntem çevrimiçi hesap makinelerinde mevcuttur, bu nedenle uygulaması sorunlu değildir. ve n p için bu yöntemin kullanılmasını önermeyin< 4 или n · (1 – p) < 4 по причине слишком грубого приближения распределения р к нормальному в такой ситуации, однако зарубежные статистики считают метод Уилсона применимым и для малых выборок .

Wilson yöntemine ek olarak, Agresti-Caull düzeltmeli Wald yönteminin de frekanslar için güven aralığının optimal bir tahminini sağladığına inanılmaktadır. Agresti-Coulle düzeltmesi, paya hangi 2'nin eklendiğini ve paydaya 4'ün eklendiğini hesaplarken, örnekte (p) bir özelliğin ortaya çıkma sıklığının Wald formülünde p' ile değiştirilmesidir. , p` = (X + 2) / (N + 4), burada X, çalışılan özelliğe sahip çalışma katılımcılarının sayısıdır ve N, örneklem büyüklüğüdür. Bu modifikasyon, olay oranının %0 veya %100'e yaklaşması ve numunenin küçük olması dışında Wilson formülüne çok benzer sonuçlara yol açar. Frekanslar için güven aralıklarını hesaplamak için yukarıdaki yöntemlere ek olarak, küçük örnekler için hem Wald yöntemi hem de Wilson yöntemi için süreklilik düzeltmeleri önerilmiştir, ancak çalışmalar bunların kullanımının uygun olmadığını göstermiştir.

İki örnek kullanarak güven aralıklarını hesaplamak için yukarıdaki yöntemlerin uygulamasını düşünün. İlk durumda, 450'sinin incelenen özelliğe sahip olduğu (bir risk faktörü, bir sonuç veya başka bir özellik olabilir) 0,45 sıklık olan rastgele seçilmiş 1.000 çalışma katılımcısından oluşan geniş bir örneklem üzerinde çalışıyoruz. veya %45. İkinci durumda, çalışma küçük bir örneklem kullanılarak yürütülür, diyelim ki sadece 20 kişi ve çalışmadaki sadece 1 katılımcı (%5) incelenen özelliğe sahiptir. Wald yöntemi için, Agresti-Coll düzeltmeli Wald yöntemi için, Wilson yöntemi için güven aralıkları Jeff Sauro (http://www./wald.htm) tarafından geliştirilen bir çevrimiçi hesap makinesi kullanılarak hesaplandı. Süreklilik düzeltmeli Wilson güven aralıkları, Wassar İstatistikleri: İstatistiksel Hesaplama için Web Sitesi (http://faculty.vassar.edu/lowry/prop1.html) tarafından sağlanan hesaplayıcı kullanılarak hesaplandı. Fisher açısal dönüşümünü kullanan hesaplamalar, sırasıyla 19 ve 999 serbestlik derecesi için kritik t değeri kullanılarak "manuel" olarak yapıldı. Hesaplama sonuçları her iki örnek için tabloda sunulmuştur.

Metinde anlatılan iki örnek için altı farklı şekilde hesaplanan güven aralıkları

Güven Aralığı Hesaplama Yöntemi

P=0.0500 veya %5

X=450, N=1000, P=0.4500 veya %45 için %95 GA

–0,0455–0,2541

Agresti-Coll düzeltmeli Walda

<,0001–0,2541

Süreklilik düzeltmeli Wilson

Klopper-Pearson'ın "kesin yöntemi"

açısal dönüşüm

<0,0001–0,1967

Tablodan da görüleceği üzere birinci örnek için "genel kabul görmüş" Wald yöntemi ile hesaplanan güven aralığı frekanslar için geçerli olmayan negatif bölgeye gitmektedir. Ne yazık ki, bu tür olaylar Rus edebiyatında nadir değildir. Verileri frekans ve hata olarak göstermenin geleneksel yolu, bu sorunu kısmen maskeler. Örneğin, bir özelliğin ortaya çıkma sıklığı (yüzde olarak) 2,1 ± 1,4 olarak sunuluyorsa, bu durum aynı anlama gelse de %2,1 (%95 GA: –0,7; 4,9) kadar “rahatsız edici” değildir. Agresti-Coll düzeltmeli Wald yöntemi ve açısal dönüşüm kullanılarak hesaplama, sıfıra eğilimli bir alt sınır verir. Süreklilik düzeltmeli Wilson yöntemi ve "kesin yöntem", Wilson yönteminden daha geniş güven aralıkları verir. İkinci örnek için, tüm yöntemler yaklaşık olarak aynı güven aralıklarını verir (farklar yalnızca binde bir görünür), bu şaşırtıcı değildir, çünkü bu örnekteki olayın sıklığı %50'den çok farklı değildir ve örneklem boyutu oldukça büyüktür. .

Bu problemle ilgilenen okuyucular için, güven aralığını hesaplamak için sırasıyla 7 ve 10 farklı yöntem kullanmanın artılarını ve eksilerini veren R. G. Newcombe ve Brown, Cai ve Dasgupta'nın çalışmalarını önerebiliriz. Yerli kılavuzlardan, teorinin ayrıntılı bir açıklamasına ek olarak, Wald, Wilson yöntemlerinin yanı sıra binom frekans dağılımını dikkate alarak güven aralıklarını hesaplamak için bir yöntemin sunulduğu kitap ve tavsiye edilir. . Ücretsiz çevrimiçi hesaplayıcılara (http://www./wald.htm ve http://faculty.vassar.edu/lowry/prop1.html) ek olarak, frekanslar için güven aralıkları (ve sadece değil!) http://www'den indirilebilen CIA programı (Güven Aralıkları Analizi). tıp fakültesi. soton. AC. İngiltere/cia/ .

Sonraki makale, nitel verileri karşılaştırmanın tek değişkenli yollarını inceleyecektir.

bibliyografya

Banerjee A. Sade bir dilde tıbbi istatistikler: bir giriş kursu / A. Banerzhi. - M. : Pratik tıp, 2007. - 287 s. Tıbbi istatistikler / . - M. : Tıbbi Bilgi Ajansı, 2007. - 475 s. Glanz S. Mediko-biyolojik istatistikler / S. Glants. - M. : Uygulama, 1998. Veri türleri, dağıtım doğrulaması ve tanımlayıcı istatistikler // İnsan Ekolojisi - 2008. - No. 1. - S. 52–58. Zhizhin K.S.. Tıbbi istatistikler: ders kitabı / . - Rostov n / D: Phoenix, 2007. - 160 s. Uygulamalı Tıbbi İstatistikler / , . - St.Petersburg. : Folyo, 2003. - 428 s. Lakin G.F. Biyometri / . - M. : Yüksekokul, 1990. - 350 s. doktor V.A. Tıpta matematiksel istatistikler / , . - M. : Finans ve istatistik, 2007. - 798 s. Klinik araştırmalarda matematiksel istatistikler / , . - E. : GEOTAR-MED, 2001. - 256 s. Junkerov V. Ve. Tıbbi araştırma verilerinin mediko-istatistiksel işlenmesi /,. - St.Petersburg. : VmedA, 2002. - 266 s. Agresti A. Yaklaşık, binom oranlarının aralık tahmini için kesinden daha iyidir / A. Agresti, B. Coull // Amerikan istatistikçi. - 1998. - N 52. - S. 119-126. Altman D. Güvenilir istatistikler // D. Altman, D. Machin, T. Bryant, M. J. Gardner. - Londra: BMJ Kitapları, 2000. - 240 s. kahverengi L.D. Binom oranı için aralık tahmini / L. D. Brown, T. T. Cai, A. Dasgupta // İstatistik bilimi. - 2001. - N 2. - S. 101-133. Clopper C.J. Binom / C. J. Clopper, E. S. Pearson // Biometrika durumunda gösterilen güven veya referans sınırlarının kullanımı. - 1934. - N 26. - S. 404-413. Garcia-Perez M.A. Binom parametresi / M. A. Garcia-Perez // Nitelik ve nicelik için güven aralığında. - 2005. - N 39. - S. 467-481. Motulsky H. Sezgisel biyoistatistik // H. Motulsky. - Oxford: Oxford University Press, 1995. - 386 s. Newcombe R.G. Tek Oran için İki Taraflı Güven Aralıkları: Yedi Yöntemin Karşılaştırılması / R. G. Newcombe // Tıpta İstatistik. - 1998. - N. 17. - S. 857-872. Sauro J.İki terimli güven aralıklarını kullanarak küçük örneklerden tamamlama oranlarının tahmin edilmesi: karşılaştırmalar ve öneriler / J. Sauro, J. R. Lewis // İnsan faktörleri ve ergonomi topluluğu yıllık toplantısının bildirileri. - Orlando, Florida, 2005. Wald A. Sürekli dağılım fonksiyonları için güven sınırları // A. Wald, J. Wolfovitz // Annals of Mathematical Statistics. - 1939. - N 10. - S. 105–118. Wilson E.B.. Olası çıkarım, ardışıklık yasası ve istatistiksel çıkarım / E. B. Wilson // Amerikan İstatistik Derneği Dergisi. - 1927. - N 22. - S. 209-212.

ORANLAR İÇİN GÜVEN ARALIKLARI

A. M. Grjibovski

Ulusal Halk Sağlığı Enstitüsü, Oslo, Norveç

Makale, Wald, Wilson, arksinüs, Agresti-Coull ve kesin Clopper-Pearson yöntemleri gibi binom oranları için güven aralıklarını hesaplamak için çeşitli yöntemler sunmaktadır. Makale, iki terimli bir oranın güven aralığı tahmini sorununa yalnızca genel bir giriş sağlar ve amacı yalnızca okuyucuları kendi ampirik araştırmalarının sonuçlarını sunarken güven aralıklarını kullanmaya teşvik etmek değil, aynı zamanda onları daha önce istatistik kitaplarına başvurmaya teşvik etmektir. kendi verilerini analiz etme ve el yazmaları hazırlama.

anahtar kelimeler: güven aralığı, orantı

İletişim bilgileri:

Kıdemli Danışman, Ulusal Halk Sağlığı Enstitüsü, Oslo, Norveç