Przedział ufności. ABC statystyki medycznej

Zbudujmy w programie MS EXCEL przedział ufności do oszacowania średniej wartości rozkładu w przypadku znanej wartości wariancji.

Oczywiście wybór poziom zaufania całkowicie zależy od wykonywanego zadania. Zatem stopień zaufania pasażera lotniczego do niezawodności samolotu powinien być oczywiście wyższy niż stopień zaufania kupującego do niezawodności żarówki.

Formułowanie zadań

Załóżmy, że od populacja biorąc próbka rozmiar r. Zakłada się, że odchylenie standardowe ten rozkład jest znany. Niezbędne na tej podstawie próbki ocenić nieznane średnia dystrybucji(μ, ) i skonstruuj odpowiedni dwustronny przedział ufności.

Szacowanie punktowe

Jak wiadomo z Statystyka(nazwijmy to X por) Jest nieobciążone oszacowanie średniej Ten populacja i ma rozkład N(μ;σ 2 /n).

Notatka: Co jeśli musisz zbudować przedział ufności w przypadku dystrybucji, które nie jest normalna? W tym przypadku przychodzi na ratunek, który mówi, że o wystarczająco dużym rozmiarze próbki n z dystrybucji nie- normalna, próbkowanie rozkład statystyk Х śr będzie około korespondować normalna dystrybucja o parametrach N(μ;σ 2 /n).

Więc, Punktowe oszacowanie środek wartości dystrybucji mamy jest próbka średnia, tj. X por. Teraz bądźmy zajęci przedział ufności.

Budowanie przedziału ufności

Zwykle znając rozkład i jego parametry możemy obliczyć prawdopodobieństwo, że zmienna losowa przyjmie wartość z zadanego przedziału. Teraz zróbmy coś przeciwnego: znajdź przedział, w którym zmienna losowa wypada z zadanym prawdopodobieństwem. Na przykład z właściwości normalna dystrybucja wiadomo, że z prawdopodobieństwem 95% zmienna losowa o rozkładzie normalne prawo, mieści się w przedziale około +/- 2 od Średnia wartość(patrz artykuł o). Ten interwał posłuży jako nasz prototyp przedział ufności.

Teraz zobaczmy, czy znamy rozkład , obliczyć ten odstęp? Aby odpowiedzieć na pytanie, musimy określić formę dystrybucji i jej parametry.

Wiemy, jaka jest forma dystrybucji normalna dystrybucja(pamiętaj, że mówimy o dystrybucja próbek Statystyka X por).

Parametr μ jest nam nieznany (wystarczy go oszacować za pomocą przedział ufności), ale mamy jego oszacowanie X por., obliczona na podstawie próbka, które można wykorzystać.

Drugi parametr to średnie odchylenie standardowe próbki będzie znany, jest równe σ/√n.

Ponieważ nie znamy μ, to zbudujemy przedział +/- 2 odchylenia standardowe nie z Średnia wartość, ale ze znanego oszacowania X por. Te. przy obliczaniu przedział ufności NIE będziemy tego zakładać X por mieści się w przedziale +/- 2 odchylenia standardowe od μ z prawdopodobieństwem 95% i przyjmiemy, że przedział wynosi +/- 2 odchylenia standardowe z X por z prawdopodobieństwem 95% pokryje μ - średnia dla populacji ogólnej, z którego próbka. Te dwa stwierdzenia są równoważne, ale drugie stwierdzenie pozwala nam konstruować przedział ufności.

Ponadto udoskonalamy przedział: zmienną losową o rozkładzie normalne prawo, z 95% prawdopodobieństwem mieści się w przedziale +/- 1,960 odchylenia standardowe, nie +/- 2 odchylenia standardowe. Można to obliczyć za pomocą wzoru \u003d NORM.ST.OBR ((1 + 0,95) / 2), cm. przykładowy plik Rozstaw arkuszy.

Teraz możemy sformułować twierdzenie probabilistyczne, które posłuży nam do sformułowania przedział ufności:
„Prawdopodobieństwo, że średnia populacji znajduje się od Średnia próbki w promieniu 1,960" odchylenia standardowe średniej próbki”, jest równe 95%.

Wartość prawdopodobieństwa wymieniona w zestawieniu ma specjalną nazwę , z którym jest powiązany poziomu istotności α (alfa) za pomocą prostego wyrażenia poziom zaufania =1 . W naszym przypadku poziom istotności α =1-0,95=0,05 .

Teraz, opierając się na tym stwierdzeniu probabilistycznym, piszemy wyrażenie do obliczania przedział ufności:

gdzie Zα/2 standard normalna dystrybucja(taka wartość zmiennej losowej z, Co P(z>=Za/2 )=α/2).

Notatka: Górny kwantyl α/2 określa szerokość przedział ufności V odchylenia standardowe próbka średnia. Górny kwantyl α/2 standard normalna dystrybucja jest zawsze większe od 0, co jest bardzo wygodne.

W naszym przypadku, przy α=0,05, górny kwantyl α/2 równa się 1,960. Dla pozostałych poziomów istotności α (10%; 1%) górny kwantyl α/2 Za/2 można obliczyć za pomocą wzoru \u003d NORM.ST.OBR (1-α / 2) lub, jeśli jest znany poziom zaufania, =NORM.ST.OBR((1+poziom ufności)/2).

Zazwyczaj podczas budowy przedziały ufności do oszacowania średniej tylko do użytku górna α/2-kwantyl i nie używać niższy α/2-kwantyl. Jest to możliwe, ponieważ standard normalna dystrybucja symetrycznie względem osi x ( gęstość jego dystrybucji symetryczny ok średnia, tj. 0). Dlatego nie ma potrzeby obliczania niższy kwantyl α/2(nazywa się to po prostu α /2-kwantyl), ponieważ jest równy górna α/2-kwantyl ze znakiem minusa.

Przypomnijmy, że niezależnie od kształtu rozkładu x, odpowiadająca mu zmienna losowa X por Rozpowszechniane około Cienki N(μ;σ 2 /n) (patrz artykuł o). Dlatego ogólnie powyższe wyrażenie dla przedział ufności jest tylko przybliżony. Jeśli x jest rozłożone normalne prawo N(μ;σ 2 /n), to wyrażenie dla przedział ufności Jest dokładna.

Obliczanie przedziału ufności w MS EXCEL

Rozwiążmy problem.
Czas odpowiedzi elementu elektronicznego na sygnał wejściowy jest ważną cechą urządzenia. Inżynier chce wykreślić przedział ufności dla średniego czasu odpowiedzi na poziomie ufności 95%. Z wcześniejszego doświadczenia inżynier wie, że odchylenie standardowe czasu odpowiedzi wynosi 8 ms. Wiadomo, że inżynier wykonał 25 pomiarów, aby oszacować czas odpowiedzi, średnia wartość wyniosła 78 ms.

Rozwiązanie: Inżynier chce poznać czas odpowiedzi urządzenia elektronicznego, ale rozumie, że czas odpowiedzi nie jest ustalony, ale jest zmienną losową, która ma swój własny rozkład. Więc najlepsze, na co może liczyć, to określenie parametrów i kształtu tego rozkładu.

Niestety ze stanu problemu nie znamy postaci rozkładu czasu odpowiedzi (nie musi być normalna). , ten rozkład jest również nieznany. Tylko on jest znany odchylenie standardoweσ=8. Dlatego, chociaż nie możemy obliczyć prawdopodobieństw i skonstruować przedział ufności.

Jednak chociaż nie znamy dystrybucji czas oddzielna odpowiedź, wiemy, że wg CPT, dystrybucja próbek średni czas odpowiedzi jest w przybliżeniu normalna(założymy, że warunki CPT są wykonywane, ponieważ rozmiar próbki wystarczająco duży (n=25)) .

Ponadto, przeciętny ten rozkład jest równy Średnia wartość rozkłady odpowiedzi jednostkowych, tj. μ. A odchylenie standardowe tego rozkładu (σ/√n) można obliczyć za pomocą wzoru =8/ROOT(25) .

Wiadomo też, że otrzymał inżynier Punktowe oszacowanie parametr μ równy 78 ms (X cf). Dlatego teraz możemy obliczyć prawdopodobieństwa, ponieważ znamy formę dystrybucji ( normalna) i jego parametry (Х ср i σ/√n).

Inżynier chce wiedzieć wartość oczekiwanaμ rozkładu czasu odpowiedzi. Jak stwierdzono powyżej, to μ jest równe oczekiwanie rozkładu próby średniego czasu odpowiedzi. Jeśli używamy normalna dystrybucja N(X cf; σ/√n), to pożądane μ będzie mieścić się w przedziale +/-2*σ/√n z prawdopodobieństwem około 95%.

Poziom istotności równa się 1-0,95=0,05.

Na koniec znajdź lewą i prawą granicę przedział ufności.
Lewa granica: \u003d 78-NORM.ST.INR (1-0,05 / 2) * 8 / PIERWIEŃ (25) = 74,864
Prawa granica: \u003d 78 + NORM ST OBR (1-0,05 / 2) * 8 / KORZEŃ (25) \u003d 81,136

Lewa granica: =ROZKŁAD.NORMALNY.ODWR(0,05/2; 78; 8/PIERW.PIERW.(25))
Prawa granica: =ROZKŁ.NORMALNY.ODWR(1-0,05/2; 78; 8/PIERW.PIERW.(25))

Odpowiedź: przedział ufności Na 95% poziom ufności i σ=8msek równa się 78+/-3,136ms

W przykładowy plik na arkuszu Sigma znany stworzył formularz do obliczeń i konstrukcji dwustronny przedział ufności za arbitralne próbki z zadanym σ i poziom istotności.

UFNOŚĆ.NORMALNA().

Jeśli wartości próbki są w zasięgu B20:B79 , A poziom istotności równe 0,05; następnie formuła MS EXCEL:
=ŚREDNIA(B20:B79)-UFNOŚĆ(0,05;σ;LICZ.(B20:B79))
zwróci lewe obramowanie przedział ufności.

Tę samą granicę można obliczyć za pomocą wzoru:
=ŚREDNIA(B20:B79)-ROZKŁAD.NORMALNY.ST.ODWR(1-0,05/2)*σ/PRÓB(LICZ.(B20:B79))

Notatka: Funkcja TRUST.NORM() pojawiła się w MS EXCEL 2010. Wcześniejsze wersje MS EXCEL używały funkcji TRUST().

Przedziały ufności ( język angielski Przedziały ufności) jeden z rodzajów szacunków przedziałowych stosowanych w statystyce, które są obliczane dla danego poziomu istotności. Pozwalają one na stwierdzenie, że prawdziwa wartość nieznanego parametru statystycznego populacji generalnej mieści się w uzyskanym przedziale wartości z prawdopodobieństwem określonym przez wybrany poziom istotności statystycznej.

Normalna dystrybucja

Gdy znana jest wariancja (σ 2 ) populacji danych, do obliczenia granic ufności (punktów granicznych przedziału ufności) można użyć wyniku z. W porównaniu z użyciem rozkładu t, użycie wyniku z nie tylko zapewni węższy przedział ufności, ale także zapewni bardziej wiarygodne oszacowania średniej i odchylenia standardowego (σ), ponieważ wynik Z jest oparty na rozkładzie normalnym.

Formuła

Do wyznaczenia punktów granicznych przedziału ufności, przy założeniu, że znane jest odchylenie standardowe populacji danych, stosuje się następujący wzór

L = X - Z α/2 σ
√ rz

Przykład

Załóżmy, że wielkość próby wynosi 25 obserwacji, średnia próby wynosi 15, a odchylenie standardowe populacji wynosi 8. Dla poziomu istotności α=5%, Z-score wynosi Z α/2 =1,96. W takim przypadku dolna i górna granica przedziału ufności będzie wynosić

L = 15 - 1,96 8 = 11,864
√25
L = 15 + 1,96 8 = 18,136
√25

Można zatem stwierdzić, że z prawdopodobieństwem 95% matematyczne oczekiwania ogółu populacji mieszczą się w przedziale od 11,864 do 18,136.

Metody zawężania przedziału ufności

Powiedzmy, że zakres jest zbyt szeroki dla celów naszego badania. Istnieją dwa sposoby zmniejszenia zakresu przedziału ufności.

  1. Zmniejszyć poziom istotności statystycznej α.
  2. Zwiększ rozmiar próbki.

Zmniejszając poziom istotności statystycznej do α=10%, otrzymujemy Z-score równy Z α/2 =1,64. W takim przypadku dolna i górna granica przedziału będą

L = 15 - 1,64 8 = 12,376
√25
L = 15 + 1,64 8 = 17,624
√25

A sam przedział ufności można zapisać jako

W tym przypadku możemy założyć, że z prawdopodobieństwem 90% matematyczne oczekiwania populacji ogólnej będą mieścić się w przedziale.

Jeśli chcemy zachować poziom istotności statystycznej α, to jedyną alternatywą jest zwiększenie liczebności próby. Zwiększając ją do 144 obserwacji, otrzymujemy następujące wartości granic ufności

L = 15 - 1,96 8 = 13,693
√144
L = 15 + 1,96 8 = 16,307
√144

Sam przedział ufności będzie wyglądał następująco:

Zatem zawężenie przedziału ufności bez obniżania poziomu istotności statystycznej jest możliwe tylko poprzez zwiększenie liczebności próby. Jeżeli nie ma możliwości zwiększenia liczebności próby, to zawężenie przedziału ufności można osiągnąć wyłącznie poprzez obniżenie poziomu istotności statystycznej.

Budowanie przedziału ufności dla rozkładu innego niż normalny

Jeśli odchylenie standardowe populacji nie jest znane lub rozkład nie jest normalny, rozkład t jest używany do skonstruowania przedziału ufności. Technika ta jest bardziej konserwatywna, co wyraża się w szerszych przedziałach ufności, w porównaniu do techniki opartej na Z-score.

Formuła

Poniższe wzory służą do obliczania dolnej i górnej granicy przedziału ufności na podstawie rozkładu t

L = X - tα σ
√ rz

Rozkład Studenta lub rozkład t zależy tylko od jednego parametru – liczby stopni swobody, która jest równa liczbie poszczególnych wartości cech (liczbie obserwacji w próbie). Wartość testu t-Studenta dla danej liczby stopni swobody (n) oraz poziom istotności statystycznej α można znaleźć w tablicach przeglądowych.

Przykład

Załóżmy, że liczebność próby wynosi 25 pojedynczych wartości, średnia wartość próby wynosi 50, a odchylenie standardowe próby wynosi 28. Należy skonstruować przedział ufności dla poziomu istotności statystycznej α=5%.

W naszym przypadku liczba stopni swobody wynosi 24 (25-1), zatem odpowiednia wartość tabelaryczna testu t-Studenta dla poziomu istotności statystycznej α=5% wynosi 2,064. Dlatego dolna i górna granica przedziału ufności będzie

L = 50 - 2,064 28 = 38,442
√25
L = 50 + 2,064 28 = 61,558
√25

A sam przedział można zapisać jako

Możemy zatem stwierdzić, że z prawdopodobieństwem 95% matematyczne oczekiwania populacji generalnej będą mieścić się w przedziale.

Korzystanie z rozkładu t umożliwia zawężenie przedziału ufności poprzez zmniejszenie istotności statystycznej lub zwiększenie wielkości próby.

Zmniejszając istotność statystyczną z 95% do 90% w warunkach naszego przykładu, otrzymujemy odpowiednią wartość tabelaryczną testu t-Studenta 1,711.

L = 50 - 1,711 28 = 40,418
√25
L = 50 + 1,711 28 = 59,582
√25

W tym przypadku możemy powiedzieć, że z prawdopodobieństwem 90% matematyczne oczekiwania populacji ogólnej będą mieścić się w przedziale.

Jeśli nie chcemy zmniejszać istotności statystycznej, jedyną alternatywą jest zwiększenie liczebności próby. Powiedzmy, że są to 64 pojedyncze obserwacje, a nie 25 jak w warunku początkowym przykładu. Wartość tabelaryczna testu t-Studenta dla 63 stopni swobody (64-1) i poziomu istotności statystycznej α=5% wynosi 1,998.

L = 50 - 1,998 28 = 43,007
√64
L = 50 + 1,998 28 = 56,993
√64

Daje nam to możliwość stwierdzenia, że ​​z prawdopodobieństwem 95% matematyczne oczekiwania populacji ogólnej będą mieścić się w przedziale.

Duże próbki

Duże próbki to próbki z populacji danych obejmującej więcej niż 100 pojedynczych obserwacji. Badania statystyczne wykazały, że większe próbki mają tendencję do rozkładu normalnego, nawet jeśli rozkład populacji nie jest normalny. Ponadto dla takich próbek użycie z-score i t-distribution daje w przybliżeniu takie same wyniki przy konstruowaniu przedziałów ufności. Dlatego w przypadku dużych próbek dopuszczalne jest użycie wyniku z dla rozkładu normalnego zamiast rozkładu t.

Podsumowując

Przedział ufności(CI; w języku angielskim przedział ufności – CI) uzyskany w badaniu na próbie daje miarę dokładności (lub niepewności) wyników badania, w celu wyciągnięcia wniosków na temat populacji wszystkich takich pacjentów (populacja ogólna ). Prawidłową definicję 95% CI można sformułować następująco: 95% takich przedziałów będzie zawierało wartość prawdziwą w populacji. Ta interpretacja jest nieco mniej dokładna: CI to zakres wartości, w obrębie którego można mieć 95% pewności, że zawiera on prawdziwą wartość. Przy stosowaniu CI nacisk kładzie się na określenie efektu ilościowego, w przeciwieństwie do wartości P, którą uzyskuje się w wyniku testowania istotności statystycznej. Wartość P nie ocenia żadnej kwoty, ale raczej służy jako miara siły dowodów przeciwko hipotezie zerowej „brak efektu”. Sama wartość P nie mówi nam nic o wielkości różnicy, ani nawet o jej kierunku. Dlatego niezależne wartości P są absolutnie nieinformacyjne w artykułach lub abstraktach. W przeciwieństwie do tego CI wskazuje zarówno wielkość efektu będącego przedmiotem bezpośredniego zainteresowania, takiego jak przydatność leczenia, jak i siłę dowodów. Dlatego DI jest bezpośrednio związane z praktyką DM.

Podejście punktowe do analizy statystycznej, zilustrowane przez CI, ma na celu zmierzenie wielkości efektu będącego przedmiotem zainteresowania (czułość testu diagnostycznego, przewidywana częstość występowania, względne zmniejszenie ryzyka przy leczeniu itp.) oraz zmierzenie niepewności co do tego efektu. Najczęściej CI to zakres wartości po obu stronach oszacowania, w którym prawdopodobnie mieści się prawdziwa wartość, i możesz być tego pewien na 95%. Konwencja stosowania prawdopodobieństwa 95% jest dowolna, podobnie jak wartość P<0,05 для оценки статистической значимости, и авторы иногда используют 90% или 99% ДИ. Заметим, что слово «интервал» означает диапазон величин и поэтому стоит в единственном числе. Две величины, которые ограничивают интервал, называются «доверительными пределами».

CI opiera się na założeniu, że to samo badanie przeprowadzone na różnych grupach pacjentów nie dałoby identycznych wyników, ale ich wyniki byłyby rozłożone wokół prawdziwej, ale nieznanej wartości. Innymi słowy, CI opisuje to jako „zmienność zależną od próbki”. CI nie odzwierciedla dodatkowej niepewności wynikającej z innych przyczyn; w szczególności nie obejmuje wpływu selektywnej utraty pacjentów na śledzenie, słabej zgodności lub niedokładnego pomiaru wyniku, braku zaślepienia itp. CI zatem zawsze nie docenia całkowitej kwoty niepewności.

Obliczanie przedziału ufności

Tabela A1.1. Błędy standardowe i przedziały ufności dla niektórych pomiarów klinicznych

Zazwyczaj CI jest obliczany na podstawie obserwowanego oszacowania miary ilościowej, takiej jak różnica (d) między dwiema proporcjami oraz błąd standardowy (SE) w oszacowaniu tej różnicy. Otrzymany w ten sposób przybliżony 95% przedział ufności wynosi d ± 1,96 SE. Formuła zmienia się w zależności od charakteru miary wyniku i zasięgu CI. Na przykład w randomizowanym, kontrolowanym placebo badaniu bezkomórkowej szczepionki przeciw krztuścowi krztusiec rozwinął się u 72 z 1670 (4,3%) niemowląt, które otrzymały szczepionkę, i u 240 z 1665 (14,4%) w grupie kontrolnej. Różnica procentowa, znana jako bezwzględna redukcja ryzyka, wynosi 10,1%. SE tej różnicy wynosi 0,99%. W związku z tym 95% CI wynosi 10,1% + 1,96 x 0,99%, tj. od 8,2 do 12,0.

Pomimo różnych podejść filozoficznych, CI i testy istotności statystycznej są ściśle powiązane matematycznie.

Zatem wartość P jest „znacząca”, tj. R<0,05 соответствует 95% ДИ, который исключает величину эффекта, указывающую на отсутствие различия. Например, для различия между двумя средними пропорциями это ноль, а для относительного риска или отношения шансов - единица. При некоторых обстоятельствах эти два подхода могут быть не совсем эквивалентны. Преобладающая точка зрения: оценка с помощью ДИ - предпочтительный подход к суммированию результатов исследования, но ДИ и величина Р взаимодополняющи, и во многих статьях используются оба способа представления результатов.

Niepewność (niedokładność) oszacowania, wyrażona w CI, jest w dużej mierze związana z pierwiastkiem kwadratowym wielkości próby. Małe próbki dostarczają mniej informacji niż duże próbki, a CI są odpowiednio szersze w mniejszych próbkach. Na przykład w artykule porównującym skuteczność trzech testów stosowanych do diagnozowania zakażenia Helicobacter pylori podano, że czułość testu oddechowego na mocznik wynosi 95,8% (95% CI 75-100). Chociaż liczba 95,8% wygląda imponująco, niewielka wielkość próby 24 dorosłych pacjentów z H. pylori oznacza, że ​​istnieje znaczna niepewność w tym oszacowaniu, jak pokazuje szeroki przedział ufności. Rzeczywiście, dolna granica 75% jest znacznie niższa niż szacunkowa wartość 95,8%. Gdyby taką samą czułość zaobserwowano w próbie 240 osób, wówczas 95% przedział ufności wyniósłby 92,5-98,0, co daje większą pewność, że test jest bardzo czuły.

W randomizowanych badaniach kontrolowanych (RCT) wyniki nieistotne (tj. te z P > 0,05) są szczególnie podatne na błędną interpretację. CI jest tutaj szczególnie przydatny, ponieważ wskazuje, w jakim stopniu wyniki są zgodne z klinicznie użytecznym rzeczywistym efektem. Na przykład w RCT porównującym zespolenie szwem ze zszywką w okrężnicy zakażenie rany rozwinęło się odpowiednio u 10,9% i 13,5% pacjentów (p = 0,30). 95% CI dla tej różnicy wynosi 2,6% (-2 do +8). Nawet w tym badaniu, które obejmowało 652 pacjentów, pozostaje prawdopodobne, że istnieje niewielka różnica w częstości występowania infekcji wynikających z tych dwóch procedur. Im mniejsze badanie, tym większa niepewność. Sung i in. przeprowadzili RCT porównujące infuzję oktreotydu ze skleroterapią doraźną w ostrym krwawieniu z żylaków u 100 pacjentów. W grupie oktreotydu odsetek zatrzymania krwawienia wyniósł 84%; w grupie skleroterapii – 90%, co daje P=0,56. Należy zauważyć, że częstość ciągłego krwawienia jest podobna do częstości zakażenia rany we wspomnianym badaniu. Jednak w tym przypadku 95% CI dla różnicy w interwencjach wynosi 6% (-7 do +19). Ten zakres jest dość szeroki w porównaniu z 5% różnicą, która byłaby interesująca klinicznie. Oczywiste jest, że badanie nie wyklucza istotnej różnicy w skuteczności. Zatem konkluzja autorów, że „wlew oktreotydu i skleroterapia są równie skuteczne w leczeniu krwawień z żylaków” jest zdecydowanie nietrafna. W przypadkach takich jak ten, w których 95% CI dla bezwzględnej redukcji ryzyka (ARR) obejmuje zero, tak jak tutaj, CI dla NNT (liczba potrzebna do leczenia) jest raczej trudna do interpretacji. NLP i jego CI uzyskuje się z odwrotności ACP (mnożąc je przez 100, jeśli te wartości są podane w procentach). Tutaj otrzymujemy NPP = 100: 6 = 16,6 z 95% CI od -14,3 do 5,3. Jak wynika z przypisu „d” w tabeli. A1.1, ten CI zawiera wartości dla NTPP od 5,3 do nieskończoności i NTLP od 14,3 do nieskończoności.

CI można konstruować dla najczęściej używanych szacunków statystycznych lub porównań. W przypadku RCT obejmuje różnicę między średnimi proporcjami, względnymi ryzykami, ilorazami szans i NRR. Podobnie CI można uzyskać dla wszystkich głównych oszacowań dokonanych w badaniach dokładności testów diagnostycznych — czułości, swoistości, dodatniej wartości predykcyjnej (z których wszystkie są prostymi proporcjami) oraz ilorazów wiarygodności — oszacowań uzyskanych w metaanalizach i porównaniach z grupą kontrolną. studia. Osobisty program komputerowy, który obejmuje wiele z tych zastosowań DI, jest dostępny w drugim wydaniu Statistics with Confidence. Makra do obliczania CI dla proporcji są dostępne bezpłatnie dla programu Excel i programów statystycznych SPSS i Minitab pod adresem http://www.uwcm.ac.uk/study/medicine/epidemiology_statistics/research/statistics/proportions, htm.

Wielokrotna ocena efektu leczenia

Chociaż konstrukcja CI jest pożądana dla głównych wyników badania, nie jest wymagana dla wszystkich wyników. CI dotyczy klinicznie ważnych porównań. Na przykład podczas porównywania dwóch grup prawidłowy CI to ten, który jest zbudowany dla różnicy między grupami, jak pokazano w powyższych przykładach, a nie CI, który można zbudować dla oszacowania w każdej grupie. Nie tylko bezużyteczne jest podawanie osobnych CI dla wyników w każdej grupie, ale taka prezentacja może wprowadzać w błąd. Podobnie, właściwym podejściem przy porównywaniu skuteczności leczenia w różnych podgrupach jest bezpośrednie porównanie dwóch (lub więcej) podgrup. Błędne jest założenie, że leczenie jest skuteczne tylko w jednej podgrupie, jeśli jej CI wyklucza wartość odpowiadającą brakowi efektu, podczas gdy inne nie. CI są również przydatne podczas porównywania wyników w wielu podgrupach. na ryc. A1.1 przedstawia względne ryzyko rzucawki u kobiet ze stanem przedrzucawkowym w podgrupach kobiet z kontrolowanego placebo RCT siarczanu magnezu.

Ryż. A1.2. Wykres leśny przedstawia wyniki 11 randomizowanych badań klinicznych szczepionki bydlęcej przeciwko rotawirusowi w zapobieganiu biegunce w porównaniu z placebo. Do oszacowania względnego ryzyka biegunki zastosowano 95% przedział ufności. Rozmiar czarnego kwadratu jest proporcjonalny do ilości informacji. Ponadto pokazane jest podsumowanie szacunkowej skuteczności leczenia i 95% przedział ufności (oznaczony rombem). W metaanalizie wykorzystano model efektów losowych, który wykracza poza niektóre z góry ustalone; na przykład może to być rozmiar użyty do obliczenia rozmiaru próbki. Zgodnie z bardziej rygorystycznym kryterium cały zakres IK musi wykazywać korzyść przekraczającą z góry określone minimum.

Omówiliśmy już błąd polegający na uznaniu braku istotności statystycznej za wskazówkę, że dwie metody leczenia są równie skuteczne. Równie ważne jest, aby nie utożsamiać istotności statystycznej z istotnością kliniczną. Znaczenie kliniczne można założyć, gdy wynik jest statystycznie istotny i wielkość odpowiedzi na leczenie

Badania mogą wykazać, czy wyniki są istotne statystycznie i które z nich są istotne klinicznie, a które nie. na ryc. A1.2 pokazuje wyniki czterech prób, dla których cały CI<1, т.е. их результаты статистически значимы при Р <0,05 , . После высказанного предположения о том, что клинически важным различием было бы сокращение риска диареи на 20% (ОР = 0,8), все эти испытания показали клинически значимую оценку сокращения риска, и лишь в исследовании Treanor весь 95% ДИ меньше этой величины. Два других РКИ показали клинически важные результаты, которые не были статистически значимыми. Обратите внимание, что в трёх испытаниях точечные оценки эффективности лечения были почти идентичны, но ширина ДИ различалась (отражает размер выборки). Таким образом, по отдельности доказательная сила этих РКИ различна.

I inne Wszystkie z nich są szacunkami ich teoretycznych odpowiedników, które można by uzyskać, gdyby nie była próba, ale populacja ogólna. Niestety, ogólna populacja jest bardzo droga i często niedostępna.

Pojęcie estymacji przedziałowej

Każde oszacowanie próbki ma pewien rozrzut, ponieważ jest zmienną losową zależną od wartości w konkretnej próbie. Dlatego dla bardziej wiarygodnych wnioskowań statystycznych należy znać nie tylko oszacowanie punktowe, ale również przedział, który z dużym prawdopodobieństwem γ (gamma) obejmuje szacowany wskaźnik θ (teta).

Formalnie są to dwie takie wartości (statystyka) T1(X) I T2(X), Co T1< T 2 , dla których przy danym poziomie prawdopodobieństwa γ warunek jest spełniony:

Krótko mówiąc, jest to prawdopodobne γ lub więcej prawdziwa wartość znajduje się między punktami T1(X) I T2(X), które nazywane są dolną i górną granicą przedział ufności.

Jednym z warunków konstruowania przedziałów ufności jest jego maksymalna zawężenie, tj. powinien być jak najkrótszy. Pragnienie jest całkiem naturalne, ponieważ. badacz stara się dokładniej zlokalizować znalezienie pożądanego parametru.

Wynika z tego, że przedział ufności powinien obejmować maksymalne prawdopodobieństwa rozkładu. a sama partytura powinna znajdować się w środku.

Oznacza to, że prawdopodobieństwo odchylenia (wskaźnika prawdziwego od oszacowania) w górę jest równe prawdopodobieństwu odchylenia w dół. Należy również zauważyć, że w przypadku rozkładów skośnych przedział po prawej stronie nie jest równy przedziałowi po lewej stronie.

Powyższy rysunek wyraźnie pokazuje, że im wyższy poziom ufności, tym szerszy przedział – zależność bezpośrednia.

Było to małe wprowadzenie do teorii estymacji przedziałowej nieznanych parametrów. Przejdźmy do znalezienia granic ufności dla oczekiwań matematycznych.

Przedział ufności dla oczekiwań matematycznych

Jeśli oryginalne dane są rozłożone na , średnia będzie wartością normalną. Wynika to z zasady, że liniowa kombinacja wartości normalnych ma również rozkład normalny. Dlatego do obliczenia prawdopodobieństw moglibyśmy użyć aparatu matematycznego prawa rozkładu normalnego.

Będzie to jednak wymagało znajomości dwóch parametrów – wartości oczekiwanej i wariancji, które zwykle nie są znane. Można oczywiście użyć szacunków zamiast parametrów (średnia arytmetyczna i ), ale wtedy rozkład średniej nie będzie całkiem normalny, będzie lekko spłaszczony. Obywatel Irlandii William Gosset zręcznie odnotował ten fakt, publikując swoje odkrycie w wydaniu Biometrica z marca 1908 roku. Dla zachowania poufności Gosset podpisał kontrakt ze Studentem. W ten sposób pojawił się rozkład t-Studenta.

Jednak normalny rozkład danych, używany przez K. Gaussa w analizie błędów w obserwacjach astronomicznych, jest niezwykle rzadki w życiu na Ziemi i dość trudno go ustalić (do wysokiej dokładności potrzeba około 2 tysięcy obserwacji). Dlatego najlepiej jest odrzucić założenie o normalności i użyć metod, które nie zależą od rozkładu oryginalnych danych.

Powstaje pytanie: jaki jest rozkład średniej arytmetycznej, jeśli oblicza się ją z danych o nieznanym rozkładzie? Odpowiedzi udziela znany w teorii prawdopodobieństwa Centralne twierdzenie graniczne(CPT). W matematyce istnieje kilka jego wersji (sformułowania były przez lata udoskonalane), ale wszystkie z grubsza sprowadzają się do stwierdzenia, że ​​suma dużej liczby niezależnych zmiennych losowych spełnia prawo rozkładu normalnego.

Przy obliczaniu średniej arytmetycznej używana jest suma zmiennych losowych. Z tego okazuje się, że średnia arytmetyczna ma rozkład normalny, w którym wartością oczekiwaną jest wartość oczekiwana danych początkowych, a wariancja wynosi .

Inteligentni ludzie wiedzą, jak udowodnić CLT, ale zweryfikujemy to za pomocą eksperymentu przeprowadzonego w Excelu. Przeprowadźmy symulację próby 50 równomiernie rozłożonych zmiennych losowych (używając funkcji programu Excel RANDOMBETWEEN). Następnie wykonamy 1000 takich próbek i obliczymy średnią arytmetyczną dla każdej z nich. Przyjrzyjmy się ich rozkładowi.

Można zauważyć, że rozkład średniej jest zbliżony do prawa normalnego. Jeśli objętość próbek i ich liczba zostaną jeszcze większe, podobieństwo będzie jeszcze lepsze.

Teraz, gdy sami przekonaliśmy się o słuszności CLT, możemy, korzystając z , obliczyć przedziały ufności dla średniej arytmetycznej, które pokrywają prawdziwą średnią lub matematyczne oczekiwanie z zadanym prawdopodobieństwem.

Aby ustalić górną i dolną granicę, wymagana jest znajomość parametrów rozkładu normalnego. Z reguły nie są, dlatego stosuje się szacunki: Średnia arytmetyczna I wariancja próbki. Ponownie, ta metoda daje dobre przybliżenie tylko dla dużych próbek. Gdy próbki są małe, często zaleca się stosowanie rozkładu Studenta. nie wierz! Rozkład Studenta dla średniej występuje tylko wtedy, gdy oryginalne dane mają rozkład normalny, czyli prawie nigdy. Dlatego lepiej od razu ustawić minimalny pasek ilości wymaganych danych i użyć asymptotycznie poprawnych metod. Podobno wystarczy 30 obserwacji. Weź 50 - nie możesz się pomylić.

T 1.2 są dolną i górną granicą przedziału ufności

– przykładowa średnia arytmetyczna

s0– odchylenie standardowe próbki (nieobciążone)

N - wielkość próbki

γ – poziom ufności (zwykle równy 0,9, 0,95 lub 0,99)

c γ = Φ -1 ((1+γ)/2) jest odwrotnością standardowej funkcji rozkładu normalnego. Mówiąc prościej, jest to liczba błędów standardowych od średniej arytmetycznej do dolnej lub górnej granicy (wskazane trzy prawdopodobieństwa odpowiadają wartościom 1,64, 1,96 i 2,58).

Istota wzoru polega na tym, że bierze się średnią arytmetyczną, a następnie odkłada się od niej pewną kwotę ( z γ) błędy standardowe ( s 0 /√n). Wszystko wiadomo, weź to i policz.

Przed masowym użyciem komputerów PC, aby uzyskać wartości rozkładu normalnego i jego odwrotności, używano . Nadal są używane, ale bardziej efektywne jest skorzystanie z gotowych formuł Excela. Wszystkie elementy z powyższego wzoru ( , i ) można łatwo obliczyć w Excelu. Ale jest też gotowy wzór na obliczenie przedziału ufności - NORMA ZAUFANIA. Jego składnia jest następująca.

NORMA UFNOŚCI(alfa; odchylenie_standardowe; rozmiar)

alfa– poziom istotności lub poziom ufności, który w powyższym zapisie jest równy 1-γ, tj. prawdopodobieństwo, że matematyczneoczekiwanie będzie poza przedziałem ufności. Przy poziomie ufności 0,95 alfa wynosi 0,05 i tak dalej.

standard_wył jest odchyleniem standardowym danych próbki. Nie musisz obliczać błędu standardowego, Excel podzieli przez pierwiastek z n.

rozmiar– liczebność próby (n).

Wynikiem funkcji UFNOŚĆ.NORMA jest drugi wyraz ze wzoru na obliczenie przedziału ufności, tj. półprzedział. Odpowiednio dolny i górny punkt to średnia ± uzyskana wartość.

W ten sposób możliwe jest zbudowanie uniwersalnego algorytmu obliczania przedziałów ufności dla średniej arytmetycznej, która nie zależy od rozkładu danych początkowych. Ceną za uniwersalność jest jej asymptotyczny charakter, tj. konieczność stosowania stosunkowo dużych próbek. Jednak w dobie nowoczesnych technologii zebranie odpowiedniej ilości danych zazwyczaj nie jest trudne.

Testowanie hipotez statystycznych przy użyciu przedziału ufności

(moduł 111)

Jednym z głównych problemów rozwiązywanych w statystyce jest. Krótko mówiąc, jego istotą jest to. Przyjmuje się na przykład założenie, że oczekiwanie ogółu populacji jest równe pewnej wartości. Następnie konstruuje się rozkład średnich z próby, który można zaobserwować przy zadanym oczekiwaniu. Następnie przyjrzymy się, gdzie w tym rozkładzie warunkowym znajduje się średnia rzeczywista. Jeśli wykracza poza dopuszczalne granice, pojawienie się takiej średniej jest bardzo mało prawdopodobne, a przy pojedynczym powtórzeniu eksperymentu jest prawie niemożliwe, co jest sprzeczne z wysuniętą hipotezą, którą skutecznie odrzuca. Jeśli średnia nie przekracza poziomu krytycznego, to hipoteza nie jest odrzucana (ale też nie jest udowodniona!).

Tak więc, za pomocą przedziałów ufności, w naszym przypadku dla oczekiwań, można również przetestować pewne hipotezy. To bardzo łatwe. Załóżmy, że średnia arytmetyczna dla pewnej próbki wynosi 100. Testowana jest hipoteza, że ​​wartość oczekiwana wynosi, powiedzmy, 90. To znaczy, jeśli postawimy pytanie prymitywnie, brzmi ono tak: czy może być tak, że przy prawdziwej wartości średnia równa 90, obserwowana średnia wynosiła 100?

Aby odpowiedzieć na to pytanie, potrzebne będą dodatkowe informacje na temat odchylenia standardowego i wielkości próby. Powiedzmy, że odchylenie standardowe wynosi 30, a liczba obserwacji to 64 (aby łatwo wyodrębnić pierwiastek). Wtedy błąd standardowy średniej wynosi 30/8 czyli 3,75. Aby obliczyć 95% przedział ufności, należy odłożyć dwa błędy standardowe po obu stronach średniej (dokładniej 1,96). Przedział ufności wyniesie około 100 ± 7,5, czyli od 92,5 do 107,5.

Dalsze rozumowanie jest następujące. Jeżeli badana wartość mieści się w przedziale ufności, to nie jest sprzeczna z hipotezą, gdyż mieści się w granicach wahań losowych (z prawdopodobieństwem 95%). Jeżeli badany punkt znajduje się poza przedziałem ufności, to prawdopodobieństwo takiego zdarzenia jest bardzo małe, w każdym razie poniżej akceptowalnego poziomu. W związku z tym hipoteza zostaje odrzucona jako sprzeczna z obserwowanymi danymi. W naszym przypadku hipoteza oczekiwań jest poza przedziałem ufności (testowana wartość 90 nie mieści się w przedziale 100±7,5), więc należy ją odrzucić. Odpowiadając na prymitywne pytanie powyżej, należy powiedzieć: nie, w żadnym wypadku nie może, zdarza się to niezwykle rzadko. Często wskazuje to na określone prawdopodobieństwo błędnego odrzucenia hipotezy (poziom p), a nie na dany poziom, według którego budowano przedział ufności, ale o tym innym razem.

Jak widać, nie jest trudno zbudować przedział ufności dla średniej (lub matematycznego oczekiwania). Najważniejsze jest, aby złapać esencję, a potem wszystko pójdzie. W praktyce większość używa 95% przedziału ufności, który ma szerokość około dwóch błędów standardowych po obu stronach średniej.

To wszystko na teraz. Wszystkiego najlepszego!

PRZEDZIAŁY UFNOŚCI DLA CZĘSTOTLIWOŚCI I CZĘŚCI

© 2008

Narodowy Instytut Zdrowia Publicznego, Oslo, Norwegia

W artykule opisano i omówiono obliczanie przedziałów ufności dla częstości i proporcji metodami Walda, Wilsona, Kloppera-Pearsona, z wykorzystaniem transformacji kątowej oraz metodą Walda z poprawką Agrestiego-Cowlla. Prezentowany materiał zawiera ogólne informacje o metodach obliczania przedziałów ufności dla częstości i proporcji i ma na celu wzbudzenie zainteresowania czytelników czasopisma nie tylko wykorzystaniem przedziałów ufności przy prezentacji wyników własnych badań, ale także zapoznaniem się z literaturą fachową przed rozpoczęciem praca nad kolejnymi publikacjami.

Słowa kluczowe: przedział ufności, częstotliwość, proporcja

W jednej z poprzednich publikacji pokrótce wspomniano o opisie danych jakościowych i podano, że dla opisu częstości występowania badanej cechy w populacji generalnej preferowane jest ich oszacowanie przedziałowe niż oszacowanie punktowe. Rzeczywiście, ponieważ badania są prowadzone na podstawie danych z próby, projekcja wyników na populację ogólną musi zawierać element niedokładności w oszacowaniu próby. Przedział ufności jest miarą dokładności estymowanego parametru. Co ciekawe, w niektórych książkach z podstaw statystyki dla lekarzy temat przedziałów ufności dla częstości jest całkowicie pomijany. W tym artykule rozważymy kilka sposobów obliczania przedziałów ufności dla częstości, zakładając cechy próbki, takie jak niepowtarzalność i reprezentatywność, a także niezależność obserwacji od siebie. Częstość w tym artykule nie jest rozumiana jako liczba bezwzględna pokazująca, ile razy ta lub inna wartość występuje w agregacie, ale wartość względna, która określa odsetek uczestników badania, którzy mają badaną cechę.

W badaniach biomedycznych najczęściej stosuje się 95% przedziały ufności. Ten przedział ufności to obszar, w którym prawdziwa proporcja mieści się w 95% przypadków. Innymi słowy, można z 95% pewnością stwierdzić, że prawdziwa wartość częstości występowania cechy w populacji ogólnej będzie mieściła się w 95% przedziale ufności.

Większość podręczników statystycznych dla naukowców medycznych podaje, że błąd częstotliwości oblicza się za pomocą wzoru

gdzie p jest częstością występowania cechy w próbie (wartość od 0 do 1). W większości krajowych artykułów naukowych wskazywana jest wartość częstości występowania cechy w próbce (p), a także jej błąd (s) w postaci p ± s. Bardziej celowe jest jednak przedstawienie 95% przedziału ufności dla częstości występowania cechy w populacji ogólnej, który będzie obejmował wartości od

zanim.

W niektórych podręcznikach dla małych prób zaleca się zastąpienie wartości 1,96 wartością t dla N - 1 stopni swobody, gdzie N to liczba obserwacji w próbie. Wartość t znajduje się w tablicach rozkładu t, które są dostępne w prawie wszystkich podręcznikach statystyki. Wykorzystanie rozkładu t dla metody Walda nie zapewnia widocznej przewagi nad innymi metodami omówionymi poniżej i dlatego niektórzy autorzy nie są mile widziani.

Powyższa metoda obliczania przedziałów ufności dla częstości lub ułamków nosi imię Abrahama Walda (Abraham Wald, 1902–1950), ponieważ zaczęła być szeroko stosowana po publikacji Walda i Wolfowitza w 1939 r. Jednak sama metoda została zaproponowana przez Pierre'a Simona Laplace'a (1749-1827) już w 1812 roku.

Metoda Walda jest bardzo popularna, jednak jej zastosowanie wiąże się z istotnymi problemami. Metoda nie jest zalecana dla próbek o małej liczebności, a także w przypadkach, gdy częstość występowania cechy dąży do 0 lub 1 (0% lub 100%) i po prostu nie jest możliwa dla częstości 0 i 1. Ponadto przybliżenie rozkładu normalnego, które jest używane przy obliczaniu błędu , „nie działa” w przypadkach, gdy n p< 5 или n · (1 – p) < 5 . Более консервативные статистики считают, что n · p и n · (1 – p) должны быть не менее 10 . Более детальное рассмотрение метода Вальда показало, что полученные с его помощью доверительные интервалы в большинстве случаев слишком узки, то есть их применение ошибочно создает слишком оптимистичную картину, особенно при удалении частоты встречаемости признака от 0,5, или 50 % . К тому же при приближении частоты к 0 или 1 доверительный интревал может принимать отрицательные значения или превышать 1, что выглядит абсурдно для частот. Многие авторы совершенно справедливо не рекомендуют применять данный метод не только в уже упомянутых случаях, но и тогда, когда частота встречаемости признака менее 25 % или более 75 % . Таким образом, несмотря на простоту расчетов, метод Вальда может применяться лишь в очень ограниченном числе случаев. Зарубежные исследователи более категоричны в своих выводах и однозначно рекомендуют не применять этот метод для небольших выборок , а ведь именно с такими выборками часто приходится иметь дело исследователям-медикам.

Ponieważ nowa zmienna ma rozkład normalny, dolna i górna granica 95% przedziału ufności dla zmiennej φ wyniesie φ-1,96 i φ+1,96 w lewo">

Zamiast 1,96 dla małych próbek zaleca się zastąpienie N - 1 stopni swobody wartością t. Ta metoda nie daje wartości ujemnych i pozwala dokładniej oszacować przedziały ufności dla częstotliwości niż metoda Walda. Ponadto jest opisany w wielu krajowych podręcznikach statystyki medycznej, co jednak nie doprowadziło do jego szerokiego zastosowania w badaniach medycznych. Obliczanie przedziałów ufności przy użyciu transformacji kątowej nie jest zalecane dla częstotliwości zbliżających się do 0 lub 1.

Na tym zwykle kończy się opis metod szacowania przedziałów ufności w większości książek z podstaw statystyki dla badaczy medycznych, a problem ten jest typowy nie tylko dla literatury krajowej, ale także zagranicznej. Obie metody opierają się na centralnym twierdzeniu granicznym, co oznacza dużą próbę.

Biorąc pod uwagę wady szacowania przedziałów ufności przy użyciu powyższych metod, Clopper (Clopper) i Pearson (Pearson) zaproponowali w 1934 r. metodę obliczania tzw. dokładnego przedziału ufności, uwzględniającą rozkład dwumianowy badanej cechy. Metoda ta jest dostępna w wielu kalkulatorach internetowych, jednak uzyskane w ten sposób przedziały ufności są w większości przypadków zbyt szerokie. Jednocześnie metoda ta jest zalecana do stosowania w przypadkach, gdy wymagane jest ostrożne oszacowanie. Stopień konserwatywności metody wzrasta wraz ze zmniejszaniem się liczebności próby, zwłaszcza dla N< 15 . описывает применение функции биномиального распределения для анализа качественных данных с использованием MS Excel, в том числе и для определения доверительных интервалов, однако расчет последних для частот в электронных таблицах не «затабулирован» в удобном для пользователя виде, а потому, вероятно, и не используется большинством исследователей.

Według wielu statystyków najbardziej optymalne oszacowanie przedziałów ufności dla częstotliwości przeprowadza się metodą Wilsona, zaproponowaną jeszcze w 1927 r., Ale praktycznie niestosowaną w krajowych badaniach biomedycznych. Ta metoda nie tylko umożliwia oszacowanie przedziałów ufności zarówno dla bardzo małych, jak i bardzo wysokich częstotliwości, ale ma również zastosowanie do niewielkiej liczby obserwacji. Ogólnie przedział ufności według wzoru Wilsona ma postać od



gdzie przy obliczaniu 95% przedziału ufności przyjmuje wartość 1,96, N to liczba obserwacji, a p to częstość występowania cechy w próbie. Ta metoda jest dostępna w kalkulatorach online, więc jej zastosowanie nie nastręcza problemów. i nie zalecamy używania tej metody dla n p< 4 или n · (1 – p) < 4 по причине слишком грубого приближения распределения р к нормальному в такой ситуации, однако зарубежные статистики считают метод Уилсона применимым и для малых выборок .

Uważa się, że oprócz metody Wilsona, metoda Walda z korektą Agrestiego-Caulla zapewnia również optymalne oszacowanie przedziału ufności dla częstotliwości. Poprawka Agresti-Coulle'a polega na zastąpieniu we wzorze Walda częstości występowania cechy w próbie (p) przez p`, przy obliczaniu której do licznika dodaje się 2, a do mianownika 4, czyli , p` = (X + 2) / (N + 4), gdzie X to liczba uczestników badania, którzy mają badaną cechę, a N to wielkość próby. Ta modyfikacja daje wyniki bardzo podobne do tych ze wzoru Wilsona, z wyjątkiem sytuacji, gdy częstość zdarzeń zbliża się do 0% lub 100%, a próba jest mała. Oprócz powyższych metod obliczania przedziałów ufności dla częstotliwości, zaproponowano poprawki ciągłości zarówno dla metody Walda, jak i metody Wilsona dla małych próbek, ale badania wykazały, że ich użycie jest niewłaściwe.

Rozważ zastosowanie powyższych metod do obliczania przedziałów ufności na dwóch przykładach. W pierwszym przypadku badamy dużą próbę 1000 losowo wybranych uczestników badania, z których 450 ma badaną cechę (niezależnie od tego, czy jest to czynnik ryzyka, wynik, czy jakakolwiek inna cecha), co jest częstością 0,45, lub 45%. W drugim przypadku badanie przeprowadzane jest na małej próbie, powiedzmy tylko 20 osób, a tylko 1 uczestnik badania (5%) ma badaną cechę. Przedziały ufności dla metody Walda, dla metody Walda z poprawką Agresti-Coll, dla metody Wilsona obliczono za pomocą internetowego kalkulatora opracowanego przez Jeffa Sauro (http://www./wald.htm). Skorygowane o ciągłość przedziały ufności Wilsona obliczono przy użyciu kalkulatora dostarczonego przez Wassar Stats: Web Site for Statistical Computation (http://faculty.vassar.edu/lowry/prop1.html). Obliczenia z wykorzystaniem transformacji kątowej Fishera wykonano „ręcznie” z wartością krytyczną t odpowiednio dla 19 i 999 stopni swobody. Wyniki obliczeń przedstawiono w tabeli dla obu przykładów.

Przedziały ufności obliczono na sześć różnych sposobów dla dwóch przykładów opisanych w tekście

Metoda obliczania przedziału ufności

P=0,0500, czyli 5%

95% CI dla X=450, N=1000, P=0,4500 lub 45%

–0,0455–0,2541

Waldy z korekcją Agresti-Coll

<,0001–0,2541

Wilsona z korekcją ciągłości

„Dokładna metoda” Kloppera-Pearsona

Transformacja kątowa

<0,0001–0,1967

Jak widać z tabeli, w pierwszym przykładzie przedział ufności obliczony „ogólnie akceptowaną” metodą Walda przechodzi w obszar ujemny, co nie może mieć miejsca w przypadku częstości. Niestety, takie incydenty nie są rzadkością w literaturze rosyjskiej. Tradycyjny sposób przedstawiania danych jako częstotliwości i jej błędu częściowo maskuje ten problem. Na przykład, jeśli częstość występowania cechy (w procentach) jest przedstawiona jako 2,1 ± 1,4, to nie jest to tak „irytujące” jak 2,1% (95% CI: –0,7; 4,9), chociaż i oznacza to samo. Metoda Walda z poprawką Agresti-Coulle'a i obliczenia z wykorzystaniem transformacji kątowej dają dolną granicę dążącą do zera. Metoda Wilsona z poprawką na ciągłość i „metoda dokładna” dają szersze przedziały ufności niż metoda Wilsona. Dla drugiego przykładu wszystkie metody dają w przybliżeniu takie same przedziały ufności (różnice pojawiają się tylko w tysięcznych), co nie jest zaskakujące, ponieważ częstotliwość zdarzenia w tym przykładzie nie różni się zbytnio od 50%, a liczebność próby jest dość duża .

Czytelnikom zainteresowanym tym problemem możemy polecić prace R. G. Newcombe oraz Brown, Cai i Dasgupta, które przedstawiają wady i zalety stosowania odpowiednio 7 i 10 różnych metod obliczania przedziałów ufności. Z podręczników krajowych polecana jest książka i, w której oprócz szczegółowego opisu teorii przedstawiono metody Walda i Wilsona, a także metodę obliczania przedziałów ufności z uwzględnieniem dwumianowego rozkładu częstości. Oprócz bezpłatnych kalkulatorów online (http://www./wald.htm i http://faculty.vassar.edu/lowry/prop1.html), przedziały ufności dla częstości (i nie tylko!) program CIA (Analiza przedziałów ufności), który można pobrać ze strony http://www. Szkoła Medyczna. soton ak. Wielka Brytania/cia/ .

W następnym artykule przyjrzymy się jednowymiarowym sposobom porównywania danych jakościowych.

Bibliografia

Banerjee A. Statystyka medyczna w prostym języku: kurs wprowadzający / A. Banerzhi. - M. : Medycyna praktyczna, 2007. - 287 s. Statystyka medyczna / . - M. : Agencja Informacji Medycznej, 2007. - 475 s. Glanz S. Statystyka medyczno-biologiczna / S. Glants. - M. : Praktyka, 1998. Typy danych, weryfikacja dystrybucji i statystyki opisowe / // Ekologia człowieka - 2008. - nr 1. - s. 52–58. Żyżyn K.S.. Statystyka medyczna: podręcznik / . - Rostów n / D: Phoenix, 2007. - 160 s. Stosowana Statystyka Medyczna / , . - Sankt Petersburg. : Folio, 2003. - 428 s. Lakin GF. Biometria / . - M. : Szkoła wyższa, 1990r. - 350 s. Medyk V. A. Statystyka matematyczna w medycynie / , . - M.: Finanse i statystyka, 2007. - 798 s. Statystyka matematyczna w badaniach klinicznych / , . - M. : GEOTAR-MED, 2001. - 256 s. Junkerov V. I. Przetwarzanie medyczno-statystyczne danych z badań medycznych /,. - Sankt Petersburg. : VmedA, 2002. - 266 s. Agrest A. Przybliżenie jest lepsze niż dokładne dla estymacji przedziałowej proporcji dwumianowych / A. Agresti, B. Coull // Statystyk amerykański. - 1998. - N 52. - S. 119-126. Altman D. Pewne statystyki // D. Altman, D. Machin, T. Bryant, MJ Gardner. - Londyn: BMJ Books, 2000. - 240 s. Brązowy LD Estymacja przedziałowa dla proporcji dwumianowej / LD Brown, TT Cai, A. Dasgupta // Nauki statystyczne. - 2001. - N 2. - s. 101-133. Clopper C.J. Wykorzystanie granic ufności lub wiarygodności zilustrowane na przykładzie dwumianu / C. J. Clopper, E. S. Pearson // Biometrika. - 1934. - N 26. - s. 404-413. Garcia-Perez MA. O przedziale ufności dla parametru dwumianowego / M. A. Garcia-Perez // Jakość i ilość. - 2005. - N 39. - s. 467-481. Motulski H. Intuicyjna biostatystyka // H. Motulsky. - Oksford: Oxford University Press, 1995. - 386 s. Newcombe RG Dwustronne przedziały ufności dla pojedynczej proporcji: porównanie siedmiu metod / RG Newcombe // Statystyka w medycynie. - 1998. - N. 17. - P. 857–872. Sauro J. Szacowanie wskaźników ukończenia na podstawie małych próbek przy użyciu dwumianowych przedziałów ufności: porównania i zalecenia / J. Sauro, JR Lewis // Doroczne spotkanie Proceedings of Human Factor and Ergonomics Society. – Orlando, Floryda, 2005. Wald A. Granice ufności dla funkcji rozkładu ciągłego // A. Wald, J. Wolfovitz // Annals of Mathematical Statistics. - 1939. - N 10. - s. 105–118. Wilson EB. Wnioskowanie prawdopodobne, prawo sukcesji i wnioskowanie statystyczne / EB Wilson // Journal of American Statistical Association. - 1927. - N 22. - s. 209-212.

PRZEDZIAŁY UFNOŚCI DLA PROPORCJONALNOŚCI

A. M. Grjibovski

Narodowy Instytut Zdrowia Publicznego, Oslo, Norwegia

W artykule przedstawiono kilka metod obliczania przedziałów ufności dla proporcji dwumianowych, a mianowicie metodę Walda, Wilsona, arcsinus, Agresti-Coull oraz dokładną metodę Cloppera-Pearsona. Artykuł stanowi jedynie ogólne wprowadzenie do problematyki estymacji przedziału ufności proporcji dwumianowej i ma na celu nie tylko zachęcenie czytelników do stosowania przedziałów ufności przy przedstawianiu wyników własnych badań empirycznych, ale także zachęcenie do sięgania do książek statystycznych przed do analizy własnych danych i przygotowania manuskryptów.

słowa kluczowe: przedział ufności, proporcja

Informacje kontaktowe:

Starszy doradca, Narodowy Instytut Zdrowia Publicznego, Oslo, Norwegia