Przedział ufności dla oczekiwań matematycznych. Próbki i przedziały ufności

Przedział ufności dla oczekiwań matematycznych - jest to taki przedział wyliczony z danych, który ze znanym prawdopodobieństwem zawiera matematyczne oczekiwanie populacji ogólnej. Naturalnym oszacowaniem matematycznego oczekiwania jest średnia arytmetyczna jego obserwowanych wartości. Dlatego w dalszej części lekcji będziemy używać terminów „średnia”, „średnia wartość”. W problemach obliczania przedziału ufności najczęściej wymagana odpowiedź brzmi: „Przedział ufności średniej liczby [wartości w konkretnym zadaniu] wynosi od [niższa wartość] do [wyższa wartość]”. Za pomocą przedziału ufności można ocenić nie tylko średnie wartości, ale także udział tej lub innej cechy w populacji ogólnej. Na lekcji analizowane są wartości średnie, wariancja, odchylenie standardowe i błąd, przez które dojdziemy do nowych definicji i wzorów Charakterystyka próby i populacji .

Estymatory punktowe i przedziałowe średniej

Jeżeli średnia wartość populacji ogólnej jest szacowana za pomocą liczby (punktów), wówczas jako oszacowanie nieznanej średniej populacji ogólnej przyjmuje się określoną średnią obliczoną z próby obserwacji. W tym przypadku wartość średniej z próby – zmiennej losowej – nie pokrywa się ze średnią z populacji ogólnej. Dlatego przy wskazaniu wartości średniej próbki konieczne jest jednoczesne wskazanie błędu próbki. Błąd standardowy jest używany jako miara błędu próbkowania, który jest wyrażany w tych samych jednostkach co średnia. Dlatego często używa się następującej notacji: .

Jeśli oszacowanie średniej musi być powiązane z pewnym prawdopodobieństwem, to parametr populacji ogólnej zainteresowania musi być szacowany nie przez pojedynczą liczbę, ale przez przedział. Przedział ufności to przedział, w którym z pewnym prawdopodobieństwem P znaleziono wartość szacowanego wskaźnika populacji ogólnej. Przedział ufności, w którym z prawdopodobieństwem P = 1 - α jest zmienną losową , obliczana jest w następujący sposób:

,

α = 1 - P, który można znaleźć w dodatku do niemal każdej książki o statystyce.

W praktyce średnia populacji i wariancja nie są znane, więc wariancję populacji zastępuje się wariancją próby, a średnią populacji średnią próby. Zatem przedział ufności w większości przypadków oblicza się w następujący sposób:

.

Wzór przedziału ufności można wykorzystać do oszacowania średniej populacji, jeśli

  • znane jest odchylenie standardowe populacji ogólnej;
  • lub odchylenie standardowe populacji nie jest znane, ale wielkość próby jest większa niż 30.

Średnia próbki jest bezstronnym oszacowaniem średniej populacji. Z kolei wariancja próbki nie jest obiektywnym oszacowaniem wariancji populacji. Aby uzyskać bezstronne oszacowanie wariancji populacji we wzorze wariancji próby, wielkość próby wynosi n należy zastąpić n-1.

Przykład 1 Ze 100 losowo wybranych kawiarni w danym mieście zbierane są informacje, że średnia liczba pracowników w nich wynosi 10,5 przy odchyleniu standardowym 4,6. Określ przedział ufności 95% liczby pracowników kawiarni.

gdzie jest wartością krytyczną standardowego rozkładu normalnego dla poziomu istotności α = 0,05 .

Zatem 95% przedział ufności dla średniej liczby pracowników kawiarni mieścił się w przedziale od 9,6 do 11,4.

Przykład 2 Dla próby losowej z ogólnej populacji 64 obserwacji obliczono następujące wartości sumaryczne:

suma wartości w obserwacjach,

suma kwadratów odchyleń wartości od średniej .

Oblicz 95% przedział ufności dla wartości oczekiwanej.

obliczyć odchylenie standardowe:

,

obliczyć średnią wartość:

.

Zastąp wartościami w wyrażeniu przedział ufności:

gdzie jest wartością krytyczną standardowego rozkładu normalnego dla poziomu istotności α = 0,05 .

Otrzymujemy:

Zatem 95% przedział ufności dla matematycznych oczekiwań tej próbki wahał się od 7,484 do 11,266.

Przykład 3 Dla losowej próby z ogólnej populacji 100 obserwacji obliczono średnią wartość 15,2 i odchylenie standardowe 3,2. Oblicz 95% przedział ufności dla wartości oczekiwanej, a następnie 99% przedział ufności. Jeśli moc próbki i jej zmienność pozostaną takie same, ale współczynnik ufności wzrośnie, czy przedział ufności zawęzi się, czy poszerzy?

Podstawiamy te wartości do wyrażenia dla przedziału ufności:

gdzie jest wartością krytyczną standardowego rozkładu normalnego dla poziomu istotności α = 0,05 .

Otrzymujemy:

.

Zatem 95% przedział ufności dla średniej tej próbki wynosił od 14,57 do 15,82.

Ponownie podstawiamy te wartości do wyrażenia dla przedziału ufności:

gdzie jest wartością krytyczną standardowego rozkładu normalnego dla poziomu istotności α = 0,01 .

Otrzymujemy:

.

Zatem 99% przedział ufności dla średniej tej próby wynosił od 14,37 do 16,02.

Jak widać, wraz ze wzrostem współczynnika ufności wzrasta również wartość krytyczna standardowego rozkładu normalnego, a zatem punkty początkowe i końcowe przedziału znajdują się dalej od średniej, a tym samym przedziału ufności dla matematycznego oczekiwania wzrasta.

Estymatory punktowe i przedziałowe ciężaru właściwego

Udział jakiejś cechy w próbie można interpretować jako oszacowanie punktowe udziału p ta sama cecha w populacji ogólnej. Jeśli tę wartość trzeba powiązać z prawdopodobieństwem, należy obliczyć przedział ufności ciężaru właściwego p cecha w populacji ogólnej z prawdopodobieństwem P = 1 - α :

.

Przykład 4 W jednym mieście jest dwóch kandydatów A oraz B kandydować na burmistrza. Wylosowano 200 mieszkańców miasta, z czego 46% odpowiedziało, że zagłosuje na kandydata A, 26% - dla kandydata B a 28% nie wie, na kogo zagłosuje. Określ 95% przedział ufności dla odsetka mieszkańców miasta, którzy popierają kandydata A.

Instrukcja

Proszę to zanotować interwał(l1 lub l2), którego obszar centralny będzie oszacowaniem l*, a także w którym prawdopodobnie będzie zawarta prawdziwa wartość parametru, będzie po prostu ufnością interwał om lub odpowiednia wartość poziomu ufności alfa. W takim przypadku samo l* będzie odnosić się do oszacowań punktowych. Na przykład na podstawie wyników dowolnych wartości próbki o wartości losowej X (x1, x2,..., xn) konieczne jest obliczenie nieznanego parametru wskaźnika l, od którego będzie zależał rozkład. W tym przypadku otrzymanie oszacowania danego parametru l* będzie oznaczało, że dla każdej próbki konieczne będzie odpowiednie przyporządkowanie pewnej wartości parametru, czyli utworzenie funkcji wyników obserwacji wskaźnika Q, czyli wartości która zostanie przyjęta jako równa oszacowanej wartości parametru l* w postaci wzoru: l*=Q*(x1,x2,...,xn).

Zauważ, że każda funkcja na wynikach obserwacji nazywana jest statystyką. Co więcej, jeśli w pełni opisuje rozważany parametr (zjawisko), to nazywa się to statystyką wystarczającą. A ponieważ wyniki obserwacji są losowe, to l * również będzie zmienną losową. Zadanie obliczania statystyk powinno być wykonywane z uwzględnieniem kryteriów jego jakości. Tutaj należy wziąć pod uwagę, że prawo rozkładu oszacowania jest dość określone, rozkład gęstości prawdopodobieństwa W(x, l).

Możesz obliczyć pewność interwał dość łatwe, jeśli znasz prawo dotyczące dystrybucji wycen. Na przykład zaufanie interwał szacunki w odniesieniu do oczekiwań matematycznych (wartość średnia wartości losowej) mx* =(1/n)*(x1+x2+ …+xn) . Oszacowanie to będzie bezstronne, tzn. matematyczne oczekiwanie lub średnia wartość wskaźnika będzie równa prawdziwej wartości parametru (M(mx*) = mx).

Możesz ustalić, że wariancja oszacowania przez matematyczne oczekiwanie wynosi: bx*^2=Dx/n. Na podstawie centralnego twierdzenia granicznego możemy wyciągnąć odpowiedni wniosek, że prawo rozkładu tego oszacowania jest gaussowskie (normalne). Dlatego do obliczeń można użyć wskaźnika Ф (z) - całki prawdopodobieństw. W takim przypadku wybierz długość zaufania interwał i 2nd, więc otrzymujesz: alfa \u003d P (mx-ld (przy użyciu właściwości całki prawdopodobieństwa zgodnie ze wzorem: Ф (-z) \u003d 1- Ф (z)).

Budować zaufanie interwał oszacowania matematycznego oczekiwania: - znajdź wartość wzoru (alfa + 1) / 2 - wybierz wartość równą ld / sqrt (Dx / n) z tabeli całek prawdopodobieństwa - weź oszacowanie prawdziwej wariancji: Dx * = (1 / n) * ( (x1 - mx*)^2+(x2 - mx*)^2+…+(xn - mx*)^2); interwał według wzoru: (mx*-ld, mx*+ld).

Przedział ufności(CI; w języku angielskim, przedział ufności - CI) uzyskany w badaniu na próbie stanowi miarę dokładności (lub niepewności) wyników badania, w celu wyciągnięcia wniosków na temat populacji wszystkich takich pacjentów (populacja ogólna ). Prawidłową definicję 95% CI można sformułować w następujący sposób: 95% takich przedziałów będzie zawierało rzeczywistą wartość w populacji. Ta interpretacja jest nieco mniej dokładna: CI to zakres wartości, w którym możesz mieć 95% pewności, że zawiera wartość prawdziwą. Przy stosowaniu CI nacisk kładzie się na określenie efektu ilościowego, w przeciwieństwie do wartości P, którą uzyskuje się w wyniku testowania istotności statystycznej. Wartość P nie ocenia żadnej ilości, ale służy raczej jako miara siły dowodu przeciwko hipotezie zerowej „braku efektu”. Sama wartość P nie mówi nam nic o wielkości różnicy, ani nawet o jej kierunku. Dlatego niezależne wartości P są absolutnie nieinformacyjne w artykułach lub abstraktach. W przeciwieństwie do tego CI wskazuje zarówno wielkość efektu bezpośredniego zainteresowania, takiego jak użyteczność leczenia, jak i siłę dowodów. Dlatego DI jest bezpośrednio związane z praktyką DM.

Punktowe podejście do analizy statystycznej, zilustrowane przez CI, ma na celu zmierzenie wielkości efektu zainteresowania (czułość testu diagnostycznego, przewidywana częstość występowania, względna redukcja ryzyka z leczeniem, itp.) oraz zmierzenie niepewności tego efektu. Najczęściej CI to zakres wartości po obu stronach oszacowania, w którym prawdopodobnie leży prawdziwa wartość, i możesz być tego 95% pewien. Konwencja użycia prawdopodobieństwa 95% jest dowolna, podobnie jak wartość P<0,05 для оценки статистической значимости, и авторы иногда используют 90% или 99% ДИ. Заметим, что слово «интервал» означает диапазон величин и поэтому стоит в единственном числе. Две величины, которые ограничивают интервал, называются «доверительными пределами».

CI opiera się na założeniu, że to samo badanie przeprowadzone na różnych grupach pacjentów nie dałoby identycznych wyników, ale ich wyniki byłyby rozłożone wokół prawdziwej, ale nieznanej wartości. Innymi słowy, CI opisuje to jako „zmienność zależną od próby”. CI nie odzwierciedla dodatkowej niepewności z innych przyczyn; w szczególności nie obejmuje wpływu selektywnej utraty pacjentów na śledzenie, słabej zgodności lub niedokładnego pomiaru wyników, braku zaślepienia itp. W ten sposób CI zawsze zaniża całkowitą wielkość niepewności.

Obliczanie przedziału ufności

Tabela A1.1. Błędy standardowe i przedziały ufności dla niektórych pomiarów klinicznych

Zazwyczaj CI oblicza się na podstawie obserwowanego oszacowania miary ilościowej, takiej jak różnica (d) między dwiema proporcjami oraz błąd standardowy (SE) w oszacowaniu tej różnicy. Uzyskany w ten sposób około 95% CI wynosi d ± 1,96 SE. Formuła zmienia się w zależności od charakteru miary wyniku i zasięgu CI. Na przykład w randomizowanym, kontrolowanym placebo badaniu bezkomórkowej szczepionki przeciw krztuścowi krztusiec rozwinął się u 72 z 1670 (4,3%) niemowląt, które otrzymały szczepionkę i 240 z 1665 (14,4%) w grupie kontrolnej. Różnica procentowa, znana jako bezwzględna redukcja ryzyka, wynosi 10,1%. SE tej różnicy wynosi 0,99%. Odpowiednio 95% CI wynosi 10,1% + 1,96 x 0,99%, tj. od 8,2 do 12,0.

Pomimo różnych podejść filozoficznych, CI i testy istotności statystycznej są ściśle powiązane matematycznie.

Zatem wartość P jest „istotna”, tj. R<0,05 соответствует 95% ДИ, который исключает величину эффекта, указывающую на отсутствие различия. Например, для различия между двумя средними пропорциями это ноль, а для относительного риска или отношения шансов - единица. При некоторых обстоятельствах эти два подхода могут быть не совсем эквивалентны. Преобладающая точка зрения: оценка с помощью ДИ - предпочтительный подход к суммированию результатов исследования, но ДИ и величина Р взаимодополняющи, и во многих статьях используются оба способа представления результатов.

Niepewność (niedokładność) oszacowania, wyrażona w CI, jest w dużej mierze związana z pierwiastkiem kwadratowym wielkości próby. Małe próbki dostarczają mniej informacji niż duże próbki, a CI są odpowiednio szersze w mniejszych próbkach. Na przykład artykuł porównujący działanie trzech testów stosowanych do diagnozowania zakażenia Helicobacter pylori donosił o czułości testu oddechowego mocznika na poziomie 95,8% (95% CI 75-100). Chociaż wynik 95,8% wygląda imponująco, mała liczebność próby 24 dorosłych pacjentów z H. pylori oznacza, że ​​istnieje znaczna niepewność w tym oszacowaniu, co pokazuje szeroki CI. Rzeczywiście, dolna granica 75% jest znacznie niższa niż szacowana 95,8%. Gdyby tę samą czułość zaobserwowano w próbie 240 osób, wówczas 95% CI wyniósłby 92,5-98,0, co daje większą pewność, że test jest bardzo czuły.

W randomizowanych kontrolowanych badaniach (RCT) nieistotne wyniki (tj. te z P > 0,05) są szczególnie podatne na błędną interpretację. CI jest tu szczególnie przydatny, ponieważ wskazuje, jak zgodne są wyniki z klinicznie użytecznym rzeczywistym efektem. Na przykład, w RCT porównującym zespolenie szwów i zszywek w okrężnicy, zakażenie rany rozwinęło się odpowiednio u 10,9% i 13,5% pacjentów (P = 0,30). 95% CI dla tej różnicy wynosi 2,6% (-2 do +8). Nawet w tym badaniu, które obejmowało 652 pacjentów, nadal prawdopodobne jest, że istnieje niewielka różnica w częstości występowania zakażeń wynikających z obu procedur. Im mniejsze badanie, tym większa niepewność. Sung i in. przeprowadził badanie RCT porównujące wlew oktreotydu ze skleroterapią doraźną w ostrym krwawieniu żylakowym u 100 pacjentów. W grupie oktreotydu wskaźnik zatrzymania krwawienia wyniósł 84%; w grupie skleroterapii – 90%, co daje P=0,56. Należy zauważyć, że we wspomnianym badaniu wskaźniki utrzymujących się krwawień są podobne do wskaźników infekcji ran. Jednak w tym przypadku 95% CI dla różnicy interwencji wynosi 6% (-7 do +19). Ten zakres jest dość szeroki w porównaniu z 5% różnicą, która byłaby interesująca klinicznie. Oczywiste jest, że badanie nie wyklucza znaczącej różnicy w skuteczności. Dlatego wniosek autorów „wlew oktreotydu i skleroterapia są równie skuteczne w leczeniu krwawień z żylaków” zdecydowanie nie jest zasadny. W takich przypadkach, gdzie 95% CI dla bezwzględnej redukcji ryzyka (ARR) obejmuje zero, tak jak tutaj, CI dla NNT (liczba potrzebna do leczenia) jest raczej trudna do interpretacji. NLP i jego CI uzyskuje się z odwrotności ACP (mnożąc je przez 100, jeśli wartości te są podane w procentach). Tutaj otrzymujemy NPP = 100: 6 = 16,6 z 95% CI od -14,3 do 5,3. Jak wynika z przypisu „d” w tabeli. A1.1, ten CI zawiera wartości dla NTPP od 5,3 do nieskończoności i NTLP od 14,3 do nieskończoności.

CI można konstruować dla najczęściej używanych oszacowań statystycznych lub porównań. W przypadku RCT obejmuje różnicę między średnimi proporcjami, względnym ryzykiem, ilorazami szans i NRR. Podobnie, CI można uzyskać dla wszystkich głównych szacunków dokonanych w badaniach dokładności testów diagnostycznych – czułość, swoistość, dodatnia wartość predykcyjna (z których wszystkie są prostymi proporcjami) i iloraz wiarygodności – oszacowania uzyskane w metaanalizach i porównaniu z kontrolą studia. Osobisty program komputerowy, który obejmuje wiele z tych zastosowań DI, jest dostępny w drugiej edycji Statistics with Confidence. Makra do obliczania CI dla proporcji są bezpłatnie dostępne dla programu Excel i programów statystycznych SPSS i Minitab pod adresem http://www.uwcm.ac.uk/study/medicine/epidemiology_statistics/research/statistics/proportions, htm.

Wielokrotna ocena efektu leczenia

Chociaż konstrukcja CI jest pożądana dla głównych wyników badania, nie są one wymagane dla wszystkich wyników. CI dotyczy porównań istotnych klinicznie. Na przykład podczas porównywania dwóch grup prawidłowy CI to ten, który jest tworzony dla różnicy między grupami, jak pokazano w powyższych przykładach, a nie CI, który można zbudować dla oszacowania w każdej grupie. Nie tylko bezużyteczne jest podawanie oddzielnych CI dla wyników w każdej grupie, ta prezentacja może być myląca. Podobnie, właściwym podejściem przy porównywaniu skuteczności leczenia w różnych podgrupach jest bezpośrednie porównanie dwóch (lub więcej) podgrup. Błędem jest założenie, że leczenie jest skuteczne tylko w jednej podgrupie, jeśli jej CI wyklucza wartość odpowiadającą brakowi efektu, podczas gdy inne nie. CI są również przydatne przy porównywaniu wyników w wielu podgrupach. Na ryc. A1.1 pokazuje względne ryzyko rzucawki u kobiet ze stanem przedrzucawkowym w podgrupach kobiet z kontrolowanego placebo RCT siarczanu magnezu.

Ryż. A1.2. Forest Graph przedstawia wyniki 11 randomizowanych badań klinicznych szczepionki przeciwko rotawirusowi bydła w zapobieganiu biegunce w porównaniu z placebo. Do oszacowania względnego ryzyka biegunki zastosowano 95% przedział ufności. Rozmiar czarnego kwadratu jest proporcjonalny do ilości informacji. Dodatkowo pokazano sumaryczne oszacowanie skuteczności leczenia i 95% przedział ufności (wskazywany przez diament). W metaanalizie wykorzystano model efektów losowych, który wykracza poza niektóre wcześniej ustalone; na przykład może to być wielkość użyta do obliczenia wielkości próby. Zgodnie z bardziej rygorystycznym kryterium, cały zakres CI musi wykazywać korzyści, które przekraczają z góry określone minimum.

Omówiliśmy już błąd polegający na przyjmowaniu braku istotności statystycznej jako wskazania, że ​​dwie metody leczenia są równie skuteczne. Równie ważne jest, aby nie zrównywać istotności statystycznej z istotnością kliniczną. Znaczenie kliniczne można przyjąć, gdy wynik jest istotny statystycznie, a wielkość odpowiedzi na leczenie

Badania mogą wykazać, czy wyniki są istotne statystycznie, a które są istotne klinicznie, a które nie. Na ryc. A1.2 przedstawia wyniki czterech prób, dla których cały CI<1, т.е. их результаты статистически значимы при Р <0,05 , . После высказанного предположения о том, что клинически важным различием было бы сокращение риска диареи на 20% (ОР = 0,8), все эти испытания показали клинически значимую оценку сокращения риска, и лишь в исследовании Treanor весь 95% ДИ меньше этой величины. Два других РКИ показали клинически важные результаты, которые не были статистически значимыми. Обратите внимание, что в трёх испытаниях точечные оценки эффективности лечения были почти идентичны, но ширина ДИ различалась (отражает размер выборки). Таким образом, по отдельности доказательная сила этих РКИ различна.

Załóżmy, że mamy dużą liczbę artykułów o normalnym rozkładzie pewnych cech (na przykład pełny magazyn warzyw tego samego rodzaju, których wielkość i waga są różne). Chcesz poznać średnią charakterystykę całej partii towaru, ale nie masz ani czasu, ani ochoty na mierzenie i ważenie każdego warzywa. Rozumiesz, że to nie jest konieczne. Ale ile sztuk musiałbyś wziąć do wyrywkowej kontroli?

Zanim podamy kilka wzorów przydatnych w tej sytuacji, przypomnijmy sobie pewną notację.

Po pierwsze, gdybyśmy zmierzyli cały magazyn warzyw (ten zestaw elementów nazywamy populacją ogólną), to z całą dostępną nam dokładnością znalibyśmy średnią wartość masy całej partii. Nazwijmy to średnią X cf .g pl . - Średnia ogólna. Wiemy już, co jest całkowicie określone, jeśli znana jest jego wartość średnia i odchylenie s . To prawda, jak dotąd nie jesteśmy ani X avg., ani s nie znamy ogólnej populacji. Możemy tylko pobrać pewną próbkę, zmierzyć potrzebne nam wartości i obliczyć dla tej próbki zarówno wartość średnią X sr. w próbce, jak i odchylenie standardowe S sb.

Wiadomo, że jeśli nasza niestandardowa kontrola zawiera dużą liczbę elementów (zwykle n jest większe niż 30), a są one brane naprawdę losowo, to s ogólna populacja prawie nie będzie się różnić od S ..

Dodatkowo dla przypadku rozkładu normalnego możemy skorzystać z następujących wzorów:

Z prawdopodobieństwem 95%


Z prawdopodobieństwem 99%



Ogólnie z prawdopodobieństwem Р (t)


Zależność między wartością t a wartością prawdopodobieństwa P(t), z jaką chcemy poznać przedział ufności, można zaczerpnąć z poniższej tabeli:


Tym samym ustaliliśmy, w jakim przedziale znajduje się średnia wartość dla populacji ogólnej (z danym prawdopodobieństwem).

Dopóki nie mamy wystarczająco dużej próby, nie możemy twierdzić, że populacja ma s = Wyb. Ponadto w tym przypadku problematyczna jest bliskość próbki do rozkładu normalnego. W takim przypadku zamiast tego użyj również S sb s we wzorze:




ale wartość t dla ustalonego prawdopodobieństwa P(t) będzie zależeć od liczby elementów w próbce n. Im większe n, tym wynikowy przedział ufności będzie bliższy wartości podanej wzorem (1). Wartości t w tym przypadku są pobierane z innej tabeli (test t-Studenta), który podajemy poniżej:

Wartości testu t-Studenta dla prawdopodobieństwa 0,95 i 0,99


Przykład 3 Spośród pracowników firmy wybrano losowo 30 osób. Według próby okazało się, że średnia pensja (miesięcznie) wynosi 30 tysięcy rubli przy średnim odchyleniu kwadratowym 5 tysięcy rubli. Z prawdopodobieństwem 0,99 określ średnie wynagrodzenie w firmie.

Rozwiązanie: Z warunku mamy n = 30, X por. =30000, S=5000, P=0,99. Aby znaleźć przedział ufności, korzystamy ze wzoru odpowiadającego kryterium Studenta. Zgodnie z tabelą dla n \u003d 30 i P \u003d 0,99 znajdujemy t \u003d 2,756, dlatego


tych. pożądane zaufanie przedział 27484< Х ср.ген < 32516.

Tak więc z prawdopodobieństwem 0,99 można argumentować, że przedział (27484; 32516) zawiera średnią pensję w firmie.

Mamy nadzieję, że będziesz korzystać z tej metody bez konieczności posiadania przy sobie arkusza kalkulacyjnego za każdym razem. Obliczenia mogą być wykonywane automatycznie w Excelu. Będąc w pliku Excel, kliknij przycisk fx w górnym menu. Następnie wybierz spośród funkcji typ "statystyczne", a z proponowanej listy w polu - STEUDRASP. Następnie po monicie, umieszczając kursor w polu „prawdopodobieństwo”, wpisz wartość prawdopodobieństwa odwrotności (czyli w naszym przypadku zamiast prawdopodobieństwa 0,95 musisz wpisać prawdopodobieństwo 0,05). Najwyraźniej arkusz kalkulacyjny jest zaprojektowany tak, aby wynik odpowiadał na pytanie, jak prawdopodobne jest, że możemy się mylić. Podobnie w polu „stopień swobody” wprowadź wartość (n-1) dla swojej próbki.

Umysł tkwi nie tylko w wiedzy, ale także w umiejętności zastosowania wiedzy w praktyce. (Arystoteles)

Przedziały ufności

przegląd ogólny

Pobierając próbkę z populacji uzyskamy oszacowanie punktowe interesującego nas parametru i obliczymy błąd standardowy w celu wskazania dokładności oszacowania.

Jednak w większości przypadków błąd standardowy jako taki jest niedopuszczalny. O wiele bardziej przydatne jest połączenie tej miary dokładności z oszacowaniem przedziału dla parametru populacji.

Można to zrobić, wykorzystując wiedzę o teoretycznym rozkładzie prawdopodobieństwa statystyki próbki (parametr) w celu obliczenia przedziału ufności (CI — przedział ufności, CI — przedział ufności) dla parametru.

Ogólnie przedział ufności rozszerza oszacowania w obu kierunkach o pewną wielokrotność błędu standardowego (danego parametru); dwie wartości (granice ufności), które definiują przedział, są zwykle oddzielone przecinkiem i ujęte w nawiasy.

Przedział ufności dla średniej

Korzystanie z rozkładu normalnego

Średnia próbki ma rozkład normalny, jeśli wielkość próbki jest duża, więc znajomość rozkładu normalnego może być zastosowana przy rozważaniu średniej próbki.

W szczególności 95% rozkładu średnich z próby mieści się w zakresie 1,96 odchylenia standardowego (SD) średniej populacji.

Gdy mamy tylko jedną próbkę, nazywamy to błędem standardowym średniej (SEM) i obliczamy 95% przedział ufności dla średniej w następujący sposób:

Jeśli ten eksperyment zostanie powtórzony kilka razy, przedział będzie zawierał rzeczywistą średnią populacji w 95% przypadków.

Jest to zwykle przedział ufności, taki jak zakres wartości, w którym mieści się rzeczywista średnia populacji (średnia ogólna) przy 95% poziomie ufności.

Chociaż interpretacja przedziału ufności w ten sposób nie jest do końca ścisła (średnia populacji jest wartością stałą i dlatego nie może być z nią powiązanym prawdopodobieństwem), jest koncepcyjnie łatwiejsza do zrozumienia.

Stosowanie t- dystrybucja

Możesz użyć rozkładu normalnego, jeśli znasz wartość wariancji w populacji. Ponadto, gdy wielkość próbki jest mała, średnia próbki jest zgodna z rozkładem normalnym, jeśli dane stanowiące podstawę populacji mają rozkład normalny.

Jeżeli dane leżące u podstaw populacji nie mają rozkładu normalnego i/lub ogólna wariancja (wariancja populacji) jest nieznana, średnia próbki jest zgodna Rozkład t-Studenta.

Obliczyć 95% przedział ufności dla średniej populacji w następujący sposób:

Gdzie - punkt procentowy (percentyl) t- Rozkład Studenta z (n-1) stopniami swobody, co daje dwustronne prawdopodobieństwo 0,05.

Ogólnie rzecz biorąc, zapewnia szerszy przedział niż przy użyciu rozkładu normalnego, ponieważ uwzględnia dodatkową niepewność, która jest wprowadzana przez oszacowanie odchylenia standardowego populacji i/lub ze względu na małą liczebność próby.

Gdy wielkość próby jest duża (rzędu 100 lub więcej), różnica między dwoma rozkładami ( t-student i normalne) jest znikome. Jednak zawsze używaj t- rozkład przy obliczaniu przedziałów ufności, nawet jeśli wielkość próby jest duża.

Zwykle podaje się 95% CI. Można obliczyć inne przedziały ufności, takie jak 99% CI dla średniej.

Zamiast iloczynu błędu standardowego i wartości tabeli t- rozkład, który odpowiada dwustronnemu prawdopodobieństwu 0,05, pomnóż go (błąd standardowy) przez wartość odpowiadającą dwustronnemu prawdopodobieństwu 0,01. Jest to szerszy przedział ufności niż przypadek 95%, ponieważ odzwierciedla zwiększoną pewność, że przedział rzeczywiście obejmuje średnią populacji.

Przedział ufności dla proporcji

Rozkład proporcji w próbce ma rozkład dwumianowy. Jeśli jednak wielkość próbki n rozsądnie duży, to rozkład próbki proporcjonalnej jest w przybliżeniu normalny ze średnią .

Oszacuj według współczynnika próbkowania p=r/n(gdzie r- liczba osobników w próbie o interesujących nas cechach), a błąd standardowy szacowany jest:

Szacuje się 95% przedział ufności dla proporcji:

Jeśli wielkość próbki jest mała (zwykle gdy np lub n(1-p) mniej 5 ), to w celu obliczenia dokładnych przedziałów ufności należy użyć rozkładu dwumianowego.

Zauważ, że jeśli p wyrażona w procentach, a następnie (1-p) zastąpione przez (100p).

Interpretacja przedziałów ufności

Interpretując przedział ufności, interesują nas następujące pytania:

Jak szeroki jest przedział ufności?

Szeroki przedział ufności wskazuje, że oszacowanie jest nieprecyzyjne; wąski wskazuje na dokładne oszacowanie.

Szerokość przedziału ufności zależy od wielkości błędu standardowego, który z kolei zależy od wielkości próby i, biorąc pod uwagę zmienną liczbową ze zmienności danych, daje szersze przedziały ufności niż badania dużego zbioru danych kilku zmiennych.

Czy CI zawiera jakieś wartości szczególnie interesujące?

Możesz sprawdzić, czy prawdopodobna wartość parametru populacji mieści się w przedziale ufności. Jeśli tak, to wyniki są zgodne z tą prawdopodobną wartością. Jeśli nie, to jest mało prawdopodobne (dla 95% przedziału ufności prawdopodobieństwo jest prawie 5%), że parametr ma tę wartość.