Przedział ufności dla oszacowania średniej (znana jest wariancja) w MS EXCEL.

Przedział ufności– wartości graniczne wielkości statystycznej, która przy danym prawdopodobieństwie ufności γ będzie znajdować się w tym przedziale przy próbkowaniu większej objętości. Oznaczane jako P(θ - ε. W praktyce prawdopodobieństwo ufności γ wybiera się spośród wartości całkiem bliskich jedności: γ = 0,9, γ = 0,95, γ = 0,99.

Cel usługi. Korzystając z tej usługi możesz określić:

  • przedział ufności dla średniej ogólnej, przedział ufności dla wariancji;
  • przedział ufności dla odchylenia standardowego, przedział ufności dla udziału ogólnego;
Powstałe rozwiązanie jest zapisywane w pliku Word (patrz przykład). Poniżej znajduje się filmowa instrukcja jak wypełnić dane początkowe.

Przykład nr 1. W kołchozowym stadzie liczącym 1000 owiec 100 owiec zostało poddanych selektywnemu strzyżeniu kontrolnemu. W rezultacie ustalono średni strzyżenie wełny na owcę na poziomie 4,2 kg. Wyznaczyć z prawdopodobieństwem 0,99 średni błąd kwadratowy próbki przy wyznaczaniu średniego strzyżenia wełny na owcę oraz granice, w jakich mieści się wartość strzyżenia, jeżeli wariancja wynosi 2,5. Próbka nie jest powtarzalna.
Przykład nr 2. Z partii importowanych produktów na placówce Moskiewskiego Północnego Urzędu Celnego pobrano 20 próbek produktu „A” w drodze losowego, powtarzanego pobierania próbek. W wyniku badania ustalono średnią wilgotność produktu „A” w próbce, która okazała się równa 6% przy odchyleniu standardowym 1%.
Wyznacz z prawdopodobieństwem 0,683 granice średniej wilgotności produktu w całej partii importowanych produktów.
Przykład nr 3. Badanie przeprowadzone na 36 studentach wykazało, że średnia liczba podręczników przeczytanych przez nich w ciągu roku akademickiego wyniosła 6. Zakładając, że liczba podręczników przeczytanych przez studenta w semestrze ma rozkład normalny z odchyleniem standardowym równym 6, znajdź : A) z wiarygodnością oszacowania przedziałowego 0,99 dla matematycznego oczekiwania tej zmiennej losowej; B) z jakim prawdopodobieństwem można powiedzieć, że obliczona na podstawie tej próby średnia liczba podręczników przeczytanych przez studenta w semestrze będzie odbiegać od oczekiwań matematycznych w wartości bezwzględnej nie więcej niż o 2.

Klasyfikacja przedziałów ufności

Według rodzaju ocenianego parametru:

Według typu próbki:

  1. Przedział ufności dla nieskończonej próbki;
  2. Przedział ufności dla próbki końcowej;
Próbkę nazywa się ponownym próbkowaniem, jeśli wybrany obiekt zostanie zwrócony do populacji przed wybraniem kolejnego. Próbkę nazywa się niepowtarzalną, jeśli wybrany obiekt nie zostanie zwrócony do populacji. W praktyce zazwyczaj mamy do czynienia z próbkami jednorazowymi.

Obliczanie średniego błędu próbkowania dla losowego doboru próby

Nazywa się rozbieżność między wartościami wskaźników uzyskanych z próby a odpowiadającymi im parametrami populacji ogólnej błąd reprezentatywności.
Oznaczenia głównych parametrów populacji ogólnej i próbnej.
Wzory średniego błędu próbkowania
ponowny wybórpowtórzyć wybór
dla przeciętnegodo udostępnieniadla przeciętnegodo udostępnienia
Zależność między granicą błędu próbkowania (Δ) gwarantowana z pewnym prawdopodobieństwem Р(t), a średni błąd próbkowania ma postać: lub Δ = t·μ, gdzie T– współczynnik ufności, wyznaczany w zależności od poziomu prawdopodobieństwa P(t) zgodnie z tablicą całki Laplace’a.

Wzory do obliczania liczebności próby przy zastosowaniu metody doboru czysto losowego

Oszacowanie przedziałów ufności

Cele kształcenia

Statystyki uwzględniają następujące kwestie dwa główne zadania:

    Mamy pewne szacunki oparte na przykładowych danych i chcemy sformułować probabilistyczne stwierdzenie na temat tego, gdzie leży prawdziwa wartość szacowanego parametru.

    Mamy konkretną hipotezę, którą należy przetestować na przykładowych danych.

W tym temacie rozważamy pierwsze zadanie. Wprowadźmy jeszcze definicję przedziału ufności.

Przedział ufności to przedział zbudowany wokół szacowanej wartości parametru i pokazujący, gdzie znajduje się prawdziwa wartość szacowanego parametru z określonym z góry prawdopodobieństwem.

Po przestudiowaniu materiału na ten temat:

    dowiedzieć się, jaki jest przedział ufności dla oszacowania;

    nauczyć się klasyfikować problemy statystyczne;

    opanować technikę konstruowania przedziałów ufności, zarówno przy użyciu wzorów statystycznych, jak i przy użyciu narzędzi programowych;

    nauczyć się określać wymaganą liczebność próby, aby osiągnąć określone parametry dokładności szacunków statystycznych.

Rozkłady cech próbek

Rozkład T

Jak omówiono powyżej, rozkład zmiennej losowej jest zbliżony do standaryzowanego rozkładu normalnego o parametrach 0 i 1. Ponieważ nie znamy wartości σ, zastępujemy ją jakąś estymatą s. Ilość ma już inny rozkład, a mianowicie lub Dystrybucja studencka, który jest określony przez parametr n -1 (liczba stopni swobody). Rozkład ten jest zbliżony do rozkładu normalnego (im większe n, tym bliższe rozkłady).

Na ryc. 95
przedstawiono rozkład Studenta z 30 stopniami swobody. Jak widać jest on bardzo zbliżony do rozkładu normalnego.

Podobnie do funkcji pracy z rozkładem normalnym ROZKŁAD NORMALNY i NORMINV, istnieją funkcje do pracy z rozkładem t - ROZKŁAD.T. STUDRASOBR (TINV). Przykład wykorzystania tych funkcji można zobaczyć w pliku STUDRASP.XLS (szablon i rozwiązanie) oraz na rys. 96
.

Rozkłady innych cech

Jak już wiemy, aby określić dokładność oszacowania oczekiwań matematycznych, potrzebujemy rozkładu t. Aby oszacować inne parametry, takie jak wariancja, wymagane są różne rozkłady. Dwa z nich to dystrybucja F i x 2 -dystrybucja.

Przedział ufności dla średniej

Przedział ufności- jest to przedział zbudowany wokół szacowanej wartości parametru i pokazujący, gdzie z określonym z góry prawdopodobieństwem znajduje się prawdziwa wartość szacowanego parametru.

Następuje konstrukcja przedziału ufności dla wartości średniej w następujący sposób:

Przykład

Restauracja typu fast food planuje poszerzyć swój asortyment o nowy rodzaj kanapki. Aby oszacować popyt na niego, menadżer planuje losowo wybrać 40 gości spośród tych, którzy już go wypróbowali i poprosić ich o ocenę swojego stosunku do nowego produktu w skali od 1 do 10. Menedżer chce oszacować oczekiwane liczbę punktów, jaką otrzyma nowy produkt i skonstruuj 95% przedział ufności dla tego oszacowania. Jak to zrobić? (patrz plik SANDWICH1.XLS (szablon i rozwiązanie).

Rozwiązanie

Aby rozwiązać ten problem, możesz użyć . Wyniki przedstawiono na ryc. 97
.

Przedział ufności dla wartości całkowitej

Czasami, korzystając z przykładowych danych, konieczne jest oszacowanie nie oczekiwania matematycznego, ale całkowitej sumy wartości. Na przykład w sytuacji audytora interesem może być oszacowanie nie średniej wielkości konta, ale sumy wszystkich rachunków.

Niech N będzie całkowitą liczbą elementów, n będzie wielkością próby, T 3 będzie sumą wartości w próbie, T” będzie oszacowaniem sumy całej populacji, następnie , a przedział ufności oblicza się ze wzoru , gdzie s jest oszacowaniem odchylenia standardowego dla próby, a jest oszacowaniem średniej dla próby.

Przykład

Załóżmy, że agencja podatkowa chce oszacować łączną kwotę zwrotu podatku dla 10 000 podatników. Podatnik albo otrzymuje zwrot podatku, albo płaci dodatkowy podatek. Znajdź 95% przedział ufności dla kwoty zwrotu, zakładając wielkość próby 500 osób (patrz plik KWOTA ZWROTU.XLS (szablon i rozwiązanie).

Rozwiązanie

StatPro nie ma specjalnej procedury w tym przypadku, można jednak zauważyć, że granice można wyznaczyć z granic dla średniej na podstawie powyższych wzorów (ryc. 98
).

Przedział ufności dla proporcji

Niech p będzie matematycznym oczekiwaniem udziału klientów, a p b będzie oszacowaniem tego udziału uzyskanym z próby o wielkości n. Można to wykazać dla wystarczająco dużych rozkład ocen będzie zbliżony do normalnego z oczekiwaniem matematycznym p i odchyleniem standardowym . Standardowy błąd oszacowania w tym przypadku wyraża się jako , a przedział ufności wynosi .

Przykład

Restauracja typu fast food planuje poszerzyć swój asortyment o nowy rodzaj kanapki. Aby ocenić popyt na ten produkt, menadżer wybrał losowo 40 gości spośród tych, którzy już go wypróbowali i poprosił ich o ocenę swojego stosunku do nowego produktu w skali od 1 do 10. Menedżer chce oszacować oczekiwaną proporcję klientów, którzy ocenią nowy produkt na co najmniej 6 punktów (oczekuje, że ci klienci będą konsumentami nowego produktu).

Rozwiązanie

Początkowo tworzymy nową kolumnę na podstawie atrybutu 1 jeśli ocena klienta była większa niż 6 punktów, a w innym przypadku 0 (patrz plik SANDWICH2.XLS (szablon i rozwiązanie).

Metoda 1

Licząc liczbę 1, szacujemy udział, a następnie korzystamy ze wzorów.

Wartość zcr pobierana jest ze specjalnych tablic rozkładu normalnego (na przykład 1,96 dla 95% przedziału ufności).

Stosując to podejście i konkretne dane do skonstruowania przedziału 95%, otrzymujemy następujące wyniki (ryc. 99).
). Wartość krytyczna parametru zcr wynosi 1,96. Błąd standardowy oszacowania wynosi 0,077. Dolna granica przedziału ufności wynosi 0,475. Górna granica przedziału ufności wynosi 0,775. Menedżer ma więc prawo wierzyć z 95% pewnością, że odsetek klientów oceniających nowy produkt na 6 lub więcej punktów będzie się mieścić w przedziale 47,5–77,5.

Metoda 2

Ten problem można rozwiązać za pomocą standardowych narzędzi StatPro. Aby to zrobić, wystarczy zauważyć, że udział w tym przypadku pokrywa się ze średnią wartością kolumny Typ. Następnie aplikujemy StatPro/Wnioskowanie statystyczne/Analiza jednej próbki skonstruować przedział ufności średniej (oszacowanie oczekiwań matematycznych) dla kolumny Typ. Wyniki uzyskane w tym przypadku będą bardzo zbliżone do wyników pierwszej metody (ryc. 99).

Przedział ufności dla odchylenia standardowego

s służy jako estymata odchylenia standardowego (wzór podano w rozdziale 1). Funkcja gęstości oszacowania s jest funkcją chi-kwadrat, która podobnie jak rozkład t ma n-1 stopni swobody. Istnieją specjalne funkcje do pracy z tą dystrybucją CHIDIST i CHIINV.

Przedział ufności w tym przypadku nie będzie już symetryczny. Konwencjonalny diagram graniczny pokazano na ryc. 100 .

Przykład

Maszyna musi produkować części o średnicy 10 cm, jednak z różnych powodów pojawiają się błędy. Kontrolera jakości niepokoją dwie okoliczności: po pierwsze, średnia wartość powinna wynosić 10 cm; po drugie, nawet w tym przypadku, jeśli odchylenia są duże, wiele części zostanie odrzuconych. Codziennie wykonuje próbkę 50 części (patrz plik KONTROLA JAKOŚCI.XLS (szablon i rozwiązanie). Jakie wnioski może dać taka próbka?

Rozwiązanie

Skonstruujmy 95% przedziały ufności dla średniej i odchylenia standardowego za pomocą StatPro/Wnioskowanie statystyczne/Analiza jednej próbki(ryc. 101
).

Następnie, korzystając z założenia o normalnym rozkładzie średnic, obliczamy odsetek produktów wadliwych, ustalając maksymalne odchylenie na poziomie 0,065. Korzystając z możliwości tabeli podstawieniowej (w przypadku dwóch parametrów) wykreślamy zależność proporcji defektów od wartości średniej i odchylenia standardowego (ryc. 102
).

Przedział ufności dla różnicy między dwiema średnimi

Jest to jedno z najważniejszych zastosowań metod statystycznych. Przykłady sytuacji.

    Kierownik sklepu odzieżowego chciałby wiedzieć, ile mniej więcej przeciętna klientka wydaje w sklepie, niż przeciętny mężczyzna.

    Obie linie latają na podobnych trasach. Organizacja konsumencka chciałaby porównać różnicę między średnim oczekiwanym czasem opóźnienia lotu w przypadku obu linii lotniczych.

    Firma wysyła kupony na określone rodzaje towarów w jednym mieście, a w innym nie. Menedżerowie chcą porównać średnie wolumeny zakupów tych produktów w ciągu najbliższych dwóch miesięcy.

    Dealer samochodowy często ma do czynienia z małżeństwami podczas prezentacji. Aby zrozumieć ich osobiste reakcje na prezentację, pary często przeprowadzają oddzielne wywiady. Menedżer chce ocenić różnicę w ocenach wystawianych przez mężczyzn i kobiety.

Przypadek próbek niezależnych

Różnica między średnimi będzie miała rozkład t z n 1 + n 2 - 2 stopniami swobody. Przedział ufności dla μ 1 - μ 2 wyraża się zależnością:

Problem ten można rozwiązać nie tylko za pomocą powyższych formuł, ale także za pomocą standardowych narzędzi StatPro. Aby to zrobić, wystarczy użyć

Przedział ufności dla różnicy proporcji

Niech będzie matematycznym oczekiwaniem udziałów. Niech będą ich przykładowymi szacunkami, skonstruowanymi z próbek o wielkości odpowiednio n 1 i n 2. Następnie następuje oszacowanie różnicy. Dlatego przedział ufności tej różnicy wyraża się jako:

Tutaj z cr jest wartością uzyskaną z rozkładu normalnego przy użyciu specjalnych tabel (na przykład 1,96 dla 95% przedziału ufności).

Standardowy błąd oszacowania wyraża się w tym przypadku zależnością:

.

Przykład

Sklep przygotowując się do dużej wyprzedaży przeprowadził następujące badania marketingowe. Wybrano 300 najlepszych nabywców i losowo podzielono ich na dwie grupy po 150 członków każda. Do wszystkich wybranych kupujących zostały wysłane zaproszenia do wzięcia udziału w wyprzedaży, jednak tylko członkowie pierwszej grupy otrzymali kupon uprawniający do 5% rabatu. Podczas sprzedaży rejestrowano zakupy wszystkich 300 wybranych kupujących. Jak menedżer może zinterpretować wyniki i ocenić skuteczność kuponów? (patrz plik COUPONS.XLS (szablon i rozwiązanie)).

Rozwiązanie

W naszym konkretnym przypadku spośród 150 klientów, którzy otrzymali kupon rabatowy, 55 dokonało zakupu w promocji, a spośród 150, którzy nie otrzymali kuponu, jedynie 35 dokonało zakupu (ryc. 103
). Wówczas wartości proporcji próbek wynoszą odpowiednio 0,3667 i 0,2333. A różnica próbek między nimi wynosi odpowiednio 0,1333. Zakładając 95% przedział ufności, z tabeli rozkładu normalnego wynika, że ​​z cr = 1,96. Obliczenie błędu standardowego różnicy próbek wynosi 0,0524. Ostatecznie stwierdzamy, że dolna granica 95% przedziału ufności wynosi odpowiednio 0,0307, ​​a górna granica wynosi odpowiednio 0,2359. Uzyskane wyniki można interpretować w ten sposób, że na każdych 100 klientów, którzy otrzymali kupon rabatowy, możemy spodziewać się od 3 do 23 nowych klientów. Musimy jednak pamiętać, że wniosek ten sam w sobie nie oznacza efektywności wykorzystania kuponów (bo udzielając rabatu tracimy zysk!). Pokażmy to na konkretnych danych. Załóżmy, że średni rozmiar zakupu wynosi 400 rubli, z czego 50 rubli. sklep ma zysk. Wówczas oczekiwany zysk na 100 klientach, którzy nie otrzymali kuponu wynosi:

50 0,2333 100 = 1166,50 rub.

Podobne wyliczenia dla 100 klientów, którzy otrzymali kupon dają:

30 0,3667 100 = 1100,10 rub.

Spadek średniego zysku do 30 tłumaczy się faktem, że korzystając z rabatu klienci, którzy otrzymali kupon, dokonają zakupu średnio za 380 rubli.

Ostateczny wniosek wskazuje zatem na nieefektywność wykorzystania tego typu kuponów w tej konkretnej sytuacji.

Komentarz. Ten problem można rozwiązać za pomocą standardowych narzędzi StatPro. Aby to zrobić, wystarczy sprowadzić ten problem do problemu oszacowania różnicy pomiędzy dwiema średnimi za pomocą metody, a następnie zastosować StatPro/Wnioskowanie statystyczne/Analiza dwóch próbek skonstruować przedział ufności dla różnicy pomiędzy dwiema wartościami średnimi.

Sterowanie długością przedziału ufności

Długość przedziału ufności zależy od następujące warunki:

    dane bezpośrednio (odchylenie standardowe);

    poziom istotności;

    wielkość próbki.

Wielkość próby do oszacowania średniej

Najpierw rozważmy problem w ogólnym przypadku. Oznaczmy wartość połowy długości podanego nam przedziału ufności jako B (ryc. 104).
). Wiemy, że przedział ufności dla średniej wartości jakiejś zmiennej losowej X wyraża się jako , Gdzie . Wierząc:

i wyrażając n, otrzymujemy .

Niestety nie znamy dokładnej wartości wariancji zmiennej losowej X. Ponadto nie znamy wartości tcr, ponieważ zależy ona od n poprzez liczbę stopni swobody. W tej sytuacji możemy wykonać następujące czynności. Zamiast wariancji s używamy pewnego oszacowania wariancji w oparciu o wszelkie dostępne implementacje badanej zmiennej losowej. Zamiast wartości t cr używamy wartości z cr dla rozkładu normalnego. Jest to całkiem akceptowalne, ponieważ funkcje gęstości rozkładu dla rozkładu normalnego i t są bardzo zbliżone (z wyjątkiem przypadku małego n). Zatem wymagana formuła ma postać:

.

Ponieważ wzór daje, ogólnie rzecz biorąc, wyniki niecałkowite, za pożądaną wielkość próby przyjmuje się zaokrąglenie z nadmiarem wyniku.

Przykład

Restauracja typu fast food planuje poszerzyć swój asortyment o nowy rodzaj kanapki. Aby ocenić popyt na ten produkt, menedżer planuje losowo wybrać liczbę odwiedzających spośród tych, którzy już go wypróbowali, i poprosić ich o ocenę swojego stosunku do nowego produktu w skali od 1 do 10. Menedżer chce oszacować oczekiwaną liczbę punktów, jaką nowy produkt otrzyma i skonstruuj 95% przedział ufności dla tego oszacowania. Jednocześnie chce, aby połowa szerokości przedziału ufności nie przekraczała 0,3. Z iloma gośćmi musi przeprowadzić wywiad?

następująco:

Tutaj ot jest oszacowaniem proporcji p, a B jest daną połową długości przedziału ufności. Zawyżenie wartości n można uzyskać za pomocą tej wartości ot= 0,5. W tym przypadku długość przedziału ufności nie przekroczy określonej wartości B dla żadnej prawdziwej wartości p.

Przykład

Niech menedżer z poprzedniego przykładu zaplanuje oszacowanie udziału klientów, którzy preferowali nowy typ produktu. Chce skonstruować 90% przedział ufności, którego połowa długości nie przekracza 0,05. Ilu klientów należy uwzględnić w próbie losowej?

Rozwiązanie

W naszym przypadku wartość z cr = 1,645. Dlatego wymaganą ilość oblicza się jako .

Jeżeli menedżer miałby podstawy sądzić, że pożądana wartość p wynosi na przykład około 0,3, to podstawiając tę ​​wartość do powyższego wzoru otrzymalibyśmy mniejszą wartość próbki losowej, a mianowicie 228.

Wzór do ustalenia losowa wielkość próby w przypadku różnicy między dwiema średnimi napisane jako:

.

Przykład

Niektóre firmy komputerowe mają centrum obsługi klienta. W ostatnim czasie wzrosła liczba skarg klientów na złą jakość obsługi. Centrum usług zatrudnia głównie dwa typy pracowników: tych, którzy nie mają dużego doświadczenia, ale ukończyli specjalne kursy przygotowawcze, oraz tych, którzy mają duże doświadczenie praktyczne, ale nie ukończyli specjalnych kursów. Firma chce przeanalizować reklamacje klientów na przestrzeni ostatnich sześciu miesięcy i porównać średnią liczbę reklamacji dla każdej z dwóch grup pracowników. Zakłada się, że liczebność próbek w obu grupach będzie taka sama. Ilu pracowników musi znaleźć się w próbie, aby otrzymać przedział 95% z połową długości nie większą niż 2?

Rozwiązanie

Tutaj σ ots jest oszacowaniem odchylenia standardowego obu zmiennych losowych przy założeniu, że są one bliskie. Zatem w naszym problemie musimy w jakiś sposób uzyskać to oszacowanie. Można to zrobić na przykład w następujący sposób. Analizując dane dotyczące reklamacji klientów w ciągu ostatnich sześciu miesięcy, menedżer może zauważyć, że na jednego pracownika przypada zazwyczaj od 6 do 36 skarg. Wiedząc, że w przypadku rozkładu normalnego prawie wszystkie wartości różnią się od średniej o więcej niż trzy odchylenia standardowe, może zasadnie wierzyć, że:

, skąd σ ots = 5.

Podstawiając tę ​​wartość do wzoru, otrzymujemy .

Wzór do ustalenia wielkość próby losowej w przypadku szacowania różnicy proporcji ma postać:

Przykład

Niektóre firmy mają dwie fabryki produkujące podobne produkty. Menedżer firmy chce porównać odsetek wadliwych produktów w obu fabrykach. Według dostępnych informacji, wskaźnik defektów w obu fabrykach waha się od 3 do 5%. Ma on na celu skonstruowanie 99% przedziału ufności z połową długości nie większą niż 0,005 (lub 0,5%). Ile produktów należy wybrać z każdej fabryki?

Rozwiązanie

Tutaj p 1ots i p 2ots to szacunki dwóch nieznanych udziałów wad w pierwszej i drugiej fabryce. Jeśli wstawimy p 1ots = p 2ots = 0,5, wówczas otrzymamy zawyżoną wartość dla n. Ponieważ jednak w naszym przypadku mamy informację aprioryczną o tych udziałach, przyjmujemy górne oszacowanie tych udziałów, czyli 0,05. Dostajemy

Podczas szacowania niektórych parametrów populacji na podstawie przykładowych danych przydatne jest nie tylko oszacowanie punktowe parametru, ale także podanie przedziału ufności, który pokazuje, gdzie może znajdować się dokładna wartość szacowanego parametru.

W tym rozdziale zapoznaliśmy się także z zależnościami ilościowymi, które pozwalają nam konstruować takie przedziały dla różnych parametrów; nauczyli się sposobów kontrolowania długości przedziału ufności.

Należy również zauważyć, że problem szacowania wielkości próby (problem planowania eksperymentu) można rozwiązać za pomocą standardowych narzędzi StatPro, a mianowicie StatPro/wnioskowanie statystyczne/wybór wielkości próbki.

Przedział ufności pochodzi od nas ze statystyki. Jest to pewien zakres, który służy do oszacowania nieznanego parametru z dużym stopniem wiarygodności. Najłatwiej wyjaśnić to na przykładzie.

Załóżmy, że chcesz zbadać jakąś zmienną losową, na przykład szybkość odpowiedzi serwera na żądanie klienta. Za każdym razem, gdy użytkownik wpisuje adres konkretnej witryny, serwer odpowiada z różną szybkością. Zatem badany czas reakcji jest losowy. Zatem przedział ufności pozwala nam wyznaczyć granice tego parametru i wtedy możemy powiedzieć, że z 95% prawdopodobieństwem serwer znajdzie się w obliczonym przez nas przedziale.

Lub musisz dowiedzieć się, ile osób wie o znaku towarowym firmy. Po obliczeniu przedziału ufności będzie można np. powiedzieć, że z 95% prawdopodobieństwem odsetek świadomych tego konsumentów mieści się w przedziale od 27% do 34%.

Ściśle powiązany z tym terminem jest wartość prawdopodobieństwa ufności. Reprezentuje prawdopodobieństwo, że żądany parametr mieści się w przedziale ufności. To, jak duży będzie nasz pożądany zakres, zależy od tej wartości. Im większa jest wartość, tym węższy staje się przedział ufności i odwrotnie. Zwykle jest ustawiony na 90%, 95% lub 99%. Najbardziej popularna jest wartość 95%.

Na wskaźnik ten wpływa również rozproszenie obserwacji, a jego definicja opiera się na założeniu, że badana cecha jest przestrzegana, co jest również znane jako prawo Gaussa. Według niego normalna to rozkład wszystkich prawdopodobieństw ciągłej zmiennej losowej, który można opisać za pomocą gęstości prawdopodobieństwa. Jeżeli założenie o rozkładzie normalnym jest nieprawidłowe, wówczas oszacowanie może być nieprawidłowe.

Najpierw zastanówmy się, jak obliczyć przedział ufności dla. Istnieją dwa możliwe przypadki. Rozproszenie (stopień rozproszenia zmiennej losowej) może być znane lub nie. Jeśli jest znany, to nasz przedział ufności oblicza się za pomocą następującego wzoru:

xsr - t*σ / (sqrt(n))<= α <= хср + t*σ / (sqrt(n)), где

α - znak,

t - parametr z tablicy rozkładu Laplace'a,

σ jest pierwiastkiem kwadratowym wariancji.

Jeśli wariancja jest nieznana, można ją obliczyć, jeśli znamy wszystkie wartości pożądanej cechy. Używa się do tego następującego wzoru:

σ2 = х2ср - (хср)2, gdzie

х2ср – średnia wartość kwadratów badanej cechy,

(хср)2 jest kwadratem tej cechy.

Wzór, według którego obliczany jest przedział ufności w tym przypadku, ulega niewielkim zmianom:

xsr - t*s / (sqrt(n))<= α <= хср + t*s / (sqrt(n)), где

xsr - średnia próbki,

α - znak,

t jest parametrem, który można znaleźć za pomocą tablicy rozkładu Studenta t = t(ɣ;n-1),

sqrt(n) - pierwiastek kwadratowy z całkowitej wielkości próby,

s jest pierwiastkiem kwadratowym wariancji.

Rozważmy ten przykład. Załóżmy, że na podstawie wyników 7 pomiarów wyznaczono badaną cechę na 30, a wariancję próbki na 36. Należy znaleźć z prawdopodobieństwem 99% przedział ufności zawierający prawdziwą wartość mierzonego parametru.

Najpierw ustalmy, ile t jest równe: t = t (0,99; 7-1) = 3,71. Korzystając z powyższego wzoru otrzymujemy:

xsr - t*s / (sqrt(n))<= α <= хср + t*s / (sqrt(n))

30 - 3,71*36 / (sqrt(7))<= α <= 30 + 3.71*36 / (sqrt(7))

21.587 <= α <= 38.413

Przedział ufności dla wariancji oblicza się zarówno w przypadku znanej średniej, jak i wtedy, gdy nie ma danych o oczekiwaniu matematycznym, a znana jest jedynie wartość punktowego nieobciążonego oszacowania wariancji. Nie podamy tutaj wzorów do jego obliczenia, ponieważ są one dość złożone i w razie potrzeby zawsze można je znaleźć w Internecie.

Zauważmy tylko, że wygodnie jest określić przedział ufności za pomocą Excela lub usługi sieciowej, która tak się nazywa.

Przedziały ufności.

Obliczenie przedziału ufności opiera się na średnim błędzie odpowiedniego parametru. Przedział ufności pokazuje, w jakich granicach z prawdopodobieństwem (1-a) mieści się prawdziwa wartość szacowanego parametru. Tutaj a jest poziomem istotności, (1-a) jest również nazywane prawdopodobieństwem ufności.

W pierwszym rozdziale pokazaliśmy, że np. dla średniej arytmetycznej prawdziwa średnia populacji w około 95% przypadków mieści się w granicach 2 błędów standardowych średniej. Zatem granice 95% przedziału ufności dla średniej zostaną oddzielone od średniej z próbki o dwukrotność średniego błędu średniej, tj. mnożymy średni błąd średniej przez określony współczynnik w zależności od poziomu ufności. Za średnią i różnicę średnich przyjmuje się współczynnik Studenta (wartość krytyczna testu Studenta), dla udziału i różnicy udziałów wartość krytyczną kryterium z. Iloczyn współczynnika i błędu średniego można nazwać błędem maksymalnym danego parametru, tj. maksimum, jakie możemy uzyskać przy jego ocenie.

Przedział ufności dla Średnia arytmetyczna : .

Oto przykładowa średnia;

Średni błąd średniej arytmetycznej;

S - Odchylenie standardowe próbki;

N

f = rz-1 (współczynnik Studenta).

Przedział ufności dla różnice średnich arytmetycznych :

Oto różnica między przykładowymi średnimi;

- błąd średni różnicy średnich arytmetycznych;

s 1 , s 2 – przykładowe odchylenia standardowe;

n1, n2

Wartość krytyczna testu Studenta dla danego poziomu istotności a oraz liczba stopni swobody f=n 1 + n 2-2 (współczynnik Studenta).

Przedział ufności dla Akcje :

.

Tutaj d jest frakcją próbki;

– średni błąd ułamkowy;

N– liczebność próby (wielkość grupy);

Przedział ufności dla różnica udziałów :

Oto różnica w przykładowych udziałach;

– błąd średni różnicy średnich arytmetycznych;

n1, n2– objętości próbek (liczba grup);

Wartość krytyczna kryterium z na danym poziomie istotności a ( , , ).

Obliczając przedziały ufności dla różnicy między wskaźnikami, po pierwsze, bezpośrednio widzimy możliwe wartości efektu, a nie tylko jego ocenę punktową. Po drugie, możemy wyciągnąć wniosek o przyjęciu lub odrzuceniu hipotezy zerowej, a po trzecie, możemy wyciągnąć wniosek o mocy testu.

Testując hipotezy za pomocą przedziałów ufności należy przestrzegać następującej zasady:

Jeżeli 100(1-a) procentowy przedział ufności różnicy średnich nie zawiera zera, wówczas różnice są istotne statystycznie na poziomie istotności a; wręcz przeciwnie, jeśli ten przedział zawiera zero, to różnice nie są istotne statystycznie.

Rzeczywiście, jeśli w tym przedziale znajduje się zero, oznacza to, że porównywany wskaźnik może być większy lub mniejszy w jednej z grup w porównaniu do drugiej, tj. zaobserwowane różnice wynikają z przypadku.

Moc testu można ocenić na podstawie położenia zera w przedziale ufności. Jeżeli zero znajduje się blisko dolnej lub górnej granicy przedziału, wówczas możliwe jest, że przy większej liczbie porównywanych grup różnice osiągną istotność statystyczną. Jeśli zero znajduje się blisko środka przedziału, oznacza to, że zarówno wzrost, jak i spadek wskaźnika w grupie eksperymentalnej są równie prawdopodobne i prawdopodobnie tak naprawdę nie ma różnic.

Przykłady:

Porównanie śmiertelności chirurgicznej przy zastosowaniu dwóch różnych rodzajów znieczulenia: w pierwszym rodzaju znieczulenia operowano 61 osób, 8 zmarło, w drugim – 67 osób, 10 zmarło.

re 1 = 8/61 = 0,131; d2 = 10/67 = 0,149; d1-d2 = - 0,018.

Różnica w śmiertelności porównywanych metod będzie mieściła się w przedziale (-0,018 - 0,122; -0,018 + 0,122) lub (-0,14; 0,104) z prawdopodobieństwem 100(1-a) = 95%. Przedział zawiera zero, tj. nie można odrzucić hipotezy o równej śmiertelności przy dwóch różnych rodzajach znieczulenia.

Zatem śmiertelność może i będzie spadać do 14% i wzrastać do 10,4% z prawdopodobieństwem 95%, tj. zero znajduje się mniej więcej pośrodku przedziału, więc można argumentować, że najprawdopodobniej te dwie metody naprawdę nie różnią się śmiertelnością.

W omówionym wcześniej przykładzie porównano średni czas prasowania podczas testu stukania w czterech grupach uczniów różniących się wynikami egzaminu. Obliczmy przedziały ufności dla średniego czasu prasowania dla uczniów, którzy zdali egzamin z ocenami 2 i 5 oraz przedział ufności dla różnicy między tymi średnimi.

Współczynniki Studenta wyznacza się korzystając z tablic rozkładów Studenta (patrz załącznik): dla pierwszej grupy: = t(0,05;48) = 2,011; dla drugiej grupy: = t(0,05;61) = 2,000. Zatem przedziały ufności dla pierwszej grupy: = (162,19-2,011*2,18; 162,19+2,011*2,18) = (157,8; 166,6), dla drugiej grupy (156,55-2000*1,88; 156,55+2000*1,88) = (152,8 ; 160,3). Zatem dla tych, którzy zdali egzamin na 2, średni czas prasowania waha się od 157,8 ms do 166,6 ms z prawdopodobieństwem 95%, dla tych, którzy zdali egzamin na 5 – od 152,8 ms do 160,3 ms z prawdopodobieństwem 95%. .

Hipotezę zerową można także przetestować, używając przedziałów ufności dla średnich, a nie tylko dla różnicy średnich. Przykładowo, jak w naszym przypadku, jeżeli przedziały ufności dla średnich pokrywają się, to hipotezy zerowej nie można odrzucić. Aby odrzucić hipotezę na wybranym poziomie istotności, odpowiednie przedziały ufności nie mogą się pokrywać.

Znajdźmy przedział ufności dla różnicy średniego czasu prasowania w grupach, które zdały egzamin z ocenami 2 i 5. Różnica średnich: 162,19 – 156,55 = 5,64. Współczynnik Studenta: = t(0,05;49+62-2) = t(0,05;109) = 1,982. Grupowe odchylenia standardowe będą równe: ; . Obliczamy błąd średni różnicy średnich: . Przedział ufności: =(5,64-1,982*2,87; 5,64+1,982*2,87) = (-0,044; 11,33).

Zatem różnica w średnim czasie prasowania w grupach, które zdały egzamin na 2 i 5, będzie się mieścić w przedziale od -0,044 ms do 11,33 ms. Przedział ten zawiera zero, tj. Średni czas prasowania dla osób, które zdały egzamin dobrze, może się wydłużyć lub zmniejszyć w porównaniu do osób, które zdały egzamin niezadowalająco, tj. hipotezy zerowej nie można odrzucić. Jednak zero jest bardzo blisko dolnej granicy, a czas wciskania jest znacznie bardziej skrócony w przypadku tych, którzy zdali dobrze. Możemy zatem stwierdzić, że nadal istnieją różnice w średnim czasie tłoczenia pomiędzy osobami, które zdały egzamin 2 i 5, po prostu nie mogliśmy ich wykryć, biorąc pod uwagę zmianę średniego czasu, rozpiętość średniego czasu i wielkość próby.



Moc testu to prawdopodobieństwo odrzucenia błędnej hipotezy zerowej, tj. znaleźć różnice tam, gdzie faktycznie istnieją.

Moc testu określa się na podstawie poziomu istotności, wielkości różnic między grupami, rozrzutu wartości w grupach oraz wielkości próbek.

Do testu t-Studenta i analizy wariancji można zastosować diagramy wrażliwości.

Siłę kryterium można wykorzystać do wstępnego określenia wymaganej liczby grup.

Przedział ufności pokazuje, w jakich granicach z danym prawdopodobieństwem mieści się prawdziwa wartość szacowanego parametru.

Korzystając z przedziałów ufności, można testować hipotezy statystyczne i wyciągać wnioski na temat wrażliwości kryteriów.

LITERATURA.

Glanz S. – Rozdział 6,7.

Rebrova O.Yu. – s. 112-114, s. 171-173, s. 234-238.

Sidorenko E.V. – s. 32-33.

Pytania do samodzielnego sprawdzenia uczniów.

1. Jaka jest siła kryterium?

2. W jakich przypadkach należy oceniać siłę kryteriów?

3. Metody obliczania mocy.

6. Jak testować hipotezę statystyczną za pomocą przedziału ufności?

7. Co można powiedzieć o mocy kryterium przy obliczaniu przedziału ufności?

Zadania.

„Katren-Style” kontynuuje publikację serii Konstantina Krawczyka na temat statystyki medycznej. W dwóch poprzednich artykułach autor zajmował się wyjaśnieniem takich pojęć jak i.

Konstanty Krawczik

Matematyk-analityk. Specjalista w zakresie badań statystycznych w medycynie i naukach humanistycznych

Moskwa

Bardzo często w artykułach dotyczących badań klinicznych można spotkać tajemnicze sformułowanie: „przedział ufności” (95 % CI lub 95 % CI - przedział ufności). W artykule można na przykład napisać: „Aby ocenić znaczenie różnic, do obliczenia 95% przedziału ufności zastosowano test t-Studenta”.

Jaka jest wartość „95 % przedziału ufności” i po co go obliczać?

Co to jest przedział ufności? - Jest to zakres, w którym mieszczą się prawdziwe średnie populacyjne. Czy istnieją „nieprawdziwe” średnie? W pewnym sensie tak. W wyjaśniliśmy, że nie da się zmierzyć interesującego nas parametru w całej populacji, dlatego badacze zadowalają się ograniczoną próbą. W tej próbie (np. na podstawie masy ciała) występuje jedna wartość średnia (pewna masa), na podstawie której oceniamy wartość średnią w całej populacji. Jest jednak mało prawdopodobne, aby średnia waga w próbie (zwłaszcza małej) pokrywała się ze średnią wagą w populacji ogólnej. Dlatego bardziej poprawne jest obliczenie i wykorzystanie zakresu średnich wartości populacji.

Załóżmy na przykład, że 95% przedział ufności (95% CI) dla hemoglobiny wynosi 110 do 122 g/l. Oznacza to, że istnieje 95% szans, że prawdziwa średnia wartość hemoglobiny w populacji będzie wynosić od 110 do 122 g/l. Innymi słowy, nie znamy średniej wartości hemoglobiny w populacji, ale możemy z 95% prawdopodobieństwem wskazać przedział wartości tej cechy.

Przedziały ufności są szczególnie istotne w przypadku różnic w średnich między grupami lub, jak się je nazywa, wielkości efektu.

Załóżmy, że porównaliśmy skuteczność dwóch preparatów żelaza: tego, który jest na rynku od dawna i tego, który właśnie został zarejestrowany. Po zakończeniu terapii oceniano stężenie hemoglobiny w badanych grupach pacjentów, a program statystyczny wyliczył, że różnica pomiędzy wartościami średnimi w obu grupach mieściła się z prawdopodobieństwem 95 % w przedziale od 1,72 do 14,36 g/l (tabela 1).

Tabela 1. Przetestuj próbki niezależne
(grupy porównuje się według poziomu hemoglobiny)

Należy to interpretować w następujący sposób: u części pacjentów z populacji ogólnej przyjmujących nowy lek stężenie hemoglobiny będzie wyższe średnio o 1,72–14,36 g/l niż u osób, które przyjmowały już znany lek.

Innymi słowy, w populacji ogólnej różnica średnich wartości hemoglobiny między grupami mieści się w tych granicach z prawdopodobieństwem 95%. Ocena, czy to dużo, czy mało, należy do badacza. Chodzi o to, że nie pracujemy z jedną wartością średnią, ale z zakresem wartości, dlatego wiarygodniej oceniamy różnicę parametru pomiędzy grupami.

W pakietach statystycznych, według uznania badacza, można samodzielnie zawęzić lub rozszerzyć granice przedziału ufności. Obniżając prawdopodobieństwa przedziału ufności zawężamy zakres średnich. Na przykład przy 90 % CI zakres średnich (lub różnica średnich) będzie węższy niż przy 95 %.

I odwrotnie, zwiększenie prawdopodobieństwa do 99 % rozszerza zakres wartości. Podczas porównywania grup dolna granica CI może przekroczyć granicę zera. Przykładowo, jeśli rozszerzymy granice przedziału ufności do 99 %, to granice przedziału wahają się od –1 do 16 g/l. Oznacza to, że w populacji ogólnej istnieją grupy, pomiędzy którymi różnica średnich dla badanej cechy jest równa 0 (M = 0).

Korzystając z przedziału ufności, można testować hipotezy statystyczne. Jeżeli przedział ufności przekracza wartość zerową, wówczas prawdziwa jest hipoteza zerowa, która zakłada, że ​​grupy nie różnią się pod względem badanego parametru. Przykład opisano powyżej, gdzie rozszerzyliśmy granice do 99 %. Gdzieś w populacji ogólnej znaleźliśmy grupy, które nie różniły się niczym.

95% przedział ufności różnicy w stężeniu hemoglobiny (g/l)


Rysunek pokazuje 95% przedział ufności dla różnicy średnich wartości hemoglobiny pomiędzy obiema grupami. Linia przechodzi przez znak zerowy, zatem istnieje różnica pomiędzy średnimi zera, co potwierdza hipotezę zerową, że grupy nie różnią się. Zakres różnic między grupami wynosi od –2 do 5 g/l. Oznacza to, że stężenie hemoglobiny może albo zmniejszyć się o 2 g/l, albo wzrosnąć o 5 g/l.

Przedział ufności jest bardzo ważnym wskaźnikiem. Dzięki niemu widać, czy różnice w grupach rzeczywiście wynikały z różnicy średnich, czy też z dużej próby, gdyż przy dużej próbie szanse na znalezienie różnic są większe niż przy małej.

W praktyce może to wyglądać tak. Pobraliśmy próbkę 1000 osób, zmierzyliśmy poziom hemoglobiny i odkryliśmy, że przedział ufności dla różnicy średnich wahał się od 1,2 do 1,5 g/l. Poziom istotności statystycznej w tym przypadku p

Widzimy, że stężenie hemoglobiny wzrosło, ale prawie niezauważalnie, zatem istotność statystyczna pojawiła się właśnie ze względu na wielkość próby.

Przedziały ufności można obliczyć nie tylko dla średnich, ale także dla proporcji (i współczynników ryzyka). Nas interesuje np. przedział ufności odsetka pacjentów, którzy osiągnęli remisję po przyjęciu opracowanego leku. Załóżmy, że 95 % CI dla proporcji, czyli dla odsetka takich pacjentów, mieści się w przedziale 0,60–0,80. Można zatem powiedzieć, że nasz lek ma działanie lecznicze w 60–80% przypadków.