Konfidensintervall for å estimere gjennomsnittet (spredning er kjent) i MS EXCEL.

Konfidensintervall er grenseverdiene for den statistiske mengden, som, med en gitt konfidenssannsynlighet γ, vil være i dette intervallet med en større utvalgsstørrelse. Angitt som P(θ - ε . I praksis velges konfidenssannsynligheten γ fra verdiene γ = 0,9 , γ = 0,95 , γ = 0,99 tilstrekkelig nær enhet.

Tjenesteoppdrag. Denne tjenesten definerer:

  • konfidensintervall for det generelle gjennomsnittet, konfidensintervall for variansen;
  • konfidensintervall for standardavviket, konfidensintervall for den generelle brøken;
Den resulterende løsningen lagres i en Word-fil (se eksempel). Nedenfor er en videoinstruksjon om hvordan du fyller inn de første dataene.

Eksempel #1. På en kollektiv gård, av en samlet besetning på 1000 sauer, ble 100 sauer utsatt for selektiv kontrollklipping. Som et resultat ble det etablert en gjennomsnittlig ullskjær på 4,2 kg per sau. Bestem med en sannsynlighet på 0,99 standardfeilen til prøven ved å bestemme gjennomsnittlig ullskjæring per sau og grensene for skjærverdien dersom variansen er 2,5. Prøven er ikke-repetitiv.
Eksempel #2. Fra partiet med importerte produkter ved posten til Moskva nordlige tollvesen ble det tatt 20 prøver av produkt "A" i rekkefølgen av tilfeldig ny prøvetaking. Som et resultat av kontrollen ble gjennomsnittlig fuktighetsinnhold av produktet "A" i prøven etablert, som viste seg å være 6% med et standardavvik på 1%.
Bestem med en sannsynlighet på 0,683 grensene for det gjennomsnittlige fuktighetsinnholdet i produktet i hele partiet av importerte produkter.
Eksempel #3. En undersøkelse av 36 studenter viste at gjennomsnittlig antall lærebøker lest av dem per studieår viste seg å være 6. Forutsatt at antall lærebøker lest av en student per semester har en normalfordelingslov med standardavvik lik 6, finn : A) med en reliabilitet på 0,99 intervallestimat for den matematiske forventningen til denne tilfeldige variabelen; B) med hvilken sannsynlighet kan det hevdes at gjennomsnittlig antall lærebøker lest av en student per semester, beregnet for dette utvalget, avviker fra den matematiske forventningen i absolutt verdi med ikke mer enn 2.

Klassifisering av konfidensintervaller

Etter typen parameter som evalueres:

Etter prøvetype:

  1. Konfidensintervall for uendelig sampling;
  2. Konfidensintervall for den endelige prøven;
Sampling kalles re-sampling, hvis det valgte objektet returneres til den generelle befolkningen før du velger det neste. Prøven kalles ikke-repetitiv. hvis det valgte objektet ikke returneres til den generelle befolkningen. I praksis forholder man seg vanligvis til ikke-gjentakende prøver.

Beregning av gjennomsnittlig prøvetakingsfeil for tilfeldig utvalg

Avviket mellom verdiene til indikatorer hentet fra utvalget og de tilsvarende parameterne for den generelle befolkningen kalles representativitetsfeil.
Betegnelser på hovedparametrene for den generelle og utvalgspopulasjonen.
Eksempel på gjennomsnittsfeilformler
gjenvalgikke-repeterende utvalg
for midtenfor delingfor midtenfor deling
Forholdet mellom prøvetakingsfeilgrensen (Δ) garantert med en viss sannsynlighet P(t), og den gjennomsnittlige prøvetakingsfeilen har formen: eller Δ = t μ, hvor t– konfidens koeffisient, bestemt avhengig av sannsynlighetsnivået P(t) i henhold til tabellen for den integrale Laplace-funksjonen.

Formler for å beregne prøvestørrelsen med en riktig tilfeldig utvalgsmetode

Estimering av konfidensintervaller

Læringsmål

Statistikken vurderer følgende to hovedoppgaver:

    Vi har et estimat basert på utvalgsdata, og vi ønsker å lage en probabilistisk uttalelse om hvor den sanne verdien av parameteren som estimeres er.

    Vi har en spesifikk hypotese som må testes basert på prøvedata.

I dette emnet tar vi for oss det første problemet. Vi introduserer også definisjonen av et konfidensintervall.

Et konfidensintervall er et intervall som er bygget rundt den estimerte verdien av en parameter og viser hvor den sanne verdien av den estimerte parameteren ligger med en a priori gitt sannsynlighet.

Etter å ha studert materialet om dette emnet, kan du:

    lære hva som er konfidensintervallet til estimatet;

    lære å klassifisere statistiske problemer;

    beherske teknikken for å konstruere konfidensintervaller, både ved bruk av statistiske formler og ved bruk av programvareverktøy;

    lære å bestemme de nødvendige prøvestørrelsene for å oppnå visse parametere for nøyaktighet av statistiske estimater.

Fordelinger av prøvekarakteristikker

T-fordeling

Som diskutert ovenfor, er fordelingen av den stokastiske variabelen nær en standardisert normalfordeling med parametere 0 og 1. Siden vi ikke vet verdien av σ, erstatter vi den med noen estimat s . Mengden har allerede en annen fordeling, nemlig eller Elevens fordeling, som bestemmes av parameteren n -1 (antall frihetsgrader). Denne fordelingen er nær normalfordelingen (jo større n, jo nærmere distribusjonene).

På fig. 95
Elevens fordeling med 30 frihetsgrader presenteres. Som du kan se, er den veldig nær normalfordelingen.

I likhet med funksjonene for å arbeide med normalfordelingen NORMDIST og NORMINV, finnes det funksjoner for å arbeide med t-fordelingen - STUDIST (TDIST) og STUDRASPBR (TINV). Et eksempel på bruk av disse funksjonene finnes i filen STUDRIST.XLS (mal og løsning) og i fig. 96
.

Fordelinger av andre egenskaper

Som vi allerede vet, for å bestemme nøyaktigheten til forventningsestimatet, trenger vi en t-fordeling. For å estimere andre parametere, for eksempel varians, kreves andre fordelinger. To av dem er F-fordelingen og x 2 -fordeling.

Konfidensintervall for gjennomsnittet

Konfidensintervall er et intervall som er bygget rundt den estimerte verdien av parameteren og viser hvor den sanne verdien av den estimerte parameteren ligger med en a priori gitt sannsynlighet.

Konstruksjonen av et konfidensintervall for middelverdien skjer på følgende måte:

Eksempel

Gatekjøkkenet planlegger å utvide sortimentet med en ny type smørbrød. For å estimere etterspørselen etter det, planlegger lederen å tilfeldig velge 40 besøkende blant de som allerede har prøvd det og be dem vurdere holdningen deres til det nye produktet på en skala fra 1 til 10. Lederen ønsker å anslå forventet antall poeng som det nye produktet vil motta og konstruer et 95 % konfidensintervall for dette estimatet. Hvordan gjøre det? (se fil SANDWICH1.XLS (mal og løsning).

Løsning

For å løse dette problemet kan du bruke . Resultatene er presentert i fig. 97
.

Konfidensintervall for totalverdien

Noen ganger, i henhold til prøvedata, er det nødvendig å estimere ikke den matematiske forventningen, men den totale summen av verdier. For eksempel, i en situasjon med en revisor, kan det være av interesse å estimere ikke gjennomsnittsverdien av en faktura, men summen av alle fakturaer.

La N være det totale antallet elementer, n være prøvestørrelsen, T 3 være summen av verdiene i utvalget, T" være anslaget for summen over hele populasjonen, så , og konfidensintervallet beregnes med formelen , hvor s er estimatet av standardavviket for utvalget, er estimatet av gjennomsnittet for utvalget.

Eksempel

La oss si at et skattekontor ønsker å anslå beløpet for total skatterefusjon for 10 000 skattytere. Skattyter får enten refusjon eller betaler tilleggsskatt. Finn 95 % konfidensintervall for refusjonsbeløpet, forutsatt en prøvestørrelse på 500 personer (se filen REFUSJONSBELØP.XLS (mal og løsning).

Løsning

Det er ingen spesiell prosedyre i StatPro for dette tilfellet, men du kan se at grensene kan hentes fra grensene for gjennomsnittet ved å bruke formlene ovenfor (fig. 98
).

Konfidensintervall for proporsjoner

La p være forventningen til en andel kunder, og pv være et estimat for denne andelen, hentet fra et utvalg av størrelse n. Det kan vises at for tilstrekkelig store estimatfordelingen vil være nær normalen med gjennomsnittlig p og standardavvik . Standardfeilen til estimatet i dette tilfellet er uttrykt som , og konfidensintervallet som .

Eksempel

Gatekjøkkenet planlegger å utvide sortimentet med en ny type smørbrød. For å estimere etterspørselen etter det valgte lederen tilfeldig ut 40 besøkende blant de som allerede hadde prøvd det og ba dem vurdere holdningen deres til det nye produktet på en skala fra 1 til 10. Lederen ønsker å estimere forventet andel av kunder som vurderer det nye produktet minst 6 poeng (han forventer at disse kundene er forbrukerne av det nye produktet).

Løsning

Til å begynne med oppretter vi en ny kolonne på grunnlag av 1 hvis klientens poengsum var mer enn 6 poeng og 0 ellers (se filen SANDWICH2.XLS (mal og løsning).

Metode 1

Ved å telle mengden 1 estimerer vi andelen, og deretter bruker vi formlene.

Verdien av z cr er hentet fra spesielle normalfordelingstabeller (for eksempel 1,96 for et 95 % konfidensintervall).

Ved å bruke denne tilnærmingen og spesifikke data for å konstruere et 95 % intervall, får vi følgende resultater (fig. 99
). Den kritiske verdien av parameteren z cr er 1,96. Standardfeilen for estimatet er 0,077. Den nedre grensen for konfidensintervallet er 0,475. Den øvre grensen for konfidensintervallet er 0,775. Dermed kan en leder anta med 95 % sikkerhet at andelen kunder som vurderer et nytt produkt 6 poeng eller mer vil være mellom 47,5 og 77,5.

Metode 2

Dette problemet kan løses ved å bruke standard StatPro-verktøy. For å gjøre dette er det nok å merke seg at andelen i dette tilfellet sammenfaller med gjennomsnittsverdien til Type-kolonnen. Søk deretter StatPro/Statistical Inference/One-Sample Analysiså bygge et konfidensintervall for middelverdien (forventningsestimat) for Type-kolonnen. Resultatene som oppnås i dette tilfellet vil være svært nær resultatet av den første metoden (fig. 99).

Konfidensintervall for standardavvik

s brukes som et estimat for standardavviket (formelen er gitt i seksjon 1). Tetthetsfunksjonen til estimatet s er kjikvadratfunksjonen, som i likhet med t-fordelingen har n-1 frihetsgrader. Det er spesielle funksjoner for å arbeide med denne distribusjonen CHI2DIST (CHIDIST) og CHI2OBR (CHIINV) .

Konfidensintervallet i dette tilfellet vil ikke lenger være symmetrisk. Det betingede skjemaet for grensene er vist i fig. 100 .

Eksempel

Maskinen skal produsere deler med en diameter på 10 cm, men på grunn av ulike forhold oppstår det feil. Kvalitetskontrolløren er bekymret for to ting: For det første bør gjennomsnittsverdien være 10 cm; for det andre, selv i dette tilfellet, hvis avvikene er store, vil mange detaljer bli avvist. Hver dag lager han en prøve på 50 deler (se fil KVALITETSKONTROLL.XLS (mal og løsning) Hvilke konklusjoner kan en slik prøve gi?

Løsning

Vi konstruerer 95 % konfidensintervaller for gjennomsnittet og for standardavviket ved hjelp av StatPro/Statistical Inference/ One-Sample Analysis(Fig. 101
).

Videre, ved å bruke antakelsen om en normal fordeling av diametre, beregner vi andelen av defekte produkter, og setter et maksimalt avvik på 0,065. Ved å bruke funksjonene til oppslagstabellen (tilfellet av to parametere), konstruerer vi avhengigheten av prosentandelen avslag på gjennomsnittsverdien og standardavviket (fig. 102
).

Konfidensintervall for forskjellen på to gjennomsnitt

Dette er en av de viktigste anvendelsene av statistiske metoder. Situasjonseksempler.

    En klesbutikksjef vil gjerne vite hvor mye mer eller mindre den gjennomsnittlige kvinnelige kjøperen bruker i butikken enn en mann.

    De to flyselskapene flyr lignende ruter. En forbrukerorganisasjon vil gjerne sammenligne forskjellen mellom gjennomsnittlig forventet flyforsinkelse for begge flyselskapene.

    Selskapet sender ut kuponger for visse typer varer i en by og sender ikke ut i en annen. Ledere ønsker å sammenligne gjennomsnittlig kjøp av disse varene i løpet av de neste to månedene.

    En bilforhandler handler ofte med ektepar på presentasjoner. For å forstå deres personlige reaksjoner på presentasjonen, blir par ofte intervjuet hver for seg. Lederen ønsker å evaluere forskjellen i vurderinger gitt av menn og kvinner.

Tilfelle av uavhengige prøver

Middelforskjellen vil ha en t-fordeling med n 1 + n 2 - 2 frihetsgrader. Konfidensintervallet for μ 1 - μ 2 er uttrykt ved forholdet:

Dette problemet kan løses ikke bare med formlene ovenfor, men også med standard StatPro-verktøy. For å gjøre dette er det nok å søke

Konfidensintervall for forskjell mellom proporsjoner

La være den matematiske forventningen til aksjene. La være deres prøveanslag bygget på prøver av henholdsvis størrelse n 1 og n 2. Så er et estimat for forskjellen. Derfor er konfidensintervallet for denne forskjellen uttrykt som:

Her er z cr verdien oppnådd fra normalfordelingen av spesielle tabeller (for eksempel 1,96 for 95 % konfidensintervall).

Standardfeilen til estimatet uttrykkes i dette tilfellet av forholdet:

.

Eksempel

Butikken, som forberedelse til det store salget, gjennomførte følgende markedsundersøkelser. De 300 beste kjøperne ble valgt ut og tilfeldig delt inn i to grupper på 150 medlemmer hver. Alle de utvalgte kjøperne fikk tilsendt invitasjoner til å delta i salget, men kun for medlemmer av den første gruppen ble det vedlagt en kupong som gir rett til 5 % rabatt. Under salget ble kjøpene til alle 300 utvalgte kjøpere registrert. Hvordan kan en leder tolke resultatene og gjøre en vurdering om effektiviteten av kuponger? (Se CUPONS.XLS-fil (mal og løsning)).

Løsning

For vårt spesielle tilfelle, av 150 kunder som mottok en rabattkupong, foretok 55 et kjøp på salg, og blant 150 som ikke mottok en kupong, var det bare 35 som foretok et kjøp (fig. 103
). Da er verdiene til prøveproporsjonene henholdsvis 0,3667 og 0,2333. Og prøveforskjellen mellom dem er lik henholdsvis 0,1333. Forutsatt et konfidensintervall på 95 % finner vi fra normalfordelingstabellen z cr = 1,96. Beregningen av standardfeilen til utvalgsforskjellen er 0,0524. Til slutt får vi at den nedre grensen for 95 % konfidensintervallet er henholdsvis 0,0307, ​​og den øvre grensen er 0,2359. Resultatene som oppnås kan tolkes slik at for hver 100 kunder som mottok en rabattkupong, kan vi forvente fra 3 til 23 nye kunder. Det bør imidlertid huskes at denne konklusjonen i seg selv ikke betyr effektiviteten ved å bruke kuponger (fordi ved å gi en rabatt, taper vi i fortjeneste!). La oss demonstrere dette på spesifikke data. Anta at gjennomsnittlig kjøpsbeløp er 400 rubler, hvorav 50 rubler. det er butikkoverskudd. Da er forventet fortjeneste per 100 kunder som ikke mottok en kupong lik:

50 0,2333 100 \u003d 1166,50 rubler.

Lignende beregninger for 100 kjøpere som mottok en kupong gir:

30 0,3667 100 \u003d 1100,10 rubler.

Nedgangen i gjennomsnittlig fortjeneste til 30 forklares av det faktum at ved å bruke rabatten vil kjøpere som mottok en kupong i gjennomsnitt kjøpe for 380 rubler.

Dermed indikerer den endelige konklusjonen ineffektiviteten ved å bruke slike kuponger i denne spesielle situasjonen.

Kommentar. Dette problemet kan løses ved å bruke standard StatPro-verktøy. For å gjøre dette er det tilstrekkelig å redusere dette problemet til problemet med å estimere forskjellen mellom to gjennomsnitt ved metoden, og deretter bruke StatPro/Statistical Inference/To-Sample Analysiså bygge et konfidensintervall for forskjellen mellom to gjennomsnittsverdier.

Konfidensintervallkontroll

Lengden på konfidensintervallet avhenger av følgende forhold:

    direkte data (standardavvik);

    Signifikansnivå;

    prøvestørrelse.

Prøvestørrelse for å estimere gjennomsnittet

La oss først vurdere problemet i den generelle saken. La oss betegne verdien av halve lengden av konfidensintervallet gitt til oss som B (fig. 104
). Vi vet at konfidensintervallet for middelverdien til en tilfeldig variabel X er uttrykt som , hvor . Forutsatt:

og uttrykker n , får vi .

Dessverre vet vi ikke den eksakte verdien av variansen til den tilfeldige variabelen X. I tillegg vet vi ikke verdien av t cr da den avhenger av n gjennom antall frihetsgrader. I denne situasjonen kan vi gjøre følgende. I stedet for variansen bruker vi et estimat av variansen for noen tilgjengelige realiseringer av den tilfeldige variabelen som studeres. I stedet for t cr-verdien bruker vi z cr-verdien for normalfordelingen. Dette er ganske akseptabelt, siden tetthetsfunksjonene for normal- og t-fordelingen er veldig nære (bortsett fra tilfellet med liten n ). Dermed har den ønskede formelen formen:

.

Siden formelen generelt gir ikke-heltallsresultater, tas avrunding med et overskudd av resultatet som ønsket prøvestørrelse.

Eksempel

Gatekjøkkenet planlegger å utvide sortimentet med en ny type smørbrød. For å estimere etterspørselen etter det, planlegger lederen tilfeldig å velge ut et antall besøkende blant de som allerede har prøvd det, og be dem vurdere sin holdning til det nye produktet på en skala fra 1 til 10. Lederen ønsker for å estimere det forventede antall poeng som det nye produktet vil motta produkt og plott konfidensintervallet på 95 % for det estimatet. Han ønsker imidlertid at halve bredden av konfidensintervallet ikke skal overstige 0,3. Hvor mange besøkende trenger han for å stemme?

følgende:

Her r ots er et estimat av brøken p, og B er en gitt halvpart av lengden på konfidensintervallet. En oppblåst verdi for n kan oppnås ved å bruke verdien r ots= 0,5. I dette tilfellet vil lengden på konfidensintervallet ikke overstige den gitte verdien B for noen sann verdi av p.

Eksempel

La lederen fra forrige eksempel planlegge å anslå andelen kunder som foretrekker en ny type produkt. Han ønsker å konstruere et 90 % konfidensintervall hvis halve lengde er mindre enn eller lik 0,05. Hvor mange kunder bør prøves tilfeldig?

Løsning

I vårt tilfelle er verdien av z cr = 1,645. Derfor beregnes nødvendig mengde som .

Hvis lederen hadde grunn til å tro at den ønskede verdien av p for eksempel er omtrent 0,3, ville vi ved å erstatte denne verdien i formelen ovenfor få en mindre verdi av det tilfeldige utvalget, nemlig 228.

Formel å bestemme tilfeldige utvalgsstørrelser ved forskjell mellom to gjennomsnitt skrevet som:

.

Eksempel

Noen dataselskaper har et kundeservicesenter. Den siste tiden har antallet kundeklager på dårlig kvalitet på tjenesten økt. Servicesenteret sysselsetter i hovedsak to typer ansatte: de med liten erfaring, men som har gjennomført spesialopplæringskurs, og de med lang praktisk erfaring, men som ikke har gjennomført spesialkurs. Selskapet ønsker å analysere kundeklager de siste seks månedene og sammenligne deres gjennomsnittlige antall per hver av de to gruppene av ansatte. Det antas at tallene i prøvene for begge gruppene vil være like. Hvor mange ansatte må inkluderes i utvalget for å få 95 % intervall med en halv lengde på ikke mer enn 2?

Løsning

Her er σ ots et estimat av standardavviket til begge tilfeldige variabler under forutsetning av at de er nærliggende. Derfor, i vår oppgave, må vi på en eller annen måte oppnå dette anslaget. Dette kan for eksempel gjøres på følgende måte. Når en ser på kundeklagedata de siste seks månedene, kan en leder legge merke til at det vanligvis er mellom 6 og 36 klager per ansatt. Når han vet at for en normalfordeling er praktisk talt alle verdier ikke mer enn tre standardavvik fra gjennomsnittet, kan han med rimelighet tro at:

, hvorav σ ots = 5.

Ved å erstatte denne verdien i formelen får vi .

Formel å bestemme størrelsen på et tilfeldig utvalg ved estimering av forskjellen mellom aksjene ser ut som:

Eksempel

Noen selskaper har to fabrikker for produksjon av lignende produkter. Lederen av et selskap ønsker å sammenligne defektratene til begge fabrikkene. Ifølge tilgjengelig informasjon er avvisningsraten ved begge fabrikkene fra 3 til 5 %. Det er ment å bygge et 99 % konfidensintervall med en halv lengde på ikke mer enn 0,005 (eller 0,5 %). Hvor mange produkter bør velges fra hver fabrikk?

Løsning

Her er p 1ot og p 2ot estimater av to ukjente fraksjoner av avslag ved 1. og 2. fabrikk. Hvis vi setter p 1ots \u003d p 2ots \u003d 0,5, vil vi få en overvurdert verdi for n. Men siden vi i vårt tilfelle har noe a priori-informasjon om disse aksjene, tar vi det øvre anslaget på disse aksjene, nemlig 0,05. Vi får

Når du estimerer noen populasjonsparametere fra prøvedata, er det nyttig å gi ikke bare et punktestimat av parameteren, men også et konfidensintervall som viser hvor den nøyaktige verdien av parameteren som estimeres kan ligge.

I dette kapittelet ble vi også kjent med kvantitative sammenhenger som gjør at vi kan bygge slike intervaller for ulike parametere; lærte måter å kontrollere lengden på konfidensintervallet på.

Vi legger også merke til at problemet med å estimere prøvestørrelsen (eksperimentplanleggingsproblem) kan løses ved bruk av standard StatPro-verktøy, nemlig StatPro/Statistical Inference/Sample Size Selection.

Konfidensintervallet kom til oss fra statistikkfeltet. Dette er et definert område som tjener til å estimere en ukjent parameter med høy grad av pålitelighet. Den enkleste måten å forklare dette på er med et eksempel.

Anta at du må undersøke en tilfeldig variabel, for eksempel hastigheten på serverens svar på en klientforespørsel. Hver gang en bruker skriver inn adressen til et bestemt nettsted, svarer serveren med en annen hastighet. Dermed har den undersøkte responstiden en tilfeldig karakter. Så, konfidensintervallet lar deg bestemme grensene for denne parameteren, og da vil det være mulig å hevde at med en sannsynlighet på 95% vil serveren være i området vi beregnet.

Eller du må finne ut hvor mange som vet om merkevaren til selskapet. Når konfidensintervallet beregnes, vil man for eksempel kunne si at med 95 % sannsynlighet ligger andelen forbrukere som vet om dette i området fra 27 % til 34 %.

Nært knyttet til dette begrepet er en slik verdi som konfidensnivået. Den representerer sannsynligheten for at den ønskede parameteren er inkludert i konfidensintervallet. Denne verdien bestemmer hvor stort vårt ønskede utvalg vil være. Jo større verdien den tar, jo smalere blir konfidensintervallet, og omvendt. Vanligvis er den satt til 90 %, 95 % eller 99 %. Verdien på 95% er den mest populære.

Denne indikatoren er også påvirket av variansen til observasjoner og dens definisjon er basert på antakelsen om at funksjonen som studeres adlyder. Denne uttalelsen er også kjent som Gauss' lov. Ifølge ham kalles en slik fordeling av alle sannsynligheter for en kontinuerlig tilfeldig variabel, som kan beskrives med en sannsynlighetstetthet, normal. Hvis antakelsen om en normalfordeling viste seg å være feil, kan anslaget vise seg å være feil.

La oss først finne ut hvordan vi beregner konfidensintervallet for Her er to tilfeller mulige. Spredning (graden av spredning av en tilfeldig variabel) kan være kjent eller ikke. Hvis det er kjent, beregnes vårt konfidensintervall ved å bruke følgende formel:

xsr - t*σ / (sqrt(n))<= α <= хср + t*σ / (sqrt(n)), где

α - tegn,

t er en parameter fra Laplace-fordelingstabellen,

σ er kvadratroten av dispersjonen.

Hvis variansen er ukjent, kan den beregnes hvis vi kjenner alle verdiene til den ønskede funksjonen. For dette brukes følgende formel:

σ2 = х2ср - (хр)2, hvor

х2ср - gjennomsnittsverdien av kvadratene til egenskapen som studeres,

(xsr)2 er kvadratet til denne funksjonen.

Formelen som konfidensintervallet beregnes med i dette tilfellet endres litt:

xsr - t*s / (sqrt(n))<= α <= хср + t*s / (sqrt(n)), где

xsr - eksempelgjennomsnitt,

α - tegn,

t er en parameter som er funnet ved hjelp av studentens distribusjonstabell t \u003d t (ɣ; n-1),

sqrt(n) er kvadratroten av den totale prøvestørrelsen,

s er kvadratroten av variansen.

Tenk på dette eksemplet. Anta at, basert på resultatene av 7 målinger, ble egenskapen som ble undersøkt bestemt til å være 30 og prøvevariansen lik 36. Det er nødvendig å finne, med en sannsynlighet på 99 %, et konfidensintervall som inneholder den sanne verdien av den målte parameteren.

Først, la oss bestemme hva t er lik: t \u003d t (0,99; 7-1) \u003d 3,71. Ved å bruke formelen ovenfor får vi:

xsr - t*s / (sqrt(n))<= α <= хср + t*s / (sqrt(n))

30 - 3,71*36 / (sqrt(7))<= α <= 30 + 3.71*36 / (sqrt(7))

21.587 <= α <= 38.413

Konfidensintervallet for variansen beregnes både i tilfelle av et kjent gjennomsnitt og når det ikke er data om den matematiske forventningen, og bare verdien av det objektive punktestimatet av variansen er kjent. Vi vil ikke gi her formlene for beregningen, siden de er ganske komplekse, og om ønskelig kan de alltid finnes på nettet.

Vi bemerker bare at det er praktisk å bestemme konfidensintervallet ved å bruke Excel-programmet eller en nettverkstjeneste, som kalles det.

Konfidensintervaller.

Beregningen av konfidensintervallet er basert på gjennomsnittsfeilen til den tilsvarende parameteren. Konfidensintervall viser innenfor hvilke grenser med sannsynlighet (1-a) er den sanne verdien av den estimerte parameteren. Her er a signifikansnivået, (1-a) kalles også konfidensnivået.

I det første kapittelet viste vi at for eksempel for det aritmetiske gjennomsnittet, ligger det sanne populasjonsmiddelet innenfor 2 gjennomsnittsfeil av gjennomsnittet omtrent 95 % av tiden. Dermed vil grensene for 95 % konfidensintervallet for gjennomsnittet være fra prøvegjennomsnittet med to ganger gjennomsnittsfeilen til gjennomsnittet, dvs. vi multipliserer middelfeilen til gjennomsnittet med en faktor som avhenger av konfidensnivået. For gjennomsnittet og differansen av gjennomsnittene tas studentens koeffisient (den kritiske verdien av studentens kriterium), for andelen og differansen til andelene, den kritiske verdien av z-kriteriet. Produktet av koeffisienten og gjennomsnittsfeilen kan kalles marginalfeilen til denne parameteren, dvs. det maksimale vi kan oppnå når vi evaluerer det.

Konfidensintervall for aritmetisk gjennomsnitt : .

Her er prøvegjennomsnittet;

Gjennomsnittlig feil av det aritmetiske gjennomsnittet;

s- prøve standardavvik;

n

f = n-1 (Elevens koeffisient).

Konfidensintervall for forskjell i aritmetiske middelverdier :

Her er forskjellen mellom prøvemidlene;

- den gjennomsnittlige feilen for forskjellen mellom aritmetiske midler;

s 1 , s 2 - prøve standardavvik;

n1,n2

Kritisk verdi av Studentens kriterium for et gitt betydningsnivå a og antall frihetsgrader f=n1 +n2-2 (Elevens koeffisient).

Konfidensintervall for aksjer :

.

Her er d prøveandelen;

– gjennomsnittlig aksjefeil;

n– prøvestørrelse (gruppestørrelse);

Konfidensintervall for dele forskjeller :

Her er forskjellen mellom prøveandelene;

er gjennomsnittsfeilen for forskjellen mellom de aritmetiske middelverdiene;

n1,n2– utvalgsstørrelser (antall grupper);

Den kritiske verdien av kriteriet z ved et gitt signifikansnivå a ( , , ).

Ved å beregne konfidensintervallene for forskjellen i indikatorer, ser vi for det første direkte de mulige verdiene av effekten, og ikke bare punktestimatet. For det andre kan vi trekke en konklusjon om aksept eller tilbakevisning av nullhypotesen, og for det tredje kan vi trekke en konklusjon om kraften til kriteriet.

Når du tester hypoteser ved bruk av konfidensintervaller, bør følgende regel følges:

Hvis 100(1-a)-prosent konfidensintervallet til den gjennomsnittlige forskjellen ikke inneholder null, så er forskjellene statistisk signifikante på a signifikansnivået; tvert imot, hvis dette intervallet inneholder null, er ikke forskjellene statistisk signifikante.

Faktisk, hvis dette intervallet inneholder null, betyr det at den sammenlignede indikatoren kan være enten mer eller mindre i en av gruppene sammenlignet med den andre, dvs. de observerte forskjellene er tilfeldige.

Etter stedet der null er plassert innenfor konfidensintervallet, kan man bedømme kraften til kriteriet. Hvis null er nær nedre eller øvre grense for intervallet, så kanskje med et større antall sammenlignede grupper, vil forskjellene nå statistisk signifikans. Hvis null er nær midten av intervallet, betyr det at både økningen og reduksjonen av indikatoren i den eksperimentelle gruppen er like sannsynlig, og sannsynligvis er det egentlig ingen forskjeller.

Eksempler:

For å sammenligne operasjonell dødelighet ved bruk av to forskjellige typer anestesi: 61 personer ble operert med den første typen anestesi, 8 døde, ved bruk av den andre - 67 personer, 10 døde.

d 1 \u003d 8/61 \u003d 0,131; d 2 \u003d 10/67 \u003d 0,149; d1-d2 = - 0,018.

Forskjellen i dødelighet for de sammenlignede metodene vil være i området (-0,018 - 0,122; -0,018 + 0,122) eller (-0,14; 0,104) med en sannsynlighet på 100(1-a) = 95%. Intervallet inneholder null, dvs. hypotesen om samme dødelighet med to forskjellige typer anestesi kan ikke avvises.

Dermed kan og vil dødeligheten gå ned til 14 % og øke til 10,4 % med en sannsynlighet på 95 %, d.v.s. null er omtrent midt i intervallet, så det kan hevdes at disse to metodene mest sannsynlig ikke er forskjellige i dødelighet.

I eksemplet som ble vurdert tidligere, ble gjennomsnittlig tappetid sammenlignet i fire grupper av studenter som hadde ulik eksamenspoeng. La oss beregne konfidensintervallene for gjennomsnittlig pressetid for studenter som besto eksamen for 2 og 5 og konfidensintervallet for forskjellen mellom disse gjennomsnittene.

Elevens koeffisienter er funnet fra tabellene over Students fordeling (se vedlegg): for den første gruppen: = t(0,05;48) = 2,011; for den andre gruppen: = t(0,05;61) = 2,000. Dermed konfidensintervaller for den første gruppen: = (162.19-2.011 * 2.18; 162.19 + 2.011 * 2.18) = (157.8; 166.6) , for den andre gruppen (156.55- 2.000* 1.58.0) = 1.580. ; 160,3). Så, for de som besto eksamen for 2, varierer den gjennomsnittlige pressetiden fra 157,8 ms til 166,6 ms med en sannsynlighet på 95%, for de som besto eksamenen for 5 - fra 152,8 ms til 160,3 ms med en sannsynlighet på 95% .

Du kan også teste nullhypotesen ved å bruke konfidensintervaller for middelene, og ikke bare for forskjellen i middelverdiene. For eksempel, som i vårt tilfelle, hvis konfidensintervallene for midlene overlapper, kan nullhypotesen ikke forkastes. For å forkaste en hypotese på et valgt signifikansnivå, må ikke de tilsvarende konfidensintervallene overlappe hverandre.

La oss finne konfidensintervallet for forskjellen i gjennomsnittlig pressetid i gruppene som besto eksamen for 2 og 5. Forskjellen i gjennomsnittene: 162,19 - 156,55 = 5,64. Elevens koeffisient: \u003d t (0,05; 49 + 62-2) \u003d t (0,05; 109) \u003d 1,982. Gruppestandardavvik vil være lik: ; . Vi beregner gjennomsnittsfeilen for differansen mellom middelene: . Konfidensintervall: \u003d (5,64-1,982 * 2,87; 5,64 + 1,982 * 2,87) \u003d (-0,044; 11,33).

Så forskjellen i gjennomsnittlig pressetid i gruppene som besto eksamen klokken 2 og 5 vil være i området fra -0,044 ms til 11,33 ms. Dette intervallet inkluderer null, dvs. den gjennomsnittlige pressetiden for de som besto eksamen med utmerket resultat kan både øke og avta sammenlignet med de som besto eksamen utilfredsstillende, d.v.s. nullhypotesen kan ikke forkastes. Men null er veldig nær den nedre grensen, presstiden er mye mer sannsynlig å redusere for utmerkede passere. Dermed kan vi konkludere med at det fortsatt er forskjeller i gjennomsnittlig klikktid mellom de som passerte med 2 og med 5, vi kunne bare ikke oppdage dem for en gitt endring i gjennomsnittlig tid, spredning av gjennomsnittlig tid og utvalgsstørrelser.



Testens kraft er sannsynligheten for å forkaste en feil nullhypotese, dvs. finne forskjeller der de egentlig er.

Kraften til testen bestemmes basert på signifikansnivået, størrelsen på forskjellene mellom grupper, spredningen av verdier i grupper og utvalgsstørrelsen.

For Students t-test og variansanalyse kan du bruke sensitivitetsdiagrammer.

Kraften til kriteriet kan brukes i den foreløpige bestemmelsen av det nødvendige antallet grupper.

Konfidensintervallet viser innenfor hvilke grenser den sanne verdien av den estimerte parameteren ligger med en gitt sannsynlighet.

Ved hjelp av konfidensintervaller kan du teste statistiske hypoteser og trekke konklusjoner om sensitiviteten til kriteriene.

LITTERATUR.

Glantz S. - Kapittel 6.7.

Rebrova O.Yu. - s.112-114, s.171-173, s.234-238.

Sidorenko E. V. - s. 32-33.

Spørsmål til egenundersøkelse av studenter.

1. Hva er kraften i kriteriet?

2. I hvilke tilfeller er det nødvendig å vurdere kriterienes makt?

3. Metoder for å beregne effekt.

6. Hvordan teste en statistisk hypotese ved hjelp av et konfidensintervall?

7. Hva kan sies om kraften til kriteriet ved beregning av konfidensintervallet?

Oppgaver.

«Katren-Style» fortsetter utgivelsen av Konstantin Kravchiks serie om medisinsk statistikk. I to tidligere artikler har forfatteren vært inne på forklaringen av slike begreper som og.

Konstantin Kravchik

Matematiker-analytiker. Spesialist innen statistisk forskning innen medisin og humaniora

Moskva by

Svært ofte i artikler om kliniske studier kan du finne en mystisk setning: "konfidensintervall" (95 % CI eller 95 % CI – konfidensintervall). For eksempel kan en artikkel si: "Studentens t-test ble brukt til å evaluere betydningen av forskjeller, med et 95 % konfidensintervall beregnet."

Hva er verdien av "95 % konfidensintervall" og hvorfor beregne det?

Hva er et konfidensintervall? – Dette er området der de sanne middelverdiene i befolkningen faller. Og hva, det er "usanne" gjennomsnitt? På en måte, ja, det gjør de. I forklarte vi at det er umulig å måle parameteren av interesse i hele populasjonen, så forskerne nøyer seg med et begrenset utvalg. I dette utvalget (for eksempel etter kroppsvekt) er det én gjennomsnittsverdi (en viss vekt), som vi bedømmer gjennomsnittsverdien etter i hele befolkningen generelt. Det er imidlertid lite sannsynlig at gjennomsnittsvekten i utvalget (spesielt en liten en) vil falle sammen med gjennomsnittsvekten i befolkningen generelt. Derfor er det mer riktig å beregne og bruke rekkevidden av gjennomsnittsverdier for den generelle befolkningen.

Anta for eksempel at 95 % konfidensintervall (95 % KI) for hemoglobin er mellom 110 og 122 g/L. Dette betyr at med 95 % sannsynlighet vil den sanne gjennomsnittsverdien for hemoglobin i den generelle befolkningen være i området fra 110 til 122 g/l. Med andre ord, vi kjenner ikke gjennomsnittlig hemoglobin i den generelle befolkningen, men vi kan indikere verdiområdet for denne funksjonen med 95% sannsynlighet.

Konfidensintervaller er spesielt relevante for forskjellen i middel mellom grupper, eller det som kalles effektstørrelsen.

Anta at vi sammenlignet effektiviteten til to jernpreparater: en som har vært på markedet lenge og en som nettopp er registrert. Etter behandlingsforløpet ble konsentrasjonen av hemoglobin i de studerte pasientgruppene vurdert, og det statistiske programmet beregnet for oss at forskjellen mellom gjennomsnittsverdiene til de to gruppene med en sannsynlighet på 95 % er i området fra 1,72 til 14,36 g/l (tabell 1).

Tab. 1. Kriterium for uavhengige utvalg
(gruppene sammenlignes etter hemoglobinnivå)

Dette skal tolkes slik: Hos en del av pasientene i den generelle befolkningen som tar et nytt legemiddel, vil hemoglobinet i gjennomsnitt være høyere med 1,72–14,36 g/l enn hos de som tok et allerede kjent legemiddel.

Med andre ord, i den generelle befolkningen er forskjellen i gjennomsnittsverdiene for hemoglobin i grupper med 95 % sannsynlighet innenfor disse grensene. Det vil være opp til forskeren å vurdere om dette er mye eller lite. Poenget med alt dette er at vi ikke jobber med én gjennomsnittsverdi, men med en rekke verdier, derfor estimerer vi mer pålitelig forskjellen i en parameter mellom grupper.

I statistiske pakker, etter forskerens skjønn, kan man uavhengig begrense eller utvide grensene for konfidensintervallet. Ved å senke sannsynlighetene for konfidensintervallet, begrenser vi middelområdet. For eksempel, ved 90 % KI, vil området for gjennomsnitt (eller gjennomsnittlige forskjeller) være smalere enn ved 95 % KI.

Omvendt, øker sannsynligheten til 99 % utvider verdiområdet. Ved sammenligning av grupper kan den nedre grensen for CI krysse nullmerket. For eksempel, hvis vi utvidet grensene for konfidensintervallet til 99 %, varierte grensene for intervallet fra –1 til 16 g/L. Dette betyr at i den generelle befolkningen er det grupper, hvor forskjellen mellom gjennomsnittene for den studerte egenskapen er 0 (M=0).

Konfidensintervaller kan brukes til å teste statistiske hypoteser. Hvis konfidensintervallet krysser null, er nullhypotesen, som antar at gruppene ikke er forskjellige i den studerte parameteren, sann. Et eksempel er beskrevet ovenfor, da vi utvidet grensene til 99 %. Et sted i den generelle befolkningen fant vi grupper som ikke var forskjellige på noen måte.

95 % konfidensintervall for forskjell i hemoglobin, (g/l)


Figuren viser 95 % konfidensintervall for gjennomsnittlig hemoglobinforskjell mellom de to gruppene som en linje. Linjen passerer nullmerket, derfor er det en forskjell mellom middelene lik null, noe som bekrefter nullhypotesen om at gruppene ikke er forskjellige. Forskjellen mellom gruppene varierer fra -2 til 5 g/l, noe som betyr at hemoglobin enten kan synke med 2 g/l eller øke med 5 g/l.

Konfidensintervallet er en svært viktig indikator. Takket være den kan du se om forskjellene i gruppene virkelig skyldtes forskjellen i gjennomsnitt eller på grunn av et stort utvalg, for med et stort utvalg er sjansene for å finne forskjeller større enn med et lite.

I praksis kan det se slik ut. Vi tok en prøve på 1000 personer, målte hemoglobinnivået og fant ut at konfidensintervallet for forskjellen i gjennomsnittet ligger fra 1,2 til 1,5 g/L. Nivået av statistisk signifikans i dette tilfellet s

Vi ser at hemoglobinkonsentrasjonen økte, men nesten umerkelig, derfor dukket den statistiske signifikansen opp nettopp på grunn av prøvestørrelsen.

Konfidensintervaller kan beregnes ikke bare for gjennomsnitt, men også for proporsjoner (og risikoforhold). For eksempel er vi interessert i konfidensintervallet for andelen pasienter som oppnådde remisjon mens de tok det utviklede stoffet. Anta at 95 % KI for proporsjoner, dvs. for andelen slike pasienter, er i området 0,60–0,80. Dermed kan vi si at medisinen vår har en terapeutisk effekt i 60 til 80 % av tilfellene.