Konfidensinterval for matematisk forventning. Prøver og konfidensintervaller

Konfidensinterval for matematisk forventning - dette er sådan et interval beregnet ud fra dataene, som med en kendt sandsynlighed indeholder den generelle befolknings matematiske forventning. Det naturlige skøn for den matematiske forventning er det aritmetiske middelværdi af dens observerede værdier. Derfor vil vi længere i lektionen bruge udtrykkene "gennemsnit", "gennemsnitsværdi". I problemer med at beregne konfidensintervallet er svaret oftest påkrævet "Konfidensintervallet for det gennemsnitlige antal [værdi i en specifik opgave] er fra [lavere værdi] til [højere værdi]". Ved hjælp af konfidensintervallet er det muligt at evaluere ikke kun gennemsnitsværdierne, men også andelen af ​​et eller andet træk i den generelle befolkning. Middelværdier, varians, standardafvigelse og fejl, hvorigennem vi kommer til nye definitioner og formler, analyseres i lektionen Prøve- og befolkningskarakteristika .

Punkt- og intervalestimat af middelværdien

Hvis middelværdien af ​​den generelle befolkning estimeres med et tal (point), så tages en specifik middelværdi beregnet ud fra en stikprøve af observationer som et estimat af det ukendte gennemsnit af den generelle befolkning. I dette tilfælde falder værdien af ​​stikprøvegennemsnittet - en tilfældig variabel - ikke sammen med middelværdien for den generelle befolkning. Når prøvens middelværdi angives, er det derfor også nødvendigt at angive prøvens fejl på samme tid. Standardfejlen bruges som et mål for stikprøvefejl, som udtrykkes i de samme enheder som middelværdien. Derfor bruges følgende notation ofte: .

Hvis estimatet af middelværdien skal være forbundet med en vis sandsynlighed, skal parameteren for den generelle population af interesse estimeres ikke med et enkelt tal, men med et interval. Et konfidensinterval er et interval, hvori, med en vis sandsynlighed, P værdien af ​​den estimerede indikator for den generelle befolkning findes. Konfidensinterval i hvilket med sandsynlighed P = 1 - α er en tilfældig variabel, beregnes som følger:

,

α = 1 - P, som kan findes i bilaget til næsten enhver bog om statistik.

I praksis kendes populationens middelværdi og varians ikke, så populationsvariansen erstattes af stikprøvevariansen, og populationsmiddelværdien med stikprøvegennemsnittet. Således beregnes konfidensintervallet i de fleste tilfælde som følger:

.

Konfidensintervalformlen kan bruges til at estimere populationsmiddelværdien if

  • standardafvigelsen for den generelle befolkning er kendt;
  • eller standardafvigelsen for populationen er ikke kendt, men stikprøvestørrelsen er større end 30.

Stikprøvegennemsnittet er et upartisk estimat af populationsgennemsnittet. Til gengæld prøvevariansen er ikke et upartisk estimat af populationsvariansen. For at opnå et upartisk estimat af populationsvariansen i stikprøvevariansformlen er stikprøvestørrelsen n skal udskiftes med n-1.

Eksempel 1 Der indsamles oplysninger fra 100 tilfældigt udvalgte cafeer i en bestemt by, at det gennemsnitlige antal ansatte i dem er 10,5 med en standardafvigelse på 4,6. Bestem konfidensintervallet på 95 % af antallet af cafeansatte.

hvor er den kritiske værdi af standardnormalfordelingen for signifikansniveauet α = 0,05 .

Således var 95 % konfidensintervallet for det gennemsnitlige antal cafeansatte mellem 9,6 og 11,4.

Eksempel 2 For en tilfældig stikprøve fra en generel population på 64 observationer blev følgende samlede værdier beregnet:

summen af ​​værdier i observationer,

summen af ​​kvadrerede afvigelser af værdier fra middelværdien .

Beregn 95 % konfidensintervallet for den forventede værdi.

beregn standardafvigelsen:

,

beregn gennemsnitsværdien:

.

Erstat værdierne i udtrykket med konfidensintervallet:

hvor er den kritiske værdi af standardnormalfordelingen for signifikansniveauet α = 0,05 .

Vi får:

Således varierede 95 % konfidensintervallet for den matematiske forventning af denne prøve fra 7.484 til 11.266.

Eksempel 3 For en tilfældig stikprøve fra en generel population på 100 observationer blev en middelværdi på 15,2 og en standardafvigelse på 3,2 beregnet. Beregn 95 % konfidensintervallet for den forventede værdi, derefter 99 % konfidensintervallet. Hvis prøvestyrken og dens variation forbliver den samme, men konfidensfaktoren stiger, vil konfidensintervallet indsnævres eller udvides?

Vi erstatter disse værdier i udtrykket for konfidensintervallet:

hvor er den kritiske værdi af standardnormalfordelingen for signifikansniveauet α = 0,05 .

Vi får:

.

Således var 95 % konfidensintervallet for gennemsnittet af denne prøve fra 14,57 til 15,82.

Igen erstatter vi disse værdier i udtrykket for konfidensintervallet:

hvor er den kritiske værdi af standardnormalfordelingen for signifikansniveauet α = 0,01 .

Vi får:

.

Således var 99 % konfidensintervallet for gennemsnittet af denne prøve fra 14,37 til 16,02.

Som du kan se, stiger den kritiske værdi af standardnormalfordelingen også, når konfidensfaktoren stiger, og derfor er start- og slutpunkterne for intervallet placeret længere fra middelværdien og dermed konfidensintervallet for den matematiske forventning. stiger.

Punkt- og intervalestimat af den specifikke vægtfylde

Andelen af ​​nogle træk i stikprøven kan fortolkes som et punktestimat af andelen s samme egenskab i den almindelige befolkning. Hvis denne værdi skal forbindes med en sandsynlighed, skal konfidensintervallet for den specifikke vægt beregnes s træk i den almindelige befolkning med en sandsynlighed P = 1 - α :

.

Eksempel 4 Der er to kandidater i en bestemt by EN og B stiller op til borgmesterposten. 200 indbyggere i byen blev tilfældigt adspurgt, hvoraf 46 % svarede, at de ville stemme på kandidaten EN, 26% - for kandidaten B og 28 % ved ikke, hvem de vil stemme på. Bestem 95 % konfidensintervallet for andelen af ​​byens beboere, der støtter kandidaten EN.

Instruktion

Bemærk, at interval(l1 eller l2), hvis centrale område vil være estimatet l*, og også hvor den sande værdi af parameteren er indeholdt med sandsynlighed, vil kun være tilliden interval ohm eller den tilsvarende værdi af konfidensniveauet alfa. I dette tilfælde vil l* selv henvise til punktoverslag. For eksempel, ifølge resultaterne af enhver prøveværdi af en tilfældig værdi X (x1, x2,..., xn), er det nødvendigt at beregne en ukendt indikatorparameter l, som fordelingen vil afhænge af. I dette tilfælde vil opnåelse af et estimat af en given parameter l* betyde, at det for hver prøve vil være nødvendigt at sætte en vis værdi af parameteren på linje, det vil sige at skabe en funktion af resultaterne af observation af indikatoren Q, hvis værdi vil blive taget lig med den estimerede værdi af parameteren l* i form af en formel: l*=Q*(x1, x2,..., xn).

Bemærk, at enhver funktion på resultaterne af en observation kaldes en statistik. Desuden, hvis det fuldt ud beskriver parameteren (fænomenet) under overvejelse, så kaldes det tilstrækkelig statistik. Og fordi resultaterne af observationer er tilfældige, så vil l * også være en tilfældig variabel. Opgaven med at beregne statistik bør udføres under hensyntagen til kriterierne for dens kvalitet. Her er det nødvendigt at tage højde for, at fordelingsloven for estimatet er ganske bestemt, fordelingen af ​​sandsynlighedstætheden W(x, l).

Du kan beregne tilliden interval nemt nok, hvis du kender loven om fordeling af værdiansættelse. For eksempel tillid interval estimater i forhold til den matematiske forventning (middelværdi af en tilfældig værdi) mx* =(1/n)*(x1+x2+ …+xn) . Dette estimat vil være upartisk, det vil sige, at den matematiske forventning eller gennemsnitsværdi af indikatoren vil være lig med den sande værdi af parameteren (M(mx*) = mx).

Du kan fastslå, at variansen af ​​estimatet ved matematisk forventning er: bx*^2=Dx/n. Baseret på grænse-centralsætningen kan vi drage den passende konklusion, at fordelingsloven for dette estimat er Gaussisk (normal). Derfor kan du til beregninger bruge indikatoren Ф (z) - integralet af sandsynligheder. I dette tilfælde skal du vælge længden af ​​tilliden interval og 2ld, så du får: alfa \u003d P (mx-ld (ved at bruge sandsynlighedsintegralets egenskab ifølge formlen: Ф (-z) \u003d 1- Ф (z)).

Opbyg tillid interval estimater af den matematiske forventning: - find værdien af ​​formlen (alfa + 1) / 2; - vælg værdien lig med ld / sqrt (Dx / n) fra sandsynlighedsintegraltabellen; - tag estimatet af den sande varians: Dx * = (1/n) * ((x1 - mx*)^2+(x2 - mx*)^2+...+(xn - mx*)^2); interval ifølge formlen: (mx*-ld, mx*+ld).

Konfidensinterval(CI; på engelsk, konfidensinterval - CI) opnået i undersøgelsen ved stikprøven giver et mål for nøjagtigheden (eller usikkerheden) af undersøgelsens resultater for at drage konklusioner om populationen af ​​alle sådanne patienter (generel befolkning) ). Den korrekte definition af 95 % CI kan formuleres som følger: 95 % af sådanne intervaller vil indeholde den sande værdi i populationen. Denne fortolkning er noget mindre nøjagtig: CI er det interval af værdier, inden for hvilket du kan være 95 % sikker på, at den indeholder den sande værdi. Ved brug af CI lægges der vægt på at bestemme den kvantitative effekt i modsætning til P-værdien, som opnås som følge af test for statistisk signifikans. P-værdien vurderer ikke nogen mængde, men tjener snarere som et mål for styrken af ​​beviset mod nulhypotesen om "ingen effekt". Værdien af ​​P i sig selv fortæller os ikke noget om størrelsen af ​​forskellen, eller endda om dens retning. Derfor er uafhængige værdier af P absolut uinformative i artikler eller abstracts. I modsætning hertil angiver CI både mængden af ​​effekt af umiddelbar interesse, såsom nytten af ​​en behandling, og styrken af ​​evidensen. Derfor er DI direkte relateret til udøvelsen af ​​DM.

Scoringstilgangen til statistisk analyse, illustreret af CI, har til formål at måle størrelsen af ​​interesseeffekten (følsomhed af den diagnostiske test, forudsagt forekomst, relativ risikoreduktion med behandling osv.) og at måle usikkerheden i denne effekt. Oftest er CI den række af værdier på hver side af estimatet, som den sande værdi sandsynligvis vil ligge i, og du kan være 95% sikker på det. Konventionen for at bruge 95% sandsynlighed er vilkårlig, såvel som værdien af ​​P<0,05 для оценки статистической значимости, и авторы иногда используют 90% или 99% ДИ. Заметим, что слово «интервал» означает диапазон величин и поэтому стоит в единственном числе. Две величины, которые ограничивают интервал, называются «доверительными пределами».

CI er baseret på ideen om, at den samme undersøgelse udført på forskellige sæt patienter ikke ville give identiske resultater, men at deres resultater ville blive fordelt omkring den sande, men ukendte værdi. Med andre ord beskriver CI dette som "stikprøveafhængig variabilitet". CI afspejler ikke yderligere usikkerhed på grund af andre årsager; Det omfatter især ikke virkningerne af selektivt tab af patienter på sporing, dårlig compliance eller unøjagtig resultatmåling, manglende blinding osv. CI undervurderer således altid den samlede mængde usikkerhed.

Konfidensintervalberegning

Tabel A1.1. Standardfejl og konfidensintervaller for nogle kliniske målinger

Typisk beregnes CI ud fra et observeret estimat af et kvantitativt mål, såsom forskellen (d) mellem to proportioner og standardfejlen (SE) i estimatet af denne forskel. Den således opnåede omtrentlige 95 % CI er d ± 1,96 SE. Formlen ændres i henhold til karakteren af ​​resultatmålet og dækningen af ​​CI. I et randomiseret, placebo-kontrolleret forsøg med acellulær pertussis-vaccine udviklede sig f.eks. kighoste hos 72 ud af 1670 (4,3%) spædbørn, der modtog vaccinen, og 240 ud af 1665 (14,4%) i kontrolgruppen. Den procentvise forskel, kendt som den absolutte risikoreduktion, er 10,1 %. SE af denne forskel er 0,99%. Følgelig er 95 % CI 10,1 % + 1,96 x 0,99 %, dvs. fra 8,2 til 12,0.

På trods af forskellige filosofiske tilgange er CI'er og test for statistisk signifikans tæt forbundet matematisk.

Værdien af ​​P er således "signifikant", dvs. R<0,05 соответствует 95% ДИ, который исключает величину эффекта, указывающую на отсутствие различия. Например, для различия между двумя средними пропорциями это ноль, а для относительного риска или отношения шансов - единица. При некоторых обстоятельствах эти два подхода могут быть не совсем эквивалентны. Преобладающая точка зрения: оценка с помощью ДИ - предпочтительный подход к суммированию результатов исследования, но ДИ и величина Р взаимодополняющи, и во многих статьях используются оба способа представления результатов.

Usikkerheden (unøjagtigheden) af estimatet, udtrykt i CI, er i vid udstrækning relateret til kvadratroden af ​​stikprøvestørrelsen. Små prøver giver mindre information end store prøver, og CI'er er tilsvarende bredere i mindre prøver. For eksempel rapporterede en artikel, der sammenlignede ydeevnen af ​​tre tests, der blev brugt til at diagnosticere Helicobacter pylori-infektion, en urinstof-åndedrætstestfølsomhed på 95,8 % (95 % CI 75-100). Mens tallet på 95,8 % ser imponerende ud, betyder den lille stikprøvestørrelse på 24 voksne H. pylori-patienter, at der er betydelig usikkerhed i dette estimat, som vist af det brede CI. Faktisk er den nedre grænse på 75 % meget lavere end estimatet på 95,8 %. Hvis den samme følsomhed blev observeret i en prøve på 240 personer, ville 95 % CI være 92,5-98,0, hvilket giver mere sikkerhed for, at testen er meget sensitiv.

I randomiserede kontrollerede forsøg (RCT'er) er ikke-signifikante resultater (dvs. dem med P > 0,05) særligt modtagelige for fejlfortolkning. CI er særligt nyttigt her, da det angiver, hvor kompatible resultaterne er med den klinisk nyttige sande effekt. For eksempel, i en RCT, der sammenlignede sutur og stapelanastomose i tyktarmen, udviklede der sig sårinfektion hos henholdsvis 10,9 % og 13,5 % af patienterne (P = 0,30). 95 % CI for denne forskel er 2,6 % (-2 til +8). Selv i denne undersøgelse, som omfattede 652 patienter, er det fortsat sandsynligt, at der er en beskeden forskel i forekomsten af ​​infektioner som følge af de to procedurer. Jo mindre undersøgelsen er, jo større er usikkerheden. Sung et al. udført en RCT for at sammenligne octreotidinfusion med akut scleroterapi for akut variceblødning hos 100 patienter. I octreotidgruppen var blødningsstopfrekvensen 84 %; i scleroterapigruppen - 90%, hvilket giver P = 0,56. Bemærk, at hastigheden for fortsat blødning svarer til dem for sårinfektion i den nævnte undersøgelse. I dette tilfælde er 95 % CI for forskel i interventioner dog 6 % (-7 til +19). Dette interval er ret bredt sammenlignet med en forskel på 5 %, der ville være af klinisk interesse. Det er klart, at undersøgelsen ikke udelukker en signifikant forskel i effektivitet. Derfor er konklusionen fra forfatterne "octreotidinfusion og skleroterapi er lige effektive til behandling af blødning fra varicer" absolut ikke gyldig. I tilfælde som dette, hvor 95 % CI for absolut risikoreduktion (ARR) inkluderer nul, som her, er CI for NNT (tal nødvendigt for at behandle) ret vanskelig at fortolke. . NLP og dets CI er opnået fra de gensidige i ACP (multiplicere dem med 100, hvis disse værdier er angivet i procent). Her får vi NPP = 100: 6 = 16,6 med en 95% CI på -14,3 til 5,3. Som det kan ses af fodnoten "d" i tabel. A1.1, denne CI inkluderer værdier for NTPP fra 5,3 til uendeligt og NTLP fra 14,3 til uendeligt.

CI'er kan konstrueres til de mest almindeligt anvendte statistiske estimater eller sammenligninger. For RCT'er inkluderer det forskellen mellem gennemsnitlige proportioner, relative risici, oddsforhold og NRR'er. Tilsvarende kan CI'er opnås for alle større estimater lavet i undersøgelser af diagnostisk testnøjagtighed - sensitivitet, specificitet, positiv prædiktiv værdi (som alle er simple proportioner) og sandsynlighedsforhold - estimater opnået i metaanalyser og sammenligning-til-kontrol undersøgelser. Et personligt computerprogram, der dækker mange af disse anvendelser af DI, er tilgængeligt med anden udgave af Statistics with Confidence. Makroer til beregning af CI'er for proportioner er frit tilgængelige for Excel og de statistiske programmer SPSS og Minitab på http://www.uwcm.ac.uk/study/medicine/epidemiology_statistics/research/statistics/proportions, htm.

Flere evalueringer af behandlingseffekt

Selvom konstruktionen af ​​CI'er er ønskelig for primære undersøgelsesresultater, er de ikke nødvendige for alle resultater. CI vedrører klinisk vigtige sammenligninger. For eksempel, når man sammenligner to grupper, er den korrekte CI den, der er bygget til forskellen mellem grupperne, som vist i eksemplerne ovenfor, og ikke den CI, der kan bygges for estimatet i hver gruppe. Ikke alene er det nytteløst at give separate CI'er for scoringerne i hver gruppe, denne præsentation kan være vildledende. Tilsvarende er den korrekte tilgang, når man sammenligner behandlingseffektivitet i forskellige undergrupper, at sammenligne to (eller flere) undergrupper direkte. Det er forkert at antage, at behandling kun er effektiv i én undergruppe, hvis dens CI udelukker værdien, der svarer til ingen effekt, mens andre ikke gør. CI'er er også nyttige, når man sammenligner resultater på tværs af flere undergrupper. På fig. A1.1 viser den relative risiko for eclampsia hos kvinder med præeklampsi i undergrupper af kvinder fra en placebokontrolleret RCT af magnesiumsulfat.

Ris. A1.2. Skovgrafen viser resultaterne af 11 randomiserede kliniske forsøg med bovin rotavirusvaccine til forebyggelse af diarré versus placebo. 95 % konfidensintervallet blev brugt til at estimere den relative risiko for diarré. Størrelsen af ​​den sorte firkant er proportional med mængden af ​​information. Derudover vises et sammenfattende estimat af behandlingseffektivitet og et 95 % konfidensinterval (angivet med en diamant). Metaanalysen brugte en model med tilfældige effekter, der overstiger nogle på forhånd etablerede; det kunne f.eks. være den størrelse, der bruges til at beregne stikprøvestørrelsen. Under et strengere kriterium skal hele rækken af ​​CI'er vise en fordel, der overstiger et forudbestemt minimum.

Vi har allerede diskuteret fejlen i at tage fraværet af statistisk signifikans som en indikation af, at to behandlinger er lige effektive. Det er lige så vigtigt ikke at sætte lighedstegn mellem statistisk signifikans og klinisk signifikans. Klinisk betydning kan antages, når resultatet er statistisk signifikant og størrelsen af ​​behandlingsresponsen

Undersøgelser kan vise, om resultaterne er statistisk signifikante, og hvilke der er klinisk vigtige, og hvilke der ikke er. På fig. A1.2 viser resultaterne af fire forsøg, for hvilke hele CI<1, т.е. их результаты статистически значимы при Р <0,05 , . После высказанного предположения о том, что клинически важным различием было бы сокращение риска диареи на 20% (ОР = 0,8), все эти испытания показали клинически значимую оценку сокращения риска, и лишь в исследовании Treanor весь 95% ДИ меньше этой величины. Два других РКИ показали клинически важные результаты, которые не были статистически значимыми. Обратите внимание, что в трёх испытаниях точечные оценки эффективности лечения были почти идентичны, но ширина ДИ различалась (отражает размер выборки). Таким образом, по отдельности доказательная сила этих РКИ различна.

Antag, at vi har et stort antal varer med en normal fordeling af nogle karakteristika (for eksempel et fuldt lager af samme type grøntsager, hvis størrelse og vægt varierer). Du vil gerne kende de gennemsnitlige egenskaber for hele varepartiet, men du har hverken tid eller lyst til at måle og veje hver grøntsag. Du forstår, at dette ikke er nødvendigt. Men hvor mange stykker skal du tage til tilfældig inspektion?

Før vi giver nogle formler, der er nyttige for denne situation, husker vi nogle notationer.

For det første, hvis vi målte hele lageret af grøntsager (dette sæt af elementer kaldes den generelle befolkning), så ville vi vide med al den nøjagtighed, der er tilgængelig for os, gennemsnitsværdien af ​​vægten af ​​hele partiet. Lad os kalde dette gennemsnit X jfr .g da . - generelt gennemsnit. Vi ved allerede, hvad der er fuldstændigt bestemt, hvis dens middelværdi og afvigelse er kendt . Sandt nok, indtil videre er vi hverken X gns. eller s vi kender ikke den almindelige befolkning. Vi kan kun tage nogle prøver, måle de værdier vi har brug for og beregne både middelværdien X sr. i prøven og standardafvigelsen S sb for denne prøve.

Det er kendt, at hvis vores brugerdefinerede check indeholder et stort antal elementer (normalt er n større end 30), og de tages virkelig tilfældigt, derefter s den generelle befolkning vil næsten ikke adskille sig fra S ..

Derudover kan vi i tilfælde af en normalfordeling bruge følgende formler:

Med en sandsynlighed på 95 %


Med en sandsynlighed på 99 %



Generelt, med sandsynlighed Р (t)


Forholdet mellem værdien af ​​t og værdien af ​​sandsynligheden P(t), som vi ønsker at kende konfidensintervallet med, kan tages fra følgende tabel:


Vi har således bestemt, i hvilket interval gennemsnitsværdien for den generelle befolkning er (med en given sandsynlighed).

Medmindre vi har en stor nok stikprøve, kan vi ikke påstå, at populationen har s = S sel. I dette tilfælde er prøvens nærhed til normalfordelingen desuden problematisk. Brug i dette tilfælde også S sb i stedet s i formlen:




men værdien af ​​t for en fast sandsynlighed P(t) vil afhænge af antallet af elementer i stikprøven n. Jo større n, jo tættere vil det resulterende konfidensinterval være på værdien givet af formel (1). t-værdierne i dette tilfælde er taget fra en anden tabel (Studentens t-test), som vi giver nedenfor:

Elevens t-testværdier for sandsynlighed 0,95 og 0,99


Eksempel 3 30 personer blev tilfældigt udvalgt blandt de ansatte i virksomheden. Ifølge prøven viste det sig, at den gennemsnitlige løn (pr. måned) er 30 tusind rubler med en gennemsnitlig kvadratafvigelse på 5 tusind rubler. Med en sandsynlighed på 0,99 bestemme den gennemsnitlige løn i virksomheden.

Løsning: Ved betingelse har vi n = 30, X jfr. =30000, S=5000, P=0,99. For at finde konfidensintervallet bruger vi formlen svarende til Elevens kriterium. Ifølge tabellen for n \u003d 30 og P \u003d 0,99 finder vi t \u003d 2,756, derfor,


de der. ønsket tillid interval 27484< Х ср.ген < 32516.

Så med en sandsynlighed på 0,99 kan man argumentere for, at intervallet (27484; 32516) indeholder gennemsnitslønnen i virksomheden.

Vi håber, at du vil bruge denne metode uden nødvendigvis at have et regneark med dig hver gang. Beregninger kan udføres automatisk i Excel. Mens du er i en Excel-fil, skal du klikke på fx-knappen i topmenuen. Vælg derefter blandt funktionerne typen "statistisk", og fra den foreslåede liste i boksen - STEUDRASP. Placer derefter markøren i feltet "sandsynlighed" ved prompten, og skriv værdien af ​​den gensidige sandsynlighed (det vil sige i vores tilfælde, i stedet for sandsynligheden på 0,95, skal du indtaste sandsynligheden på 0,05). Tilsyneladende er regnearket designet således, at resultatet besvarer spørgsmålet om, hvor sandsynligt vi kan tage fejl. På samme måde skal du indtaste værdien (n-1) for din prøve i feltet "frihedsgrad".

Sindet er ikke kun i viden, men også i evnen til at anvende viden i praksis. (Aristoteles)

Konfidensintervaller

generel gennemgang

Ved at tage en stikprøve fra populationen vil vi få et punktestimat af parameteren af ​​interesse for os og beregne standardfejlen for at indikere nøjagtigheden af ​​estimatet.

Men i de fleste tilfælde er standardfejlen som sådan ikke acceptabel. Det er meget mere nyttigt at kombinere dette præcisionsmål med et intervalestimat for populationsparameteren.

Dette kan gøres ved at bruge viden om den teoretiske sandsynlighedsfordeling af stikprøvestatistikken (parameteren) til at beregne et konfidensinterval (CI - Konfidensinterval, CI - Konfidensinterval) for parameteren.

Generelt udvider konfidensintervallet estimaterne i begge retninger med et eller andet multiplum af standardfejlen (af en given parameter); de to værdier (konfidensgrænser), der definerer intervallet, er normalt adskilt af et komma og omgivet af parentes.

Konfidensinterval for middelværdi

Bruger normalfordelingen

Stikprøvegennemsnittet har en normalfordeling, hvis stikprøvestørrelsen er stor, så viden om normalfordelingen kan anvendes, når stikprøvegennemsnittet tages i betragtning.

Især er 95 % af fordelingen af ​​stikprøvegennemsnittet inden for 1,96 standardafvigelser (SD) af populationsgennemsnittet.

Når vi kun har én prøve, kalder vi dette standardfejlen for middelværdien (SEM) og beregner 95 % konfidensintervallet for middelværdien som følger:

Hvis dette eksperiment gentages flere gange, vil intervallet indeholde det sande populationsmiddel 95 % af tiden.

Dette er normalt et konfidensinterval, såsom det interval af værdier, inden for hvilket den sande populationsmiddelværdi (generelt gennemsnit) ligger med et 95% konfidensniveau.

Selvom det ikke er ret strengt (populationsmiddelværdien er en fast værdi og kan derfor ikke have en sandsynlighed relateret til det) at fortolke konfidensintervallet på denne måde, er det begrebsmæssigt nemmere at forstå.

Brug t- fordeling

Du kan bruge normalfordelingen, hvis du kender værdien af ​​variansen i populationen. Når stikprøvestørrelsen er lille, følger stikprøvegennemsnittet også en normalfordeling, hvis de data, der ligger til grund for populationen, er normalfordelte.

Hvis de data, der ligger til grund for populationen, ikke er normalfordelte og/eller den generelle varians (populationsvarians) er ukendt, adlyder stikprøvegennemsnittet Elevens t-fordeling.

Beregn 95 % konfidensintervallet for populationens middelværdi som følger:

Hvor - procentpoint (percentil) t- Elevfordeling med (n-1) frihedsgrader, hvilket giver en tosidet sandsynlighed på 0,05.

Generelt giver det et bredere interval end ved brug af en normalfordeling, fordi det tager højde for den yderligere usikkerhed, der indføres ved at estimere populationens standardafvigelse og/eller på grund af den lille stikprøvestørrelse.

Når stikprøvestørrelsen er stor (i størrelsesordenen 100 eller mere), er forskellen mellem de to fordelinger ( t-elev og normal) er ubetydelig. Brug dog altid t- fordeling ved beregning af konfidensintervaller, selvom stikprøvestørrelsen er stor.

Normalt er 95 % CI angivet. Andre konfidensintervaller kan beregnes, såsom 99 % CI for gennemsnittet.

I stedet for produkt af standardfejl og tabelværdi t- fordeling, der svarer til en to-halet sandsynlighed på 0,05 gange den (standardfejl) med en værdi, der svarer til en to-halet sandsynlighed på 0,01. Dette er et bredere konfidensinterval end i 95 %-tilfældet, fordi det afspejler øget tillid til, at intervallet faktisk inkluderer befolkningsgennemsnittet.

Konfidensinterval for proportioner

Prøvefordelingen af ​​proportioner har en binomial fordeling. Men hvis prøvestørrelsen n rimelig stor, så er andelsstikprøvefordelingen omtrent normal med middelværdi.

Estimat efter stikprøveforhold p=r/n(hvor r- antallet af individer i stikprøven med de egenskaber, der er af interesse for os), og standardfejlen estimeres:

95 % konfidensintervallet for andelen er estimeret:

Hvis prøvestørrelsen er lille (normalt hvornår np eller n(1-p) mindre 5 ), så skal binomialfordelingen bruges til at beregne de nøjagtige konfidensintervaller.

Bemærk, at hvis s udtrykt i procent altså (1-p) erstattet af (100p).

Fortolkning af konfidensintervaller

Når vi fortolker konfidensintervallet, er vi interesserede i følgende spørgsmål:

Hvor bredt er konfidensintervallet?

Et bredt konfidensinterval indikerer, at estimatet er upræcist; smal angiver et fint skøn.

Bredden af ​​konfidensintervallet afhænger af størrelsen af ​​standardfejlen, som igen afhænger af stikprøvestørrelsen, og når man betragter en numerisk variabel ud fra variabiliteten af ​​dataene, giver det bredere konfidensintervaller end studier af et stort datasæt på få variabler.

Indeholder CI nogen værdier af særlig interesse?

Du kan kontrollere, om den sandsynlige værdi for en populationsparameter falder inden for et konfidensinterval. Hvis ja, så stemmer resultaterne overens med denne sandsynlige værdi. Hvis ikke, er det usandsynligt (for et 95 % konfidensinterval er chancen næsten 5 %), at parameteren har denne værdi.