Konfidensinterval. ABC for medicinsk statistik

Lad os bygge et konfidensinterval i MS EXCEL til at estimere middelværdien af ​​fordelingen i tilfælde af en kendt værdi af variansen.

Selvfølgelig valget tillidsniveau afhænger helt af opgaven. Således bør graden af ​​tillid hos flypassageren til flyets pålidelighed naturligvis være højere end graden af ​​købers tillid til pærens pålidelighed.

Opgaveformulering

Lad os antage, at fra befolkning have taget prøve størrelse n. Det antages at standardafvigelse denne fordeling er kendt. Nødvendigt på baggrund af dette prøver vurdere det ukendte fordelingsmiddel(μ, ) og konstruer den tilsvarende bilateralt konfidensinterval.

Point Estimation

Som det kendes fra Statistikker(lad os kalde det X jfr) er upartisk skøn over gennemsnittet dette befolkning og har fordelingen N(μ;σ 2 /n).

Bemærk: Hvad hvis du skal bygge konfidensinterval i tilfælde af distribution, som er ikke normal? I dette tilfælde kommer til undsætning, som siger, at med en tilstrækkelig stor størrelse prøver n fra distribution ikke- normal, stikprøvefordeling af statistik Х av vil være rundt regnet korrespondere Normal fordeling med parametre N(μ;σ 2/n).

Så, punkt estimat midten fordelingsværdier vi har er prøvegennemsnit, dvs. X jfr. Lad os nu få travlt konfidensinterval.

Opbygning af et konfidensinterval

Normalt, ved at kende fordelingen og dens parametre, kan vi beregne sandsynligheden for, at en tilfældig variabel vil tage en værdi fra det interval, vi har angivet. Lad os nu gøre det modsatte: find det interval, hvori den stokastiske variabel falder med en given sandsynlighed. For eksempel fra ejendomme Normal fordeling det er kendt, at med en sandsynlighed på 95%, en stokastisk variabel fordelt over normal lov, vil falde inden for intervallet ca. +/- 2 fra middelværdi(se artikel om). Dette interval vil tjene som vores prototype for konfidensinterval.

Lad os nu se, om vi kender fordelingen , at beregne dette interval? For at besvare spørgsmålet skal vi specificere distributionsformen og dens parametre.

Vi ved, at distributionsformen er Normal fordeling(husk, at vi taler om prøveudtagningsfordeling Statistikker X jfr).

Parameteren μ er ukendt for os (den skal blot estimeres ved hjælp af konfidensinterval), men vi har dens skøn X jf. beregnes ud fra prøve, som kan bruges.

Den anden parameter er prøvegennemsnitlig standardafvigelse vil blive kendt, det er lig med σ/√n.

Fordi vi kender ikke μ, så bygger vi intervallet +/- 2 standardafvigelser ikke fra middelværdi, men fra dets kendte skøn X jfr. De der. ved beregning konfidensinterval det vil vi IKKE gå ud fra X jfr vil falde inden for intervallet +/- 2 standardafvigelser fra μ med en sandsynlighed på 95 %, og vi vil antage, at intervallet er +/- 2 standardafvigelser fra X jfr med en sandsynlighed på 95 % vil dække μ - gennemsnittet af den almindelige befolkning, hvorfra prøve. Disse to udsagn er ækvivalente, men den anden udsagn giver os mulighed for at konstruere konfidensinterval.

Derudover forfiner vi intervallet: en stokastisk variabel fordelt over normal lov, med 95 % sandsynlighed falder inden for intervallet +/- 1,960 standardafvigelser, ikke +/- 2 standardafvigelser. Dette kan beregnes ved hjælp af formlen \u003d NORM.ST.OBR ((1 + 0,95) / 2), cm. eksempelfil Arkafstand.

Nu kan vi formulere en sandsynlighedserklæring, som vil tjene os til at danne konfidensinterval:
"Sandsynligheden for at befolkningsmiddel placeret fra prøvegennemsnit inden for 1.960" standardafvigelser for prøvegennemsnittet", er lig med 95%.

Sandsynlighedsværdien nævnt i udsagnet har et særligt navn , som er forbundet med signifikansniveau α (alfa) ved et simpelt udtryk tillidsniveau =1 . I vores tilfælde betydningsniveau α =1-0,95=0,05 .

Ud fra denne sandsynlighedserklæring skriver vi nu et udtryk til beregning konfidensinterval:

hvor Za/2 standard Normal fordeling(sådan en værdi af en tilfældig variabel z, hvad P(z>=Za/2 )=a/2).

Bemærk: Øvre α/2-kvantil definerer bredden konfidensinterval i standardafvigelser prøvegennemsnit. Øvre α/2-kvantil standard Normal fordeling er altid større end 0, hvilket er meget praktisk.

I vores tilfælde, ved α=0,05, øvre α/2-kvantil svarer til 1.960. For andre signifikansniveauer α (10 %; 1 %) øvre α/2-kvantil Za/2 kan beregnes ved hjælp af formlen \u003d NORM.ST.OBR (1-α / 2) eller, hvis kendt tillidsniveau, =NORM.ST.OBR((1+konfidensniveau)/2).

Normalt når man bygger konfidensintervaller til estimering af gennemsnittet kun brug øverste α/2-kvantil og ikke bruge lavere α/2-kvantil. Dette er muligt pga standard Normal fordeling symmetrisk om x-aksen ( tætheden af ​​dens fordeling symmetrisk omkring gennemsnit, dvs. 0). Derfor er der ingen grund til at beregne lavere α/2-kvantil(det kaldes simpelthen α /2-kvantil), fordi det er lige øverste α/2-kvantil med et minustegn.

Husk, at uanset formen af ​​fordelingen af ​​x, den tilsvarende stokastiske variabel X jfr fordelt rundt regnet bøde N(μ;σ 2 /n) (se artikel om). Derfor generelt er ovenstående udtryk for konfidensinterval er kun omtrentlig. Hvis x er fordelt over normal lov N(μ;σ 2 /n), derefter udtrykket for konfidensinterval er nøjagtig.

Beregning af konfidensinterval i MS EXCEL

Lad os løse problemet.
En elektronisk komponents responstid på et inputsignal er en vigtig egenskab ved en enhed. En ingeniør ønsker at plotte et konfidensinterval for den gennemsnitlige responstid ved et konfidensniveau på 95 %. Ud fra tidligere erfaring ved ingeniøren, at standardafvigelsen for responstiden er 8 ms. Det er kendt, at ingeniøren foretog 25 målinger for at estimere responstiden, den gennemsnitlige værdi var 78 ms.

Løsning: En ingeniør vil gerne vide responstiden for en elektronisk enhed, men han forstår, at responstiden ikke er fast, men en tilfældig variabel, der har sin egen fordeling. Så det bedste, han kan håbe på, er at bestemme parametrene og formen for denne fordeling.

Ud fra problemets tilstand kender vi desværre ikke formen for fordelingen af ​​responstiden (det behøver ikke at være normal). , denne fordeling er også ukendt. Kun han er kendt standardafvigelseσ=8. Derfor, mens vi ikke kan beregne sandsynligheder og konstruere konfidensinterval.

Dog selvom vi ikke kender fordelingen tid separat svar, det ved vi iflg CPT, prøveudtagningsfordeling gennemsnitlig svartid er ca normal(vi antager, at betingelserne CPT udføres, fordi størrelsen prøver stor nok (n=25)) .

Desuden, gennemsnit denne fordeling er lig med middelværdi enhedssvarfordelinger, dvs. μ. MEN standardafvigelse af denne fordeling (σ/√n) kan beregnes ved hjælp af formlen =8/ROOT(25) .

Det vides også, at ingeniøren modtog punkt estimat parameter μ lig med 78 ms (X cf). Derfor kan vi nu beregne sandsynligheden, fordi vi kender distributionsformen ( normal) og dens parametre (Х ср og σ/√n).

Ingeniøren vil vide det forventet værdiμ af responstidsfordelingen. Som nævnt ovenfor er denne μ lig med forventning om stikprøvefordelingen af ​​den gennemsnitlige svartid. Hvis vi bruger Normal fordeling N(X cf; σ/√n), så vil den ønskede μ være i området +/-2*σ/√n med en sandsynlighed på cirka 95%.

Betydningsniveau er lig med 1-0,95=0,05.

Til sidst skal du finde venstre og højre kant konfidensinterval.
Venstre kant: \u003d 78-NORM.ST.INR (1-0,05 / 2) * 8 / ROD (25) = 74,864
Højre kant: \u003d 78 + NORM. ST. OBR (1-0,05 / 2) * 8 / ROOT (25) \u003d 81.136

Venstre kant: =NORM.INV(0,05/2; 78; 8/SQRT(25))
Højre kant: =NORM.INV(1-0,05/2; 78; 8/SQRT(25))

Svar: konfidensinterval95 % konfidensniveau og σ=8msek lige med 78+/-3.136ms

eksempelfil på ark Sigma kendt oprettet et skema til beregning og konstruktion bilateralt konfidensinterval for vilkårlig prøver med en given σ og betydningsniveau.

CONFIDENCE.NORM() funktion

Hvis værdierne prøver er i sortimentet B20:B79 , a betydningsniveau lig med 0,05; derefter MS EXCEL formel:
=MIDDEL(B20:B79)-TILLID(0,05;σ; ANTAL(B20:B79))
vil returnere den venstre kant konfidensinterval.

Den samme grænse kan beregnes ved hjælp af formlen:
=MIDDEL(B20:B79)-NORM.ST.INV(1-0,05/2)*σ/SQRT(ANTAL(B20:B79))

Bemærk: Funktionen TRUST.NORM() dukkede op i MS EXCEL 2010. Tidligere versioner af MS EXCEL brugte TRUST()-funktionen.

Konfidensintervaller ( engelsk Konfidensintervaller) en af ​​de typer intervalestimater, der bruges i statistik, som beregnes for et givet signifikansniveau. De giver os mulighed for at komme med en erklæring om, at den sande værdi af en ukendt statistisk parameter for den generelle befolkning er i det opnåede område af værdier med en sandsynlighed, der er givet af det valgte niveau af statistisk signifikans.

Normal fordeling

Når variansen (σ 2 ) af populationen af ​​data er kendt, kan en z-score bruges til at beregne konfidensgrænser (grænsepunkter for konfidensintervallet). Sammenlignet med at bruge en t-fordeling vil brug af en z-score ikke kun give et snævrere konfidensinterval, men også give mere pålidelige estimater af middelværdien og standardafvigelsen (σ), da Z-scoren er baseret på en normalfordeling.

Formel

For at bestemme grænsepunkterne for konfidensintervallet, forudsat at standardafvigelsen for populationen af ​​data er kendt, anvendes følgende formel

L = X - Z a/2 σ
√n

Eksempel

Antag, at stikprøvestørrelsen er 25 observationer, stikprøvegennemsnittet er 15, og populationens standardafvigelse er 8. For et signifikansniveau på α=5% er Z-score Z α/2 =1,96. I dette tilfælde vil den nedre og øvre grænse for konfidensintervallet være

L = 15 - 1,96 8 = 11,864
√25
L = 15 + 1,96 8 = 18,136
√25

Således kan vi konstatere, at med en sandsynlighed på 95% vil den matematiske forventning for den generelle befolkning falde i området fra 11.864 til 18.136.

Metoder til at indsnævre konfidensintervallet

Lad os sige, at rækkevidden er for bred til formålet med vores undersøgelse. Der er to måder at reducere konfidensintervallet på.

  1. Reducer niveauet af statistisk signifikans α.
  2. Forøg prøvestørrelsen.

Reducerer niveauet af statistisk signifikans til α=10%, får vi en Z-score lig med Z α/2 =1,64. I dette tilfælde vil den nedre og øvre grænse for intervallet være

L = 15 - 1,64 8 = 12,376
√25
L = 15 + 1,64 8 = 17,624
√25

Og selve konfidensintervallet kan skrives som

I dette tilfælde kan vi antage, at med en sandsynlighed på 90% vil den matematiske forventning hos den generelle befolkning falde inden for området.

Hvis vi vil beholde niveauet af statistisk signifikans α, så er det eneste alternativ at øge stikprøvestørrelsen. Ved at øge det til 144 observationer opnår vi følgende værdier af konfidensgrænserne

L = 15 - 1,96 8 = 13,693
√144
L = 15 + 1,96 8 = 16,307
√144

Selve konfidensintervallet vil se sådan ud:

Indsnævring af konfidensintervallet uden at reducere niveauet af statistisk signifikans er således kun muligt ved at øge stikprøvestørrelsen. Hvis det ikke er muligt at øge stikprøvestørrelsen, så kan indsnævringen af ​​konfidensintervallet opnås udelukkende ved at reducere niveauet af statistisk signifikans.

Opbygning af et konfidensinterval for en ikke-normal fordeling

Hvis standardafvigelsen for populationen ikke er kendt, eller fordelingen er ikke-normal, bruges t-fordelingen til at konstruere et konfidensinterval. Denne teknik er mere konservativ, hvilket kommer til udtryk i bredere konfidensintervaller sammenlignet med teknikken baseret på Z-score.

Formel

Følgende formler bruges til at beregne de nedre og øvre grænser for konfidensintervallet baseret på t-fordelingen

L = X - tα σ
√n

Elevens fordeling eller t-fordeling afhænger kun af én parameter - antallet af frihedsgrader, som er lig med antallet af individuelle funktionsværdier (antallet af observationer i prøven). Værdien af ​​Students t-test for et givet antal frihedsgrader (n) og niveauet af statistisk signifikans α kan findes i opslagstabellerne.

Eksempel

Antag, at stikprøvestørrelsen er 25 individuelle værdier, middelværdien af ​​stikprøven er 50, og prøvens standardafvigelse er 28. Du skal konstruere et konfidensinterval for niveauet af statistisk signifikans α=5%.

I vores tilfælde er antallet af frihedsgrader 24 (25-1), derfor er den tilsvarende tabelværdi af Students t-test for niveauet af statistisk signifikans α=5% 2,064. Derfor vil den nedre og øvre grænse for konfidensintervallet være

L = 50 - 2,064 28 = 38,442
√25
L = 50 + 2,064 28 = 61,558
√25

Og selve intervallet kan skrives som

Således kan vi konstatere, at med en sandsynlighed på 95 % vil den matematiske forventning hos den almindelige befolkning ligge i intervallet.

Ved at bruge en t-fordeling kan du indsnævre konfidensintervallet, enten ved at reducere statistisk signifikans eller ved at øge stikprøvestørrelsen.

Reducerer den statistiske signifikans fra 95 % til 90 % i betingelserne i vores eksempel, får vi den tilsvarende tabelværdi af Students t-test 1.711.

L = 50 - 1,711 28 = 40,418
√25
L = 50 + 1,711 28 = 59,582
√25

I dette tilfælde kan vi sige, at med en sandsynlighed på 90% vil den matematiske forventning for den generelle befolkning være i området.

Hvis vi ikke ønsker at reducere statistisk signifikans, så er det eneste alternativ at øge stikprøvestørrelsen. Lad os sige, at det er 64 individuelle observationer, og ikke 25 som i eksemplets begyndelsestilstand. Tabelværdien af ​​Students t-test for 63 frihedsgrader (64-1) og niveauet af statistisk signifikans α=5% er 1,998.

L = 50 - 1,998 28 = 43,007
√64
L = 50 + 1,998 28 = 56,993
√64

Dette giver os muligheden for at hævde, at med en sandsynlighed på 95 % vil den matematiske forventning hos den generelle befolkning være inden for området.

Store prøver

Store stikprøver er stikprøver fra en population af data med mere end 100 individuelle observationer. Statistiske undersøgelser har vist, at større stikprøver har tendens til at være normalfordelte, selvom fordelingen af ​​populationen ikke er normal. For sådanne prøver giver brugen af ​​z-score og t-fordeling tilnærmelsesvis de samme resultater, når der konstrueres konfidensintervaller. For store stikprøver er det således acceptabelt at bruge en z-score for en normalfordeling i stedet for en t-fordeling.

Opsummering

Konfidensinterval(CI; på engelsk, konfidensinterval - CI) opnået i en undersøgelse i stikprøven giver et mål for nøjagtigheden (eller usikkerheden) af undersøgelsens resultater for at drage konklusioner om populationen af ​​alle sådanne patienter (generel befolkning) ). Den korrekte definition af 95 % CI kan formuleres som følger: 95 % af sådanne intervaller vil indeholde den sande værdi i populationen. Denne fortolkning er noget mindre nøjagtig: CI er det interval af værdier, inden for hvilket du kan være 95 % sikker på, at den indeholder den sande værdi. Ved brug af CI lægges der vægt på at bestemme den kvantitative effekt i modsætning til P-værdien, som opnås som følge af test for statistisk signifikans. P-værdien vurderer ikke nogen mængde, men tjener snarere som et mål for styrken af ​​beviset mod nulhypotesen om "ingen effekt". Værdien af ​​P i sig selv fortæller os ikke noget om størrelsen af ​​forskellen, eller endda om dens retning. Derfor er uafhængige værdier af P absolut uinformative i artikler eller abstracts. I modsætning hertil angiver CI både mængden af ​​effekt af umiddelbar interesse, såsom nytten af ​​en behandling, og styrken af ​​evidensen. Derfor er DI direkte relateret til udøvelsen af ​​DM.

Scoringstilgangen til statistisk analyse, illustreret af CI, har til formål at måle størrelsen af ​​interesseeffekten (følsomhed af den diagnostiske test, forudsagt forekomst, relativ risikoreduktion med behandling osv.) og at måle usikkerheden i denne effekt. Oftest er CI den række af værdier på hver side af estimatet, som den sande værdi sandsynligvis vil ligge i, og du kan være 95% sikker på det. Konventionen for at bruge 95% sandsynlighed er vilkårlig, såvel som værdien af ​​P<0,05 для оценки статистической значимости, и авторы иногда используют 90% или 99% ДИ. Заметим, что слово «интервал» означает диапазон величин и поэтому стоит в единственном числе. Две величины, которые ограничивают интервал, называются «доверительными пределами».

CI er baseret på ideen om, at den samme undersøgelse udført på forskellige sæt patienter ikke ville give identiske resultater, men at deres resultater ville blive fordelt omkring den sande, men ukendte værdi. Med andre ord beskriver CI dette som "stikprøveafhængig variabilitet". CI afspejler ikke yderligere usikkerhed på grund af andre årsager; Det omfatter især ikke virkningerne af selektivt tab af patienter på sporing, dårlig compliance eller unøjagtig resultatmåling, manglende blinding osv. CI undervurderer således altid den samlede mængde usikkerhed.

Konfidensintervalberegning

Tabel A1.1. Standardfejl og konfidensintervaller for nogle kliniske målinger

Typisk beregnes CI ud fra et observeret estimat af et kvantitativt mål, såsom forskellen (d) mellem to proportioner og standardfejlen (SE) i estimatet af denne forskel. Den således opnåede omtrentlige 95 % CI er d ± 1,96 SE. Formlen ændres i henhold til karakteren af ​​resultatmålet og dækningen af ​​CI. I et randomiseret, placebo-kontrolleret forsøg med acellulær pertussis-vaccine udviklede sig f.eks. kighoste hos 72 ud af 1670 (4,3%) spædbørn, der modtog vaccinen, og 240 ud af 1665 (14,4%) i kontrolgruppen. Den procentvise forskel, kendt som den absolutte risikoreduktion, er 10,1 %. SE af denne forskel er 0,99%. Følgelig er 95 % CI 10,1 % + 1,96 x 0,99 %, dvs. fra 8,2 til 12,0.

På trods af forskellige filosofiske tilgange er CI'er og test for statistisk signifikans tæt forbundet matematisk.

Værdien af ​​P er således "signifikant", dvs. R<0,05 соответствует 95% ДИ, который исключает величину эффекта, указывающую на отсутствие различия. Например, для различия между двумя средними пропорциями это ноль, а для относительного риска или отношения шансов - единица. При некоторых обстоятельствах эти два подхода могут быть не совсем эквивалентны. Преобладающая точка зрения: оценка с помощью ДИ - предпочтительный подход к суммированию результатов исследования, но ДИ и величина Р взаимодополняющи, и во многих статьях используются оба способа представления результатов.

Usikkerheden (unøjagtigheden) af estimatet, udtrykt i CI, er i vid udstrækning relateret til kvadratroden af ​​stikprøvestørrelsen. Små prøver giver mindre information end store prøver, og CI'er er tilsvarende bredere i mindre prøver. For eksempel rapporterede en artikel, der sammenlignede ydeevnen af ​​tre tests, der blev brugt til at diagnosticere Helicobacter pylori-infektion, en urinstof-åndedrætstestfølsomhed på 95,8 % (95 % CI 75-100). Mens tallet på 95,8 % ser imponerende ud, betyder den lille stikprøvestørrelse på 24 voksne H. pylori-patienter, at der er betydelig usikkerhed i dette estimat, som vist af det brede CI. Faktisk er den nedre grænse på 75 % meget lavere end estimatet på 95,8 %. Hvis den samme følsomhed blev observeret i en prøve på 240 personer, ville 95 % CI være 92,5-98,0, hvilket giver mere sikkerhed for, at testen er meget sensitiv.

I randomiserede kontrollerede forsøg (RCT'er) er ikke-signifikante resultater (dvs. dem med P > 0,05) særligt modtagelige for fejlfortolkning. CI er særligt nyttigt her, da det angiver, hvor kompatible resultaterne er med den klinisk nyttige sande effekt. For eksempel, i en RCT, der sammenlignede sutur og stapelanastomose i tyktarmen, udviklede der sig sårinfektion hos henholdsvis 10,9 % og 13,5 % af patienterne (P = 0,30). 95 % CI for denne forskel er 2,6 % (-2 til +8). Selv i denne undersøgelse, som omfattede 652 patienter, er det fortsat sandsynligt, at der er en beskeden forskel i forekomsten af ​​infektioner som følge af de to procedurer. Jo mindre undersøgelsen er, jo større er usikkerheden. Sung et al. udført en RCT for at sammenligne octreotidinfusion med akut scleroterapi for akut variceblødning hos 100 patienter. I octreotidgruppen var blødningsstopfrekvensen 84 %; i scleroterapigruppen - 90%, hvilket giver P = 0,56. Bemærk, at hastigheden for fortsat blødning svarer til dem for sårinfektion i den nævnte undersøgelse. I dette tilfælde er 95 % CI for forskel i interventioner dog 6 % (-7 til +19). Dette interval er ret bredt sammenlignet med en forskel på 5 %, der ville være af klinisk interesse. Det er klart, at undersøgelsen ikke udelukker en signifikant forskel i effektivitet. Derfor er konklusionen fra forfatterne "octreotidinfusion og skleroterapi er lige effektive til behandling af blødning fra varicer" absolut ikke gyldig. I tilfælde som dette, hvor 95 % CI for absolut risikoreduktion (ARR) inkluderer nul, som her, er CI for NNT (tal nødvendigt for at behandle) ret vanskelig at fortolke. . NLP og dets CI er opnået fra de gensidige i ACP (multiplicere dem med 100, hvis disse værdier er angivet i procent). Her får vi NPP = 100: 6 = 16,6 med en 95% CI på -14,3 til 5,3. Som det kan ses af fodnoten "d" i tabel. A1.1, denne CI inkluderer værdier for NTPP fra 5,3 til uendeligt og NTLP fra 14,3 til uendeligt.

CI'er kan konstrueres til de mest almindeligt anvendte statistiske estimater eller sammenligninger. For RCT'er inkluderer det forskellen mellem gennemsnitlige proportioner, relative risici, oddsforhold og NRR'er. Tilsvarende kan CI'er opnås for alle større estimater lavet i undersøgelser af diagnostisk testnøjagtighed - sensitivitet, specificitet, positiv prædiktiv værdi (som alle er simple proportioner) og sandsynlighedsforhold - estimater opnået i metaanalyser og sammenligning-til-kontrol undersøgelser. Et personligt computerprogram, der dækker mange af disse anvendelser af DI, er tilgængeligt med anden udgave af Statistics with Confidence. Makroer til beregning af CI'er for proportioner er frit tilgængelige for Excel og de statistiske programmer SPSS og Minitab på http://www.uwcm.ac.uk/study/medicine/epidemiology_statistics/research/statistics/proportions, htm.

Flere evalueringer af behandlingseffekt

Selvom konstruktionen af ​​CI'er er ønskelig for primære undersøgelsesresultater, er de ikke nødvendige for alle resultater. CI vedrører klinisk vigtige sammenligninger. For eksempel, når man sammenligner to grupper, er den korrekte CI den, der er bygget til forskellen mellem grupperne, som vist i eksemplerne ovenfor, og ikke den CI, der kan bygges for estimatet i hver gruppe. Ikke alene er det nytteløst at give separate CI'er for scoringerne i hver gruppe, denne præsentation kan være vildledende. Tilsvarende er den korrekte tilgang, når man sammenligner behandlingseffektivitet i forskellige undergrupper, at sammenligne to (eller flere) undergrupper direkte. Det er forkert at antage, at behandling kun er effektiv i én undergruppe, hvis dens CI udelukker værdien, der svarer til ingen effekt, mens andre ikke gør. CI'er er også nyttige, når man sammenligner resultater på tværs af flere undergrupper. På fig. A1.1 viser den relative risiko for eclampsia hos kvinder med præeklampsi i undergrupper af kvinder fra en placebokontrolleret RCT af magnesiumsulfat.

Ris. A1.2. Skovgrafen viser resultaterne af 11 randomiserede kliniske forsøg med bovin rotavirusvaccine til forebyggelse af diarré versus placebo. 95 % konfidensintervallet blev brugt til at estimere den relative risiko for diarré. Størrelsen af ​​den sorte firkant er proportional med mængden af ​​information. Derudover vises et sammenfattende estimat af behandlingseffektivitet og et 95 % konfidensinterval (angivet med en diamant). Metaanalysen brugte en model med tilfældige effekter, der overstiger nogle på forhånd etablerede; det kunne f.eks. være den størrelse, der bruges til at beregne stikprøvestørrelsen. Under et strengere kriterium skal hele rækken af ​​CI'er vise en fordel, der overstiger et forudbestemt minimum.

Vi har allerede diskuteret fejlen i at tage fraværet af statistisk signifikans som en indikation af, at to behandlinger er lige effektive. Det er lige så vigtigt ikke at sætte lighedstegn mellem statistisk signifikans og klinisk signifikans. Klinisk betydning kan antages, når resultatet er statistisk signifikant og størrelsen af ​​behandlingsresponsen

Undersøgelser kan vise, om resultaterne er statistisk signifikante, og hvilke der er klinisk vigtige, og hvilke der ikke er. På fig. A1.2 viser resultaterne af fire forsøg, for hvilke hele CI<1, т.е. их результаты статистически значимы при Р <0,05 , . После высказанного предположения о том, что клинически важным различием было бы сокращение риска диареи на 20% (ОР = 0,8), все эти испытания показали клинически значимую оценку сокращения риска, и лишь в исследовании Treanor весь 95% ДИ меньше этой величины. Два других РКИ показали клинически важные результаты, которые не были статистически значимыми. Обратите внимание, что в трёх испытаниях точечные оценки эффективности лечения были почти идентичны, но ширина ДИ различалась (отражает размер выборки). Таким образом, по отдельности доказательная сила этих РКИ различна.

Og andre. Alle er skøn over deres teoretiske modstykker, som kunne opnås, hvis der ikke var en stikprøve, men den generelle befolkning. Men desværre er befolkningen generelt meget dyr og ofte utilgængelig.

Begrebet interval estimering

Ethvert prøveestimat har en vis spredning, fordi er en tilfældig variabel afhængig af værdierne i en bestemt prøve. Derfor, for mere pålidelige statistiske slutninger, bør man ikke kun kende punktestimatet, men også intervallet, som med stor sandsynlighed γ (gamma) dækker den estimerede indikator θ (theta).

Formelt er disse to sådanne værdier (statistik) T1(X) og T2(X), hvad T1< T 2 , for hvilket på et givet sandsynlighedsniveau γ betingelse er opfyldt:

Kort sagt, det er sandsynligt γ eller mere er den sande værdi mellem punkterne T1(X) og T2(X), som kaldes de nedre og øvre grænser konfidensinterval.

En af betingelserne for at konstruere konfidensintervaller er dens maksimale snæverhed, dvs. det skal være så kort som muligt. Lyst er ganske naturligt, fordi. forskeren forsøger mere præcist at lokalisere fundet af den ønskede parameter.

Det følger heraf, at konfidensintervallet bør dække de maksimale sandsynligheder for fordelingen. og selve partituret være i centrum.

Det vil sige, at sandsynligheden for afvigelse (for den sande indikator fra estimatet) opad er lig med sandsynligheden for afvigelse nedad. Det skal også bemærkes, at for skæve fordelinger er intervallet til højre ikke lig med intervallet til venstre.

Ovenstående figur viser tydeligt, at jo større konfidensniveau, desto bredere er intervallet - en direkte sammenhæng.

Dette var en lille introduktion til teorien om intervalestimering af ukendte parametre. Lad os gå videre til at finde tillidsgrænser for den matematiske forventning.

Konfidensinterval for matematisk forventning

Hvis de oprindelige data er fordelt over , vil gennemsnittet være en normal værdi. Dette følger af reglen om, at en lineær kombination af normalværdier også har en normalfordeling. For at beregne sandsynligheder kunne vi derfor bruge normalfordelingslovens matematiske apparat.

Dette vil dog kræve kendskab til to parametre - den forventede værdi og variansen, som normalt ikke er kendt. Man kan selvfølgelig bruge estimater i stedet for parametre (aritmetisk middelværdi og ), men så vil fordelingen af ​​middelværdien ikke være helt normal, den bliver lidt fladt ned. Borgeren William Gosset fra Irland bemærkede behændigt dette faktum, da han offentliggjorde sin opdagelse i marts 1908-udgaven af ​​Biometrica. Af hensyn til tavshedspligten underskrev Gosset med Student. Sådan fremstod Elevens t-fordeling.

Imidlertid er den normale fordeling af data, brugt af K. Gauss i analysen af ​​fejl i astronomiske observationer, ekstremt sjælden i jordbaseret liv, og det er ret svært at fastslå dette (for høj nøjagtighed er der brug for omkring 2 tusinde observationer). Derfor er det bedst at droppe normalitetsantagelsen og bruge metoder, der ikke afhænger af fordelingen af ​​de originale data.

Spørgsmålet opstår: hvad er fordelingen af ​​det aritmetiske middelværdi, hvis det beregnes ud fra data fra en ukendt fordeling? Svaret er givet af den velkendte inden for sandsynlighedsteori Central grænsesætning(CPT). I matematik er der flere versioner af det (formuleringerne er blevet forfinet gennem årene), men alle sammen kommer groft sagt ud til at sige, at summen af ​​en lang række uafhængige stokastiske variable overholder normalfordelingsloven.

Ved beregning af det aritmetiske middelværdi anvendes summen af ​​stokastiske variable. Heraf viser det sig, at det aritmetiske middel har en normalfordeling, hvor den forventede værdi er den forventede værdi af de indledende data, og variansen er .

Smarte mennesker ved, hvordan man beviser CLT, men vi vil verificere dette ved hjælp af et eksperiment udført i Excel. Lad os simulere en stikprøve på 50 ensartet fordelte tilfældige variabler (ved hjælp af Excel-funktionen TILFÆLDIG MELLEM). Så laver vi 1000 sådanne prøver og beregner det aritmetiske gennemsnit for hver. Lad os se på deres fordeling.

Det kan ses, at fordelingen af ​​gennemsnittet er tæt på normalloven. Hvis mængden af ​​prøver og deres antal gøres endnu større, vil ligheden være endnu bedre.

Nu hvor vi selv har set CLT'ens gyldighed, kan vi ved hjælp af , beregne konfidensintervallerne for det aritmetiske middelværdi, som dækker den sande middelværdi eller den matematiske forventning med en given sandsynlighed.

For at etablere de øvre og nedre grænser er det nødvendigt at kende parametrene for normalfordelingen. Som regel er de ikke, derfor anvendes estimater: aritmetisk middelværdi og prøvevarians. Igen giver denne metode kun en god tilnærmelse for store prøver. Når stikprøverne er små, anbefales det ofte at bruge Students fordeling. Tro ikke! Elevens fordeling for middelværdien opstår kun, når de oprindelige data har en normalfordeling, det vil sige næsten aldrig. Derfor er det bedre straks at indstille minimumsbjælken for mængden af ​​nødvendige data og bruge asymptotisk korrekte metoder. De siger, at 30 observationer er nok. Tag 50 - du kan ikke gå galt.

T 1.2 er de nedre og øvre grænser for konfidensintervallet

– prøve aritmetisk gennemsnit

s0– prøvestandardafvigelse (uvildig)

n - prøvestørrelse

γ – konfidensniveau (normalt lig med 0,9, 0,95 eller 0,99)

c γ =Φ -1 ((1+γ)/2) er den gensidige af standard normalfordelingsfunktionen. Enkelt sagt er dette antallet af standardfejl fra det aritmetiske middel til den nedre eller øvre grænse (de angivne tre sandsynligheder svarer til værdierne 1,64, 1,96 og 2,58).

Essensen af ​​formlen er, at det aritmetiske middelværdi tages, og så sættes en vis mængde til side ( med γ) standardfejl ( s 0 /√n). Alt er kendt, tag det og tæl.

Før massebrugen af ​​pc'er, for at opnå værdierne af normalfordelingsfunktionen og dens omvendte, brugte de . De bruges stadig, men det er mere effektivt at vende sig til færdige Excel-formler. Alle elementer fra formlen ovenfor ( , og ) kan nemt beregnes i Excel. Men der er også en færdig formel til beregning af konfidensintervallet - TILLIDSNORM. Dens syntaks er følgende.

KONFIDENS NORM(alfa, standard_dev, størrelse)

alfa– signifikansniveau eller konfidensniveau, som i ovenstående notation er lig med 1-γ, dvs. sandsynligheden for, at den matematiskeforventningen vil ligge uden for konfidensintervallet. Med et konfidensniveau på 0,95 er alfa 0,05, og så videre.

standard_off er standardafvigelsen for prøvedataene. Du behøver ikke at beregne standardfejlen, Excel vil dividere med roden af ​​n.

størrelsen– prøvestørrelse (n).

Resultatet af funktionen CONFIDENCE.NORM er det andet led fra formlen til beregning af konfidensintervallet, dvs. halvt interval. Følgelig er de nedre og øvre punkter gennemsnittet ± den opnåede værdi.

Det er således muligt at bygge en universel algoritme til beregning af konfidensintervaller for det aritmetiske middelværdi, som ikke afhænger af fordelingen af ​​de indledende data. Prisen for universalitet er dens asymptotiske natur, dvs. behovet for at bruge relativt store prøver. Men i den moderne teknologis tidsalder er det normalt ikke svært at indsamle den rigtige mængde data.

Test af statistiske hypoteser ved hjælp af et konfidensinterval

(modul 111)

Et af de vigtigste problemer, der løses i statistik, er. I en nøddeskal er dens essens dette. Der antages f.eks., at forventningen til befolkningen generelt er lig med en eller anden værdi. Derefter konstrueres fordelingen af ​​stikprøvemiddelværdier, som kan observeres med en given forventning. Dernæst ser vi på, hvor i denne betingede fordeling det reelle gennemsnit er placeret. Hvis det går ud over de tilladte grænser, så er udseendet af et sådant gennemsnit meget usandsynligt, og med en enkelt gentagelse af eksperimentet er det næsten umuligt, hvilket er i modstrid med den fremsatte hypotese, som med succes forkastes. Hvis gennemsnittet ikke går ud over det kritiske niveau, så afvises hypotesen ikke (men den er heller ikke bevist!).

Så ved hjælp af konfidensintervaller, i vores tilfælde for forventningen, kan du også teste nogle hypoteser. Det er meget nemt at gøre. Antag, at det aritmetiske middelværdi for en prøve er 100. Hypotesen testes, at den forventede værdi f.eks. er 90. Det vil sige, hvis vi sætter spørgsmålet primitivt, lyder det sådan: kan det være, at med den sande værdi af gennemsnit lig med 90, det observerede gennemsnit var 100?

For at besvare dette spørgsmål vil der være behov for yderligere oplysninger om standardafvigelse og stikprøvestørrelse. Lad os sige, at standardafvigelsen er 30, og antallet af observationer er 64 (for nemt at udtrække roden). Så er standardfejlen for middelværdien 30/8 eller 3,75. For at beregne 95 % konfidensintervallet skal du tilsidesætte to standardfejl på begge sider af middelværdien (mere præcist 1,96). Konfidensintervallet vil være cirka 100 ± 7,5 eller fra 92,5 til 107,5.

Yderligere begrundelse er som følger. Hvis den testede værdi falder inden for konfidensintervallet, så modsiger den ikke hypotesen, da passer inden for grænserne for tilfældige udsving (med en sandsynlighed på 95%). Hvis det testede punkt er uden for konfidensintervallet, så er sandsynligheden for en sådan hændelse meget lille, under alle omstændigheder under det acceptable niveau. Derfor afvises hypotesen som i modstrid med de observerede data. I vores tilfælde er forventningshypotesen uden for konfidensintervallet (den testede værdi på 90 er ikke inkluderet i intervallet 100±7,5), så den bør forkastes. Som besvarelse af det primitive spørgsmål ovenfor bør man sige: nej, det kan i hvert fald ikke, dette sker ekstremt sjældent. Ofte indikerer dette en specifik sandsynlighed for fejlagtig afvisning af hypotesen (p-niveau), og ikke et givet niveau, som konfidensintervallet er bygget efter, men mere om det en anden gang.

Som du kan se, er det ikke svært at opbygge et konfidensinterval for middelværdien (eller den matematiske forventning). Det vigtigste er at fange essensen, og så vil tingene gå. I praksis bruger de fleste 95 % konfidensintervallet, som er omkring to standardfejl brede på hver side af middelværdien.

Det er alt for nu. Alt det bedste!

KONFIDENSINTERVALLER FOR FREKVENSER OG DELE

© 2008

Statens Institut for Folkesundhed, Oslo, Norge

Artiklen beskriver og diskuterer beregningen af ​​konfidensintervaller for frekvenser og proportioner ved brug af Wald, Wilson, Klopper-Pearson metoderne, ved brug af vinkeltransformationen og Wald metoden med Agresti-Cowll korrektion. Det fremlagte materiale giver generel information om metoderne til beregning af konfidensintervaller for frekvenser og proportioner og har til formål at vække interesse hos tidsskriftets læsere ikke blot for at anvende konfidensintervaller ved præsentation af resultaterne af egen forskning, men også ved læsning af speciallitteratur før påbegynde arbejdet med fremtidige udgivelser.

Nøgleord: konfidensinterval, frekvens, proportion

I en af ​​de tidligere publikationer blev beskrivelsen af ​​kvalitative data kort nævnt, og det blev rapporteret, at deres intervalestimering er at foretrække frem for et punktestimat til at beskrive hyppigheden af ​​forekomsten af ​​den undersøgte karakteristik i den generelle befolkning. Da undersøgelser udføres ved hjælp af stikprøvedata, skal fremskrivningen af ​​resultaterne på den generelle befolkning faktisk indeholde et element af unøjagtighed i stikprøveestimatet. Konfidensintervallet er et mål for nøjagtigheden af ​​den estimerede parameter. Det er interessant, at i nogle bøger om det grundlæggende i statistik for læger ignoreres emnet konfidensintervaller for frekvenser fuldstændigt. I denne artikel vil vi overveje flere måder at beregne konfidensintervaller for frekvenser på, idet vi antager stikprøvekarakteristika såsom ikke-gentagelse og repræsentativitet, samt uafhængigheden af ​​observationer fra hinanden. Hyppigheden i denne artikel forstås ikke som et absolut tal, der viser, hvor mange gange denne eller hin værdi forekommer samlet, men en relativ værdi, der bestemmer andelen af ​​undersøgelsesdeltagere, der har egenskaben under undersøgelse.

I biomedicinsk forskning er 95 % konfidensintervaller mest almindeligt anvendt. Dette konfidensinterval er det område, inden for hvilket den sande andel falder 95 % af tiden. Med andre ord kan det siges med 95 % sikkerhed, at den sande værdi af hyppigheden af ​​forekomst af et træk i den generelle befolkning vil være inden for 95 % konfidensintervallet.

De fleste statistiske lærebøger for medicinske forskere rapporterer, at frekvensfejlen beregnes ved hjælp af formlen

hvor p er hyppigheden af ​​forekomsten af ​​træk i prøven (værdi fra 0 til 1). I de fleste indenlandske videnskabelige artikler er værdien af ​​hyppigheden af ​​forekomsten af ​​et træk i prøven (p) angivet, såvel som dens fejl (s) i form af p ± s. Det er dog mere hensigtsmæssigt at præsentere et 95 % konfidensinterval for hyppigheden af ​​forekomst af et træk i den generelle befolkning, som vil omfatte værdier fra

Før.

I nogle lærebøger anbefales det for små prøver at erstatte værdien af ​​1,96 med værdien af ​​t for N - 1 frihedsgrader, hvor N er antallet af observationer i prøven. Værdien af ​​t findes i tabellerne for t-fordelingen, som findes i næsten alle lærebøger om statistik. Brugen af ​​fordelingen af ​​t for Wald-metoden giver ikke synlige fordele i forhold til andre metoder diskuteret nedenfor, og er derfor ikke velkommen af ​​nogle forfattere.

Ovenstående metode til beregning af konfidensintervaller for frekvenser eller brøker er opkaldt efter Abraham Wald (Abraham Wald, 1902-1950), da den begyndte at blive meget brugt efter udgivelsen af ​​Wald og Wolfowitz i 1939. Selve metoden blev imidlertid foreslået af Pierre Simon Laplace (1749–1827) allerede i 1812.

Wald-metoden er meget populær, men dens anvendelse er forbundet med betydelige problemer. Metoden anbefales ikke til små stikprøvestørrelser, såvel som i tilfælde, hvor hyppigheden af ​​forekomst af en funktion har tendens til 0 eller 1 (0 % eller 100 %) og simpelthen ikke er mulig for frekvenser på 0 og 1. normalfordelingstilnærmelsen, som bruges ved beregning af fejlen, "virker ikke" i tilfælde, hvor n p< 5 или n · (1 – p) < 5 . Более консервативные статистики считают, что n · p и n · (1 – p) должны быть не менее 10 . Более детальное рассмотрение метода Вальда показало, что полученные с его помощью доверительные интервалы в большинстве случаев слишком узки, то есть их применение ошибочно создает слишком оптимистичную картину, особенно при удалении частоты встречаемости признака от 0,5, или 50 % . К тому же при приближении частоты к 0 или 1 доверительный интревал может принимать отрицательные значения или превышать 1, что выглядит абсурдно для частот. Многие авторы совершенно справедливо не рекомендуют применять данный метод не только в уже упомянутых случаях, но и тогда, когда частота встречаемости признака менее 25 % или более 75 % . Таким образом, несмотря на простоту расчетов, метод Вальда может применяться лишь в очень ограниченном числе случаев. Зарубежные исследователи более категоричны в своих выводах и однозначно рекомендуют не применять этот метод для небольших выборок , а ведь именно с такими выборками часто приходится иметь дело исследователям-медикам.

Da den nye variabel er normalfordelt, vil den nedre og øvre grænse for 95 % konfidensintervallet for variabel φ være φ-1,96 og φ+1,96venstre">

I stedet for 1,96 for små prøver anbefales det at erstatte værdien af ​​t med N - 1 frihedsgrader. Denne metode giver ikke negative værdier og giver dig mulighed for mere præcist at estimere konfidensintervallerne for frekvenser end Wald-metoden. Derudover er den beskrevet i mange indenlandske opslagsværker om medicinsk statistik, som dog ikke førte til dens udbredte anvendelse i medicinsk forskning. Beregning af konfidensintervaller ved hjælp af en vinkeltransformation anbefales ikke til frekvenser, der nærmer sig 0 eller 1.

Det er her beskrivelsen af ​​metoder til at estimere konfidensintervaller i de fleste bøger om det grundlæggende i statistik for medicinske forskere normalt slutter, og dette problem er typisk ikke kun for indenlandsk, men også for udenlandsk litteratur. Begge metoder er baseret på den centrale grænsesætning, som indebærer en stor stikprøve.

Under hensyntagen til manglerne ved at estimere konfidensintervaller ved hjælp af ovenstående metoder, foreslog Clopper (Clopper) og Pearson (Pearson) i 1934 en metode til beregning af det såkaldte eksakte konfidensinterval under hensyntagen til den binomiale fordeling af det undersøgte træk. Denne metode er tilgængelig i mange online-beregnere, dog er konfidensintervallerne opnået på denne måde i de fleste tilfælde for brede. Samtidig anbefales denne metode til brug i tilfælde, hvor et konservativt skøn er påkrævet. Graden af ​​konservativitet af metoden stiger, når prøvestørrelsen falder, især for N< 15 . описывает применение функции биномиального распределения для анализа качественных данных с использованием MS Excel, в том числе и для определения доверительных интервалов, однако расчет последних для частот в электронных таблицах не «затабулирован» в удобном для пользователя виде, а потому, вероятно, и не используется большинством исследователей.

Ifølge mange statistikere udføres det mest optimale estimat af konfidensintervaller for frekvenser ved hjælp af Wilson-metoden, foreslået tilbage i 1927, men praktisk talt ikke brugt i indenlandsk biomedicinsk forskning. Denne metode gør det ikke kun muligt at estimere konfidensintervaller for både meget små og meget høje frekvenser, men er også anvendelig til et lille antal observationer. Generelt har konfidensintervallet ifølge Wilson-formlen formen fra



hvor den tager værdien 1,96 ved beregning af 95 % konfidensintervallet, N er antallet af observationer, og p er frekvensen af ​​træk i stikprøven. Denne metode er tilgængelig i online regnemaskiner, så dens anvendelse er ikke problematisk. og anbefaler ikke at bruge denne metode til n s< 4 или n · (1 – p) < 4 по причине слишком грубого приближения распределения р к нормальному в такой ситуации, однако зарубежные статистики считают метод Уилсона применимым и для малых выборок .

Ud over Wilson-metoden menes den Agresti-Caull-korrigerede Wald-metode også at give et optimalt estimat af konfidensintervallet for frekvenser. Agresti-Coulle-korrektionen er en erstatning i Wald-formlen af ​​hyppigheden af ​​forekomst af et træk i stikprøven (p) med p`, når man beregner hvilken 2 der lægges til tælleren, og 4 lægges til nævneren, dvs. , p` = (X + 2) / (N + 4), hvor X er antallet af undersøgelsesdeltagere, der har egenskaben under undersøgelse, og N er stikprøvestørrelsen. Denne modifikation giver resultater, der ligner dem i Wilson-formlen, undtagen når hændelsesraten nærmer sig 0 % eller 100 %, og prøven er lille. Ud over ovenstående metoder til beregning af konfidensintervaller for frekvenser er der foreslået korrektioner for kontinuitet for både Wald-metoden og Wilson-metoden for små prøver, men undersøgelser har vist, at deres anvendelse er uhensigtsmæssig.

Overvej anvendelsen af ​​ovenstående metoder til beregning af konfidensintervaller ved hjælp af to eksempler. I det første tilfælde studerer vi en stor stikprøve på 1.000 tilfældigt udvalgte undersøgelsesdeltagere, hvoraf 450 har den egenskab, der undersøges (det kan være en risikofaktor, et resultat eller en hvilken som helst anden egenskab), som er en frekvens på 0,45, eller 45 %. I det andet tilfælde udføres undersøgelsen ved hjælp af en lille stikprøve, f.eks. kun 20 personer, og kun 1 deltager i undersøgelsen (5%) har den egenskab, der undersøges. Konfidensintervaller for Wald-metoden, for Wald-metoden med Agresti-Coll-korrektion, for Wilson-metoden blev beregnet ved hjælp af en online-beregner udviklet af Jeff Sauro (http://www./wald.htm). Kontinuitetskorrigerede Wilson-konfidensintervaller blev beregnet ved hjælp af lommeregneren leveret af Wassar Stats: Web Site for Statistical Computation (http://faculty.vassar.edu/lowry/prop1.html). Beregninger ved hjælp af Fisher-vinkeltransformationen blev udført "manuelt" under anvendelse af den kritiske værdi af t for henholdsvis 19 og 999 frihedsgrader. Beregningsresultaterne er vist i tabellen for begge eksempler.

Konfidensintervaller beregnet på seks forskellige måder for de to eksempler beskrevet i teksten

Metode til beregning af konfidensinterval

P=0,0500 eller 5 %

95 % CI for X=450, N=1000, P=0,4500 eller 45 %

–0,0455–0,2541

Walda med Agresti-Coll korrektion

<,0001–0,2541

Wilson med kontinuitetskorrektion

Klopper-Pearsons "præcise metode"

Vinkel transformation

<0,0001–0,1967

Som det kan ses af tabellen, går konfidensintervallet beregnet ved den "generelt accepterede" Wald-metode for det første eksempel ind i det negative område, hvilket ikke kan være tilfældet for frekvenser. Desværre er sådanne hændelser ikke ualmindelige i russisk litteratur. Den traditionelle måde at repræsentere data på som en frekvens og dens fejl maskerer delvist dette problem. For eksempel, hvis hyppigheden af ​​forekomst af et træk (i procent) præsenteres som 2,1 ± 1,4, så er dette ikke så "irriterende" som 2,1 % (95 % CI: –0,7; 4,9), selvom og betyder det samme. Wald-metoden med Agresti-Coll-korrektionen og beregningen ved hjælp af vinkeltransformationen giver en nedre grænse, der har en tendens til nul. Wilson-metoden med kontinuitetskorrektion og den "nøjagtige metode" giver bredere konfidensintervaller end Wilson-metoden. For det andet eksempel giver alle metoder omtrent de samme konfidensintervaller (forskelle vises kun i tusindedele), hvilket ikke er overraskende, da frekvensen af ​​hændelsen i dette eksempel ikke afviger meget fra 50 %, og stikprøvestørrelsen er ret stor .

For læsere, der er interesseret i dette problem, kan vi anbefale værkerne af R. G. Newcombe og Brown, Cai og Dasgupta, som giver fordele og ulemper ved at bruge henholdsvis 7 og 10 forskellige metoder til at beregne konfidensintervaller. Fra hjemlige manualer anbefales bogen og, hvori udover en detaljeret beskrivelse af teorien præsenteres Wald og Wilson metoderne, samt en metode til beregning af konfidensintervaller under hensyntagen til den binomiale frekvensfordeling. Ud over gratis online-beregnere (http://www./wald.htm og http://faculty.vassar.edu/lowry/prop1.html), kan konfidensintervaller for frekvenser (og ikke kun!) beregnes ved hjælp af CIA-program (Confidence Intervals Analysis), som kan downloades fra http://www. medskole. soton. ac. dk/cia/ .

Den næste artikel vil se på univariate måder at sammenligne kvalitative data på.

Bibliografi

Banerjee A. Medicinsk statistik i almindeligt sprog: et introduktionskursus / A. Banerzhi. - M. : Praktisk medicin, 2007. - 287 s. Medicinsk statistik / . - M. : Lægeinformationsstyrelsen, 2007. - 475 s. Glanz S. Mediko-biologisk statistik / S. Glants. - M.: Praksis, 1998. Datatyper, distributionstest og beskrivende statistik / // Human Ecology - 2008. - Nr. 1. - S. 52–58. Zhizhin K.S.. Medicinsk statistik: lærebog / . - Rostov n / D: Phoenix, 2007. - 160 s. Anvendt medicinsk statistik / , . - Sankt Petersborg. : Folio, 2003. - 428 s. Lakin G. F. Biometri / . - M. : Højere skole, 1990. - 350 s. Læge V.A. Matematisk statistik i medicin / , . - M. : Finans og statistik, 2007. - 798 s. Matematisk statistik i klinisk forskning / , . - M. : GEOTAR-MED, 2001. - 256 s. Junkerov V. Og. Medico-statistisk behandling af medicinske forskningsdata /,. - Sankt Petersborg. : VmedA, 2002. - 266 s. Agresti A. Tilnærmet er bedre end eksakt til intervalestimering af binomiale proportioner / A. Agresti, B. Coull // Amerikansk statistiker. - 1998. - N 52. - S. 119-126. Altman D. Statistik med tillid // D. Altman, D. Machin, T. Bryant, M. J. Gardner. - London: BMJ Books, 2000. - 240 s. Brown L.D. Interval estimering for en binomial proportion / L. D. Brown, T. T. Cai, A. Dasgupta // Statistisk videnskab. - 2001. - N 2. - S. 101-133. Clopper C.J. Brugen af ​​tillids- eller tillidsgrænser illustreret i tilfældet med binomialet / C. J. Clopper, E. S. Pearson // Biometrika. - 1934. - N 26. - S. 404-413. Garcia-Perez M.A. Om konfidensintervallet for den binomiale parameter / M. A. Garcia-Perez // Kvalitet og kvantitet. - 2005. - N 39. - P. 467-481. Motulsky H. Intuitiv biostatistik // H. Motulsky. - Oxford: Oxford University Press, 1995. - 386 s. Newcombe R.G. To-sidede konfidensintervaller for den enkelte andel: Sammenligning af syv metoder / R. G. Newcombe // Statistik i medicin. - 1998. - N. 17. - P. 857–872. Sauro J. Estimering af fuldførelsesrater fra små stikprøver ved hjælp af binomiale konfidensintervaller: sammenligninger og anbefalinger / J. Sauro, J. R. Lewis // Årsmøde for samfundet for menneskelige faktorer og ergonomi. – Orlando, FL, 2005. Wald A. Konfidensgrænser for kontinuerte distributionsfunktioner // A. Wald, J. Wolfovitz // Annals of Mathematical Statistics. - 1939. - N 10. - S. 105–118. Wilson E.B. Sandsynlig slutning, arveloven og statistisk slutning / E. B. Wilson // Journal of American Statistical Association. - 1927. - N 22. - S. 209-212.

KONFIDENSINTERVALLER FOR PROPORTIONER

EN. M. Grjibovski

Statens Institut for Folkesundhed, Oslo, Norge

Artiklen præsenterer flere metoder til beregning af konfidensintervaller for binomiale proportioner, nemlig Wald, Wilson, arcsine, Agresti-Coull og eksakte Clopper-Pearson metoder. Artiklen giver kun en generel introduktion til problemet med konfidensintervalestimering af en binomial proportion, og dens formål er ikke kun at stimulere læserne til at bruge konfidensintervaller, når de præsenterer resultater af egen empirisk forskning, men også at tilskynde dem til at konsultere statistikbøger forud for analysere egne data og udarbejde manuskripter.

nøgleord: konfidensinterval, proportion

Kontakt information:

Seniorrådgiver, Statens Institut for Folkesundhed, Oslo, Norge