Konfidensinterval til estimering af middelværdien (varians er kendt) i MS EXCEL.

Konfidensinterval– grænseværdierne for en statistisk størrelse, der med en given konfidenssandsynlighed γ vil ligge i dette interval ved prøvetagning af et større volumen. Benævnt P(θ - ε. I praksis vælges konfidenssandsynligheden γ fra værdier ganske tæt på enhed: γ = 0,9, γ = 0,95, γ = 0,99.

Formålet med tjenesten. Ved at bruge denne tjeneste kan du bestemme:

  • konfidensinterval for den generelle middelværdi, konfidensinterval for variansen;
  • konfidensinterval for standardafvigelsen, konfidensinterval for den generelle aktie;
Den resulterende løsning gemmes i en Word-fil (se eksempel). Nedenfor er en videoinstruktion om, hvordan du udfylder de indledende data.

Eksempel nr. 1. På en kollektiv gård, ud af en samlet besætning på 1000 får, gennemgik 100 får selektiv kontrolklipning. Som følge heraf blev der etableret en gennemsnitlig uldklipning på 4,2 kg pr. Bestem med en sandsynlighed på 0,99 prøvens gennemsnitlige kvadratfejl ved bestemmelse af den gennemsnitlige uldklipning pr. Prøven er ikke-gentagen.
Eksempel nr. 2. Fra et parti af importerede produkter på posten for Moskvas nordlige toldvæsen blev 20 prøver af produkt "A" taget ved tilfældig gentagen prøveudtagning. Som et resultat af testen blev det gennemsnitlige fugtindhold af produkt "A" i prøven fastlagt, hvilket viste sig at være lig med 6% med en standardafvigelse på 1%.
Bestem med sandsynlighed 0,683 grænserne for produktets gennemsnitlige fugtindhold i hele partiet af importerede produkter.
Eksempel nr. 3. En undersøgelse af 36 studerende viste, at det gennemsnitlige antal lærebøger læst af dem i løbet af det akademiske år var lig med 6. Hvis det antages, at antallet af læsebøger af en studerende pr. semester har en normalfordelingslov med en standardafvigelse lig med 6, finder man : A) med en reliabilitet på 0,99 intervalestimat for den matematiske forventning af denne stokastiske variabel; B) med hvilken sandsynlighed kan vi sige, at det gennemsnitlige antal lærebøger læst af en studerende pr. semester, beregnet ud fra denne prøve, vil afvige fra den matematiske forventning i absolut værdi med højst 2.

Klassificering af konfidensintervaller

Efter type parameter, der vurderes:

Efter prøvetype:

  1. Konfidensinterval for en uendelig stikprøve;
  2. Konfidensinterval for den endelige prøve;
Prøven kaldes resampling, hvis det valgte objekt returneres til populationen, før det næste vælges. Prøven kaldes ikke-gentagelse, hvis det valgte objekt ikke returneres til populationen. I praksis beskæftiger vi os normalt med prøver, der ikke gentager sig.

Beregning af den gennemsnitlige stikprøvefejl for stikprøveudtagning

Uoverensstemmelsen mellem værdierne af indikatorer opnået fra prøven og de tilsvarende parametre for den generelle befolkning kaldes repræsentativitetsfejl.
Betegnelser for hovedparametrene for de generelle og stikprøvepopulationer.
Formler for gennemsnitlige stikprøvefejl
genvalggentag valg
for gennemsnittettil delfor gennemsnittettil del
Forholdet mellem prøvetagningsfejlgrænsen (Δ) garanteret med en vis sandsynlighed Р(t), og den gennemsnitlige prøveudtagningsfejl har formen: eller Δ = t·μ, hvor t– konfidenskoefficient, bestemt afhængigt af sandsynlighedsniveauet P(t) i henhold til tabellen for Laplace-integralfunktionen.

Formler til beregning af stikprøvestørrelsen ved hjælp af en rent tilfældig stikprøvemetode

Estimering af konfidensintervaller

Læringsmål

Statistik overvejer følgende to hovedopgaver:

    Vi har et estimat baseret på stikprøvedata, og vi ønsker at lave en sandsynlighedserklæring om, hvor den sande værdi af den estimerede parameter ligger.

    Vi har en specifik hypotese, der skal testes ved hjælp af prøvedata.

I dette emne behandler vi den første opgave. Lad os også introducere definitionen af ​​et konfidensinterval.

Et konfidensinterval er et interval, der er bygget op omkring den estimerede værdi af en parameter og viser, hvor den sande værdi af den estimerede parameter er placeret med en a priori specificeret sandsynlighed.

Efter at have studeret materialet om dette emne, skal du:

    lære, hvad et konfidensinterval er for et estimat;

    lære at klassificere statistiske problemer;

    mestre teknikken til at konstruere konfidensintervaller, både ved hjælp af statistiske formler og ved hjælp af softwareværktøjer;

    lære at bestemme de nødvendige stikprøvestørrelser for at opnå visse parametre for nøjagtighed af statistiske estimater.

Fordelinger af prøvekarakteristika

T-fordeling

Som diskuteret ovenfor er fordelingen af ​​den stokastiske variabel tæt på den standardiserede normalfordeling med parametrene 0 og 1. Da vi ikke kender værdien af ​​σ, erstatter vi den med et estimat af s. Mængden har allerede en anden fordeling, nemlig eller Elevfordeling, som er bestemt af parameteren n -1 (antallet af frihedsgrader). Denne fordeling er tæt på normalfordelingen (jo større n, jo tættere er fordelingerne).

I fig. 95
Elevfordelingen med 30 frihedsgrader præsenteres. Som du kan se, er det meget tæt på normalfordelingen.

I lighed med funktionerne til at arbejde med normalfordelingen NORMIDIST og NORMINV, er der funktioner til at arbejde med t-fordelingen - STUDIST (TDIST) og STUDRASOBR (TINV). Et eksempel på brug af disse funktioner kan ses i filen STUDRASP.XLS (skabelon og løsning) og i Fig. 96
.

Fordelinger af andre egenskaber

Som vi allerede ved, har vi brug for en t-fordeling for at bestemme nøjagtigheden af ​​at estimere den matematiske forventning. For at estimere andre parametre, såsom varians, kræves forskellige fordelinger. To af dem er F-fordelingen og x 2 -fordeling.

Konfidensinterval for middelværdien

Konfidensinterval- dette er et interval, der er bygget op omkring den estimerede værdi af parameteren og viser, hvor den sande værdi af den estimerede parameter er placeret med en a priori specificeret sandsynlighed.

Konstruktionen af ​​et konfidensinterval for gennemsnitsværdien forekommer på følgende måde:

Eksempel

Fastfood-restauranten planlægger at udvide sit sortiment med en ny type sandwich. For at vurdere efterspørgslen efter det, planlægger lederen tilfældigt at udvælge 40 besøgende blandt dem, der allerede har prøvet det, og bede dem vurdere deres holdning til det nye produkt på en skala fra 1 til 10. Lederen ønsker at estimere den forventede antal point, som det nye produkt vil modtage, og konstruer et 95 % konfidensinterval for dette estimat. Hvordan gør man dette? (se fil SANDWICH1.XLS (skabelon og løsning).

Løsning

For at løse dette problem kan du bruge . Resultaterne er vist i fig. 97
.

Konfidensinterval for samlet værdi

Nogle gange er det ved hjælp af stikprøvedata nødvendigt at estimere ikke den matematiske forventning, men den samlede sum af værdier. For eksempel kan interessen i en situation med en revisor være i at estimere ikke den gennemsnitlige kontostørrelse, men summen af ​​alle konti.

Lad N være det samlede antal elementer, n være stikprøvestørrelsen, T 3 være summen af ​​værdierne i stikprøven, T" være estimatet for summen af ​​hele populationen, så , og konfidensintervallet beregnes ved formlen , hvor s er estimatet af standardafvigelsen for prøven, og er estimatet af middelværdien for prøven.

Eksempel

Lad os sige, at et skattebureau ønsker at anslå de samlede skatterefusioner for 10.000 skatteydere. Skatteyderen modtager enten refusion eller betaler yderligere skat. Find 95 % konfidensintervallet for refusionsbeløbet, under antagelse af en stikprøvestørrelse på 500 personer (se filen REFUNDBETALELSE.XLS (skabelon og løsning).

Løsning

StatPro har ikke en særlig procedure for dette tilfælde, dog kan det bemærkes, at grænserne kan hentes ud fra grænserne for gennemsnittet ud fra ovenstående formler (Fig. 98)
).

Konfidensinterval for proportioner

Lad p være den matematiske forventning til andelen af ​​klienter, og lad p b være estimatet af denne andel opnået fra en stikprøve af størrelse n. Det kan påvises, at for tilstrækkeligt store vurderingsfordelingen vil være tæt på normalen med matematisk forventning p og standardafvigelse . Standardfejlen for estimering i dette tilfælde er udtrykt som , og konfidensintervallet er som .

Eksempel

Fastfood-restauranten planlægger at udvide sit sortiment med en ny type sandwich. For at vurdere efterspørgslen efter det, udvalgte lederen tilfældigt 40 besøgende blandt dem, der allerede havde prøvet det, og bad dem vurdere deres holdning til det nye produkt på en skala fra 1 til 10. Lederen ønsker at estimere den forventede andel af det nye produkt. kunder, der vurderer det nye produkt til mindst 6 point (han forventer, at disse kunder vil være forbrugerne af det nye produkt).

Løsning

I første omgang opretter vi en ny kolonne baseret på attribut 1, hvis klientens vurdering var mere end 6 point og 0 ellers (se fil SANDWICH2.XLS (skabelon og løsning).

Metode 1

Ved at tælle tallet 1 estimerer vi andelen og bruger derefter formlerne.

Zcr-værdien er taget fra specielle normalfordelingstabeller (f.eks. 1,96 for et 95 % konfidensinterval).

Ved at bruge denne tilgang og specifikke data til at konstruere et 95 % interval opnår vi følgende resultater (fig. 99)
). Den kritiske værdi af parameteren zcr er 1,96. Estimatets standardfejl er 0,077. Den nedre grænse for konfidensintervallet er 0,475. Den øvre grænse for konfidensintervallet er 0,775. Lederen har således ret til at tro med 95 % sikkerhed, at procentdelen af ​​kunder, der vurderer det nye produkt 6 point eller højere, vil være mellem 47,5 og 77,5.

Metode 2

Dette problem kan løses ved hjælp af standard StatPro-værktøjer. For at gøre dette er det nok at bemærke, at andelen i dette tilfælde falder sammen med den gennemsnitlige værdi af kolonnen Type. Dernæst ansøger vi StatPro/Statistical Inference/One-Sample Analysis at konstruere et konfidensinterval af middelværdien (estimat af den matematiske forventning) for kolonnen Type. De opnåede resultater i dette tilfælde vil være meget tæt på resultaterne af den 1. metode (fig. 99).

Konfidensinterval for standardafvigelse

s bruges som et estimat for standardafvigelsen (formlen er givet i afsnit 1). Tæthedsfunktionen af ​​estimatet s er chi-kvadratfunktionen, der ligesom t-fordelingen har n-1 frihedsgrader. Der er specielle funktioner til at arbejde med denne distribution CHIDIST og CHIINV.

Konfidensintervallet i dette tilfælde vil ikke længere være symmetrisk. Et konventionelt grænsediagram er vist i fig. 100 .

Eksempel

Maskinen skal producere dele med en diameter på 10 cm.Der opstår dog fejl på grund af forskellige forhold. Kvalitetskontrolløren er bekymret over to forhold: For det første skal den gennemsnitlige værdi være 10 cm; for det andet, selv i dette tilfælde, hvis afvigelserne er store, så vil mange dele blive afvist. Hver dag laver han en prøve på 50 dele (se filen KVALITETSKONTROL.XLS (skabelon og løsning). Hvilke konklusioner kan sådan en prøve give?

Løsning

Lad os konstruere 95 % konfidensintervaller for middelværdien og standardafvigelsen vha StatPro/Statistical Inference/One-Sample Analysis(Fig. 101
).

Dernæst, ved hjælp af antagelsen om en normal fordeling af diametre, beregner vi andelen af ​​defekte produkter og sætter en maksimal afvigelse på 0,065. Ved hjælp af mulighederne i substitutionstabellen (i tilfælde af to parametre) plotter vi afhængigheden af ​​andelen af ​​defekter af gennemsnitsværdien og standardafvigelsen (fig. 102)
).

Konfidensinterval for forskellen mellem to middelværdier

Dette er en af ​​de vigtigste anvendelser af statistiske metoder. Eksempler på situationer.

    En tøjbutikschef vil gerne vide, hvor meget mere eller mindre den gennemsnitlige kvindelige kunde bruger i butikken end den gennemsnitlige mandlige kunde.

    De to flyselskaber flyver lignende ruter. En forbrugerorganisation vil gerne sammenligne forskellen mellem de gennemsnitlige forventede flyforsinkelser for begge flyselskaber.

    Virksomheden udsender kuponer for visse typer varer i en by og ikke i en anden. Ledere ønsker at sammenligne de gennemsnitlige købsvolumener af disse produkter over de næste to måneder.

    En bilforhandler handler ofte med ægtepar ved præsentationer. For at forstå deres personlige reaktioner på præsentationen bliver par ofte interviewet hver for sig. Lederen ønsker at vurdere forskellen i vurderingerne givet af mænd og kvinder.

Tilfælde af uafhængige prøver

Forskellen mellem midlerne vil have en t-fordeling med n 1 + n 2 - 2 frihedsgrader. Konfidensintervallet for μ 1 - μ 2 er udtrykt ved relationen:

Dette problem kan løses ikke kun ved hjælp af ovenstående formler, men også ved hjælp af standard StatPro-værktøjer. For at gøre dette er det nok at bruge

Konfidensinterval for forskellen mellem proportioner

Lad være den matematiske forventning om aktier. Lad være deres stikprøveestimater, konstrueret ud fra prøver af henholdsvis størrelse n 1 og n 2. Så er et skøn for forskellen. Derfor er konfidensintervallet for denne forskel udtrykt som:

Her er z cr en værdi opnået fra en normalfordeling ved hjælp af specielle tabeller (for eksempel 1,96 for et 95 % konfidensinterval).

Standardfejlen for estimering udtrykkes i dette tilfælde ved forholdet:

.

Eksempel

Butikken, der forberedte sig på et stort salg, foretog følgende marketingundersøgelse. De 300 bedste købere blev udvalgt og tilfældigt opdelt i to grupper på hver 150 medlemmer. Alle udvalgte købere fik tilsendt invitationer til at deltage i salget, men kun medlemmer af den første gruppe modtog en kupon, der gav dem 5 % rabat. Under salget blev alle 300 udvalgte køberes køb registreret. Hvordan kan en leder fortolke resultaterne og foretage en vurdering af kuponers effektivitet? (se filen COUPONS.XLS (skabelon og løsning)).

Løsning

For vores specifikke tilfælde, ud af 150 kunder, der modtog en rabatkupon, foretog 55 et køb på udsalg, og blandt de 150, der ikke modtog en kupon, foretog kun 35 et køb (fig. 103)
). Så er værdierne af prøveproportionerne henholdsvis 0,3667 og 0,2333. Og prøveforskellen mellem dem er lig med henholdsvis 0,1333. Hvis vi antager et 95 % konfidensinterval, finder vi fra normalfordelingstabellen z cr = 1,96. Beregningen af ​​standardfejlen for stikprøveforskellen er 0,0524. Vi finder endelig, at den nedre grænse for 95% konfidensintervallet er henholdsvis 0,0307 og den øvre grænse er 0,2359. De opnåede resultater kan fortolkes sådan, at for hver 100 kunder, der modtog en rabatkupon, kan vi forvente fra 3 til 23 nye kunder. Vi skal dog huske på, at denne konklusion i sig selv ikke betyder effektiviteten af ​​at bruge kuponer (da ved at give en rabat mister vi fortjeneste!). Lad os demonstrere dette med specifikke data. Lad os antage, at den gennemsnitlige købsstørrelse er 400 rubler, hvoraf 50 rubler. der er overskud til butikken. Så er den forventede fortjeneste på 100 kunder, der ikke har modtaget en kupon:

50 0,2333 100 = 1166,50 gnid.

Lignende beregninger for 100 kunder, der modtog en kupon, giver:

30 0,3667 100 = 1100,10 gnid.

Faldet i den gennemsnitlige fortjeneste til 30 forklares af det faktum, at kunder, der modtog en kupon ved at bruge rabatten, i gennemsnit vil købe for 380 rubler.

Den endelige konklusion indikerer således ineffektiviteten af ​​at bruge sådanne kuponer i denne særlige situation.

Kommentar. Dette problem kan løses ved hjælp af standard StatPro-værktøjer. For at gøre dette er det nok at reducere dette problem til problemet med at estimere forskellen mellem to gennemsnit ved hjælp af metoden og derefter anvende StatPro/Statistical Inference/To-Sample Analysis at konstruere et konfidensinterval for forskellen mellem to gennemsnitsværdier.

Styring af konfidensintervallængden

Længden af ​​konfidensintervallet afhænger af følgende forhold:

    data direkte (standardafvigelse);

    betydningsniveau;

    prøvestørrelse.

Prøvestørrelse til estimering af middelværdi

Lad os først overveje problemet i det generelle tilfælde. Lad os betegne værdien af ​​halvdelen af ​​længden af ​​konfidensintervallet givet til os som B (fig. 104)
). Vi ved, at konfidensintervallet for middelværdien af ​​en eller anden stokastisk variabel X er udtrykt som , Hvor . At tro:

og udtrykker n, får vi .

Desværre kender vi ikke den nøjagtige værdi af variansen af ​​den stokastiske variabel X. Derudover kender vi ikke værdien af ​​tcr, da den afhænger af n gennem antallet af frihedsgrader. I denne situation kan vi gøre følgende. I stedet for varianser bruger vi et estimat af variansen baseret på eventuelle tilgængelige implementeringer af den undersøgte tilfældige variabel. I stedet for t cr-værdien bruger vi z cr-værdien til normalfordelingen. Dette er ganske acceptabelt, da fordelingstæthedsfunktionerne for normal- og t-fordelingerne er meget tætte (undtagen tilfældet med lille n). Den nødvendige formel har således formen:

.

Da formlen generelt giver resultater uden heltal, tages afrunding med et overskud af resultatet som den ønskede stikprøvestørrelse.

Eksempel

Fastfood-restauranten planlægger at udvide sit sortiment med en ny type sandwich. For at vurdere efterspørgslen efter det, planlægger lederen tilfældigt at udvælge et antal besøgende blandt dem, der allerede har prøvet det, og bede dem vurdere deres holdning til det nye produkt på en skala fra 1 til 10. Lederen ønsker at vurdere det forventede antal point, som det nye produkt vil modtage produkt og konstruer et 95 % konfidensinterval for dette estimat. Samtidig ønsker han, at den halve bredde af konfidensintervallet ikke overstiger 0,3. Hvor mange besøgende skal han interviewe?

som følger:

Her r ots er et skøn over andelen p, og B er en given halvdel af længden af ​​konfidensintervallet. Et overestimat for n kan opnås ved hjælp af værdien r ots= 0,5. I dette tilfælde vil længden af ​​konfidensintervallet ikke overstige den specificerede værdi B for nogen sand værdi af p.

Eksempel

Lad lederen fra det foregående eksempel planlægge at estimere andelen af ​​kunder, der foretrak en ny type produkt. Han ønsker at konstruere et 90 % konfidensinterval, hvis halve længde ikke overstiger 0,05. Hvor mange kunder skal indgå i stikprøven?

Løsning

I vores tilfælde er værdien af ​​z cr = 1,645. Derfor beregnes den nødvendige mængde som .

Hvis lederen havde grund til at tro, at den ønskede p-værdi for eksempel var cirka 0,3, ville vi ved at substituere denne værdi i ovenstående formel få en mindre tilfældig stikprøveværdi, nemlig 228.

Formel til bestemmelse tilfældig stikprøvestørrelse i tilfælde af forskel mellem to gennemsnit skrevet som:

.

Eksempel

Nogle computerfirmaer har et kundeservicecenter. På det seneste er antallet af kundeklager over dårlig servicekvalitet steget. Servicecentret beskæftiger hovedsageligt to typer medarbejdere: dem, der ikke har meget erfaring, men har gennemført særlige forberedende kurser, og dem, der har stor praktisk erfaring, men ikke har gennemført særlige kurser. Virksomheden ønsker at analysere kundeklager over det seneste halve år og sammenligne det gennemsnitlige antal klager for hver af to grupper af medarbejdere. Det antages, at tallene i stikprøverne for begge grupper vil være de samme. Hvor mange medarbejdere skal indgå i stikprøven for at opnå et interval på 95 % med en halv længde på højst 2?

Løsning

Her er σ ots et estimat af standardafvigelsen for begge stokastiske variable under den antagelse, at de er tæt på. Derfor skal vi i vores problem på en eller anden måde opnå dette skøn. Dette kan for eksempel gøres på følgende måde. Efter at have set på data om kundeklager over de seneste seks måneder, kan en leder bemærke, at hver medarbejder generelt modtager fra 6 til 36 klager. Ved at vide, at for en normalfordeling er næsten alle værdier ikke mere end tre standardafvigelser væk fra middelværdien, kan han med rimelighed tro, at:

, hvorfra σ ots = 5.

Ved at indsætte denne værdi i formlen får vi .

Formel til bestemmelse tilfældig stikprøvestørrelse i tilfælde af at estimere forskellen mellem proportionerne har formen:

Eksempel

Nogle virksomheder har to fabrikker, der producerer lignende produkter. En virksomhedsleder ønsker at sammenligne procentdelen af ​​defekte produkter på begge fabrikker. Ifølge tilgængelige oplysninger varierer fejlprocenten på begge fabrikker fra 3 til 5%. Det er beregnet til at konstruere et 99 % konfidensinterval med en halv længde på højst 0,005 (eller 0,5 %). Hvor mange produkter skal der vælges fra hver fabrik?

Løsning

Her er p 1ots og p 2ots skøn over to ukendte fejlandele på 1. og 2. fabrik. Hvis vi sætter p 1ots = p 2ots = 0,5, får vi en overvurderet værdi for n. Men da vi i vores tilfælde har nogle a priori-oplysninger om disse aktier, tager vi det øverste estimat for disse aktier, nemlig 0,05. Vi får

Når man estimerer nogle populationsparametre fra stikprøvedata, er det nyttigt ikke kun at give et punktestimat af parameteren, men også at give et konfidensinterval, der viser, hvor den nøjagtige værdi af den parameter, der estimeres, kan ligge.

I dette kapitel stiftede vi også bekendtskab med kvantitative sammenhænge, ​​der giver os mulighed for at konstruere sådanne intervaller for forskellige parametre; lærte måder at kontrollere længden af ​​konfidensintervallet.

Bemærk også, at problemet med at estimere stikprøvestørrelser (problemet med at planlægge et eksperiment) kan løses ved hjælp af standard StatPro-værktøjer, nemlig StatPro/Statistical Inference/Sample Size Selection.

Konfidensintervallet kommer til os fra statistikområdet. Dette er et vist interval, der tjener til at estimere en ukendt parameter med en høj grad af pålidelighed. Den nemmeste måde at forklare dette på er med et eksempel.

Antag, at du skal studere en tilfældig variabel, for eksempel serverens responshastighed på en klientanmodning. Hver gang en bruger indtaster adressen på et bestemt websted, reagerer serveren med forskellige hastigheder. Svartiden under undersøgelse er således tilfældig. Så konfidensintervallet giver os mulighed for at bestemme grænserne for denne parameter, og så kan vi sige, at med en 95% sandsynlighed vil serveren være i det område, vi beregnede.

Eller du skal finde ud af, hvor mange der kender til virksomhedens varemærke. Når konfidensintervallet beregnes, vil man eksempelvis kunne sige, at med 95 % sandsynlighed ligger andelen af ​​forbrugere, der er opmærksomme på dette, i intervallet fra 27 % til 34 %.

Tæt forbundet med dette udtryk er værdien af ​​tillidssandsynlighed. Det repræsenterer sandsynligheden for, at den ønskede parameter er inkluderet i konfidensintervallet. Hvor stort vores ønskede sortiment vil være afhænger af denne værdi. Jo større værdi den tager, jo smallere bliver konfidensintervallet, og omvendt. Typisk er den sat til 90 %, 95 % eller 99 %. Værdien 95% er den mest populære.

Denne indikator er også påvirket af spredningen af ​​observationer, og dens definition er baseret på antagelsen om, at karakteristikken, der undersøges, adlyder. Denne erklæring er også kendt som Gauss' lov. Ifølge ham er normal en fordeling af alle sandsynligheder for en kontinuert stokastisk variabel, der kan beskrives ved en sandsynlighedstæthed. Hvis antagelsen om en normalfordeling er forkert, kan skønnet være forkert.

Lad os først finde ud af, hvordan man beregner konfidensintervallet for Der er to mulige tilfælde her. Spredning (graden af ​​spredning af en tilfældig variabel) kan eller er måske ikke kendt. Hvis det er kendt, så beregnes vores konfidensinterval ved hjælp af følgende formel:

xsr - t*σ / (sqrt(n))<= α <= хср + t*σ / (sqrt(n)), где

α - tegn,

t - parameter fra Laplace-fordelingstabellen,

σ er kvadratroden af ​​variansen.

Hvis variansen er ukendt, kan den beregnes, hvis vi kender alle værdierne for den ønskede funktion. Følgende formel bruges til dette:

σ2 = х2ср - (хср)2, hvor

х2ср - gennemsnitsværdien af ​​kvadrater af den undersøgte karakteristik,

(хср)2 er kvadratet af denne karakteristik.

Formlen, hvormed konfidensintervallet beregnes i dette tilfælde, ændres lidt:

xsr - t*s / (sqrt(n))<= α <= хср + t*s / (sqrt(n)), где

xsr - prøvegennemsnit,

α - tegn,

t er en parameter, der findes ved hjælp af elevfordelingstabellen t = t(ɣ;n-1),

sqrt(n) - kvadratroden af ​​den samlede stikprøvestørrelse,

s er kvadratroden af ​​variansen.

Overvej dette eksempel. Antag, at baseret på resultaterne af 7 målinger, blev den undersøgte karakteristik bestemt til at være lig med 30 og stikprøvevariansen til at være lig med 36. Det er nødvendigt at finde, med en sandsynlighed på 99 %, et konfidensinterval, der indeholder den sande værdien af ​​den målte parameter.

Lad os først bestemme, hvad t er lig med: t = t (0,99; 7-1) = 3,71. Ved hjælp af ovenstående formel får vi:

xsr - t*s / (sqrt(n))<= α <= хср + t*s / (sqrt(n))

30 - 3,71*36 / (sqrt(7))<= α <= 30 + 3.71*36 / (sqrt(7))

21.587 <= α <= 38.413

Konfidensintervallet for variansen beregnes både i tilfælde af et kendt gennemsnit, og når der ikke er data om den matematiske forventning, og kun værdien af ​​det punktuvildige estimat af variansen er kendt. Vi vil ikke give formler til at beregne det her, da de er ret komplekse og om ønsket altid kan findes på internettet.

Lad os kun bemærke, at det er praktisk at bestemme konfidensintervallet ved hjælp af Excel eller en netværkstjeneste, som kaldes på den måde.

Konfidensintervaller.

Beregningen af ​​konfidensintervallet er baseret på gennemsnitsfejlen for den tilsvarende parameter. Konfidensinterval viser inden for hvilke grænser med sandsynlighed (1-a) den sande værdi af den estimerede parameter ligger. Her er a signifikansniveauet, (1-a) kaldes også konfidenssandsynlighed.

I det første kapitel viste vi, at f.eks. for det aritmetiske gennemsnit ligger den sande populationsmiddelværdi i cirka 95 % af tilfældene inden for 2 standardfejl af middelværdien. Således vil grænserne for 95 % konfidensintervallet for middelværdien adskilles fra stikprøvegennemsnittet med det dobbelte af middelfejlen af ​​middelværdien, dvs. vi multiplicerer gennemsnitsfejlen med en bestemt koefficient afhængigt af konfidensniveauet. For gennemsnit og forskel af gennemsnit tages Student-koefficienten (kritisk værdi af Elevens test), for andel og forskel af andele, den kritiske værdi af z-kriteriet. Produktet af koefficienten og gennemsnitsfejlen kan kaldes den maksimale fejl af en given parameter, dvs. det maksimale, vi kan opnå, når vi vurderer det.

Konfidensinterval for aritmetisk middelværdi : .

Her er prøvegennemsnittet;

Gennemsnitlig fejl af det aritmetiske gennemsnit;

s – prøve standardafvigelse;

n

f = n-1 (Elevens koefficient).

Konfidensinterval for forskelle i aritmetiske middelværdier :

Her er forskellen mellem prøvemiddel;

- gennemsnitlig fejl af forskellen mellem aritmetiske middelværdier;

s 1, s 2 – prøve standardafvigelser;

n1,n2

Den kritiske værdi af Elevens test for et givet signifikansniveau a og antallet af frihedsgrader f=n 1 + n 2-2 (Elevens koefficient).

Konfidensinterval for aktier :

.

Her er d prøvefraktionen;

– gennemsnitlig brøkfejl;

n– stikprøvestørrelse (gruppestørrelse);

Konfidensinterval for forskel på aktier :

Her er forskellen i prøveandele;

– gennemsnitlig fejl af forskellen mellem aritmetiske middelværdier;

n1,n2– prøvemængder (antal grupper);

Den kritiske værdi af z-kriteriet ved et givet signifikansniveau a ( , , ).

Ved at beregne konfidensintervaller for forskellen mellem indikatorer ser vi for det første direkte de mulige værdier af effekten og ikke kun dens punktestimat. For det andet kan vi drage en konklusion om accept eller afvisning af nulhypotesen, og for det tredje kan vi drage en konklusion om testens styrke.

Når du tester hypoteser ved hjælp af konfidensintervaller, skal du overholde følgende regel:

Hvis 100(1-a) procent konfidensintervallet for forskellen i gennemsnit ikke indeholder nul, så er forskellene statistisk signifikante på signifikansniveau a; tværtimod, hvis dette interval indeholder nul, så er forskellene ikke statistisk signifikante.

Faktisk, hvis dette interval indeholder nul, betyder det, at den indikator, der sammenlignes, kan være enten større eller mindre i en af ​​grupperne sammenlignet med den anden, dvs. de observerede forskelle skyldes tilfældigheder.

Testens styrke kan bedømmes ud fra placeringen af ​​nul inden for konfidensintervallet. Hvis nul er tæt på den nedre eller øvre grænse af intervallet, så er det muligt, at med et større antal grupper, der sammenlignes, vil forskellene nå statistisk signifikans. Hvis nul er tæt på midten af ​​intervallet, betyder det, at både en stigning og et fald i indikatoren i forsøgsgruppen er lige sandsynlige, og sandsynligvis er der ingen forskelle.

Eksempler:

For at sammenligne kirurgisk dødelighed ved brug af to forskellige typer anæstesi: 61 personer blev opereret med den første type bedøvelse, 8 døde, med den anden type - 67 personer, 10 døde.

d1 = 8/61 = 0,131; d2 = 10/67 = 0,149; d1-d2 = - 0,018.

Forskellen i dødelighed af de sammenlignede metoder vil ligge i området (-0,018 - 0,122; -0,018 + 0,122) eller (-0,14; 0,104) med en sandsynlighed på 100(1-a) = 95%. Intervallet indeholder nul, dvs. hypotesen om ens dødelighed med to forskellige typer af anæstesi kan ikke afvises.

Dødeligheden kan og vil således falde til 14 % og stige til 10,4 % med en sandsynlighed på 95 %, dvs. nul er omtrent midt i intervallet, så det kan argumenteres for, at disse to metoder højst sandsynligt ikke adskiller sig i dødelighed.

I det tidligere omtalte eksempel blev den gennemsnitlige pressetid under tappetesten sammenlignet i fire grupper af studerende, som var forskellige i eksamensresultater. Lad os beregne konfidensintervallerne for den gennemsnitlige pressetid for elever, der bestod eksamen med karaktererne 2 og 5, og konfidensintervallet for forskellen mellem disse gennemsnit.

Elevens koefficienter findes ved hjælp af Students fordelingstabeller (se bilag): for den første gruppe: = t(0,05;48) = 2,011; for den anden gruppe: = t(0,05;61) = 2,000. Således konfidensintervaller for den første gruppe: = (162,19-2,011*2,18; 162,19+2,011*2,18) = (157,8; 166,6), for den anden gruppe (156,55- 2.000*1,808; 5+156,08) (5+156,8) 160,3). Så for dem, der bestod eksamen med 2, varierer den gennemsnitlige pressetid fra 157,8 ms til 166,6 ms med en sandsynlighed på 95 %, for dem, der bestod eksamen med 5 – fra 152,8 ms til 160,3 ms med en sandsynlighed på 95 % .

Du kan også teste nulhypotesen ved at bruge konfidensintervaller for middelværdier og ikke kun for forskellen i middelværdier. For eksempel, som i vores tilfælde, hvis konfidensintervallerne for midlerne overlapper hinanden, kan nulhypotesen ikke forkastes. For at forkaste en hypotese på et valgt signifikansniveau må de tilsvarende konfidensintervaller ikke overlappe hinanden.

Lad os finde konfidensintervallet for forskellen i den gennemsnitlige pressetid i de grupper, der bestod eksamen med karaktererne 2 og 5. Forskel på gennemsnit: 162,19 – 156,55 = 5,64. Elevens koefficient: = t(0,05;49+62-2) = t(0,05;109) = 1,982. Gruppestandardafvigelser vil være lig med: ; . Vi beregner den gennemsnitlige fejl af forskellen mellem middelværdierne: . Konfidensinterval: =(5,64-1,982*2,87; 5,64+1,982*2,87) = (-0,044; 11,33).

Så forskellen i den gennemsnitlige pressetid i grupperne, der bestod eksamen med 2 og 5, vil ligge i området fra -0,044 ms til 11,33 ms. Dette interval omfatter nul, dvs. Den gennemsnitlige pressetid for dem, der bestod eksamen godt, kan enten stige eller falde i forhold til dem, der bestod eksamen utilfredsstillende, dvs. nulhypotesen kan ikke forkastes. Men nul er meget tæt på den nedre grænse, og pressetiden er meget mere tilbøjelig til at falde for dem, der bestod godt. Således kan vi konkludere, at der stadig er forskelle i den gennemsnitlige pressetid mellem dem, der passerede 2 og 5, vi kunne bare ikke opdage dem i betragtning af ændringen i den gennemsnitlige tid, spredningen af ​​den gennemsnitlige tid og stikprøvestørrelserne.



En tests magt er sandsynligheden for at forkaste en forkert nulhypotese, dvs. finde forskelle, hvor de faktisk findes.

Testens styrke bestemmes ud fra signifikansniveauet, størrelsen af ​​forskelle mellem grupper, spredningen af ​​værdier i grupper og størrelsen af ​​prøver.

Til Students t-test og variansanalyse kan følsomhedsdiagrammer bruges.

Kriteriets magt kan bruges til foreløbigt at bestemme det nødvendige antal grupper.

Konfidensintervallet viser inden for hvilke grænser den sande værdi af den estimerede parameter ligger med en given sandsynlighed.

Ved hjælp af konfidensintervaller kan du teste statistiske hypoteser og drage konklusioner om kriteriernes følsomhed.

LITTERATUR.

Glanz S. – Kapitel 6,7.

Rebrova O.Yu. – s.112-114, s.171-173, s.234-238.

Sidorenko E.V. – s.32-33.

Spørgsmål til selvtest af elever.

1. Hvad er styrken af ​​kriteriet?

2. I hvilke tilfælde er det nødvendigt at vurdere kriteriernes magt?

3. Metoder til beregning af effekt.

6. Hvordan tester man en statistisk hypotese ved hjælp af et konfidensinterval?

7. Hvad kan man sige om kriteriets magt ved beregning af konfidensintervallet?

Opgaver.

"Katren-Style" fortsætter udgivelsen af ​​Konstantin Kravchiks serie om medicinsk statistik. I to tidligere artikler har forfatteren beskæftiget sig med forklaringen af ​​begreber som og.

Konstantin Kravchik

Matematiker-analytiker. Specialist i statistisk forskning inden for medicin og humaniora

Moskva by

Meget ofte i artikler om kliniske undersøgelser kan du finde en mystisk sætning: "konfidensinterval" (95 % CI eller 95 % CI - konfidensinterval). For eksempel kan en artikel skrive: "For at vurdere betydningen af ​​forskelle blev den studerendes t-test brugt til at beregne 95 % konfidensintervallet."

Hvad er værdien af ​​"95 % konfidensintervallet", og hvorfor beregnes det?

Hvad er et konfidensinterval? - Det er det område, inden for hvilket den sande befolkning betyder ligge. Er der "usande" gennemsnit? På en måde, ja, det gør de. I forklarede vi, at det er umuligt at måle parameteren af ​​interesse i hele befolkningen, så forskerne nøjes med en begrænset stikprøve. I denne prøve (f.eks. baseret på kropsvægt) er der én gennemsnitsværdi (en vis vægt), som vi bedømmer gennemsnitsværdien i hele populationen ud fra. Det er dog usandsynligt, at gennemsnitsvægten i en stikprøve (især en lille) vil falde sammen med gennemsnitsvægten i den generelle befolkning. Derfor er det mere korrekt at beregne og bruge rækken af ​​gennemsnitsværdier for befolkningen.

Forestil dig for eksempel, at 95 % konfidensintervallet (95 % CI) for hæmoglobin er 110 til 122 g/L. Det betyder, at der er 95 % chance for, at den sande gennemsnitlige hæmoglobinværdi i befolkningen vil være mellem 110 og 122 g/L. Vi kender med andre ord ikke den gennemsnitlige hæmoglobinværdi i befolkningen, men vi kan med 95 % sandsynlighed angive en række værdier for denne egenskab.

Konfidensintervaller er især relevante for forskelle i middel mellem grupper, eller effektstørrelser, som de kaldes.

Lad os sige, at vi sammenlignede effektiviteten af ​​to jernpræparater: et, der har været på markedet i lang tid, og et, der lige er blevet registreret. Efter terapiforløbet vurderede vi hæmoglobinkoncentrationen i de undersøgte grupper af patienter, og det statistiske program beregnede, at forskellen mellem gennemsnitsværdierne for de to grupper var, med 95 % sandsynlighed, i området fra 1,72 til 14,36 g/l (tabel 1).

Bord 1. Test for uafhængige prøver
(grupper sammenlignes efter hæmoglobinniveau)

Dette skal fortolkes som følger: Hos nogle patienter i den almindelige befolkning, der tager et nyt lægemiddel, vil hæmoglobin i gennemsnit være 1,72-14,36 g/l højere end hos dem, der tog et allerede kendt lægemiddel.

Med andre ord, i den generelle befolkning er forskellen i gennemsnitlige hæmoglobinværdier mellem grupper inden for disse grænser med en 95% sandsynlighed. Det vil være op til forskeren at vurdere, om det er meget eller lidt. Pointen med alt dette er, at vi ikke arbejder med én gennemsnitsværdi, men med en række værdier, derfor estimerer vi mere pålideligt forskellen i en parameter mellem grupper.

I statistiske pakker kan du efter forskerens skøn selvstændigt indsnævre eller udvide grænserne for konfidensintervallet. Ved at sænke konfidensintervallets sandsynligheder indsnævrer vi intervallet af middel. For eksempel, ved 90 % CI vil intervallet af middelværdier (eller forskel i middelværdier) være smallere end ved 95 %.

Omvendt udvides rækkevidden af ​​værdier ved at øge sandsynligheden til 99  %. Ved sammenligning af grupper kan den nedre grænse for CI krydse nulmærket. For eksempel, hvis vi udvidede grænserne for konfidensintervallet til 99 %, så varierede grænserne for intervallet fra –1 til 16 g/l. Det betyder, at der i den almindelige befolkning er grupper, hvor forskellen i middelværdier for den karakteristika, der undersøges, er lig med 0 (M = 0).

Ved hjælp af et konfidensinterval kan du teste statistiske hypoteser. Hvis konfidensintervallet krydser nulværdien, så er nulhypotesen, som antager, at grupperne ikke adskiller sig på den parameter, der undersøges, sand. Eksemplet er beskrevet ovenfor, hvor vi udvidede grænserne til 99 %. Et sted i den almindelige befolkning fandt vi grupper, der ikke adskilte sig på nogen måde.

95 % konfidensinterval for forskellen i hæmoglobin, (g/l)


Figuren viser 95 % konfidensintervallet for forskellen i middelhæmoglobinværdier mellem de to grupper. Linjen går gennem nul-mærket, derfor er der en forskel mellem middelværdierne af nul, hvilket bekræfter nulhypotesen om, at grupperne ikke adskiller sig. Forskellen mellem grupperne er fra –2 til 5 g/l. Det betyder, at hæmoglobin enten kan falde med 2 g/l eller stige med 5 g/l.

Konfidensintervallet er en meget vigtig indikator. Takket være den kan du se, om forskellene i grupperne virkelig skyldes forskellen i middelværdier eller på grund af en stor stikprøve, da chancerne for at finde forskelle med et stort udsnit er større end med et lille udsnit.

I praksis kan det se sådan ud. Vi tog en prøve på 1000 personer, målte hæmoglobinniveauer og fandt ud af, at konfidensintervallet for forskellen i gennemsnit varierede fra 1,2 til 1,5 g/l. Niveauet af statistisk signifikans i dette tilfælde s

Vi ser, at hæmoglobinkoncentrationen steg, men næsten umærkeligt viste statistisk signifikans derfor netop på grund af prøvestørrelsen.

Konfidensintervaller kan beregnes ikke kun for midler, men også for proportioner (og risikoforhold). For eksempel er vi interesserede i konfidensintervallet for andelen af ​​patienter, der opnåede remission, mens de tog et udviklet lægemiddel. Lad os antage, at 95 % CI for proportionerne, dvs. for andelen af ​​sådanne patienter, ligger i området 0,60-0,80. Således kan vi sige, at vores medicin har en terapeutisk effekt i 60 til 80 % af tilfældene.