Elevkriterieberegning. Elevens t-testfordeling til test af hypotesen om middelværdien og beregning af konfidensintervallet i MS Excel

Statistisk hypotesetestning giver os mulighed for at drage stærke slutninger om egenskaberne ved en population baseret på stikprøvedata. Der er forskellige hypoteser. En af dem er hypotesen om gennemsnittet (matematisk forventning). Dens essens er at drage en korrekt konklusion, kun baseret på den tilgængelige prøve, om, hvor det generelle gennemsnit kan være placeret eller ikke (vi vil aldrig kende den nøjagtige sandhed, men vi kan indsnævre søgningen).

Den generelle tilgang til at teste hypoteser er blevet beskrevet, så lad os gå direkte til sagen. Lad os først antage, at stikprøven er trukket fra en normal population af tilfældige variable x med generelt gennemsnit μ og varians σ 2(Jeg ved, jeg ved, at dette ikke sker, men afbryd mig ikke!). Det aritmetiske gennemsnit af denne prøve er naturligvis i sig selv en tilfældig variabel. Hvis du udtrækker mange sådanne prøver og beregner deres gennemsnit, så vil de også have en matematisk forventning μ Og

Derefter den tilfældige variabel

Spørgsmålet opstår: vil det generelle gennemsnit med 95 % sandsynlighed ligge inden for ±1,96? s x̅. Med andre ord er fordelingen af ​​tilfældige variabler

tilsvarende.

Dette spørgsmål blev først stillet (og løst) af en kemiker, der arbejdede på Guinness ølfabrik i Dublin (Irland). Kemikerens navn var William Seely Gossett, og han tog prøver af øl til kemisk analyse. På et tidspunkt begyndte William tilsyneladende at blive plaget af vag tvivl om fordelingen af ​​gennemsnit. Det viste sig at være lidt mere udtværet end en normalfordeling burde være.

Efter at have indsamlet det matematiske grundlag og beregnet værdierne af den distributionsfunktion, han opdagede, skrev Dublin-kemikeren William Gosset en note, der blev offentliggjort i marts 1908-udgaven af ​​Biometrics magazine (chefredaktør - Karl Pearson). Fordi Guinness forbød strengt at give bryghemmeligheder væk; Gossett skrev under med pseudonymet Student.

På trods af at K. Pearson allerede havde opfundet fordelingen, dominerede den generelle idé om normalitet stadig. Ingen skulle tro, at fordelingen af ​​stikprøvescore måske ikke var normal. Derfor forblev W. Gossets artikel praktisk talt ubemærket og glemt. Og kun Ronald Fisher satte pris på Gossets opdagelse. Fischer brugte den nye distribution i sit arbejde og gav den navnet Elevens t-fordeling. Kriteriet for at teste hypoteser blev derfor Elevens t-test. Sådan opstod en "revolution" i statistikken, som trådte ind i æraen med analyse af prøvedata. Dette var en kort udflugt i historien.

Lad os se, hvad W. Gosset kunne se. Lad os generere 20 tusinde normale prøver fra 6 observationer med et gennemsnit ( X) 50 og standardafvigelse ( σ ) 10. Derefter normaliserer vi prøvemidlet vha generel varians:

Vi vil gruppere de resulterende 20 tusind gennemsnit i intervaller med længden 0,1 og beregne frekvenserne. Lad os på diagrammet afbilde den faktiske (Norm) og teoretiske (ENorm) frekvensfordeling af prøvemiddelværdier.

Punkterne (observerede frekvenser) falder praktisk talt sammen med linjen (teoretiske frekvenser). Dette er forståeligt, fordi dataene er taget fra den samme generelle population, og forskellene er kun stikprøvefejl.

Lad os lave et nyt eksperiment. Vi normaliserer gennemsnittet vha prøvevarians.

Lad os tælle frekvenserne igen og plotte dem på diagrammet i form af punkter og efterlade en standard normalfordelingslinje til sammenligning. Lad os betegne den empiriske frekvens af gennemsnittet, f.eks. med bogstavet t.

Det ses, at fordelingerne denne gang ikke falder ret meget sammen. Tæt på, ja, men ikke det samme. Halerne er blevet mere "tunge".

Gosset-Student havde ikke den nyeste version af MS Excel, men det er præcis den effekt, han bemærkede. Hvorfor sker dette? Forklaringen er, at den stokastiske variabel

afhænger ikke kun af stikprøvefejlen (tæller), men også af standardfejlen for middelværdien (nævneren), som også er en tilfældig variabel.

Lad os se lidt på, hvilken fordeling sådan en tilfældig variabel skal have. Først skal du huske (eller lære) noget fra matematisk statistik. Der er Fishers sætning, som siger, at i en prøve fra en normalfordeling:

1. medium X og prøvevarians s 2 er uafhængige mængder;

2. forholdet mellem stikprøve og populationsvarians, ganget med antallet af frihedsgrader, har en fordeling χ 2(chi-kvadrat) med samme antal frihedsgrader, dvs.

Hvor k– antal grader af frihed (på engelsk grader af frihed (d.f.))

Mange andre resultater i statistikken for normale modeller er baseret på denne lov.

Lad os vende tilbage til fordelingen af ​​gennemsnittet. Opdel udtrykkets tæller og nævner

σ X̅. Vi får

Tælleren er en standard normal tilfældig variabel (vi betegner ξ (xi)). Lad os udtrykke nævneren fra Fishers sætning.

Så vil det oprindelige udtryk tage formen

Dette er hvad det er i generel form (Student relation). Du kan udlede dens distributionsfunktion direkte, fordi fordelingen af ​​begge stokastiske variable i dette udtryk er kendt. Lad os overlade denne fornøjelse til matematikerne.

Student t-fordelingsfunktionen har en formel, der er ret svær at forstå, så det nytter ikke at analysere den. Ingen bruger det alligevel, fordi... sandsynligheder er angivet i specielle tabeller over Student-fordelinger (nogle gange kaldet tabeller over Student-koefficienter), eller er inkluderet i PC-formler.

Så bevæbnet med denne nye viden kan du forstå den officielle definition af Student-distributionen.
En tilfældig variabel underlagt Elevfordelingen med k frihedsgrader er forholdet mellem uafhængige stokastiske variable

Hvor ξ fordelt efter den almindelige normallov, og χ 2 k adlyder distribution χ 2 c k grader af frihed.

Elevens t-testformel for det aritmetiske gennemsnit

Der er et særligt tilfælde af elevforholdet

Af formlen og definitionen følger det, at fordelingen af ​​Students t-test kun afhænger af antallet af frihedsgrader.

k> 30 t-test adskiller sig praktisk talt ikke fra standard normalfordelingen.

I modsætning til chi-square kan t-testen være en- eller to-halet. Normalt bruger de to-sidet, idet det antages, at afvigelsen kan forekomme i begge retninger fra gennemsnittet. Men hvis problemtilstanden kun tillader afvigelse i én retning, er det rimeligt at bruge et ensidigt kriterium. Dette øger effekten lidt, fordi... ved et fast signifikansniveau nærmer den kritiske værdi sig en smule nul.

Betingelser for brug af Students t-test

På trods af at Students opdagelse på et tidspunkt revolutionerede statistik, er t-testen stadig ret begrænset i sine anvendelsesmuligheder, fordi selv kommer fra antagelsen om en normal fordeling af de originale data. Hvis dataene ikke er normale (hvilket normalt er tilfældet), så vil t-testen ikke længere have en Student-fordeling. Men på grund af virkningen af ​​den centrale grænsesætning opnår gennemsnittet selv for unormale data hurtigt en klokkeformet fordeling.

Overvej for eksempel data, der er tydeligt skæve til højre, såsom en chi-kvadratfordeling med 5 frihedsgrader.

Lad os nu oprette 20 tusinde prøver og observere, hvordan fordelingen af ​​gennemsnit ændrer sig afhængigt af deres volumen.

Forskellen er ret mærkbar i små prøver på op til 15-20 observationer. Men så forsvinder det hurtigt. Således er unormaliteten af ​​fordelingen naturligvis ikke god, men ikke kritisk.

Mest af alt er t-testen "bange" for outliers, dvs. unormale afvigelser. Lad os tage 20 tusinde normale prøver på hver 15 observationer og tilføje en tilfældig afviger til nogle af dem.

Billedet viser sig at være dystert. De faktiske frekvenser af gennemsnittet er meget forskellige fra de teoretiske. At bruge t-distributionen i en sådan situation bliver en meget risikabel virksomhed.

Så i ikke meget små prøver (fra 15 observationer) er t-testen relativt modstandsdygtig over for ikke-normal fordeling af de originale data. Men outliers i dataene forvrænger i høj grad fordelingen af ​​t-testen, hvilket igen kan føre til fejl i statistisk inferens, så unormale observationer bør elimineres. Ofte fjernes alle værdier, der falder inden for ±2 standardafvigelser fra middelværdien, fra prøven.

Et eksempel på test af en hypotese om matematisk forventning ved hjælp af Students t-test i MS Excel

Excel har flere funktioner relateret til t-distributionen. Lad os se på dem.

STUDENT.DIST – “klassisk” venstresidet Student t-fordeling. Inputtet er t-kriterieværdien, antallet af frihedsgrader og en mulighed (0 eller 1), der bestemmer, hvad der skal beregnes: tæthed eller funktionsværdi. Ved output får vi henholdsvis tætheden eller sandsynligheden for, at den stokastiske variabel vil være mindre end t-kriteriet angivet i argumentet.

STUDENT.DIST.2X – to-vejs distribution. Argumentet er den absolutte værdi (modulo) af t-testen og antallet af frihedsgrader. Som et resultat opnår vi sandsynligheden for at opnå den samme eller endnu større t-kriterieværdi, dvs. faktisk signifikansniveau (p-niveau).

STUDENT.DIST.PH – højresidet t-fordeling. Så, 1-ELEV.FORDELING(2;5;1) = STUDENT.FORDELING.PH(2;5) = 0,05097. Hvis t-testen er positiv, så er den resulterende sandsynlighed p-niveauet.

STUDENT.INR – bruges til at beregne den venstresidige inverse af t-fordelingen. Argumentet er sandsynligheden og antallet af frihedsgrader. Ved udgangen får vi t-kriterieværdien svarende til denne sandsynlighed. Sandsynlighedstællingen er til venstre. Derfor kræver venstre hale selve signifikansniveauet α , og for den rigtige 1 - α .

STUDENT.OBR.2X – den omvendte værdi for den tosidede Student-fordeling, dvs. t-testværdi (modulo). Signifikansniveauet leveres også til inputtet α . Kun denne gang udføres tællingen fra begge sider samtidigt, så sandsynligheden er fordelt i to haler. Så STUDENT.ARV(1-0,025;5) = STUDENT.ARV.2X(0,05;5) = 2,57058

STUDENT.TEST er en funktion til at teste hypotesen om ligheden af ​​matematiske forventninger i to stikprøver. Erstatter en masse beregninger, fordi Det er nok kun at angive to områder med data og et par flere parametre. Udgangen er p-niveau.

CONFIDENCE.STUDENT – beregning af konfidensintervallet for gennemsnittet under hensyntagen til t-fordelingen.

Lad os overveje dette træningseksempel. Hos virksomheden pakkes cement i 50 kg sække. På grund af tilfældighed er en vis afvigelse fra den forventede masse tilladt i en enkelt pose, men det generelle gennemsnit bør forblive 50 kg. Kvalitetskontrolafdelingen vejede tilfældigt 9 poser og opnåede følgende resultater: gennemsnitsvægt ( X) var 50,3 kg, standardafvigelse ( s) – 0,5 kg.

Er dette resultat i overensstemmelse med nulhypotesen om, at den generelle middelværdi er 50 kg? Med andre ord, er det muligt at opnå et sådant resultat ved en ren tilfældighed, hvis udstyret fungerer korrekt og giver en gennemsnitlig fyldning på 50 kg? Hvis hypotesen ikke afvises, så passer den resulterende forskel ind i rækken af ​​tilfældige udsving, men hvis hypotesen afvises, så var der højst sandsynligt en funktionsfejl i indstillingerne af maskinen, der fylder poserne. Det skal kontrolleres og konfigureres.

En kort tilstand i almindeligt accepteret notation ser sådan ud.

H0: μ = 50 kg

H1: μ ≠ 50 kg

Der er grund til at antage, at fordelingen af ​​posefyld følger en normalfordeling (eller ikke er meget forskellig fra den). Det betyder, at du for at teste hypotesen om den matematiske forventning kan bruge Student t-testen. Tilfældige afvigelser kan forekomme i alle retninger, hvilket betyder, at en tosidet t-test er nødvendig.

Først vil vi bruge antediluvianske midler: manuelt beregne t-kriteriet og sammenligne det med den kritiske tabelværdi. Beregnet t-test:

Lad os nu bestemme, om det resulterende tal overstiger det kritiske niveau på signifikansniveauet α = 0,05. Lad os bruge Elevens t-fordelingstabel (tilgængelig i enhver statistik lærebog).

Søjlerne viser sandsynligheden for højre side af fordelingen, og rækkerne viser antallet af frihedsgrader. Vi er interesseret i en tosidet t-test med et signifikansniveau på 0,05, hvilket svarer til t-værdien for halvdelen af ​​signifikansniveauet til højre: 1 - 0,05/2 = 0,975. Antallet af frihedsgrader er stikprøvestørrelsen minus 1, dvs. 9 - 1 = 8. I skæringspunktet finder vi tabelværdien af ​​t-testen - 2,306. Hvis vi brugte standard normalfordelingen, så ville det kritiske punkt være 1,96, men her er det større, fordi T-fordelingen i små prøver har et mere fladt udseende.

Lad os sammenligne den faktiske (1,8) og tabelværdien (2,306). Det beregnede kriterium viste sig at være mindre end det opstillede. De tilgængelige data modsiger derfor ikke hypotesen H 0 om, at det generelle gennemsnit er 50 kg (men beviser det heller ikke). Det er alt, hvad vi kan lære ved hjælp af tabeller. Du kan selvfølgelig også forsøge at finde p-niveauet, men det vil være omtrentligt. Og som regel er det p-niveauet, der bruges til at teste hypoteser. Derfor går vi næste gang til Excel.

Der er ingen færdiglavet funktion til at beregne t-testen i Excel. Men det er ikke skræmmende, for Elevens t-testformel er ret enkel og kan nemt bygges direkte i en Excel-celle.

Vi fik den samme 1.8. Lad os først finde den kritiske værdi. Vi tager alfa 0,05, kriteriet er tosidet. Vi har brug for den inverse t-fordelingsfunktion til den tosidede hypotese STUDENT.OBR.2X.

Den resulterende værdi afskærer det kritiske område. Den observerede t-test falder ikke ind i den, så hypotesen forkastes ikke.

Dette er dog den samme måde at teste en hypotese på ved hjælp af en tabelværdi. Det ville være mere informativt at beregne p-niveau, dvs. sandsynligheden for at opnå den observerede eller endnu større afvigelse fra gennemsnittet på 50 kg, hvis denne hypotese er korrekt. Du skal bruge elevfordelingsfunktionen til den tosidede hypotese STUDENT.FORDEL.2X.

P-niveauet er 0,1096, hvilket er større end det acceptable signifikansniveau på 0,05 – vi afviser ikke hypotesen. Men nu kan vi bedømme bevisgraden. P-niveauet viste sig at være ret tæt på niveauet, da hypotesen forkastes, og det leder til forskellige tanker. For eksempel, at prøven var for lille til at detektere en signifikant afvigelse.

Efter nogen tid besluttede kontrolafdelingen igen at kontrollere, hvordan posefyldningsstandarden blev opretholdt. Denne gang, for større pålidelighed, blev der ikke valgt 9, men 25 poser. Det er intuitivt klart, at spredningen af ​​gennemsnittet vil falde, og derfor bliver chancerne for at finde en fejl i systemet større.

Lad os sige, at de samme værdier af middelværdien og standardafvigelsen for prøven blev opnået som første gang (henholdsvis 50,3 og 0,5). Lad os beregne t-testen.


Den kritiske værdi for 24 frihedsgrader og α = 0,05 er 2,064. Billedet nedenfor viser, at t-testen falder inden for området for hypoteseafvisning.

Vi kan konkludere, at med en konfidenssandsynlighed på mere end 95 %, adskiller det generelle gennemsnit sig fra 50 kg. For at være mere overbevisende, lad os se på p-niveauet (den sidste linje i tabellen). Sandsynligheden for at opnå et gennemsnit med samme eller endnu større afvigelse fra 50, hvis hypotesen er korrekt, er 0,0062 eller 0,62 %, hvilket er praktisk talt umuligt med en enkelt måling. Generelt afviser vi hypotesen som usandsynlig.

Beregning af et konfidensinterval ved hjælp af elevens t-distribution

En anden statistisk metode er tæt forbundet med hypotesetestning - beregning af konfidensintervaller. Hvis det resulterende interval indeholder en værdi svarende til nulhypotesen, så svarer dette til, at nulhypotesen ikke er forkastet. Ellers forkastes hypotesen med det tilsvarende konfidensniveau. I nogle tilfælde tester analytikere slet ikke hypoteser i den klassiske form, men beregner kun konfidensintervaller. Denne tilgang giver dig mulighed for at udtrække endnu mere nyttig information.

Lad os beregne konfidensintervaller for middelværdien for 9 og 25 observationer. For at gøre dette vil vi bruge Excel-funktionen CONFIDENT.STUDENT. Her er alt mærkeligt nok ret simpelt. Funktionsargumenterne behøver kun at angive signifikansniveauet α , prøvestandardafvigelse og prøvestørrelse. Ved udgangen får vi halvbredden af ​​konfidensintervallet, det vil sige den værdi, der skal placeres på begge sider af gennemsnittet. Efter at have udført beregningerne og tegnet et visuelt diagram, får vi følgende.

Som du kan se, falder værdien 50 med en stikprøve på 9 observationer inden for konfidensintervallet (hypotesen er ikke forkastet), og med 25 observationer falder den ikke inden for konfidensintervallet (hypotesen forkastes). Desuden kan det i et forsøg med 25 poser konstateres, at med en sandsynlighed på 97,5 % overstiger det generelle gennemsnit 50,1 kg (den nedre grænse for konfidensintervallet er 50,094 kg). Og dette er ret værdifuld information.

Således løste vi det samme problem på tre måder:

1. Ved at bruge en gammel tilgang, sammenligne de beregnede og tabelformede værdier af t-testen
2. Mere moderne, ved at beregne p-niveauet, tilføje en grad af tillid, når hypotesen afvises.
3. Endnu mere informativ ved at beregne konfidensintervallet og opnå minimumsværdien af ​​det generelle gennemsnit.

Det er vigtigt at huske, at t-testen refererer til parametriske metoder, fordi er baseret på en normalfordeling (den har to parametre: middelværdi og varians). Derfor, for dens vellykkede anvendelse, er i det mindste den omtrentlige normalitet af de oprindelige data og fraværet af afvigere vigtige.

Til sidst foreslår jeg at se en video om, hvordan man udfører beregninger relateret til Student t-testen i Excel.

Gennem eksemplet vil vi bruge fiktiv information, så læseren selv kan foretage de nødvendige transformationer.

Så lad os sige, at vi i løbet af forskningen undersøgte virkningen af ​​lægemiddel A på indholdet af stof B (i mmol/g) i væv C og koncentrationen af ​​stof D i blodet (i mmol/l) hos patienter opdelt efter et eller andet kriterium E i 3 grupper med samme volumen (n = 10). Resultaterne af en sådan fiktiv undersøgelse er vist i tabellen:

Indhold af stof B, mmol/g

Stof D, mmol/l

stigning i koncentrationen


Vi vil gerne advare dig om, at vi overvejer prøver af størrelse 10 for at lette datapræsentation og beregninger; i praksis er en sådan stikprøvestørrelse normalt ikke nok til at danne en statistisk konklusion.

Som et eksempel kan du overveje dataene i 1. kolonne i tabellen.

Beskrivende Statistik

Prøvemiddel

Det aritmetiske middel, ofte blot kaldet "middelværdien", opnås ved at lægge alle værdierne sammen og dividere denne sum med antallet af værdier i sættet. Dette kan vises ved hjælp af en algebraisk formel. Et sæt af n observationer af en variabel x kan repræsenteres som x 1 , x 2 , x 3 , ..., x n

Formlen til bestemmelse af det aritmetiske middelværdi af observationer (udtales "X med en linje"):

= (X 1 + X 2 + ... + X n) / n

= (12 + 13 + 14 + 15 + 14 + 13 + 13 + 10 + 11 + 16) / 10 = 13,1;

Prøvevarians

En måde at måle spredningen af ​​data på er at bestemme, i hvilken grad hver observation afviger fra det aritmetiske gennemsnit. Det er klart, jo større afvigelse, jo større variabilitet, variabilitet af observationer. Vi kan dog ikke bruge gennemsnittet af disse afvigelser som et mål for spredning, fordi positive afvigelser kompenserer for negative afvigelser (deres sum er nul). For at løse dette problem kvadrerer vi hver afvigelse og finder gennemsnittet af de kvadrerede afvigelser; denne mængde kaldes variation eller spredning. Lad os tage n observationer x 1, x 2, x 3, ..., x n, gennemsnit som er lig med. Beregning af variansen dette, normalt omtalt soms2,disse observationer:

Prøvevariansen for denne indikator er s 2 = 3,2.

Standardafvigelse

Standard (middelkvadrat) afvigelse er den positive kvadratrod af variansen. Ved at bruge n observationer som eksempel, ser det sådan ud:

Vi kan tænke på standardafvigelse som en slags gennemsnitlig afvigelse af observationer fra middelværdien. Det beregnes i de samme enheder (dimensioner) som de oprindelige data.

s = sqrt (s 2) = sqrt (3,2) = 1,79.

Variationskoefficienten

Hvis man dividerer standardafvigelsen med det aritmetiske middelværdi og udtrykker resultatet i procent, får man variationskoefficienten.

CV = (1,79 / 13,1) * 100% = 13,7

Eksempel på middelfejl

1,79/sqrt(10) = 0,57;

Elevens t-koefficient (en-prøve t-test)

Bruges til at teste hypotesen om forskellen mellem gennemsnitsværdien og en kendt værdi m

Antallet af frihedsgrader beregnes som f=n-1.

I dette tilfælde er konfidensintervallet for middelværdien mellem grænserne 11,87 og 14,39.

For 95 % konfidensniveauet m=11,87 eller m=14,39, det vil sige= |13,1-11,82| = |13,1-14,38| = 1,28

Følgelig, i dette tilfælde, for antallet af frihedsgrader f = 10 - 1 = 9 og 95 % konfidensniveau t = 2,26.

Dialog Grundlæggende statistik og tabeller

I modulet Grundlæggende statistik og tabeller lad os vælge Beskrivende Statistik.

En dialogboks åbnes Beskrivende Statistik.

I marken Variabler lad os vælge Gruppe 1.

Presser Okay, får vi tabeller over resultater med beskrivende statistik over de udvalgte variable.

En dialogboks åbnes En-prøve t-test.

Antag, at vi ved, at det gennemsnitlige indhold af stof B i væv C er 11.

Tabellen over resultater med beskrivende statistik og Elevens t-test er som følger:

Vi måtte afvise hypotesen om, at det gennemsnitlige indhold af stof B i væv C er 11.

Da den beregnede værdi af kriteriet er større end den tabulerede værdi (2.26), forkastes nulhypotesen på det valgte signifikansniveau, og forskellene mellem stikprøven og den kendte værdi anses for statistisk signifikante. Konklusionen om eksistensen af ​​forskelle lavet ved hjælp af den studerendes test bekræftes således ved hjælp af denne metode.

Elevens t-test er en generel betegnelse for en klasse af metoder til statistisk test af hypoteser (statistiske test) baseret på Student-fordelingen. De mest almindelige anvendelser af t-testen involverer at teste ligheden af ​​middel i to prøver.

1. Historie om udviklingen af ​​t-testen

Dette kriterium blev udviklet William Gossett at vurdere kvaliteten af ​​øl i Guinness-selskabet. På grund af forpligtelser over for virksomheden vedrørende hemmeligholdelse af forretningshemmeligheder blev Gossets artikel publiceret i 1908 i tidsskriftet Biometrics under pseudonymet "Student".

2. Hvad bruges Elevens t-test til?

Elevens t-test bruges til at bestemme den statistiske signifikans af forskelle i middelværdier. Kan bruges både i tilfælde af sammenligning af uafhængige prøver ( for eksempel grupper af diabetikere og raske grupper), og når man sammenligner relaterede populationer ( for eksempel gennemsnitlig puls hos de samme patienter før og efter indtagelse af et antiarytmisk lægemiddel).

3. I hvilke tilfælde kan Elevens t-test bruges?

For at anvende Student t-testen er det nødvendigt, at de originale data har Normal fordeling. I tilfælde af at der anvendes et kriterium med to stikprøver for uafhængige prøver, er det også nødvendigt at opfylde betingelsen lighed (homoskedasticitet) af varianser.

Hvis disse betingelser ikke er opfyldt, bør lignende metoder anvendes ved sammenligning af prøvegennemsnit. ikke-parametrisk statistik, blandt hvilke de mest kendte er Mann-Whitney U-test(som en to-stikprøve test for uafhængige prøver), og tegn kriterium Og Wilcoxon test(bruges i tilfælde af afhængige prøver).

4. Hvordan beregner man Elevens t-test?

For at sammenligne gennemsnitsværdier beregnes Elevens t-test ved hjælp af følgende formel:

Hvor M 1- aritmetisk gennemsnit af den første sammenlignede population (gruppe), M 2- aritmetisk gennemsnit af den anden sammenlignede population (gruppe), m 1- gennemsnitsfejl af det første aritmetiske middelværdi, m 2- gennemsnitsfejl af det andet aritmetiske gennemsnit.

5. Hvordan tolker man Elevens t-test værdi?

Den resulterende Students t-testværdi skal fortolkes korrekt. For at gøre dette skal vi kende antallet af emner i hver gruppe (n 1 og n 2). At finde antallet af frihedsgrader f efter følgende formel:

f = (n 1 + n 2) - 2

Herefter bestemmer vi den kritiske værdi af Elevens t-test for det påkrævede signifikansniveau (for eksempel p = 0,05) og for et givet antal frihedsgrader f ifølge tabellen ( se nedenunder).

Vi sammenligner de kritiske og beregnede værdier af kriteriet:

  • Hvis den beregnede værdi af Elevens t-test lige eller større kritisk, fundet fra tabellen, konkluderer vi, at forskellene mellem de sammenlignede værdier er statistisk signifikante.
  • Hvis værdien af ​​den beregnede Elevs t-test mindre tabel, hvilket betyder, at forskellene mellem de sammenlignede værdier ikke er statistisk signifikante.

6. Eksempel på udregning af Elevens t-test

For at studere effektiviteten af ​​et nyt jernpræparat blev to grupper af patienter med anæmi udvalgt. I den første gruppe fik patienterne et nyt lægemiddel i to uger, og i den anden gruppe fik de placebo. Herefter blev hæmoglobinniveauet i perifert blod målt. I den første gruppe var det gennemsnitlige hæmoglobinniveau 115,4±1,2 g/l, og i den anden gruppe - 103,7±2,3 g/l (data præsenteres i formatet M±m), de populationer, der sammenlignes, har en normalfordeling. Antallet af den første gruppe var 34, og den anden - 40 patienter. Det er nødvendigt at drage en konklusion om den statistiske signifikans af de opnåede forskelle og effektiviteten af ​​det nye jernpræparat.

Løsning: For at vurdere betydningen af ​​forskelle bruger vi Students t-test, beregnet som forskellen i middelværdier divideret med summen af ​​kvadrerede fejl:

Efter at have udført beregningerne viste t-testværdien sig at være 4,51. Vi finder antallet af frihedsgrader som (34 + 40) - 2 = 72. Vi sammenligner den resulterende Students t-testværdi på 4,51 med den kritiske værdi ved p = 0,05 angivet i tabellen: 1,993. Da den beregnede værdi af kriteriet er større end den kritiske værdi, konkluderer vi, at de observerede forskelle er statistisk signifikante (signifikansniveau p<0,05).

I hvilke tilfælde kan Elevens t-test bruges?

For at anvende Student t-testen er det nødvendigt, at de originale data har Normal fordeling. I tilfælde af at der anvendes et kriterium med to stikprøver for uafhængige prøver, er det også nødvendigt at opfylde betingelsen lighed (homoskedasticitet) af varianser.

Hvis disse betingelser ikke er opfyldt, bør lignende metoder anvendes ved sammenligning af prøvegennemsnit. ikke-parametrisk statistik, blandt hvilke de mest kendte er Mann-Whitney U-test(som en to-stikprøve test for uafhængige prøver), og tegn kriterium Og Wilcoxon test(bruges i tilfælde af afhængige prøver).

For at sammenligne gennemsnitsværdier beregnes Elevens t-test ved hjælp af følgende formel:

Hvor M 1- aritmetisk gennemsnit af den første sammenlignede population (gruppe), M 2- aritmetisk gennemsnit af den anden sammenlignede population (gruppe), m 1- gennemsnitsfejl af det første aritmetiske middelværdi, m 2- gennemsnitsfejl af det andet aritmetiske gennemsnit.

Hvordan tolker man elevens t-test værdi?

Den resulterende Students t-testværdi skal fortolkes korrekt. For at gøre dette skal vi kende antallet af emner i hver gruppe (n 1 og n 2). At finde antallet af frihedsgrader f efter følgende formel:

f = (n 1 + n 2) - 2

Herefter bestemmer vi den kritiske værdi af Elevens t-test for det påkrævede signifikansniveau (for eksempel p = 0,05) og for et givet antal frihedsgrader f ifølge tabellen ( se nedenunder).

Vi sammenligner de kritiske og beregnede værdier af kriteriet:

· Hvis den beregnede værdi af Elevens t-test lige eller større kritisk, fundet fra tabellen, konkluderer vi, at forskellene mellem de sammenlignede værdier er statistisk signifikante.

· Hvis værdien af ​​den beregnede Students t-test mindre tabel, hvilket betyder, at forskellene mellem de sammenlignede værdier ikke er statistisk signifikante.

Eksempel på udregning af Elevens t-test

For at studere effektiviteten af ​​et nyt jernpræparat blev to grupper af patienter med anæmi udvalgt. I den første gruppe fik patienterne et nyt lægemiddel i to uger, og i den anden gruppe fik de placebo. Herefter blev hæmoglobinniveauet i perifert blod målt. I den første gruppe var det gennemsnitlige hæmoglobinniveau 115,4±1,2 g/l, og i den anden gruppe - 103,7±2,3 g/l (data præsenteres i formatet M±m), de populationer, der sammenlignes, har en normalfordeling. Antallet af den første gruppe var 34, og den anden - 40 patienter. Det er nødvendigt at drage en konklusion om den statistiske signifikans af de opnåede forskelle og effektiviteten af ​​det nye jernpræparat.

Løsning: For at vurdere betydningen af ​​forskelle bruger vi Students t-test, beregnet som forskellen i middelværdier divideret med summen af ​​kvadrerede fejl:

Efter at have udført beregningerne viste t-testværdien sig at være 4,51. Vi finder antallet af frihedsgrader som (34 + 40) - 2 = 72. Vi sammenligner den resulterende Students t-testværdi på 4,51 med den kritiske værdi ved p = 0,05 angivet i tabellen: 1,993. Da den beregnede værdi af kriteriet er større end den kritiske værdi, konkluderer vi, at de observerede forskelle er statistisk signifikante (signifikansniveau p<0,05).

Fisher-fordelingen er fordelingen af ​​en stokastisk variabel

hvor er de tilfældige variable X 1 Og X 2 er uafhængige og har chi-kvadratfordelinger med antallet af frihedsgrader k 1 Og k 2 henholdsvis. Samtidig er parret (k 1, k 2)– et par "frihedsgrader" af Fisher-fordelingen, nemlig, k 1 er antallet af frihedsgrader for tælleren, og k 2– antal af nævnerens frihedsgrader. Fordeling af en stokastisk variabel F opkaldt efter den store engelske statistiker R. Fisher (1890-1962), som aktivt brugte det i sine værker.

Fisher-fordelingen bruges ved test af hypoteser om modellens tilstrækkelighed i regressionsanalyse, varianslighed og i andre problemer med anvendt statistik.

Tabel over studerendes kritiske værdier.

Begyndelsen af ​​formularen

Antal frihedsgrader, f Elevens t-testværdi ved p=0,05
12.706
4.303
3.182
2.776
2.571
2.447
2.365
2.306
2.262
2.228
2.201
2.179
2.160
2.145
2.131
2.120
2.110
2.101
2.093
2.086
2.080
2.074
2.069
2.064
2.060
2.056
2.052
2.048
2.045
2.042
2.040
2.037
2.035
2.032
2.030
2.028
2.026
2.024
40-41 2.021
42-43 2.018
44-45 2.015
46-47 2.013
48-49 2.011
50-51 2.009
52-53 2.007
54-55 2.005
56-57 2.003
58-59 2.002
60-61 2.000
62-63 1.999
64-65 1.998
66-67 1.997
68-69 1.995
70-71 1.994
72-73 1.993
74-75 1.993
76-77 1.992
78-79 1.991
80-89 1.990
90-99 1.987
100-119 1.984
120-139 1.980
140-159 1.977
160-179 1.975
180-199 1.973
1.972
1.960

Elevfordelingstabel

Sandsynlighedsintegraltabeller bruges til store stikprøver fra en uendelig stor population. Men allerede ved (n)< 100 получается Несоответствие между

tabeldata og grænsesandsynlighed; ved (n)< 30 погрешность становится значительной. Несоответствие вызывается главным образом характером распределения единиц генеральной совокупности. При большом объеме выборки особенность распределения в гене-

den generelle befolkning er ligegyldig, da fordelingen af ​​afvigelser af stikprøveindikatoren fra den generelle karakteristik med en stor prøve altid viser sig at være normal.

nom. I små prøver (n)< 30 характер распределения генеральной совокупности сказывается на распределении ошибок выборки. Поэтому для расчета ошибки выборки при небольшом объеме наблюдения (уже менее 100 единиц) отбор должен проводиться из со-

befolkning med normalfordeling. Teorien om små prøver blev udviklet af den engelske statistiker W. Gosset (som skrev under pseudonymet Student) i begyndelsen af ​​det 20. århundrede. I

I 1908 konstruerede han en særlig fordeling, der tillader, selv med små stikprøver, at korrelere (t) og konfidenssandsynligheden F(t). For (n) > 100 giver elevfordelingstabeller de samme resultater som Laplace-sandsynlighedsintegraltabeller for 30< (n ) <

100 forskelle er ubetydelige. Derfor omfatter praktisk talt små prøver prøver med et volumen på mindre end 30 enheder (selvfølgelig betragtes en prøve med et volumen på mere end 100 enheder som stor).

Brugen af ​​små stikprøver skyldes i nogle tilfælde arten af ​​den population, der undersøges. I avlsarbejdet er "ren" erfaring således lettere at opnå med et lille antal

grunde. Det produktionsmæssige og økonomiske eksperiment relateret til økonomiske omkostninger udføres også på et mindre antal forsøg. Som allerede nævnt kan både tillidssandsynligheder og konfidensgrænser for det generelle gennemsnit kun beregnes for en normalfordelt population i tilfælde af en lille stikprøve.

Sandsynlighedstætheden af ​​Student-fordelingen er beskrevet af funktionen.

1 + t2

f (t,n) := Bn

n - 1

t - nuværende variabel, n - stikprøvestørrelse;

B er en størrelse, der kun afhænger af (n).

Studentfordelingen har kun én parameter: (d.f.) - antallet af frihedsgrader (nogle gange betegnet (k)). Denne fordeling er ligesom den normale symmetrisk omkring punktet (t) = 0, men den er fladere. Efterhånden som stikprøvestørrelsen øges, og dermed antallet af frihedsgrader, nærmer elevfordelingen sig hurtigt det normale. Antallet af frihedsgrader er lig med antallet af de individuelle egenskabsværdier, der skal distribueres

antage at bestemme den ønskede egenskab. For at beregne variansen skal gennemsnitsværdien være kendt. Derfor, når du beregner variansen, skal du bruge (d.f.) = n - 1.

Elevfordelingstabeller udgives i to versioner:

1. på samme måde som, værdierne ( t ) og den tilsvarende

aktuelle sandsynligheder F(t) for forskellige antal frihedsgrader;

2. værdier (t) er givet for de mest almindeligt anvendte konfidenssandsynligheder

0,70; 0,75; 0,80; 0,85; 0,90; 0,95 og 0,99 eller for 1 - 0,70 = 0,3; 1 - 0,80 = 0,2; …… 1 - 0,99 = 0,01.

3. ved forskellige antal frihedsgrader. Denne form for tabel er angivet i appendiks

(Tabel 1 - 20), samt værdien (t) - Elevens test på et signifikansniveau på 0,7