T beregnet. Klassiske metoder til statistik: Elevens t-test

Metoden giver dig mulighed for at teste hypotesen om, at gennemsnitsværdierne for de to generelle populationer, hvorfra de sammenlignes afhængig prøver er forskellige fra hinanden. Afhængighedsantagelsen betyder oftest, at egenskaben måles to gange i samme prøve, for eksempel før og efter eksponering. I det generelle tilfælde tildeles hver repræsentant for en prøve en repræsentant fra en anden prøve (de kombineres i par), således at de to dataserier er positivt korrelerede med hinanden. Svagere typer af afhængighed af prøver: prøve 1 - mænd, prøve 2 - deres koner; prøve 1 - et-årige børn, prøve 2 består af tvillinger af børn fra prøve 1 osv.

En testbar statistisk hypotese, som i det foregående tilfælde, H 0: M1 = M2(middelværdierne i prøve 1 og 2 er ens). Når den forkastes, accepteres en alternativ hypotese, at M 1 mere mindre) M 2 .

Indledende antagelser til statistisk verifikation:

□ hver repræsentant for en stikprøve (fra en generel population) får tildelt en repræsentant for en anden stikprøve (fra en anden generel population);

□ dataene for de to prøver er positivt korrelerede (parret);

□ fordelingen af ​​det undersøgte træk i begge prøver svarer til normalloven.

Indledende datastruktur: der er to værdier af egenskaben under undersøgelse for hvert objekt (for hvert par).

Begrænsninger: fordelingen af ​​træk i begge prøver bør ikke afvige væsentligt fra den normale; dataene for de to målinger svarende til den ene og den anden prøve er positivt korrelerede.

Alternativer: T-Wilcoxon-testen, hvis fordelingen for mindst én prøve afviger væsentligt fra den normale; t-elev test for uafhængige prøver - hvis data for to prøver ikke korrelerer positivt.

Formel for den empiriske værdi af Students t-test afspejler det faktum, at enheden for forskelsanalyse er forskel (skift) funktionsværdier for hvert par observationer. Følgelig beregnes forskellen først for hvert af de N par af egenskabsværdier d i \u003d x 1 i - x 2 i.

(3) hvor M d er den gennemsnitlige forskel af værdier; σ d er standardafvigelsen af ​​forskellene.

Regneeksempel:

Lad os antage, at hver af de 8 medlemmer af gruppen i løbet af testningen af ​​træningens effektivitet blev stillet spørgsmålet "Hvor ofte falder dine meninger sammen med gruppens mening?" - to gange, før og efter træningen. Til besvarelser blev der brugt en 10-trins skala: 1 - aldrig, 5 - i halvdelen af ​​tilfældene, 10 - altid. Hypotesen blev testet, at som et resultat af træningen, vil deltagernes selvvurdering af konformitet (ønsket om at være som andre i gruppen) stige (α = 0,05). Lad os lave en tabel til mellemregninger (tabel 3).

Tabel 3

Det aritmetiske middelværdi for forskellen M d = (-6)/8= -0,75. Træk denne værdi fra hver d (den næstsidste kolonne i tabellen).

Formlen for standardafvigelsen adskiller sig kun ved, at d vises i stedet for X. Vi erstatter alle de nødvendige værdier, vi får

σd = 0,886.

Trin 1. Beregn den empiriske værdi af kriteriet ved hjælp af formel (3): den gennemsnitlige forskel M d= -0,75; standardafvigelse σ d = 0,886; t e = 2,39; df = 7.

Trin 2. Vi bestemmer p-signifikansniveauet ud fra tabellen over kritiske værdier for Elevens t-test. For df = 7 ligger den empiriske værdi mellem de kritiske for p = 0,05 og p - 0,01. Derfor, s< 0,05.

df R
0,05 0,01 0,001
2,365 3,499 5,408

Trin 3. Vi træffer en statistisk beslutning og formulerer en konklusion. Den statistiske hypotese om, at midlerne er lige, forkastes. Konklusion: indikatoren for selvevaluering af deltagernes konformitet efter træningen steg statistisk signifikant (på signifikansniveauet s< 0,05).

Parametriske metoder omfatter sammenligning af variansen af ​​to prøver ved kriteriet F-Fischer. Nogle gange fører denne metode til værdifulde meningsfulde konklusioner, og i tilfælde af sammenligning af midler til uafhængige prøver, er sammenligningen af ​​varianser obligatorisk procedure.

At beregne F emp du skal finde forholdet mellem varianserne af de to stikprøver, og således at den største varians er i tælleren og den mindre nævner.

Sammenligning af varianser. Metoden giver dig mulighed for at teste hypotesen om, at varianserne af de to generelle populationer, hvorfra de sammenlignede prøver er udtrukket, adskiller sig fra hinanden. Testet statistisk hypotese H 0: σ 1 2 = σ 2 2 (variansen i prøve 1 er lig med variansen i prøve 2). Når den forkastes, accepteres en alternativ hypotese om, at den ene varians er større end den anden.

Indledende antagelser: to prøver udtages tilfældigt fra forskellige generelle populationer med en normalfordeling af det undersøgte træk.

Indledende datastruktur: den egenskab, der undersøges, måles i objekter (fag), som hver tilhører en af ​​de to sammenlignede prøver.

Begrænsninger: Fordelingerne af træk i begge prøver adskiller sig ikke væsentligt fra den normale.

Metode alternativ: Levene "sTest-testen, hvis anvendelse ikke kræver kontrol af antagelsen om normalitet (brugt i SPSS-programmet).

Formel for den empiriske værdi af F-Fisher testen:

(4)

hvor σ 1 2 - stor spredning, og σ 2 2 - mindre spredning. Da det ikke er kendt på forhånd, hvilken varians der er størst, så for at bestemme p-niveauet, Tabel over kritiske værdier for ikke-retningsbestemte alternativer. Hvis en F e > F Kp for det tilsvarende antal frihedsgrader, altså R < 0,05 и статистическую гипотезу о равенстве дисперсий можно отклонить (для α = 0,05).

Regneeksempel:

Børnene fik de sædvanlige regneopgaver, hvorefter en tilfældigt udvalgt halvdel af eleverne fik at vide, at de ikke havde bestået testen, og resten - det modsatte. Derefter blev hvert barn spurgt, hvor mange sekunder det ville tage ham at løse et lignende problem. Eksperimentatoren beregnede forskellen mellem den tid, barnet kaldte, og resultatet af den udførte opgave (i sekunder). Det var forventet, at rapportering af svigt ville forårsage en vis utilstrækkelighed i barnets selvværd. Den testede hypotese (på niveauet α = 0,005) var, at variansen af ​​populationen af ​​selvevalueringer ikke afhænger af rapporter om succes eller fiasko (Н 0: σ 1 2=σ 2 2).

Følgende data er modtaget:


Trin 1. Beregn den empiriske værdi af kriteriet og antallet af frihedsgrader ved hjælp af formler (4):

Trin 2. Ifølge tabellen over kritiske værdier for f-Fisher-kriteriet for ikke-retningsbestemt alternativer, vi finder den kritiske værdi for df nummer = 11; df tegn= 11. Der er dog kun en kritisk værdi for df nummer= 10 og df tegn = 12. Et større antal frihedsgrader kan ikke tages, derfor tager vi den kritiske værdi for df nummer= 10: For R = 0,05 F Kp = 3,526; til R = 0,01 F Kp = 5,418.

Trin 3. At træffe en statistisk beslutning og en meningsfuld konklusion. Da den empiriske værdi overstiger den kritiske værdi for R= 0,01 (og endnu mere for p = 0,05), så i dette tilfælde s< 0,01 и принимается альтернативная гипо­теза: дисперсия в группе 1 превышает дисперсию в группе 2 (R< 0,01). Følgelig, efter rapportering af fiasko, er utilstrækkeligheden af ​​selvværd højere end efter rapportering af succes.

/ praktisk statistik / referencematerialer / elev t-test værdier

Betydert - Elevprøve på et signifikansniveau på 0,10, 0,05 og 0,01

ν – grader af variationsfrihed

Standardværdier for Elevens t-test

Antal frihedsgrader

Betydningsniveauer

Antal frihedsgrader

Betydningsniveauer

Bord XI

Standardværdier for Fisher-testen bruges til at vurdere betydningen af ​​forskelle mellem to prøver

Grader af frihed

Betydningsniveau

Grader af frihed

Betydningsniveau

Elevens t-test

Elevens t-test- den generelle betegnelse for en klasse af metoder til statistisk test af hypoteser (statistiske test) baseret på den studerendes fordeling. De mest almindelige tilfælde af anvendelse af t-testen er relateret til kontrol af ligheden af ​​middelværdierne i to prøver.

t-statistik er normalt konstrueret efter følgende generelle princip: tælleren er en stokastisk variabel med nul matematisk forventning (når nulhypotesen er opfyldt), og nævneren er stikprøvens standardafvigelse af denne stokastiske variabel, opnået som kvadratroden af det ublandede variansestimat.

Historie

Dette kriterium blev udviklet af William Gosset for at evaluere kvaliteten af ​​øl hos Guinness. I forbindelse med virksomhedens forpligtelser til ikke at afsløre forretningshemmeligheder (Guinness-ledelsen overvejede en sådan brug af det statistiske apparat i deres arbejde), blev Gossets artikel publiceret i 1908 i tidsskriftet Biometrics under pseudonymet "Student" (Student) .

Datakrav

For at anvende dette kriterium er det nødvendigt, at de originale data har en normalfordeling. I tilfælde af at anvende en to-stikprøve test for uafhængige prøver, er det også nødvendigt at overholde betingelsen om lighed af varians. Der er dog alternativer til Students t-test for situationer med ulige varianser.

Kravet om at datafordelingen skal være normal er nødvendig for den nøjagtige t (\displaystyle t) -test. Men selv med andre datadistributioner er det muligt at bruge t (\displaystyle t) -statistikken. I mange tilfælde har disse statistikker asymptotisk en standard normalfordeling - N (0 , 1) (\displaystyle N(0,1)), så kvantiter af denne fordeling kan bruges. Ofte, selv i dette tilfælde, bruges kvantiler ikke fra standard normalfordelingen, men fra den tilsvarende Students fordeling, som i den nøjagtige t (\displaystyle t) -test. De er asymptotisk ækvivalente, men på små stikprøver er konfidensintervallerne for den studerendes fordeling bredere og mere pålidelige.

En-prøve t-test

Den bruges til at teste nulhypotesen H 0: E (X) = m (\displaystyle H_(0):E(X)=m) om forventningens lighed E (X) (\displaystyle E(X)) til en eller anden kendt værdi m ( \displaystyle m) .

Det er klart, under nulhypotesen E (X ¯) = m (\displaystyle E((\overline (X)))=m) . Givet observationernes formodede uafhængighed, V (X ¯) = σ 2 / n (\displaystyle V((\overline (X)))=\sigma ^(2)/n) . Brug af det upartiske variansestimat s X 2 = ∑ t = 1 n (X t − X ¯) 2 / (n − 1) (\displaystyle s_(X)^(2)=\sum _(t=1)^( n )(X_(t)-(\overline (X)))^(2)/(n-1)) får vi følgende t-statistik:

t = X ¯ − m s X / n (\displaystyle t=(\frac ((\overline (X))-m)(s_(X)/(\sqrt (n))))))

Under nulhypotesen er fordelingen af ​​denne statistik t (n − 1) (\displaystyle t(n-1)) . Derfor, hvis værdien af ​​statistik i absolut værdi overstiger den kritiske værdi af denne fordeling (på et givet signifikansniveau), forkastes nulhypotesen.

To-stikprøve t-test for uafhængige prøver

Lad der være to uafhængige stikprøver af størrelserne n 1, n 2 (\displaystyle n_(1)~,~n_(2)) af normalfordelte stokastiske variable X 1 , X 2 (\displaystyle X_(1),~X_(2) )). Det er nødvendigt at teste nulhypotesen om lighed af de matematiske forventninger til disse tilfældige variable H 0: M 1 = M 2 (\displaystyle H_(0):~M_(1)=M_(2)) ved hjælp af eksempeldata.

Overvej forskellen på prøvemiddelværdierne Δ = X ¯ 1 − X ¯ 2 (\displaystyle \Delta =(\overline (X))_(1)-(\overline (X))_(2)) . Det er klart, hvis nulhypotesen er opfyldt E (Δ) = M 1 − M 2 = 0 (\displaystyle E(\Delta)=M_(1)-M_(2)=0) . Variansen af ​​denne forskel er baseret på uafhængigheden af ​​prøverne: V (Δ) = σ 1 2 n 1 + σ 2 2 n 2 (\displaystyle V(\Delta)=(\frac (\sigma _(1) ^(2))( n_(1)))+(\frac (\sigma _(2)^(2))(n_(2)))) . Brug derefter det upartiske variansestimat s 2 = ∑ t = 1 n (X t − X ¯) 2 n − 1 (\displaystyle s^(2)=(\frac (\sum _(t=1)^(n) ( X_(t)-(\overline (X)))^(2))(n-1))) opnår vi et upartisk estimat af variansen af ​​forskellen mellem stikprøvemiddelværdierne: s Δ 2 = s 1 2 n 1 + s 2 2 n 2 (\ displaystyle s_(\Delta )^(2)=(\frac (s_(1)^(2))(n_(1)))+(\frac (s_(2)^ (2))(n_(2) ))) . Derfor er t-statistikken for at teste nulhypotesen

T = X ¯ 1 − X ¯ 2 s 1 2 n 1 + s 2 2 n 2 (\displaystyle t=(\frac ((\overline (X))_(1)-(\overline (X))_( 2))(\sqrt ((\frac (s_(1)^(2))(n_(1)))+(\frac (s_(2)^(2))(n_(2))))) ))

Denne statistik har under nulhypotesen en fordeling t (d f) (\displaystyle t(df)) , hvor d f = (s 1 2 / n 1 + s 2 2 / n 2) 2 (s 1 2 / n 1 ) 2 / (n 1 − 1) + (s 2 2 / n 2) 2 / (n 2 − 1) (\displaystyle df=(\frac ((s_(1)^(2)/n_(1)+ s_(2 )^(2)/n_(2))^(2))((s_(1)^(2)/n_(1))^(2)/(n_(1)-1)+( s_(2)^(2)/n_(2))^(2)/(n_(2)-1))))

Samme varianstilfælde

Hvis stikprøvevarianserne antages at være de samme, så

V (Δ) = σ 2 (1 n 1 + 1 n 2) (\displaystyle V(\Delta)=\sigma ^(2)\venstre((\frac (1)(n_(1)))+(\ frac (1)(n_(2)))\højre))

Så er t-statistikken:

T = X ¯ 1 − X ¯ 2 s X 1 n 1 + 1 n 2, s X = (n 1 − 1) s 1 2 + (n 2 − 1) s 2 2 n 1 + n 2 − 2 (\ displaystyle t=(\frac ((\overline (X))_(1)-(\overline (X))_(2))(s_(X)(\sqrt ((\frac (1)(n_(1) )))+(\frac (1)(n_(2)))))))~,~~s_(X)=(\sqrt (\frac ((n_(1)-1)s_(1)^ (2)+(n_(2)-1)s_(2)^(2))(n_(1)+n_(2)-2))))

Denne statistik har en fordeling t (n 1 + n 2 − 2) (\displaystyle t(n_(1)+n_(2)-2))

To-sample t-test for afhængige prøver

For at beregne den empiriske værdi af t (\displaystyle t) -kriteriet i en situation, hvor man tester en hypotese om forskellene mellem to afhængige prøver (f.eks. to prøver af samme test med et tidsinterval), anvendes følgende formel :

T = M d s d / n (\displaystyle t=(\frac (M_(d))(s_(d)/(\sqrt (n)))))

hvor M d (\displaystyle M_(d)) er middelforskellen af ​​værdierne, s d (\displaystyle s_(d)) er standardafvigelsen af ​​forskellene, og n er antallet af observationer

Denne statistik har en fordeling på t (n − 1) (\displaystyle t(n-1)) .

Test af en lineær begrænsning på lineære regressionsparametre

t-testen kan også teste en vilkårlig (enkelt) lineær begrænsning på parametrene for en lineær regression estimeret ved almindelige mindste kvadraters. Lad det være nødvendigt at teste hypotesen H 0: c T b = a (\displaystyle H_(0):c^(T)b=a) . Det er klart, under nulhypotesen E (c T b ^ − a) = c T E (b ^) − a = 0 (\displaystyle E(c^(T)(\hat (b))-a)=c^( T)E((\hat (b)))-a=0) . Her bruger vi egenskaben for uvildige mindste kvadraters estimater af modelparametre E (b ^) = b (\displaystyle E((\hat (b)))=b) . Derudover V (c T b ^ − a) = c T V (b ^) c = σ 2 c T (X T X) − 1 c (\displaystyle V(c^(T)(\hat (b))-a )=c^(T)V((\hat (b)))c=\sigma ^(2)c^(T)(X^(T)X)^(-1)c) . Ved at bruge i stedet for den ukendte varians dets upartiske estimat s 2 = E S S / (n − k) (\displaystyle s^(2)=ESS/(n-k)) får vi følgende t-statistik:

T = c T b ^ − a s c T (X T X) − 1 c (\displaystyle t=(\frac (c^(T)(\hat (b))-a)(s(\sqrt (c^(T) (X^(T)X)^(-1)c)))))

Denne statistik har under nulhypotesen en fordeling på t (n − k) (\displaystyle t(n-k)) , så hvis værdien af ​​statistikken er større end den kritiske værdi, så er nulhypotesen for en lineær begrænsning afvist.

Test af hypoteser om koefficienten for lineær regression

Et særligt tilfælde af en lineær begrænsning er at teste hypotesen om, at regressionskoefficienten b j (\displaystyle b_(j)) er lig med en eller anden værdi a (\displaystyle a) . I dette tilfælde er den tilsvarende t-statistik:

T = b ^ j − a s b ^ j (\displaystyle t=(\frac ((\hat (b))_(j)-a)(s_((\hat (b))_(j)))))

hvor s b ^ j (\displaystyle s_((\hat (b))_(j))) er standardfejlen for koefficientestimatet - kvadratroden af ​​det tilsvarende diagonale element i kovariansmatrixen for koefficientestimationerne.

Under nulhypotesen er fordelingen af ​​denne statistik t (n − k) (\displaystyle t(n-k)) . Hvis den absolutte værdi af statistikken er højere end den kritiske værdi, så er forskellen mellem koefficienten fra a (\displaystyle a) statistisk signifikant (ikke-tilfældig), ellers er den insignifikant (tilfældig, dvs. den sande koefficient er sandsynligvis lig med eller meget tæt på den forventede værdi af en (\ visningsstil a))

Kommentar

En-stikprøve-testen for matematiske forventninger kan reduceres til at teste en lineær begrænsning på de lineære regressionsparametre. I en enkeltprøvetest er dette en "regression" på en konstant. Derfor er s 2 (\displaystyle s^(2)) af regressionen et prøveestimat af variansen af ​​den undersøgte tilfældige variabel, matrixen X T X (\displaystyle X^(T)X) er lig med n (\displaystyle n), og estimatet af modellens "koefficient" er stikprøvegennemsnit. Herfra får vi udtrykket for t-statistikken givet ovenfor for det generelle tilfælde.

På samme måde kan det påvises, at en to-stikprøve test med lige prøvevarianser også reducerer til test af lineære begrænsninger. I en test med to stikprøver er dette en "regression" på en konstant og en dummy-variabel, der identificerer en delprøve afhængigt af værdien (0 eller 1): y = a + b D (\displaystyle y=a+bD) . Hypotesen om ligheden af ​​de matematiske forventninger til prøverne kan formuleres som en hypotese om ligheden mellem koefficienten b af denne model og nul. Det kan påvises, at den tilsvarende t-statistik til at teste denne hypotese er lig med den t-statistik, der er givet for to-stikprøve-testen.

Det kan også reduceres til at kontrollere den lineære begrænsning i tilfælde af forskellige varianser. I dette tilfælde tager variansen af ​​modelfejl to værdier. Herfra kan man også få en t-statistik svarende til den, der er givet for to-stikprøven.

Ikke-parametriske analoger

En analog til to-sample testen for uafhængige prøver er Mann-Whitney U-testen. For situationen med afhængige prøver er analogerne tegntesten og Wilcoxon T-testen

Litteratur

studerende. Den sandsynlige fejl i et gennemsnit. // Biometrika. 1908. nr. 6 (1). S. 1-25.

Links

Om kriterierne for at teste hypoteser om homogeniteten af ​​midler på webstedet for Novosibirsk State Technical University

Historie

Dette kriterium blev udviklet af William Gossett for at evaluere kvaliteten af ​​øl hos Guinness. I forbindelse med virksomhedens forpligtelser til ikke at afsløre forretningshemmeligheder (Guinness-ledelsen overvejede en sådan brug af det statistiske apparat i deres arbejde), blev Gossets artikel publiceret i 1908 i tidsskriftet Biometrics under pseudonymet "Student" (Student) .

Datakrav

For at anvende dette kriterium er det nødvendigt, at de originale data har en normalfordeling. I tilfælde af at anvende en to-stikprøve test for uafhængige prøver, er det også nødvendigt at overholde betingelsen om lighed af varians. Der er dog alternativer til Students t-test for situationer med ulige varianser.

To-stikprøve t-test for uafhængige prøver

I tilfælde af en lidt anderledes stikprøvestørrelse anvendes en forenklet tilnærmelsesformel:

Hvis prøvestørrelsen afviger væsentligt, anvendes en mere kompleks og præcis formel:

Hvor M 1 ,M 2 - aritmetiske middelværdier, σ 1 ,σ 2 - standardafvigelser, og N 1 ,N 2 - prøvestørrelser.

To-sample t-test for afhængige prøver

For at beregne den empiriske værdi af t-testen i en situation med test af en hypotese om forskellene mellem to afhængige prøver (for eksempel to prøver af samme test med et tidsinterval), bruges følgende formel:

hvor M d er den gennemsnitlige forskel af værdier, og σ d er standardafvigelsen for forskellene.

Antallet af frihedsgrader beregnes som

En-prøve t-test

Det bruges til at teste hypotesen om forskellen mellem middelværdien og en kendt værdi:

Antallet af frihedsgrader beregnes som

Ikke-parametriske analoger

En analog af to-sample testen for uafhængige prøver er Mann-Whitney U-testen. For situationen med afhængige prøver er analogerne tegntesten og Wilcoxon T-testen

Automatisk beregning af Elevens t-test


Wikimedia Foundation. 2010 .

  • Guinness
  • Geokemisk reservoir

Se, hvad "Studentens T-test" er i andre ordbøger:

    Elevens kriterium t-k- Elevens kriterium, t k. * Elevens kriterium, t k. * Elevens kriterium eller t c. eller S. t test en statistisk test for signifikansen af ​​forskellen mellem de sammenlignede middelværdier. Det bestemmes af forholdet mellem denne forskel og forskellens fejl: For værdier af t… … Genetik. encyklopædisk ordbog

    Elevens kriterium- Students t-test er en generel betegnelse for en klasse af metoder til statistisk test af hypoteser (statistiske test) baseret på sammenligning med Students fordeling. De mest almindelige tilfælde af anvendelse af t-kriteriet er relateret til lighedstest ... ... Wikipedia

    Elevens kriterium- Stjūdento kriterijus statusas T sritis augalininkystė apibrėžtis Skirtumo tarp dviejų vidurkių patikimumo rodiklis, išreiškiamas skirtumo ir jo paklaidos santykiu. atitikmenys: engl. Elevens test rus. Elevens kriterium... Žemės ūkio augalų selekcijos ir sėklininkystės terminų žodynas

    Elevens kriterium- En statistisk test, hvor den anvendte statistik, under forudsætning af nulhypotesen, svarer til en t-fordeling (elevs t-fordeling). Bemærk. Her er eksempler på anvendelse af dette kriterium: 1. kontrol af ligheden af ​​gennemsnittet af ... ... Ordbog over sociologisk statistik

    ELEVKRITERIUM- Biometrisk indikator for betydningen af ​​forskellen (td) mellem gennemsnitsværdierne for to sammenlignede grupper af dyr (M1 og M2) for enhver egenskab. Forskellens pålidelighed bestemmes af formlen: Den resulterende værdi af td sammenlignes med ... ... Begreber og definitioner brugt i avl, genetik og reproduktion af husdyr

    ELEVKRITERIUM- vurderer nærheden af ​​to gennemsnitsværdier med hensyn til at tilskrive eller ikke tilskrive det tilfældigt (på et givet signifikansniveau), besvare spørgsmålet om, hvorvidt gennemsnitsværdierne adskiller sig statistisk signifikant fra hinanden / B.A. Ashmarin. - M., 1978.


  • Zheleznyak, Yu.D., Petrov P.K. Grundlæggende om videnskabelige og metodiske aktiviteter i fysisk kultur og sport [Tekst]: Proc. tilskud til studerende. højere ped. uddannelsesinstitutioner / Yu.D. Zheleznyak, P.K. Petrov. - M .: Publishing Center "Academy", 2002, - 264 s.

  • Kuramshin, Yu.F. Teori og metoder for fysisk kultur [Tekst]: lærebog / Yu.F. Kuramshin. - M.: Sovjetisk sport, 2004. - 464 s.

  • Novikov, A.M. Videnskabeligt og eksperimentelt arbejde i en uddannelsesinstitution [Tekst] / A.M. Novikov. - M.: Professionsuddannelse, 1998. - 134 s.

  • Petrov, P.K. Fysisk kultur [Tekst]: semesteropgaver og eksamenskvalifikationsopgaver / P.K. Petrov. - M.: Forlaget VLADOS-PRESS, 2003.- 112 s.

  • Programmet for den endelige tilstand certificering i specialet 050720.65 - Fysisk kultur, kvalifikation lærer i fysisk kultur [Tekst] / comp. I OG. Shalginova, O.A. Pavlyuchenko, A.V. Fomins. - Abakan: Publishing House of the Khakass State University. N.F. Katanova, 2010.

  • Ulyaeva, L.G. Fysisk kultur. Enhed 5 Teori og metoder for fysisk kultur [Tekst] / L.G. Ulyaeva, S.V. Shepel. - M.: Modern State University Distance Education, 2003. - S. 32-55.
  • Bilag 1(obligatorisk)

    Specialeomslagsform
    ^ UDDANNELSES- OG VIDENSKABSMINISTERIET I RUSLAND


    ^

    JOBTITEL
    AFSLUTNING

    ^ KVALIFICERENDE ARBEJDE
    Elev (ka) __________________

    tilsynsførende

    _______________________________

    (fulde navn, akademisk grad, akademisk titel)

    Abakan 2014

    Bilag 2(obligatorisk)

    Formen på specialets titelblad

    ^ UDDANNELSES- OG VIDENSKABSMINISTERIET I RUSLAND

    Federal State Budgetary Education Institution

    videregående faglig uddannelse

    «KHAKASS STATE UNIVERSITY opkaldt efter A.I. N.F. KATANOVA
    ^ DET FYSISK KULTURFAKULTET
    Institut for Teori og Metoder for Fysisk Kultur og Idræt

    Speciale 050720.65 "Fysisk kultur"

    JOBTITEL

    ^ AFSLUTTENDE KVALIFIKATIONSARBEJDE
    Kandidatstuderende ______________ __________________

    (signatur) (fulde navn)

    Konsulent ______________ __________________

    (signatur) (fulde navn)

    Vejleder ______________ __________________

    (signatur) (fulde navn)

    Anmelder ______________ __________________

    (signatur) (fulde navn)

    "Indrøm til forsvaret"

    Hoved afdeling: ____________

    _________________________
    "____" ____________ 20___

    Abakan, 2014

    Bilag 3(obligatorisk)

    Eksempel på indholdsfortegnelse
    Indholdsfortegnelse

    Introduktion………………………………………………………………………………………….3

    Kapitel 1. Litteraturgennemgang om forskningsemnet...........................................................7


      1. Begrebet koordinationsevner………………………………………………………………7
    1.2. Koordinering af kropsfunktioner er grundlaget for bevægelseskontrol………………………………………………………………………………………………………….……….. .13

    1.2.1. Princippet om sensoriske korrektioner i bevægelseskontrol…………………………………………..13

    1.2.2. Sensoriske systemers rolle i bevægelseskontrol…………………………………………………………17

    1.3. Anatomisk-fysiologiske og psykologisk-pædagogiske træk hos børn 13-14 år…………………………………………………..……………………………………………… ……… ....21

    Kapitel 2. Metoder og tilrettelæggelse af forskning………………………………..………….39

    2.1. Forskningsmetoder …………………………………..…………………………………………………39

    2.2. Tilrettelæggelse af undersøgelsen. ………………………………………………………………………41

    Kapitel 3 Forskningsresultater og diskussion………………………..……...........48

    Konklusion……………………………………………………………………………………………… ......................56

    Bibliografisk liste …………..…………………………………………………………………..58

    Ansøgninger……………………………………………………………………………………………………………….59

    Bilag 4

    Eksempler på bibliografiske beskrivelser af forskellige typer publikationer
    ^ Lovgivningsmateriale

    Den Russiske Føderation. Grundloven (1993). Den Russiske Føderations forfatning [Tekst]: officiel. tekst. - M. : Marketing, 2001. - 39 s.

    regler

    Sikkerhedsregler for vedligeholdelse af hydrauliske strukturer og hydromekanisk udstyr i strømforsyningsorganisationer [Tekst]: RD 153-34.0-03.205–2001: godkendt. Energiministeriet Ros. Forbund 13.04.01: input. træder i kraft 01.11.01. - M. : ENAS, 2001. - 158 s.

    Bøger

    Agafonova, N.N. Civilret [Tekst]: lærebog. manual til universiteter / N. N. Agafonova, T. V. Bogacheva, L. I. Glushkova; under. i alt udg. A. G. Kalpina; udg. intro. Kunst. N. N. Polivaev; M-total og prof. uddannelse af Den Russiske Føderation, Moskva. stat gyldige acad. – Ed. 2., revideret. og yderligere - M. : Yurist, 2002. - 542 s.

    Afhandlinger

    Belozerov, I.V. Den Gyldne Hordes religionspolitik i Rusland i XIII-XIV århundreder. [Tekst]: dis. … cand. ist. Videnskaber: 07.00.02: fredet 01.22.02: godkendt. 15/07/02 / Belozerov Ivan Valentinovich. - M., 2002. - 215 s.

    Magasin

    Faktiske problemer for moderne videnskab [Tekst]: inform.-analytiker. magasin / grundlægger af Sputnik + Company LLC. - 2001, juni -. - M .: Sputnik +, 2001 - . - To måneder. - ISSN 1680-2721.

    2001, #1–3. - 2000 eksemplarer.

    Magasin artikel

    Balsevich, VK Olympisk sport og fysisk uddannelse: relationer og dissociationer // Teori og praksis om fysisk kultur. - 1996, nr. 10.- S. 2-7.
    ^ MULTI-VOLUME UDGAVER

    Dokumentet som helhed

    Gippius, Z.N. Værker [Tekst]: i 2 bind / Zinaida Gippius; [intro. Art., udarbejdet. tekst og kommentarer. T. G. Yurchenko; Ros. acad. Videnskaber, Inst. meddele. af samfundet videnskaber]. - M .: Lakom-bog: Gabestro, 2001. - 22 cm - (Sølvalderens gyldne prosa). - På banen. kun auth. og hoved. ser. - 3500 eksemplarer. – ISBN 5-85647-056-7 (i oversættelse).

    T. 1: Romaner. – 367 s. - Bibliografi. i note: s. 360-366. – Indhold: Ingen talisman; Vindere; Spirit Twilight. - I tillægget: Z. N. Gippius / V. Bryusov. – ISBN 5-85647-057-5.

    T. 2: Romaner. – 415 s. – Indhold: Forbandet dukke; Biografi i 33 kap. ; Roman Tsarevich: én virksomheds historie; Alien kærlighed. – ISBN 5-85647-058-3.

    Gippius, Z.N. Værker [Tekst]: i 2 bind / Zinaida Gippius; [intro. Art., udarbejdet. tekst og kommentarer. T. G. Yurchenko; Ros. acad. Videnskaber, Inst. meddele. af samfundet videnskaber]. - M .: Lakom-bog: Gabestro, 2001. - 2

    t.; 22 cm - (Sølvalderens guldprosa). - På banen. kun auth. og hoved. ser. - 3500 eksemplarer. – ISBN 5-85647-056-7 (i oversættelse).

    ^ Separat bind

    Kazmin, V.D. Familielægens opslagsbog [Tekst]: klokken 3 / Vladimir Kazmin. - M .: AST: Astrel, 2001 - . - 21 cm - ISBN

    5-17-011142-8 (AST).

    Del 2: Børnesygdomme. - 2002. - 503, s. : syg. - 8000 eksemplarer. – ISBN

    5-17-011143-6 (AST) (i oversættelse).

    ^ Artikel fra...

    ... en bog eller anden engangsudgivelse

    Dvinyaninova, G.S. Kompliment: Kommunikativ status eller strategi i diskurs [Tekst] / G. S. Dvinyaninova // Sprogets sociale magt: saml. videnskabelig tr. / Voronezh. interregionale Institut for Samfund. Videnskaber, Voronezh. stat un-t, Fak. romersk-tysk. historier. - Voronezh, 2001. - S. 101-106.
    ... seriel udgave

    Mikhailov, S.A Europæisk kørsel [Tekst]: systemet med betalingsveje i Rusland er ved begyndelsen. udviklingsstadier / Sergey Mikhailov // Nezavisimaya gaz. - 2002. - 17. juni.

    Efteråret er kommet, hvilket betyder, at det er tid til at lancere et nyt temaprojekt "Statistisk Analyse med R". I den vil vi overveje statistiske metoder ud fra deres anvendelse i praksis: vi vil finde ud af, hvilke metoder der findes, i hvilke tilfælde og hvordan de udføres i. Efter min mening er Students t-test eller t-test (fra engelsk. t-test) ideel som en introduktion til den statistiske analyses verden. Elevens test er ganske enkel og vejledende, og kræver desuden et minimum af grundlæggende viden inden for statistik, som læseren kan blive fortrolig med under læsningen af ​​denne artikel.

    Bemærk_1: her og i andre artikler vil du ikke se formler og matematiske forklaringer, fordi. oplysningerne er beregnet til studerende af naturlige og humanitære specialer, som kun tager deres første skridt i statistikken. analyse.

    Hvad er en t-test og hvornår skal den bruges

    I begyndelsen skal det siges, at princippet om Occams barbermaskine ofte fungerer i statistik, som siger, at det ikke giver nogen mening at udføre en kompleks statistisk analyse, hvis en enklere kan anvendes (du bør ikke skære brød med en motorsav, hvis du have en kniv). Det er derfor, trods sin enkelhed, t-test er et seriøst værktøj, hvis du ved, hvad det er, og i hvilke tilfælde det skal bruges.

    Det er mærkeligt, at denne metode blev skabt af William Gosset, en kemiker inviteret til at arbejde på Guinness-fabrikken. Testen, han udviklede, blev oprindeligt brugt til at vurdere kvaliteten af ​​øl. Imidlertid blev fabrikskemikere forbudt uafhængigt at udgive videnskabelige artikler under deres egne navne. Derfor publicerede William i 1908 sin artikel i tidsskriftet "Biometrika" under pseudonymet "Student". Senere færdiggjorde den fremragende matematiker og statistiker Ronald Fisher metoden, som siden blev udbredt under navnet Students t-test.

    Elevens t-test (t-test) er en statistisk metode, der giver dig mulighed for at sammenligne gennemsnittet af to prøver og på baggrund af testresultaterne konkludere, om de adskiller sig statistisk fra hinanden eller ej. Hvis du vil vide, om den gennemsnitlige forventede levetid i din region afviger fra landsgennemsnittet; sammenligne kartoffeludbyttet i forskellige områder; eller om blodtrykket ændrer sig før og efter indtagelse af et nyt lægemiddel, så t-test kan være nyttig for dig. Hvorfor måske? Fordi at udføre det, det er nødvendigt, at data fra prøverne har en fordeling tæt på normalen. For at gøre dette er der evalueringsmetoder, der giver dig mulighed for at sige, om det i dette tilfælde er tilladt at tro, at dataene er normalfordelt eller ej. Lad os tale om dette mere detaljeret.

    Normal fordeling af data og metoder til at estimere det qqplot og shapiro.test

    Normalfordelingen af ​​data er karakteristisk for kvantitative data, hvis fordeling er påvirket af mange faktorer, eller den er tilfældig. Normalfordelingen er karakteriseret ved flere funktioner:

    • Den er altid symmetrisk og har form som en klokke.
    • Middel- og medianværdierne er de samme.
    • Inden for en standardafvigelse i begge retninger ligger 68,2% af alle data, inden for to - 95,5%, inden for tre - 99,7%

    Lad os lave en tilfældig stikprøve med en normalfordeling på , hvor det samlede antal målinger = 100, det aritmetiske middelværdi = 5 og standardafvigelsen = 1. Plot det derefter som et histogram:

    mine data<- rnorm(100, mean = 5, sd = 1) hist(mydata, col = "light green")

    Dit diagram kan afvige lidt fra mit, da tallene er tilfældigt genereret. Som du kan se, er dataene ikke perfekt symmetriske, men de ser ud til at bevare formen af ​​en normalfordeling. Vi vil dog bruge mere objektive metoder til at bestemme normaliteten af ​​dataene.

    En af de enkleste normalitetstests er kvantilplot (qqplot). Essensen af ​​testen er enkel: Hvis dataene har en normalfordeling, bør de ikke afvige kraftigt fra rækken af ​​teoretiske kvantiler og gå ud over konfidensintervallerne. Lad os lave denne test i R.

    pakke "bil" ind i R-miljø qqPlot(mydata) #kør testen

    Som det fremgår af grafen, har vores data ikke store afvigelser fra den teoretiske normalfordeling. Men nogle gange med qqplot det er umuligt at give et sikkert svar. I dette tilfælde skal du bruge Shapiro-Wilk test , som er baseret på nulhypotesen om, at vores data er normalfordelt. Hvis P-værdien er mindre end 0,05 ( p-værdi < 0.05), то мы вынуждены отклонить нулевую гипотезу. P-значение в этом случае будет говорить о том, что вероятность ошибки при отклонении нулевой гипотезы будет равна менее 5%.

    At lave Shapiro-Wilk-testen i R er let. For at gøre dette skal du blot kalde shapiro.test-funktionen og indsætte navnet på dine data i parentes. I vores tilfælde skal p-værdien være væsentligt større end 0,05, hvilket ikke giver os mulighed for at afvise nulhypotesen om, at vores data er normalfordelt.

    Kør Elevens t-test i R

    Så hvis dataene fra prøverne har en normalfordeling, kan du roligt fortsætte med at sammenligne midlerne for disse prøver. Der er tre hovedtyper af t-test, der bruges i forskellige situationer. Lad os se på hver af dem ved hjælp af illustrative eksempler.

    One-sample t-test (en-sample t-test)

    En-prøve t-test bør vælges hvis du sammenligner prøven med et velkendt gennemsnit. For eksempel adskiller gennemsnitsalderen for indbyggerne i det nordkaukasiske føderale distrikt sig fra den generelle alder i Rusland. Der er en opfattelse af, at klimaet i Kaukasus og de kulturelle karakteristika hos de folk, der bor i det, bidrager til forlængelsen af ​​livet. For at teste denne hypotese vil vi tage RosStat-data (tabeller over gennemsnitlig forventet levealder efter regioner i Rusland) og anvende en elevs t-test med én prøve. Da Elevens t-test er baseret på test af statistiske hypoteser, vil vi acceptere som nulhypotesen, at der ikke er nogen forskelle mellem den gennemsnitlige forventede varighed i Rusland og republikkerne i Nordkaukasus. Hvis der er forskelle, så for at betragte dem som statistisk signifikante p-værdi skal være mindre end 0,05 (logikken er den samme som i Shapiro-Wilk-testen beskrevet ovenfor).

    Lad os indlæse dataene i R. For at gøre dette vil vi oprette en vektor med gennemsnitlige værdier for republikkerne i Kaukasus (inklusive Adygea). Derefter vil vi køre en t-test med én prøve, som specificerer i parameteren mu Den gennemsnitlige forventede levetid i Rusland er 70,93.

    rosstat<-c(79.42, 75.83, 74.16, 73.91, 73.82, 73.06, 72.01) qqPlot(rosstat) shapiro.test(rosstat) t.test(rosstat, mu = 70,93)

    På trods af, at vi kun har 7 point i stikprøven, består de generelt normalitetstests, og vi kan stole på dem, da disse data allerede er blevet gennemsnittet over regionen.

    Resultaterne af t-testen indikerer, at den gennemsnitlige forventede levetid blandt indbyggerne i Nordkaukasus (74,6 år) faktisk er højere end gennemsnittet for Rusland (70,93 år), og testresultaterne er statistisk signifikante (p< 0.05).

    To-stikprøve for uafhængige prøver (uafhængig to-stikprøve t-test)

    Der anvendes en t-test med to prøver, når du sammenligner to uafhængige stikprøver. Lad os sige, at vi gerne vil vide, om udbyttet af kartofler er forskelligt i den nordlige og den sydlige del af en region. For at gøre dette indsamlede vi data fra 40 gårde, hvoraf 20 var beliggende i nord og dannede "Nord"-prøven, og de resterende 20 var placeret i syd, og dannede "Syd"-prøven.

    Lad os indlæse dataene i miljøet R. Ud over at kontrollere dataenes normalitet, vil det være nyttigt at bygge et "plot med et overskæg", hvorpå du kan se medianen og spredningen af ​​dataene for begge prøver.

    Nord<- c(122, 150, 136, 129, 169, 158, 132, 162, 143, 179, 139, 193, 155, 160, 165, 149, 173, 173, 141, 166) qqPlot(North) shapiro.test(North) Syd<- c(170, 163, 178, 150, 166, 142, 157, 149, 151, 164, 163, 161, 159, 139, 180, 155, 144, 139, 151, 160) qqPlot(North) shapiro.test(North) boxplot(North, South)

    Som det kan ses af grafen, adskiller prøvernes medianer sig ikke meget fra hinanden, dog er spredningen af ​​data meget stærkere i nord. Lad os kontrollere, om middelværdierne er statistisk forskellige ved hjælp af t.test-funktionen. Men denne gang i stedet for parameteren mu vi sætter navnet på den anden prøve. Testresultaterne, som du ser i nedenstående figur, viser, at det gennemsnitlige kartoffeludbytte i nord ikke er statistisk anderledes end i syd ( s = 0.6339).

    To-stikprøver for afhængige prøver ( afhængig to-stikprøve t-prøve)

    Den tredje type t-test bruges når hvis elementerne i prøverne er afhængige af hinanden. Den er ideel til gentagelseskontrol eksperiment: hvis dataene for gentagelsen ikke statistisk adskiller sig fra originalen, så er repeterbarheden af ​​dataene høj. Også to-sample t-testen for afhængige prøver er meget brugt. i medicinsk forskning når man studerer virkningen af ​​et lægemiddel på kroppen før og efter administration.

    For at køre det i R skal du indtaste den samme t.test funktion. Men i parentes, efter datatabellerne, skal du indtaste det ekstra argument parret = TRUE . Dette argument siger, at dine data er afhængige af hinanden. For eksempel:

    t.test(eksperiment, povtor.eksperimenta, parret = SAND) t.test(tryk.do.priema, tryk.after.priema, parret = TRUE)

    Der er også to yderligere argumenter i t.test-funktionen, der kan forbedre kvaliteten af ​​testresultaterne: var.equal og alternative . Hvis du ved, at inter-sample-variationen er ens, skal du indsætte argumentet var.equal = TRUE. Hvis du vil teste hypotesen om, at forskellen mellem middelværdierne i stikprøverne er signifikant mindre eller større end 0, så indtast argumentet alternative="mindre" eller alternativ="større" (som standard siger den alternative hypotese, at prøverne er simpelthen forskellige fra hinanden ven: alternative="two.sided" ).

    Konklusion

    Artiklen blev ret lang, men nu ved du: hvad er Students kriterium og normalfordeling; som at bruge funktioner qqplot og shapiro.test kontrollere data normalitet i R; og demonterede også tre typer t-tests og udførte dem i R-miljøet.

    Emnet for dem, der lige er begyndt at stifte bekendtskab med statistiske analyser, er ikke let. Så stil gerne spørgsmål, jeg svarer gerne på dem. Statistikguruer, ret mig venligst, hvis jeg har lavet en fejl et eller andet sted. Generelt, skriv dine kommentarer, venner!