T laskettu. Klassiset tilaston menetelmät: Studentin t-testi

Menetelmän avulla voit testata hypoteesin, että kahden yleisen populaation keskiarvot, joista verratut poimitaan riippuvainen näytteet eroavat toisistaan. Riippuvuuden oletus tarkoittaa useimmiten sitä, että ominaisuus mitataan samasta otoksesta kahdesti, esimerkiksi ennen interventiota ja sen jälkeen. Yleisessä tapauksessa kullekin yhden näytteen edustajalle osoitetaan edustaja toisesta näytteestä (ne yhdistetään pareittain), jotta nämä kaksi datasarjaa korreloivat positiivisesti keskenään. Otosriippuvuuden heikommat tyypit: näyte 1 - aviomiehet, näyte 2 - heidän vaimonsa; näyte 1 - vuoden ikäiset lapset, näyte 2 koostuu otokseen 1 kuuluvien lasten kaksosista jne.

Testattavissa oleva tilastollinen hypoteesi, kuten edellisessä tapauksessa, H 0: M1 = M2(keskiarvot näytteissä 1 ja 2 ovat yhtä suuret.) Jos se hylätään, hyväksytään vaihtoehtoinen hypoteesi, että M 1 enemmän vähemmän) M 2.

Alkuperäiset oletukset tilastolliseen testaukseen:

□ jokainen yhden otoksen edustaja (yhdestä yleisestä populaatiosta) liittyy toisen otoksen edustajaan (toisesta yleisestä populaatiosta);

□ kahden näytteen tiedot korreloivat positiivisesti (muodostavat pareja);

□ tutkitun ominaisuuden jakauma molemmissa otoksissa vastaa normaalilakia.

Lähdetietojen rakenne: jokaiselle kohteelle (jokaiselle parille) on kaksi tutkitun ominaisuuden arvoa.

Rajoitukset: ominaisuuden jakautuminen molemmissa näytteissä ei saisi poiketa merkittävästi normaalista; molempia näytettä vastaavien kahden mittauksen tiedot korreloivat positiivisesti.

Vaihtoehdot: Wilcoxonin T-testi, jos vähintään yhden näytteen jakauma poikkeaa merkittävästi normaalista; t-Student-testi riippumattomille näytteille - jos kahden näytteen tiedot eivät korreloi positiivisesti.

Kaava sillä Studentin t-testin empiirinen arvo kuvastaa sitä tosiasiaa, että erojen analyysiyksikkö on ero (vaihto) ominaisarvot jokaiselle havaintoparille. Sen mukaisesti kunkin N:n attribuuttiarvoparin osalta ero lasketaan ensin d i = x 1 i - x 2 i.

(3) missä M d – arvojen keskimääräinen ero; σ d – erojen keskihajonta.

Laskuesimerkki:

Oletetaan, että koulutuksen tehokkuutta testattaessa jokaiselle ryhmän kahdeksalle jäsenelle kysyttiin "Kuinka usein mielipiteesi osuvat yhteen ryhmän mielipiteiden kanssa?" - kahdesti, ennen ja jälkeen harjoituksen. Vastauksissa käytettiin 10 pisteen asteikkoa: 1 - ei koskaan, 5 - puolet ajasta, 10 - aina. Testattiin hypoteesia, että koulutuksen seurauksena osallistujien mukautumisen itsetunto (halu olla samanlainen kuin muut ryhmässä) nousisi (α = 0,05). Tehdään taulukko välilaskutoimituksia varten (Taulukko 3).

Taulukko 3

Eron aritmeettinen keskiarvo M d = (-6)/8= -0,75. Vähennä tämä arvo jokaisesta d:stä (taulukon toiseksi viimeinen sarake).

Keskihajonnan kaava eroaa vain siinä, että siinä esiintyy d X:n sijaan. Korvaamme kaikki tarvittavat arvot ja saamme

σ d = = 0,886.

Vaihe 1. Laske kriteerin empiirinen arvo käyttämällä kaavaa (3): keskimääräinen ero Md= -0,75; keskihajonta σ d = 0,886; t e = 2,39; df = 7.

Vaihe 2. Määritämme t-Student-kriteerin kriittisten arvojen taulukon avulla p-merkittävyyden. Kun df = 7, empiirinen arvo on kriittisten arvojen p = 0,05 ja p - 0,01 välillä. Siksi s< 0,05.

df R
0,05 0,01 0,001
2,365 3,499 5,408

Vaihe 3. Teemme tilastollisen päätöksen ja muotoilemme johtopäätöksen. Tilastollinen hypoteesi keskiarvojen yhtäläisyydestä hylätään. Johtopäätös: Osallistujien vaatimustenmukaisuuden itsearvioinnin indikaattori koulutuksen jälkeen nousi tilastollisesti merkitsevästi (merkittävyystasolla s< 0,05).

Parametriset menetelmät sisältävät kahden otoksen varianssien vertailu kriteerin mukaan F-Fisher. Joskus tämä menetelmä johtaa arvokkaisiin merkityksellisiin johtopäätöksiin, ja jos vertaillaan riippumattomien näytteiden keskiarvoja, varianssien vertailu on pakollinen menettelyä.

Laskea F em sinun on löydettävä kahden otoksen varianssien suhde ja niin, että suurempi varianssi on osoittajassa ja pienempi on nimittäjässä.

Varianssien vertailu. Menetelmän avulla voit testata hypoteesin, että kahden populaation varianssit, joista verratut otokset on otettu, eroavat toisistaan. Testattu tilastollinen hypoteesi H 0: σ 1 2 = σ 2 2 (näytteen 1 varianssi on yhtä suuri kuin näytteen 2 varianssi). Jos se hylätään, hyväksytään vaihtoehtoinen hypoteesi, että yksi varianssi on suurempi kuin toinen.

Alkuperäiset oletukset: kaksi näytettä otetaan satunnaisesti eri populaatioista, joissa tutkittava piirre jakautuu normaalisti.

Lähdetietojen rakenne: tutkittava ominaisuus mitataan objekteissa (kohteessa), joista kukin kuuluu johonkin verrattavasta näytteestä.

Rajoitukset: piirteen jakaumat kummassakaan otoksessa eivät eroa merkittävästi normaalista.

Vaihtoehtoinen menetelmä: Levenen testi, jonka käyttäminen ei edellytä normaalisuusoletuksen tarkistamista (käytetään SPSS-ohjelmassa).

Kaava Fisherin F-testin empiiriselle arvolle:

(4)

missä σ 1 2 - suuri dispersio ja σ 2 2 - pienempi dispersio. Koska ei etukäteen tiedetä kumpi dispersio on suurempi, niin p-tason määrittämiseen käytetään sitä Taulukko kriittisistä arvoista suuntaamattomille vaihtoehdoille. Jos F e > F Kp vastaavalle määrälle vapausasteita, sitten R < 0,05 и статистическую гипотезу о равенстве дисперсий можно отклонить (для α = 0,05).

Laskuesimerkki:

Lapsille tehtiin säännöllisiä laskutehtäviä, minkä jälkeen yhdelle satunnaisesti valitulle puolelle opiskelijoista kerrottiin, että he olivat läpäisseet kokeen, ja muille kerrottiin päinvastoin. Jokaiselta lapselta kysyttiin sitten, kuinka monta sekuntia heiltä kuluisi samanlaisen ongelman ratkaisemiseen. Kokeen suorittaja laski eron lapsen soittoajan ja suoritetun tehtävän tuloksen välillä (sekunteina). Epäonnistumisen sanoman odotettiin aiheuttavan jonkin verran riittämättömyyttä lapsen itsetunnossa. Testattava hypoteesi (tasolla α = 0,005) oli, että kokonaisitsetunnon varianssi ei riipu onnistumis- tai epäonnistumisraporteista (H 0: σ 1 2 = σ 2 2).

Seuraavat tiedot saatiin:


Vaihe 1. Laske kriteerin empiirinen arvo ja vapausasteiden lukumäärä kaavojen (4) avulla:

Vaihe 2. Fisherin f-kriteerin kriittisten arvojen taulukon mukaan ohjaamaton vaihtoehdot, joille löydämme kriittisen arvon df numero = 11; df tietää= 11. Kriittinen arvo on kuitenkin olemassa vain arvolle df numero= 10 ja df know = 12. On mahdotonta ottaa suurempaa määrää vapausasteita, joten otamme kriittisen arvon df numero= 10: Sillä R = 0,05 F Kp = 3,526; varten R = 0,01 F Kp = 5,418.

Vaihe 3. Tilastollisen päätöksen tekeminen ja mielekäs johtopäätös. Koska empiirinen arvo ylittää kriittisen arvon R= 0,01 (ja vielä enemmän p = 0,05), niin tässä tapauksessa s< 0,01 и принимается альтернативная гипо­теза: дисперсия в группе 1 превышает дисперсию в группе 2 (R< 0,01). Näin ollen epäonnistumisesta kertovan viestin jälkeen itsetunnon riittämättömyys on korkeampi kuin menestystä kertovan viestin jälkeen.

/ käytännön tilastot / referenssimateriaalit / opiskelijan t-testin arvot

Merkityst - Opiskelijan t-testi merkitsevyystasoilla 0,10, 0,05 ja 0,01

ν – vaihtelun vapausasteet

Normaalit Studentin t-testin arvot

Vapausasteiden lukumäärä

Merkitystasot

Vapausasteiden lukumäärä

Merkitystasot

Pöytä XI

Standardi Fisherin testiarvoja käytetään arvioimaan kahden näytteen välisten erojen merkitystä

Vapauden asteet

Merkitsevyystaso

Vapauden asteet

Merkitsevyystaso

Opiskelijan t-testi

Opiskelijan t-testi- Studentin jakaumaan perustuvien hypoteesien (tilastollisten testien) tilastollisen testauksen menetelmien yleinen nimi. Yleisimmät t-testin käyttötavat ovat keskiarvojen yhtäläisyyden testaus kahdessa otoksessa.

t-tilastot rakennetaan yleensä seuraavan yleisperiaatteen mukaan: osoittaja on satunnaismuuttuja, jolla on nolla matemaattista odotusta (jos nollahypoteesi täyttyy), ja nimittäjä on tämän satunnaismuuttujan otos keskihajonnan, joka saadaan satunnaismuuttujan neliöjuurena. sekoittamaton varianssiarvio.

Tarina

Tämän kriteerin on kehittänyt William Gossett arvioidakseen oluen laatua Guinness-yhtiössä. Liikesalaisuuksien paljastamatta jättämistä koskeviin velvollisuuksiin liittyen (Guinnessin johto piti tilastolaitteiston käyttöä työssään sellaisenaan) Gossetin artikkeli julkaistiin vuonna 1908 Biometrics-lehdessä salanimellä "Student".

Tietovaatimukset

Tämän kriteerin soveltamiseksi on välttämätöntä, että alkuperäisellä tiedolla on normaalijakauma. Käytettäessä kahden otoksen testiä riippumattomille näytteille on myös noudatettava varianssien yhtäläisyyden ehtoa. Opiskelijan t-testille on kuitenkin olemassa vaihtoehtoja tilanteisiin, joissa varianssit eivät ole yhtä suuret.

Tiedon normaalijakauman vaatimus on välttämätön tarkalle t (\displaystyle t) -testille. Kuitenkin myös muissa datajakaumissa on mahdollista käyttää t (\displaystyle t) -tilastoa. Monissa tapauksissa tällä tilastolla on asymptoottisesti standardi normaalijakauma - N (0, 1) (\displaystyle N(0,1)) , joten tämän jakauman kvantiileja voidaan käyttää. Usein kvanttiileja ei kuitenkaan käytetä tässäkään tapauksessa normaalista normaalijakaumasta, vaan vastaavasta Student-jakaumasta, kuten tarkassa t (\displaystyle t) -testissä. Ne ovat asymptoottisesti ekvivalentteja, mutta pienissä otoksissa Studentin jakauman luottamusvälit ovat leveämpiä ja luotettavampia.

Yhden näytteen t-testi

Käytetään testaamaan nollahypoteesia H 0: E (X) = m (\displaystyle H_(0):E(X)=m) matemaattisen odotuksen E (X) (\displaystyle E(X)) yhtäläisyydestä jokin tunnettu arvo m (\displaystyle m) .

Ilmeisesti, jos nollahypoteesi täyttyy, E (X ¯) = m (\displaystyle E((\overline (X)))=m) . Kun otetaan huomioon havaintojen oletettu riippumattomuus, V (X ¯) = σ 2 / n (\displaystyle V((\overline (X)))=\sigma ^(2)/n) . Käyttämällä puolueetonta varianssiarviota s X 2 = ∑ t = 1 n (X t − X ¯) 2 / (n − 1) (\displaystyle s_(X)^(2)=\sum _(t=1)^( n )(X_(t)-(\overline (X)))^(2)/(n-1)) saamme seuraavat t-tilastot:

t = X ¯ − m s X / n (\displaystyle t=(\frac ((\overline (X))-m)(s_(X)/(\sqrt (n)))))

Nollahypoteesin mukaan tämän tilaston jakauma on t (n − 1) (\displaystyle t(n-1)) . Näin ollen, jos tilaston itseisarvo ylittää tietyn jakauman kriittisen arvon (tietyllä merkitsevyystasolla), nollahypoteesi hylätään.

Kahden näytteen t-testi riippumattomille näytteille

Olkoon kaksi riippumatonta näytettä tilavuuksista n 1, n 2 (\displaystyle n_(1)~,~n_(2)) normaalijakautuneista satunnaismuuttujista X 1, X 2 (\displaystyle X_(1),~X_(2 )). On tarpeen testata nollahypoteesi näiden satunnaismuuttujien matemaattisten odotusten yhtäläisyydestä H 0: M 1 = M 2 (\displaystyle H_(0):~M_(1)=M_(2)) käyttämällä näytedataa.

Tarkastellaan eroa näytekeskiarvojen välillä Δ = X ¯ 1 − X ¯ 2 (\displaystyle \Delta =(\overline (X))_(1)-(\overline (X))_(2)) . Ilmeisesti jos nollahypoteesi on tosi E (Δ) = M 1 − M 2 = 0 (\displaystyle E(\Delta)=M_(1)-M_(2)=0) . Tämän eron varianssi on yhtä suuri näytteiden riippumattomuuden perusteella: V (Δ) = σ 1 2 n 1 + σ 2 2 n 2 (\displaystyle V(\Delta)=(\frac (\sigma _(1) )^(2))( n_(1)))+(\frac (\sigma _(2)^(2))(n_(2)))) . Sitten käyttämällä puolueetonta varianssiestimaattia s 2 = ∑ t = 1 n (X t − X ¯) 2 n − 1 (\displaystyle s^(2)=(\frac (\sum _(t=1)^(n)) ( X_(t)-(\overline (X)))^(2))(n-1))) saamme puolueettoman arvion otoskeskiarvojen välisen eron varianssista: s Δ 2 = s 1 2 n 1 + s 2 2 n 2 (\ displaystyle s_(\Delta )^(2)=(\frac (s_(1)^(2))(n_(1)))+(\frac (s_(2)^( 2))(n_(2) ))) . Siksi nollahypoteesin testaamisen t-tilasto on

T = X ¯ 1 − X ¯ 2 s 1 2 n 1 + s 2 2 n 2 (\displaystyle t=(\frac ((\overline (X))_(1)-(\overline (X))_( 2))(\sqrt ((\frac (s_(1)^(2))(n_(1)))+(\frac (s_(2)^(2))(n_(2))) ))

Jos nollahypoteesi pitää paikkansa, tällä tilastolla on jakauma t (d f) (\displaystyle t(df)), missä d f = (s 1 2 / n 1 + s 2 2 / n 2) 2 (s 1 2 / n 1) 2 / (n 1 - 1) + (s 2 2 / n 2) 2 / (n 2 - 1) (\displaystyle df=(\frac ((s_(1)^(2)/n_(1)) +s_(2)^(2)/n_(2)^(2))((s_(1)^(2)/n_(1))^(2)/(n_(1)-1)+ (s_(2)^(2)/n_(2))^(2)/(n_(2)-1))))

Saman varianssin tapaus

Jos näytteiden varianssien oletetaan olevan yhtä suuret, niin

V (Δ) = σ 2 (1 n 1 + 1 n 2) (\displaystyle V(\Delta)=\sigma ^(2)\left((\frac (1)(n_(1)))+(\ frac (1)(n_(2)))\oikea))

Sitten t-tilasto on:

T = X ¯ 1 - X 2 s X 1 n 1 + 1 n 2, s X = (n 1 - 1) s 1 2 + (n 2 - 1) s 2 2 n 1 + n 2 - 2 (\ displaystyle t=(\frac ((\overline (X))_(1)-(\overline (X))_(2))(s_(X)(\sqrt ((\frac (1)(n_(1)) )))+(\frac (1)(n_(2))))))~,~~s_(X)=(\sqrt (\frac ((n_(1)-1)s_(1)^ ( 2)+(n_(2)-1)s_(2)^(2))(n_(1)+n_(2)-2))))

Tällä tilastolla on jakauma t (n 1 + n 2 − 2) (\displaystyle t(n_(1)+n_(2)-2))

Kahden näytteen t-testi riippuville näytteille

t (\displaystyle t) -kriteerin empiirisen arvon laskemiseksi tilanteessa, jossa testataan hypoteesia kahden riippuvan otoksen eroista (esimerkiksi kaksi saman testin näytettä aikavälillä), käytetään seuraavaa kaavaa:

T = M d s d / n (\displaystyle t=(\frac (M_(d))(s_(d)/(\sqrt (n)))))

missä M d (\displaystyle M_(d)) on arvojen keskimääräinen ero, s d (\displaystyle s_(d)) on erojen keskihajonta ja n on havaintojen määrä

Tällä tilastolla on jakauma t (n − 1) (\displaystyle t(n-1)) .

Lineaarisen rajoitteen testaus lineaarisilla regressioparametreilla

T-testillä voidaan myös testata mielivaltaista (yksittäistä) lineaarista rajoitusta lineaarisen regression parametreille, jotka estimoidaan tavallisilla pienimmän neliösumman avulla. Olkoon tarpeen testata hypoteesia H 0: c T b = a (\displaystyle H_(0):c^(T)b=a) . Ilmeisesti, jos nollahypoteesi täyttyy, E (c T b ^ − a) = c T E (b ^) − a = 0 (\displaystyle E(c^(T)(\hat (b))-a)= c^( T)E((\hat (b)))-a=0) . Tässä käytetään malliparametrien E (b ^) = b (\displaystyle E((\hat (b)))=b) puolueettomien pienimmän neliösumman estimaattien ominaisuutta. Lisäksi V (c T b ^ − a) = c T V (b ^) c = σ 2 c T (X T X) − 1 c (\displaystyle V(c^(T)(\hat (b)))-a )=c^(T)V((\hat (b)))c=\sigma ^(2)c^(T)(X^(T)X)^(-1)c) . Käyttämällä tuntemattoman varianssin sijaan sen puolueetonta estimaattia s 2 = E S S / (n − k) (\displaystyle s^(2)=ESS/(n-k)) saadaan seuraavat t-tilastot:

T = c T b ^ − a s c T (X T X) − 1 c (\displaystyle t=(\frac (c^(T)(\hat (b)))-a)(s(\sqrt (c^(T)) (X^(T)X)^(-1)c)))))

Tällä tilastolla, kun nollahypoteesi täyttyy, on jakauma t (n − k) (\displaystyle t(n-k)) , joten jos tilaston arvo on suurempi kuin kriittinen arvo, niin lineaarisen rajoitteen nollahypoteesi hylätään.

Lineaarisen regressiokertoimen hypoteesien testaus

Lineaarisen rajoitteen erikoistapaus on hypoteesin testaaminen, että regressiokerroin b j (\displaystyle b_(j)) on yhtä suuri kuin tietty arvo a (\displaystyle a) . Tässä tapauksessa vastaava t-tilasto on:

T = b ^ j − a s b ^ j (\displaystyle t=(\frac ((\hat (b))_(j)-a)(s_((\hattu (b))_(j)))))

missä s b ^ j (\displaystyle s_((\hat (b))_(j))) on kerroinestimaatin keskivirhe - kerroinestimaattien kovarianssimatriisin vastaavan diagonaalielementin neliöjuuri.

Jos nollahypoteesi pitää paikkansa, tämän tilaston jakauma on t (n − k) (\displaystyle t(n-k)) . Jos tilaston itseisarvo on suurempi kuin kriittinen arvo, niin kertoimen ja a (\displaystyle a) välinen ero on tilastollisesti merkitsevä (ei-satunnainen), muuten se on merkityksetön (satunnainen eli todellinen kerroin on luultavasti yhtä suuri tai hyvin lähellä arvioitua arvoa (\ näyttötyyli a))

Kommentti

Matemaattisten odotusten yhden otoksen testi voidaan pelkistää lineaarisen regression parametrien lineaarisen rajoitteen testaamiseen. Yhden näytteen testissä tämä on vakion "regressio". Siksi regression s 2 (\displaystyle s^(2)) on näytearvio tutkittavan satunnaismuuttujan varianssista, matriisi X T X (\displaystyle X^(T)X) on yhtä suuri kuin n (\displaystyle n ) , ja mallin ”kertoimen” estimaatti on yhtä suuri kuin otoksen keskiarvo. Tästä saamme yllä olevan yleisen tapauksen t-tilaston lausekkeen.

Vastaavasti voidaan osoittaa, että kahden otoksen testi, jossa on samat otosvarianssit, rajoittuu myös lineaaristen rajoitusten testaamiseen. Kahden otoksen testissä tämä on "regressio" vakiolle ja valemuuttujalle, joka tunnistaa osaotoksen arvosta (0 tai 1) riippuen: y = a + b D (\displaystyle y=a+bD) . Hypoteesi näytteiden matemaattisten odotusten yhtäläisyydestä voidaan muotoilla hypoteesiksi tämän mallin kertoimen b yhtäläisyydestä nollan kanssa. Voidaan osoittaa, että sopiva t-tilasto tämän hypoteesin testaamiseen on yhtä suuri kuin kahden otoksen testille annettu t-tilasto.

Se voidaan myös lyhentää lineaarisen rajoitteen tarkistamiseen eri dispersioiden tapauksessa. Tässä tapauksessa mallivirhevarianssi saa kaksi arvoa. Tästä voit saada myös kahden otoksen testin kaltaisen t-tilaston.

Ei-parametriset analogit

Kahden näytteen testin analogi riippumattomille näytteille on Mann-Whitney U -testi. Riippuvien näytteiden tapauksessa analogit ovat etumerkkitesti ja Wilcoxonin T-testi

Kirjallisuus

Opiskelija. Todennäköinen keskiarvon virhe. // Biometria. 1908. nro 6 (1). s. 1-25.

Linkit

Novosibirskin osavaltion teknisen yliopiston verkkosivuilla olevista kriteereistä keinojen homogeenisuutta koskevien hypoteesien testaamiseksi

Tarina

Tämän kriteerin on kehittänyt William Gossett arvioidakseen oluen laatua Guinnessissa. Liikesalaisuuksien paljastamatta jättämistä koskeviin velvollisuuksiin liittyen (Guinnessin johto piti tilastolaitteiston käyttöä työssään sellaisenaan) Gossetin artikkeli julkaistiin vuonna 1908 Biometrics-lehdessä salanimellä "Student".

Tietovaatimukset

Tämän kriteerin soveltamiseksi on välttämätöntä, että alkuperäisellä tiedolla on normaalijakauma. Käytettäessä kahden otoksen testiä riippumattomille näytteille on myös noudatettava varianssien yhtäläisyyden ehtoa. Opiskelijan t-testille on kuitenkin olemassa vaihtoehtoja tilanteisiin, joissa varianssit eivät ole yhtä suuret.

Kahden näytteen t-testi riippumattomille näytteille

Jos otoskoko on hieman erilainen, likimääräisiin laskelmiin käytetään yksinkertaistettua kaavaa:

Jos otoskoko vaihtelee merkittävästi, käytetään monimutkaisempaa ja tarkempaa kaavaa:

Missä M 1 ,M 2 - aritmeettiset keskiarvot, σ 1, σ 2 - keskihajonnat ja N 1 ,N 2 - näytekoot.

Kahden näytteen t-testi riippuville näytteille

T-testin empiirisen arvon laskemiseksi tilanteessa, jossa testataan hypoteesia kahden riippuvan otoksen eroista (esimerkiksi kaksi näytettä samasta testistä tietyllä aikavälillä), käytetään seuraavaa kaavaa:

Missä M d on arvojen keskimääräinen ero ja σ d- erojen keskihajonta.

Vapausasteiden lukumäärä lasketaan kaavalla

Yhden näytteen t-testi

Käytetään hypoteesin testaamiseen keskiarvon ja jonkin tunnetun arvon välisestä erosta:

Vapausasteiden lukumäärä lasketaan kaavalla

Ei-parametriset analogit

Kahden näytteen testin analogi riippumattomille näytteille on Mann-Whitney U -testi. Riippuvien näytteiden tapauksessa analogit ovat etumerkkitesti ja Wilcoxonin T-testi

Studentin t-testin automaattinen laskenta


Wikimedia Foundation. 2010.

  • Guinness
  • Geokemiallinen säiliö

Katso, mitä "Opiskelijan T-testi" on muista sanakirjoista:

    Opiskelijan t-c-koe- Opiskelijan kriteeri tai t c. tai S. t -testi on tilastollinen kriteeri vertailujen keskiarvojen välisen eron merkitsevyydestä. Määritetään tämän eron suhteella erovirheeseen: Arvoille t... ... Genetiikka. tietosanakirja

    Opiskelijan koe- Studentin t-testi on yleinen nimitys menetelmäluokalle hypoteesien tilastolliseen testaukseen (tilastotestit), joka perustuu Studentin jakaumaan vertailuun. Yleisimmät t-testin käyttötapaukset liittyvät tasa-arvon tarkistamiseen... ... Wikipedia

    Opiskelijan koe- Stjūdento kriteerin status T ala kasviininkystė apibrėžtis Skirtumo tarp dviejų vidurkių patikimumo rodiklis, išreiškiamas skirtumo ir jo paklaidos santykiu. atitikmenys: engl. Opiskelijoiden testi rus. Opiskelijan testi... Maatalouden kasvivalinnan ja kasvitalouden terminų žodynas

    Opiskelijan koe- Tilastollinen testi, jossa nollahypoteesin oletuksen mukaan käytetyt tilastot vastaavat t-jakaumaa (Student-jakauma). Huomautus. Tässä on esimerkkejä tämän kriteerin soveltamisesta: 1. tarkistetaan... ... Sosiologisen tilastotieteen sanakirja

    OPISKELIJAKRITEERIA- Biometrinen indikaattori kahden eläinryhmän keskiarvojen välisen eron (td) luotettavuudesta suhteessa toisiinsa (M1 ja M2) mille tahansa ominaisuudelle. Eron luotettavuus määritetään kaavalla: Saatua td-arvoa verrataan... ... Maatalouseläinten jalostuksessa, genetiikassa ja lisääntymisessä käytetyt termit ja määritelmät

    OPISKELIJAKRITEERIA- arvioi kahden keskiarvon läheisyyden siltä kannalta, luokitellaanko se satunnaiseksi vai ei (tietyllä merkitsevyystasolla) vastaamalla kysymykseen, eroavatko keskiarvot tilastollisesti merkitsevästi toisistaan ​​/ B.A. Ashmarin. - M., 1978.


  • Zheleznyak, Yu.D., Petrov P.K. Liikunnan ja urheilun tieteellisen ja metodologisen toiminnan perusteet [Teksti]: Oppikirja. apu opiskelijoille korkeampi ped. oppilaitokset / Yu.D. Zheleznyak, P.K. Petrov. – M.: Publishing Center “Academy”, 2002, - 264 s.

  • Kuramshin, Yu.F. Fyysisen kulttuurin teoria ja metodologia [Teksti]: oppikirja / Yu.F. Kuramshin. – M.: Neuvostoliiton urheilu, 2004. – 464 s.

  • Novikov, A.M. Tieteellinen ja kokeellinen työ oppilaitoksessa [Teksti] / A.M. Novikov. – M.: Ammatillinen koulutus, 1998. – 134 s.

  • Petrov, P.K. Fyysinen kulttuuri [Teksti]: kurssityöt ja loppututkinnot / P.K. Petrov. - M.: Kustantaja VLADOS-PRESS, 2003.- 112 s.

  • Ohjelma erikoisalan lopullisen valtiontutkinnon saamiseksi 050720.65 - Liikunta, liikunnanopettajan pätevyys [Teksti] / koost. IN JA. Shalginova, O.A. Pavlyuchenko, A.V. Fominykh. – Abakan: Khakassin osavaltion yliopiston kustantamo nimetty. N.F.Katanova, 2010.

  • Uljaeva, L.G. Fyysinen kulttuuri. Osa 5 Fyysisen kulttuurin teoria ja menetelmät [Teksti] / L.G. Uljaeva, S.V. Shepel. – M.: Modern State University Distance Education, 2003. – S. 32-55.
  • Liite 1(edellytetään)

    Opinnäytetyön kansilomake
    ^ VENÄJÄN OPETUS- JA TIETEMINISTERIÖ


    ^

    TYÖNIMIKE
    Valmistuminen

    ^ PÄTEVÄÄ TYÖTÄ
    Opiskelija _______________________

    Tieteellinen johtaja

    _______________________________

    (koko nimi, akateeminen tutkinto, akateeminen arvonimi)

    Abakan 2014

    Liite 2(edellytetään)

    Opinnäytetyön otsikkosivun muoto

    ^ VENÄJÄN OPETUS- JA TIETEMINISTERIÖ

    Liittovaltion budjettikoulutuslaitos

    korkeampi ammatillinen koulutus

    "KHAKASSIN osavaltioyliopisto on nimetty. N.F. KATANOVA"
    ^ FYSIKAALISET TIEDOKONE
    Fyysisen kulttuurin ja urheilun teorian ja metodologian laitos

    Erikoisala 050720.65 "Liikuntakasvatus"

    TYÖNIMIKE

    ^ VALMISTETUA PÄÄTEVÄÄ TYÖTÄ
    Jatko-opiskelija __________________ _________________________

    (allekirjoitus) (koko nimi)

    Konsultti ______________ __________________

    (allekirjoitus) (koko nimi)

    Tieteellinen neuvonantaja __________________ ______________________

    (allekirjoitus) (koko nimi)

    Arvostelija __________________ ______________________

    (allekirjoitus) (koko nimi)

    "Hyväksy suojaksi"

    Pää osasto: ____________

    _________________________
    "____"___________20___

    Abakan, 2014

    Liite 3(edellytetään)

    Esimerkki sisällysluettelon suunnittelusta
    Sisällysluettelo

    Johdanto………………………………………………………………………………………….3

    Luku 1. Kirjallisuuskatsaus tutkimusaiheeseen...........................................................7


      1. Koordinointikyvyn käsite…………………………………………………7
    1.2. Kehon toimintojen koordinaatio on liikkeenhallinnan perusta………………………………………………………………………………………….………….. .13

    1.2.1. Aistikorjausten periaate liikkeenhallinnassa……………………………..13

    1.2.2. Aistijärjestelmien rooli liikkeenohjauksessa………………………………………17

    1.3. 13-14-vuotiaiden lasten anatomiset-fysiologiset ja psykologiset-pedagoogiset ominaisuudet………………………………………………………..………………………………… …………………………………… ....21

    Luku 2. Tutkimusmenetelmät ja -organisaatio………………………………..………….39

    2.1. Tutkimusmenetelmät…………………………………………………………………………39

    2.2. Tutkimuksen organisointi. ……………………………………………………………………………………… 41

    Luku 3. Tutkimustulokset ja keskustelu………………………..……...........48

    Johtopäätös……………………………………………………................................. ......................56

    Bibliografia………………………………………………………………………………………………………………………………………………

    Hakemukset………………..………………………………………………………………………….59

    Liite 4

    Esimerkkejä erityyppisten julkaisujen bibliografisista kuvauksista
    ^ Lainsäädäntömateriaalit

    Venäjän federaatio. perustuslaki (1993). Venäjän federaation perustuslaki [Teksti]: virallinen. teksti. – M.: Markkinointi, 2001. – 39 s.

    säännöt

    Turvallisuusmääräykset energiahuoltoorganisaatioiden hydraulisten rakenteiden ja hydromekaanisten laitteiden huollosta [Teksti]: RD 153-34.0-03.205–2001: hyväksytty. Venäjän energiaministeriö. Liitto 13.4.2001: syöttö. voimassa 1.11.01 alkaen. – M.: ENAS, 2001. – 158 s.

    Kirjat

    Agafonova, N.N. Siviilioikeus [Teksti]: oppikirja. käsikirja yliopistoille / N. N. Agafonova, T. V. Bogacheva, L. I. Glushkova; alla. kaikki yhteensä toim. A.G. Kalpina; auto sisääntulo Taide. N.N. Polivaev; M-yleensä ja prof. Venäjän federaation koulutus, Moskova. osavaltio laillinen akad. – Toim. 2., tarkistettu ja ylimääräistä – M.: Juristi, 2002. – 542 s.

    Väitöskirjat

    Belozerov, I. V. Kultaisen lauman uskonnollinen politiikka Venäjällä XIII-XIV vuosisadalla. [Teksti]: diss. ... cand. ist. Tieteet: 07.00.02: suojattu 01.22.02: hyväksytty. 07.15.02 / Belozerov Ivan Valentinovich. – M., 2002. – 215 s.

    Aikakauslehti

    Nykytieteen ajankohtaiset ongelmat [Teksti]: tieto-analyytikko. -lehteä / Sputnik+ Company LLC:n perustaja. – 2001, kesäkuu – . – M.: Sputnik +, 2001–. - Kaksi kuukautta. – ISSN 1680-2721.

    2001, nro 1–3. – 2000 kappaletta.

    Lehden artikkeli

    Balsevich, V.K. Olympiaurheilu ja liikuntakasvatus: suhteet ja dissosiaatiot // Fyysisen kulttuurin teoria ja käytäntö. - 1996, nro 10.- s. 2-7.
    ^ MONINÄTEISET PAINOKSET

    Asiakirja kokonaisuudessaan

    Gippius, Z.N. Teokset [Teksti]: 2 osassa / Zinaida Gippius; [johdanto. Art., valmistettu. tekstiä ja kommentoida. T. G. Yurchenko; Ross. akad. Tieteet, Tiedeinstituutti. tiedot yhteiskunnan toimesta tieteet]. – M.: Lakom-kirja: Gabestro, 2001. – 22 cm. – (Hopeaajan kultainen proosa). - Kadulla. vain auto ja korkki. ser. – 3500 kappaletta. – ISBN 5-85647-056-7 (käännetty).

    T. 1: Romaanit. – 367 s. – Bibliografia huomautuksessa: s. 360–366. – Sisältö: Ilman talismania; Voittajat; Hengen hämärä. – Liitteessä: Z. N. Gippius / V. Bryusov. – ISBN 5-85647-057-5.

    T. 2: Romaanit. – 415 s. – Sisältö: Paholaisen nukke; Elämäkerta luvussa 33. ; Roman-Tsarevitš: yhden yrityksen tarina; Jonkun toisen rakkaus. – ISBN 5-85647-058-3.

    Gippius, Z.N. Teokset [Teksti]: 2 osassa / Zinaida Gippius; [johdanto. Art., valmistettu. tekstiä ja kommentoida. T. G. Yurchenko; Ross. akad. Tieteet, Tiedeinstituutti. tiedot yhteiskunnan toimesta tieteet]. – M.: Lakom-kirja: Gabestro, 2001. – 2

    T. ; 22 cm – (Hopeakauden kultainen proosa). - Kadulla. vain auto ja korkki. ser. – 3500 kappaletta. – ISBN 5-85647-056-7 (käännetty).

    ^ Erillinen tilavuus

    Kazmin, V.D. Perhelääkärihakemisto [Teksti]: klo 3 / Vladimir Kazmin. – M.: AST: Astrel, 2001–. – 21 cm – ISBN

    5-17-011142-8 (AST).

    Osa 2: Lapsuuden sairaudet. – 2002. – 503, s. : sairas. – 8000 kappaletta. – ISBN

    5-17-011143-6 (AST) (kaistalla).

    ^ Artikkeli lähteestä...

    ...kirja tai muu kertaluonteinen julkaisu

    Dvinyaninova, G.S. Komplimentti: Kommunikaatiostatus tai -strategia diskurssissa [Teksti] / G. S. Dvinyaninova // Kielen sosiaalinen voima: kokoelma. tieteellinen tr. / Voronezh. alueiden välinen Yhteiskuntainstituutti. Tieteet, Voronezh. osavaltio Yliopisto, Fak. Romano-germaaninen. tarinoita. – Voronezh, 2001. – s. 101–106.
    ... sarjajulkaisu

    Mihailov, S.A Eurooppalaista ajamista [Teksti]: Venäjän maksullinen tiejärjestelmä on alussa. kehitysvaiheet / Sergei Mikhailov // Nezavisimaya kaasu. – 2002 – 17. kesäkuuta.

    Syksy on saapunut, mikä tarkoittaa, että on aika käynnistää uusi teemaprojekti "Tilastollinen analyysi R:n kanssa". Siinä tarkastellaan tilastollisia menetelmiä niiden käytännön soveltamisen näkökulmasta: selvitetään, mitä menetelmiä on olemassa, missä tapauksissa ja miten ne toteutetaan. Mielestäni Student Test tai t-testi on ihanteellinen johdatukseksi tilastollisen analyysin maailmaan. Opiskelijan t-testi on melko yksinkertainen ja suuntaa-antava, ja se vaatii myös vähintään tilastollisen perustiedot, joihin lukija voi tutustua tätä artikkelia lukiessaan.

    Huomautus_1: täällä ja muissa artikkeleissa et näe kaavoja ja matemaattisia selityksiä, koska... Tieto on tarkoitettu luonnontieteiden ja humanististen tieteiden opiskelijoille, jotka ottavat vasta ensimmäisiä askeleitaan tilastossa. analyysi.

    Mikä on t-testi ja missä tapauksissa sitä tulisi käyttää?

    Aluksi on todettava, että tilastoissa pätee usein Occamin partaveitsiperiaate, jonka mukaan ei ole mitään järkeä tehdä monimutkaista tilastoanalyysiä, jos voi käyttää yksinkertaisempaa (leipää ei pidä leikata moottorisahalla, jos sinulla on veitsi). Siksi yksinkertaisuudestaan ​​huolimatta t-testi on vakava työkalu, jos tiedät mitä se on ja missä tapauksissa sitä pitäisi käyttää.

    On uteliasta, että tämän menetelmän loi William Gosset, kemisti, joka on kutsuttu työskentelemään Guinnessin tehtaalla. Hänen kehittämänsä testi alun perin arvioi oluen laatua. Tehtaan kemistejä kuitenkin kiellettiin julkaisemasta itsenäisesti tieteellistä työtä omilla nimillään. Siksi William julkaisi vuonna 1908 artikkelinsa Biometrika-lehdessä salanimellä "Student". Myöhemmin erinomainen matemaatikko ja tilastotieteilijä Ronald Fisher jalosti menetelmää, joka sitten yleistyi nimellä Studentin t-testi.

    Opiskelijakoe (t-testi) on tilastollinen menetelmä, jonka avulla voit verrata kahden näytteen keskiarvoja ja tehdä testitulosten perusteella johtopäätöksen siitä, eroavatko ne tilastollisesti toisistaan ​​vai eivät. Jos haluat tietää, eroaako alueesi keskimääräinen elinajanodote maan keskiarvosta; vertailla perunasatoja eri alueilla; tai muuttuuko verenpaineesi ennen uuden lääkkeen ottamista ja sen jälkeen t-testi voi olla sinulle hyödyllistä. Miksi ehkä? Koska sen toteuttamiseksi, On välttämätöntä, että näytedatan jakauma on lähellä normaalia. Tätä tarkoitusta varten on olemassa arviointimenetelmiä, joiden avulla voidaan sanoa, onko tietyssä tapauksessa hyväksyttävää olettaa, että tiedot ovat normaalisti jakautuneet vai ei. Puhutaanpa tästä tarkemmin.

    Datan normaalijakauma ja menetelmät sen estimoimiseksi qqplot ja shapiro.test

    Tiedon normaalijakauma on tyypillistä kvantitatiivisille tiedoille, joiden jakautumiseen vaikuttavat monet tekijät tai se on satunnaista. Normaalijakaumalle on ominaista useita ominaisuuksia:

    • Se on aina symmetrinen ja kellomainen.
    • Keskiarvo ja mediaani ovat samat.
    • 68,2 % kaikista tiedoista on yhden keskihajonnan sisällä molempiin suuntiin, kahden sisällä - 95,5 %, kolmen sisällä - 99,7 %

    Luodaan satunnaisotos, jonka normaalijakauma on , jossa mittausten kokonaismäärä = 100, aritmeettinen keskiarvo = 5 ja keskihajonta = 1. Piirrä se sitten histogrammiksi:

    omat tiedot<- rnorm(100, mean = 5, sd = 1) hist(mydata, col = "light green")

    Kaaviosi voi poiketa hieman omastani, koska luvut on luotu satunnaisesti. Kuten näet, data ei ole täysin symmetrinen, mutta näyttää säilyttävän normaalijakauman muodon. Käytämme kuitenkin objektiivisempia menetelmiä tietojen normaaliuden määrittämiseen.

    Yksi yksinkertaisimmista normaaliuden testeistä on kvantiilikaavio (qqplot). Testin olemus on yksinkertainen: jos tiedoilla on normaalijakauma, niin niiden ei pitäisi poiketa suuresti teoreettisten kvantiilien rivistä ja ylittää luottamusvälit. Tehdään tämä testi R:ssä.

    paketti "auto" R-ympäristössä qqPlot(omatiedot) #suorita testi

    Kuten kaaviosta voidaan nähdä, tiedoissamme ei ole vakavia poikkeamia teoreettisesta normaalijakaumasta. Mutta joskus avustuksella qqplot On mahdotonta antaa yksiselitteistä vastausta. Tässä tapauksessa sinun tulee käyttää Shapiro-Wilk testi , joka perustuu nollahypoteesiin, jonka mukaan tietomme ovat jakautuneet normaalisti. Jos P-arvo on pienempi kuin 0,05 ( p-arvo < 0.05), то мы вынуждены отклонить нулевую гипотезу. P-значение в этом случае будет говорить о том, что вероятность ошибки при отклонении нулевой гипотезы будет равна менее 5%.

    Shapiro-Wilk-testin suorittaminen R:ssä on helppoa. Tätä varten sinun tarvitsee vain kutsua shapiro.test-toiminto ja lisätä tietojesi nimi sulkeisiin. Meidän tapauksessamme p-arvon tulisi olla merkittävästi suurempi kuin 0,05, mikä ei salli meidän hylätä nollahypoteesia, että tietomme ovat normaalijakaumia.

    Studentin t-testin suorittaminen R-ympäristössä

    Joten jos näytteiden tiedoilla on normaalijakauma, voit turvallisesti alkaa verrata näiden näytteiden keskiarvoja. T-testiä on kolme päätyyppiä, joita käytetään eri tilanteissa. Tarkastellaan jokaista niistä havainnollistavien esimerkkien avulla.

    Yhden näytteen t-testi

    On valittava yhden otoksen t-testi jos vertaat näytettä tunnettuun keskiarvoon. Eroaako esimerkiksi Pohjois-Kaukasuksen federaatiopiirin asukkaiden keski-ikä Venäjän yleisestä iästä? On olemassa mielipide, että Kaukasuksen ilmasto ja siellä asuvien kansojen kulttuuriset ominaisuudet pidentävät elämää. Tämän hypoteesin testaamiseksi otamme tiedot RosStatista (taulukot keskimääräisestä elinajanodoteesta Venäjän alueittain) ja käytämme yhden otoksen t-testiä. Koska Studentin t-testi perustuu tilastollisten hypoteesien testaamiseen, hyväksymme nollahypoteesiksi sen, että Venäjän ja Pohjois-Kaukasian tasavaltojen keskimääräisen odotuskestotason välillä ei ole eroja. Jos eroja on, niin jotta niitä voidaan pitää tilastollisesti merkittävinä p-arvo tulee olla pienempi kuin 0,05 (logiikka on sama kuin yllä kuvatussa Shapiro-Wilk-testissä).

    Ladataan tiedot R:hen. Tätä varten luomme vektorin, jossa on Kaukasuksen tasavaltojen (mukaan lukien Adygea) keskiarvot. Suoritetaan sitten yhden näytteen t-testi, joka määritellään parametrissa mu Keskimääräinen elinajanodote Venäjällä on 70,93.

    rosstat<-c(79.42, 75.83, 74.16, 73.91, 73.82, 73.06, 72.01) qqPlot(rosstat) shapiro.test(rosstat) t.test(rosstat, mu = 70,93)

    Vaikka meillä on vain 7 pistettä otoksessa, ne yleensä läpäisevät normaaliustestit ja voimme luottaa niihin, koska nämä tiedot on jo laskettu alueen keskiarvoihin.

    T-testin tulokset osoittavat, että Pohjois-Kaukasian asukkaiden keskimääräinen elinajanodote (74,6 vuotta) on todellakin korkeampi kuin Venäjän keskiarvo (70,93 vuotta), ja testitulokset ovat tilastollisesti merkitseviä (p< 0.05).

    Riippumaton kahden otoksen t-testi

    Käytetään kahden näytteen t-testiä, kun vertaat kahta riippumatonta näytettä. Oletetaan, että haluamme selvittää, eroavatko perunasadot alueen pohjoisessa ja etelässä. Tätä varten keräsimme tietoja 40 tilalta, joista 20 sijaitsi pohjoisessa ja muodostivat "pohjoisen" näytteen ja loput 20 sijaitsi etelässä muodostaen "eteläisen" näytteen.

    Ladataan tiedot R-ympäristöön. Tietojen normaaliuden tarkistamisen lisäksi on hyödyllistä luoda "whisker plot", josta näet molempien otosten datan mediaanit ja leviämisen.

    pohjoinen<- c(122, 150, 136, 129, 169, 158, 132, 162, 143, 179, 139, 193, 155, 160, 165, 149, 173, 173, 141, 166) qqPlot(pohjoinen) shapiro.test(pohjoinen) Etelä<- c(170, 163, 178, 150, 166, 142, 157, 149, 151, 164, 163, 161, 159, 139, 180, 155, 144, 139, 151, 160) qqPlot(pohjoinen) shapiro.test(pohjoinen) boxplot(pohjoinen, etelä)

    Kuten kaaviosta näkyy, otosmediaanit eivät poikkea kovinkaan paljon toisistaan, mutta tiedon leviäminen on paljon suurempi pohjoisessa. Tarkistetaan t.test-funktiolla, ovatko keskiarvot tilastollisesti erilaisia. Tällä kertaa kuitenkin parametrin tilalle mu laitamme toisen näytteen nimen. Testitulokset, jotka näet alla olevasta kuvasta, osoittavat, että pohjoisen keskimääräinen perunasato ei eroa tilastollisesti etelän sadosta ( s = 0.6339).

    Kaksi näytettä riippuvaisille näytteille ( riippuvainen kaksinäytettä t-testata)

    Kolmatta tyyppiä t-testiä käytetään, kun jos näytteiden elementit ovat riippuvaisia ​​toisistaan. Se on ihanteellinen toistettavuustarkastukset kokeilu: jos toistodata ei tilastollisesti eroa alkuperäisestä, niin tietojen toistettavuus on korkea. Myös kahden näytteen t-testiä riippuvaisille näytteille käytetään laajalti lääketieteellisessä tutkimuksessa kun tutkitaan lääkkeen vaikutusta kehoon ennen ja jälkeen annon.

    Jotta voit suorittaa sen R:ssä, sinun tulee syöttää sama t.test-funktio. Suluissa tietotaulukoiden jälkeen on kuitenkin syötettävä lisäargumentti parisuhteessa = TRUE. Tämä argumentti sanoo, että tietosi riippuvat toisistaan. Esimerkiksi:

    t.test(kokeilu, povtor.experimenta, paritettu = TOSI) t.test(davlenie.do.priema, davlenie.posle.priema, paritettu = TOSI)

    T.test-funktiossa on myös kaksi lisäargumenttia, jotka voivat parantaa testitulosten laatua: var.equal ja alternative . Jos tiedät, että näytteiden välinen vaihtelu on yhtä suuri, lisää argumentti var.equal = TRUE . Jos haluat testata hypoteesia, että otosten keskiarvojen ero on merkittävästi pienempi tai suurempi kuin 0, syötä argumentti vaihtoehto="vähemmän" tai vaihtoehto="suurempi" (oletusarvoisesti vaihtoehtoinen hypoteesi sanoo, että otokset ovat yksinkertaisesti erilaisia, ystävät: alternative="two.sided" ).

    Johtopäätös

    Artikkeli osoittautui melko pitkäksi, mutta nyt tiedät: mitä Student-testi ja normaalijakauma ovat; miten toimintoja käytetään qqplot Ja shapiro.test tarkista datan normaalius R:ssä; Lisäksi analysoitiin kolmen tyyppisiä t-testejä ja suoritettiin ne R-ympäristössä.

    Aihe ei ole helppo niille, jotka ovat vasta tutustumassa tilastolliseen analyysiin. Älä siis epäröi esittää kysymyksiä, vastailen niihin mielelläni. Tilastoguru, korjatkaa jos tein virheen jossain. Yleensä kirjoita kommenttisi, ystävät!