Opiskelijan T-kriteerin automaattinen laskenta verkossa. Erojen merkittävyyden määrittäminen Studentin t-testillä

Useimmissa tapauksissa vertailla kahden keskiarvoja riippumattomia näytteitä(s. 91) soveltaa Studentin t-testiä. Koska Studentin testi on parametrinen, sen käyttö on mahdollista vain, jos tutkimuksen tulokset esitetään mittausten muodossa. suhde mittakaavassa(s. 90).

Opiskelijan t-testi on merkitty t ja se lasketaan kaavalla*:

t = x1 – x2 / √ m1² + m2²

Tapauksissa, joissa havaintojen määrä (n) on yli 500, merkitsevyystaso p = 0,05 saavutetaan kohdassa t = 1,96, merkitsevyystasot p = 0,01 tai p = 0,001, vastaavasti, saavutetaan t = 2,59 ja t = 3,29.

Jos havaintojen määrä on alle 500, vaadittu t-arvo eri merkitsevyystasoille määritetään taulukosta 10.

Ennen kuin siirryt pöytään, sinun on määritettävä numero vapauden asteet. Tämä termi viittaa riippumattomien suureiden lukumäärään, jotka osallistuvat tietyn parametrin (f) muodostukseen. Vapausasteiden määrittämistä koskevat säännöt on esitetty erilaisissa matemaattisten tilastojen käsikirjoissa (Yu.K. Demyanenko, 1968). Studentin t-testiä laskettaessa vapausasteiden kokonaismäärä (f) on yhtä suuri kuin n1 + n2-2.

Joten esimerkiksi verrattaessa koe- ja kontrolliryhmän hiihtäjien tuloksia kontrollimatkan suorittamisessa, saatiin seuraavat tiedot: koeryhmän (n = 12 henkilöä) keskimääräinen indikaattori oli x = 34,6 s, keskiarvon virhe oli m = 0,47 s; vertailuryhmässä (n = 14 henkilöä) nämä tiedot olivat vastaavasti x = 37,3 sekuntia, m = 0,49 sekuntia.

Korvaamalla arvot kaavaan, saamme arvon t.

t = 37,3 - 34,6 / √ V 0,49 2 + 0,47 2 = 2,7 / 0,68 = 3,97

Kun vapausasteiden lukumäärä on määritetty (f = 12 + 14 - 2 = 24), saadaan taulukosta t:n arvo. Tuloksena oleva arvo 3,97 ylittää taulukon arvon 99 %:n luottamustasolle. Tämä tarkoittaa, että voidaan väittää, että kahden vertailuryhmän tulosten välillä on merkittäviä eroja merkitsevyystasolla p< 0,01.



Suhteellisen suurella mittausmäärällä on perinteisesti hyväksytty, että jos aritmeettisten keskiarvojen ero on yhtä suuri tai enemmän kuin kolme sen virhettä, eroja pidetään luotettavina. Tässä tapauksessa erojen luotettavuus määritetään seuraavalla yhtälöllä:

Х E -Х К >3√ me + mк ²

Yllä olevassa esimerkissä verrattiin eri ryhmiin osallistuneiden tuloksia, eli riippumattomia näytteitä. Siinä tapauksessa, että verrataan samassa ryhmässä kokeen alussa ja lopussa saatuja tuloksia, eli milloin riippuvat näytteet, laske Studentin testi tavallisella kaavalla se on kielletty . Opiskelijan kriteeri tulee tässä tapauksessa laskea kaavalla:

t = X 1 -X 2 / m1 ² + m2 ² - 2 rm1 m2

Missä r - tutkittavan ominaisuuden alku- ja lopputulosten välinen korrelaatiokerroin.

Taulukko 10

Raja-arvot t (Opiskelijan t-testi)

f Luottamustasot (P)
95% . 99% 99,9%
12,71 63.60
4.30 9.93 31.60
3.18 5.84 12.94
2.78 4.60 8.61
2.57 4.03 6.86
2.45 3.71 5.96
2.37 3.50 5.41
2.31 3.36 5,04
2.26 3.25 4.78
2.23 3.17 4.59
P 2.20 3.11 4.44
2.18 3.06 4.32
1.16 3.01 4.22
2.15 2,98 4,14
2.13 2.95 4.07
2.12 2,92 4.02
2.11 2.90 3.97
2.10 2.88 3.92
2.09 2.86 3.88
2.09 2.85 3.85
2.08 2,83 3.82
2.07 2.82 3.79
2.07 2.81 3,77
2.06 2.80 3.75
2,06 2.79 3.73
2.06 2.78 3.71
2.05 2.77 3.69
2.05 2.76 3.67
2.04 2.76 3.66
2.04 2,75 " 3.65
2.02 2,70 3.55
2.01 2.68 3,50
2.00 2.66 3.46
1.99 2.64 3.42
1.98 2.63 3.39
1.98 2,62 3.37
1.97 2.60 3.34
1.96 2,59 3.31
oo 1.96 2.59 3.29
Merkitystasot (p)
0,05 0,01 0,001

Johtopäätösten muotoilu

(päätelmä)

Työn lopussa tehdään johtopäätökset. Päätelmien muotoilu yhdessä johdannon kanssa on yksi vaikeimmista ja tärkeimmistä vaiheista kurssityön valmistelussa.

Päätelmien tulee heijastaa tutkimuksen merkittävimpiä tuloksia.

Päätelmien tekemisessä on useita yleisiä virheitä. Usein opiskelija rakentaa ehdotuksen niin, että se kuulostaa julistukselta hänen tekemänsä työn ("tutkittu", "kehitetty" jne.) tuloksista. Esimerkiksi:

"Tutkimuksen aikana selvitettiin kokeellisen metodologian pääsäännöt..." tai "Tunnistattiin indikaattoreita, joiden avulla voidaan arvioida pedagogisten erikoisalojen opiskelijoiden kommunikaatiotaitoja koululaisten liikunta- ja terveystyön toteutuksessa..." ”.

Jotta edellä mainitut olisivat johtopäätöksiä, lauseet tulisi jäsentää suunnilleen näin: "Muotoilemamme kokeellisen metodologian määräykset sallivat ..." ja vastaavasti: "Valituista indikaattoreista informatiivisin, mikä mahdollistaa meille arvioida opiskelijoiden viestintätaitojen tasoa pedagogiset erikoisuudet, ovat...”

Toinen yleinen virhe on, että opiskelija esittää johtopäätöksessä jotain ilmeistä, jonka toteaminen ei vaadi erityistä tutkimusta. Esimerkiksi:

"Koululaisten liikuntatunneilla on tarpeen ottaa huomioon tämän ikäisen teini-ikäisen kehitysominaisuudet."

Joskus johtopäätös osoittautuu täysin merkityksettömäksi. Tämä on yleensä ensimmäinen johtopäätös, jonka opiskelija tekee kirjallisuuden analyysin perusteella. Esimerkiksi:

"Tieteellisen ja metodologisen kirjallisuuden analyysi on osoittanut, että liikuntakasvatuksen teoriassa simulaattoreiden käyttöä uimareiden urheilukoulutuksessa ei ole vielä täysin käsitelty."

Johtopäätösten tulee kuvastaa informatiivisesti opiskelijan tekemää työtä, mutta ne eivät saa olla monisanaisia.


REKISTERÖINTIVAATIMUKSET

KURSSI TOIMII

Lopullisen pätevöintityön tulee sisältää seuraavat rakenneosat:

· Etusivu;

· käyttöönotto;

· pääteksti(luku 1, luku 2);

· johtopäätökset (päätelmä);

· bibliografia;

· sovellukset(jos niille on tarvetta).

Opintojakson optimaalinen määrä on 40-50 sivua koneella kirjoitettua tekstiä 1:n jälkeen ,5 intervalli (mukaan lukien kuvat, taulukot, kaaviot, bibliografia ja liitteet).

Fonttikoko 14 Times New Roman.

Työ valmistetaan tietokoneella tai käsin kirjoitettuna (toinen vaihtoehto on vähemmän toivottava).

Tietokoneversiossa työn teksti painetaan puolentoista välein tavallisen A4-paperiarkin (210x297 mm) toiselle puolelle. Työsivun reunusten mitat tulee olla seuraavat: vasen - 30 mm, oikea - 10 mm, ylhäältä - 20 mm, ala - 25 mm.

Taulukot, kuvat, piirustukset, kaaviot, kaaviot tulee tehdä standardi A4-arkeille (210x297 mm). Allekirjoitukset ja selitykset tulee olla etupuolella.

Kaikki lopullisten sertifiointitöiden sivut, mukaan lukien kuvat ja liitteet, on numeroitu otsikkosivusta viimeiseen sivuun ilman puutteita tai toistoja. Ensimmäistä sivua pidetään otsikkosivuna, sille ei sijoiteta numeroa "1", numero "2" sijoitetaan seuraavalle sivulle jne. Sarjanumero sijoitetaan sivun alareunan keskelle.

Kaikki sisällysluettelon (suunnitelman) mukainen loppusertifiointitöiden materiaali on jaettu kappaleisiin. Kappaleiden nimien tulee vastata sisältöä ja ne on painettava otsikkona pienillä kirjaimilla ilman alleviivausta.

Teoksessa hyväksytään tavalliset yleisesti hyväksytyt lyhenteet, kuten "etc.", "etc.", "etc." jne.. "jne.", "katso", "sivu".

Taulukoiden ja kuvien malliesimerkki on liitteessä 3.

Etusivu

Nimilehdellä on tietoa teoksesta. Se osoittaa sen laitoksen nimen, jossa työ suoritettiin; kirjoittajan sukunimi, etunimi, sukunimi; Nimi; tieteellisen ohjaajan (konsultin) sukunimi, etunimi, sukunimi, akateeminen tutkinto ja akateeminen arvonimi; kaupunki, vuosi Lopullisten sertifiointitöiden otsikkosivu on esitetty kuvassa 1.

Liittovaltion autonominen oppilaitos

Korkeampi koulutus

"Nižni Novgorodin valtionyliopisto on nimetty. N.I. Lobatševski"

Arzamas haara

Luonnonmaantieteen tiedekunta

Fyysisen kulttuurin laitos

Kurssialalla

"Fyysisen kulttuurin teoria ja metodologia"

aiheesta:

"Liikunta- ja terveystuntien metodologiset piirteet

esikoululaisten kanssa"

Valmistunut:

Ivanov A.V.,

opiskelijaohje 034300 (49.03.01)

Fyysinen kulttuuri

profiili "Paltojohtaminen

fyysinen kulttuuri"

koulutusmuoto - kirjeenvaihto

(koko lukukausi /

nopeutettu koulutusohjelma)

1 (2) opintojakso, ryhmä 11 (12)

Tieteellinen neuvonantaja:

Ph.D., apulaisprofessori Sidorova T.V.

Arzamas

Riisi. 1. Lukuoppikirjan otsikkosivu

Lopullisissa sertifiointipapereissa käytetään sanaa "sisältöluettelo", ei "sisältö". Sisällysluettelo on yksittäisen teoksen otsikoiden (lukujen) hakemisto, kun sisältö on hakemisto julkaisuun sisältyvien eri teosten nimistä. Lukukulttuurin näkökulmasta sisällysluettelo sijoitetaan työn alkuun: lukija alkaa tutustua tutkimukseen sisällysluettelosta.

Sisällysluetteloa suunniteltaessa jokainen alaotsikko on sisennettävä sen edellisen pääotsikon oikealle puolelle, johon se liittyy, ja sijoitettava ensimmäinen numero sen otsikon ison kirjaimen alle, johon se suoraan liittyy. Kaikkien samantasoisten otsikoiden tulee alkaa samalta pystyviivalta. Tällaisen suunnitelman avulla voit nähdä selvästi kaiken materiaalin alaisuuden. Esimerkiksi:

Johdanto. . . . . . . . . . . . . . . . . . . . . . . ... . . . ... . . . . . . . . . . . . . . . . . . . . . . . . . . .
Ongelmana on tiedon kehittäminen opiskelijoiden keskuudessa heidän motivaation lisäämiseksi harjoittaa liikuntaa. . . . ………….. . . .
1. Opiskelijoiden fyysinen kulttuuri nykyvaiheessa. . . . .…………
1.11.1 Muuttuvat painopisteet opiskelijoiden liikunnassa 20-90-luvulla. . . . . . . . ………..
1.1 1.2 Opiskelijoiden nykyaikaisen koulutuksen suunta liikuntakasvatuksen alalla. . . . . . . . …………
2. Opiskelijoiden motivaation muodostuminen fyysiseen harjoitteluun. . . . . . . . . . . . . . . . . . . . ………
2.12.2 Opiskelijoiden asenteet liikuntaa kohtaan.
Johtopäätös………………………………………………………………………. 14
Bibliografia…………………………………………………………………
Sovellukset

Sisällysluettelon sisennysten samoiksi ja sivunumeroiden tasaamiseksi on suositeltavaa käyttää taulukkomuotoa, jonka rivit on asetettu parametreihin näkymättömiksi.

Loppusertifiointityössä tekstin rubrikointi on erittäin tärkeää. Rubriikit paljastavat tekstin rakenteen, osoittavat osien ja alaosien yhteyden ja keskinäisen riippuvuuden.

Kappaleiden otsikoiden tulee kuvastaa tarkasti niihin liittyvän tekstin sisältöä. Niiden ei pitäisi vähentää tai laajentaa niiden sisältämän semanttisen tiedon määrää.

Kappaleiden ja alakohtien otsikot sijaitsevat erillisen rivin keskellä ja ne on painettu lihavoituna, suoralla kirjasimella, pienillä kirjaimilla, paitsi ensimmäinen - isot kirjaimet (kuva 2).

1.1. Asennon käsite

Riisi. 2. Esimerkki kappaleen otsikosta

Otsikko erotetaan sitä seuraavasta tekstistä yhdellä välilyönnillä (yksi ei-tulostuva merkki) ja sitä edeltävästä tekstistä kahdella välilyönnillä (kaksi ei-tulostuvaa merkkiä toistensa alla). Otsikko ei voi olla sivun viimeinen rivi.

Kappaleen sisennys asetetaan vaihtoehdoilla "Muoto" ® "Kappale" ® "Sisennykset ja väli" ® "Ensimmäinen rivi" ® "Sisennys" ® 1,25 cm (1,27 cm). Kappaleen sisennystä ei voi asettaa painamalla näppäintä!

Fontin kohokohdat

Kappaleen sisällön alistaminen, tekstin osien ja elementtien merkittävyyden rajaaminen formalisoidaan fonttivalinnalla (painoltaan erilainen, kirjainten viivat vinot, numerojärjestyksessä).

Tieteellisissä töissä on tapana käyttää fontin alistamista (taulukko 11).

​ Paired Studentin t-testi on yksi Studentin menetelmän muunnelmista, jolla määritetään parillisten (toistuvien) mittausten erojen tilastollinen merkitsevyys.

1. T-testin kehityshistoria

t-testi kehitettiin William Gossett arvioida oluen laatua Guinness-yhtiössä. Yritystä kohtaan liikesalaisuuksien paljastamatta jättämistä koskevien velvoitteiden vuoksi Gossetin artikkeli julkaistiin vuonna 1908 Biometrics-lehdessä salanimellä "Student".

2. Mihin paritettua Studentin t-testiä käytetään?

Vertailuun käytetään Studentin t-testiä kaksi riippuvaista (parillista) näytettä. Riippuvaisia ​​ovat samoilta potilailta mutta eri aikoina tehdyt mittaukset, esimerkiksi verenpainepotilailla, joilla on korkea verenpaine ennen ja jälkeen verenpainelääkkeen ottaminen. Nollahypoteesi väittää, että vertailtavien näytteiden välillä ei ole eroja, vaihtoehtoisen hypoteesin mukaan tilastollisesti merkitseviä eroja on.

3. Missä tapauksissa voit käyttää parillista Studentin t-testiä?

Pääehto on näytteen riippuvuus eli vertailuarvot on saatava yhden parametrin toistuvista mittauksista.

Kuten riippumattomien näytteiden vertailussa, parillisen t-testin käyttäminen edellyttää, että alkuperäiset tiedot ovat normaalijakauma. Jos tämä ehto ei täyty, otosten keskiarvojen vertailuun tulee käyttää menetelmiä ei-parametriset tilastot, kuten G-merkin testi Ja Wilcoxonin T-testi.

Paritettua t-testiä voidaan käyttää vain vertailussa kaksi näytteet. Jos pitää verrata kolme tai enemmän toistuvia mittauksia tulee käyttää yksisuuntainen ANOVA toistuville mittauksille.

4. Miten parillinen Studentin t-testi lasketaan?

Parillinen Studentin t-testi lasketaan seuraavalla kaavalla:

Missä M d - ennen ja jälkeen mitattujen indikaattoreiden välisten erojen aritmeettinen keskiarvo, σ d - indikaattoreiden erojen keskihajonta, n - opiskeltujen aineiden määrä.

5. Kuinka tulkita Studentin t-testin arvo?

Tuloksena saadun Studentin t-testin arvon tulkinta ei poikkea t-testin arvioinnista riippumattomille populaatioille. Ensinnäkin sinun on löydettävä vapausasteiden lukumäärä f seuraavan kaavan mukaan:

f = n - 1

Tämän jälkeen määritetään Studentin t-testin kriittinen arvo vaaditulle merkitsevyystasolle (esim.<0,05) и при данном числе степеней свободы f taulukon mukaan ( Katso alempaa).

Vertailemme kriteerin kriittisiä ja laskettuja arvoja:

  • Jos parillisen Studentin t-testin laskettu arvo yhtä suuri tai suurempi kriittistä, havaitaan taulukosta, päättelemme, että vertailuarvojen väliset erot ovat tilastollisesti merkittäviä.
  • Jos lasketun parillisen Studentin t-testin arvo Vähemmän taulukkona, mikä tarkoittaa, että vertailuarvojen väliset erot eivät ole tilastollisesti merkittäviä.

6. Esimerkki Studentin t-testin laskemisesta

Uuden hypoglykeemisen aineen tehokkuuden arvioimiseksi diabetes mellituspotilailta mitattiin verensokeri ennen lääkkeen ottamista ja sen jälkeen. Tuloksena saatiin seuraavat tiedot:

Ratkaisu:

1. Laske kunkin arvoparin ero ( d):

Potilas N Verensokeri, mmol/l Ero (d)
ennen lääkkeen ottamista lääkkeen ottamisen jälkeen
1 9.6 5.7 3.9
2 8.1 5.4 2.7
3 8.8 6.4 2.4
4 7.9 5.5 2.4
5 9.2 5.3 3.9
6 8.0 5.2 2.8
7 8.4 5.1 3.3
8 10.1 6.9 3.2
9 7.8 7.5 2.3
10 8.1 5.0 3.1

2. Laske erojen aritmeettinen keskiarvo kaavalla:

3. Laske erojen keskihajonna kaavalla:

4. Laske parillisen Studentin t-testi:

5. Verrataan saatua Studentin t-testin 8.6 arvoa taulukon arvoon, joka vapausasteiden lukumäärään f yhtä suuri kuin 10 - 1 = 9 ja merkitsevyystaso p=0,05 on 2,262. Koska saatu arvo on suurempi kuin kriittinen arvo, päättelemme, että veren glukoositasoissa on tilastollisesti merkitseviä eroja ennen uuden lääkkeen ottamista ja sen jälkeen.

Yleisin tehtävä psykologisessa tutkimuksessa on tunnistaa eroja kahden tai useamman ominaisuusryhmän välillä. Tällaisten erojen tunnistaminen aritmeettisten keskiarvojen tasolla otetaan huomioon primaaritilastojen analysointimenettelyssä. Herää kuitenkin kysymys, kuinka luotettavia nämä erot ovat ja voidaanko niitä laajentaa (ekstrapoloida) koko väestöön. Tämän ongelman ratkaisemiseksi he käyttävät useimmiten (olettaen normaalijakauman tai lähellä normaalijakaumaa) t - testiä (Student's test), jonka tarkoituksena on selvittää, kuinka luotettavasti yhden koehenkilönäytteen indikaattorit eroavat toisista (esim. kun koehenkilöt saavat yhden ryhmän testauksen tuloksena korkeammat pisteet kuin toisen ryhmän edustajat). Tämä on parametrinen kriteeri, ja sillä on kaksi päämuotoa:

1) riippumaton (pariton) t - testi, jonka tarkoituksena on selvittää, onko eroja saatujen pisteiden välillä, kun samaa testiä testataan kahta eri ihmisistä muodostettua ryhmää. Tämä voi olla esimerkiksi älykkyyden tai neuropsyykkisen vakauden, menestyneiden ja epäonnistuneiden opiskelijoiden ahdistuneisuuden vertailu tai eri luokkien, ikäisten, sosiaalisten tasojen ja vastaavien opiskelijoiden vertailu näillä ominaisuuksilla. Tutkittavissa olevissa otoksissa voi olla otoksia eri sukupuolista, eri kansallisuuksista sekä osaotoksia, jotka on tunnistettu tietyn ominaisuuden mukaan. Kriteeriä kutsutaan "liittymättömäksi", koska vertailtavat ryhmät on muodostettu eri ihmisistä;

2) kytketty (paritettu) t - testi, jota käytetään vertaamaan kahden ryhmän indikaattoreita, joiden elementtien välillä on tietty yhteys. Tämä tarkoittaa, että jokainen ensimmäisen ryhmän elementti vastaa toisen ryhmän elementtiä, joka on samanlainen kuin se tietyn tutkijaa kiinnostavan parametrin mukaan. Useimmiten samojen yksilöiden parametreja verrataan ennen ja jälkeen tietyn tapahtuman tai toimenpiteen (esimerkiksi pitkittäistutkimuksen tai formatiivisen kokeen aikana). Siksi tätä kriteeriä käytetään vertaamaan samojen henkilöiden suorituskykyä ennen ja jälkeen kyselyn, kokeen tai tietyn ajan kuluttua.

Jos data ei ole normaalijakauman alainen, käytä t-testiä vastaavia ei-parametrisia testejä: Mann-Whitney-testiä, joka vastaa paritonta t-testiä, ja Two-Sample Wilcoxon-testiä, joka vastaa parillista t-testiä.

Käyttämällä t -testejä ja niiden ei-parametrisia vastineita voit verrata vain kahden ryhmän tuloksia, jotka on saatu samalla testillä. Joissakin tapauksissa on kuitenkin tarpeen verrata useita ryhmiä tai erityyppisiä arvioita. Tämä voidaan tehdä vaiheittain jakamalla tehtävä useisiin vertailupareihin (esimerkiksi jos haluat vertailla ryhmiä A, B ja Y testien X ja Y tulosten perusteella, niin t - testiä käyttämällä voit ensin vertailla ryhmät A ja B kokeen X tulosten mukaan, sitten A ja B kokeen C tulosten perusteella, A ja C kokeen X tulosten perusteella jne.). Tämä on kuitenkin erittäin työvoimavaltainen menetelmä, joten he turvautuvat monimutkaisempaan varianssianalyysimenetelmään.

Menetelmä aritmeettisten keskiarvojen erojen luotettavuuden arvioimiseksi varsin tehokkaalla parametrisella Student-testillä on tarkoitettu ratkaisemaan yksi tietojenkäsittelyn aikana useimmin havaituista ongelmista - kahden tai useamman arvosarjan välisten erojen luotettavuuden tunnistaminen. Tällainen arviointi on usein tarpeen polaaristen ryhmien vertailevassa analyysissä. ne erotetaan tutkittavan ilmiön tietyn kohdemerkin (ominaisuuksien) eri ilmaisujen perusteella. Pääsääntöisesti analyysi alkaa laskemalla valittujen ryhmien ensisijainen tilasto, jonka jälkeen arvioidaan erojen merkittävyyttä.Studioijan kriteeri lasketaan kaavalla:

Studentin testin arvo kolmelle luottamustasolle (tilastollinen) merkitsevyys (p) on annettu matemaattisten tilastojen hakuteoksissa. Vapausasteiden lukumäärä määritetään kaavalla:

Otoskoot pienenevät (n<10) критерий Стьюдента становится чувствительным к форме распределения исследуемого признака в генеральной совокупности. Поэтому в сомнительных случаях рекомендуют использовать непараметрические методы или сравнивать полученные значения с критическими (табл. 2.17) для высшего уровня значимости.

Päätös erojen luotettavuudesta tehdään, jos laskettu t-arvo ylittää taulukon arvon tietyllä määrällä vapausasteita (d (v)). Julkaisut tai tieteelliset raportit osoittavat korkean tason kolmesta: s<0,05; р <0,01; р <0,001.

Millä tahansa keskiarvojen välisen eron luotettavuuden kriteerin numeerisella arvolla tämä indikaattori ei arvioi tunnistetun eron astetta (se arvioidaan itse keskiarvojen välisen eron perusteella), vaan ainoastaan ​​sen tilastollista luotettavuutta, eli oikeus laajentaa näytteiden vertailun perusteella saatu päätelmä eron olemassaolosta koko ilmiöön (koko prosessiin) kokonaisuutena. Pieni laskettu erokriteeri ei voi toimia todisteena kahden ominaisuuden (ilmiön) välisen eron puuttumisesta, koska sen merkitys (luotettavuusaste) ei riipu pelkästään keskiarvojen koosta, vaan myös verrattavien näytteiden lukumäärästä. Se ei osoita eron puuttumista, vaan sitä, että tällaisella otoskoolla se on tilastollisesti epäluotettava: on erittäin suuri mahdollisuus, että ero näissä olosuhteissa on satunnainen, sen luotettavuuden todennäköisyys on erittäin pieni.

Taulukko 2.17. Luottamusrajat Studentin testille (t-testi) f vapausasteiden osalta

Muutos tehtävän suorittamiseen kuluvassa keskimääräisessä ajassa toisessa kokeessa (verrattuna ensimmäiseen kokeeseen) ei ole luotettava.

Tämä lauseke ei vastaa väitettä kahden vertailtavan näytteen tilastollisesta homogeenisuudesta. Lisäksi Studentin kriteerin soveltaminen tällaisten eriarvoisten otosten tapauksessa ei ole matemaattisesti täysin oikein ja tietysti vaikuttaa Xav = 9,1 ja Xav = 8,5 välisten erojen lopulliseen epäluotettavuuteen. Tätä kriteeriä käyttäen ei arvioida kahden keskiarvon läheisyysastetta, vaan otetaan huomioon satunnaisuuden osoitus tai seine (tietyllä merkitsevyystasolla). .

jossa f on vapausaste, joka määritellään seuraavasti

Esimerkki . Kaksi opiskelijaryhmää koulutettiin kahdella eri menetelmällä. Koulutuksen lopussa heille annettiin koe koko kurssin ajan. On arvioitava, kuinka merkittäviä erot hankituissa tiedoissa ovat. Testitulokset on esitetty taulukossa 4.

Taulukko 4

Lasketaan otoksen keskiarvo, varianssi ja keskihajonta:

Määritetään t p:n arvo kaavalla t p = 0,45

Taulukon 1 (katso liite) avulla saadaan kriittinen arvo t k merkitsevyystasolle p = 0,01

Johtopäätös: koska kriteerin laskettu arvo on pienempi kuin kriittinen arvo 0,45<2,88 гипотеза Но подтверждается и существенных различий в методиках обучения нет на уровне значимости 0,01.

Algoritmi Studentin t-testin laskentaan riippuvaisille mittausnäytteille

1. Määritä t-testin laskettu arvo kaavalla

, Missä

2. Laske vapausaste f

3. Määritä t-testin kriittinen arvo liitteen taulukon 1 mukaisesti.

4. Vertaa t-testin laskettua ja kriittistä arvoa. Jos laskettu arvo on suurempi tai yhtä suuri kuin kriittinen arvo, hypoteesi keskiarvojen yhtäläisyydestä kahdessa muutosnäytteessä hylätään (Ho). Kaikissa muissa tapauksissa se hyväksytään tietyllä merkitsevyystasolla.

U- kriteeriManna- Whitney

Kriteerin tarkoitus

Kriteeri on tarkoitettu arvioimaan kahden ei-parametrisen näytteen välisiä eroja minkä tahansa kvantitatiivisesti mitatun ominaisuuden tason suhteen. Sen avulla voit tunnistaa erot pienten näytteiden välillä, kun n< 30.

Kriteerin kuvaus

Tämä menetelmä määrittää, onko kahden sarjan päällekkäisten arvojen alue tarpeeksi pieni. Mitä pienempi tämä alue, sitä todennäköisemmin erot ovat merkittäviä. U-kriteerin empiirinen arvo heijastaa sitä, kuinka suuri rivien välinen sopimusalue on. Siksi mitä pienempi U on, sitä todennäköisemmin erot ovat merkittäviä.

Hypoteesit

MUTTA: Ominaisuuden taso ryhmässä 2 ei ole alempi kuin ryhmän 1 piirteen taso.

HI: Ominaisuuden taso ryhmässä 2 on alhaisempi kuin ryhmän 1 piirteen taso.

Algoritmi Mann-Whitney-kriteerin laskemiseksi (u)

    Siirrä kaikkien koehenkilöiden tiedot yksittäisille korteille.

    Merkitse näytteen 1 koehenkilöiden kortit yhdellä värillä, esimerkiksi punaisella, ja kaikki näytteen 2 kortit toisella värillä, esimerkiksi sinisellä.

    Järjestä kaikki kortit yhdelle riville attribuutin kasvuasteen mukaan riippumatta siitä, mihin otokseen ne kuuluvat, ikään kuin työskennellämme yhden suuren näytteen kanssa.


missä n 1 on koehenkilöiden lukumäärä näytteessä 1;

n 2 – koehenkilöiden määrä otoksessa 2,

T x – suurempi kahdesta huutomäärästä;

n x – niiden koehenkilöiden lukumäärä ryhmässä, joilla on suurempi pistemäärä.

9. Määritä U:n kriittiset arvot taulukon 2 mukaan (katso liite).

Jos U em.> U cr0.05, niin hypoteesi But hyväksytään. Jos U emp.≤ U cr, se hylätään. Mitä pienempi U-arvo on, sitä suurempi on erojen luotettavuus.

Esimerkki. Vertaa kahden opetusmenetelmän tehokkuutta kahdessa ryhmässä. Testitulokset on esitetty taulukossa 5.

Taulukko 5

Siirretään kaikki tiedot toiseen taulukkoon korostaen toisen ryhmän tiedot alleviivauksella ja tehdään kokonaisotoksesta järjestys (ks. ranking-algoritmi tehtävän 3 ohjeista).

Arvot

Etsitään kahden otoksen rivien summa ja valitaan suurempi: T x = 113

Lasketaan kriteerin empiirinen arvo kaavalla 2: U p = 30.

Määritämme liitteen taulukon 2 avulla kriteerin kriittisen arvon merkitsevyystasolla p = 0,05: U k = 19.

Johtopäätös: kriteerin lasketusta arvosta lähtienUon kriittistä suurempi merkitsevyystasolla p = 0,05 ja 30 > 19, silloin hypoteesi keskiarvojen yhtäläisyydestä hyväksytään ja erot opetusmenetelmissä ovat merkityksettömiä.

Menetelmän avulla voit testata hypoteesin, että kahden yleisen populaation keskiarvot, joista verratut poimitaan riippuvainen näytteet eroavat toisistaan. Riippuvuuden oletus tarkoittaa useimmiten sitä, että ominaisuus mitataan samasta otoksesta kahdesti, esimerkiksi ennen interventiota ja sen jälkeen. Yleisessä tapauksessa kullekin yhden näytteen edustajalle osoitetaan edustaja toisesta näytteestä (ne yhdistetään pareittain), jotta nämä kaksi datasarjaa korreloivat positiivisesti keskenään. Otosriippuvuuden heikommat tyypit: näyte 1 - aviomiehet, näyte 2 - heidän vaimonsa; näyte 1 - vuoden ikäiset lapset, näyte 2 koostuu otokseen 1 kuuluvien lasten kaksosista jne.

Testattavissa oleva tilastollinen hypoteesi, kuten edellisessä tapauksessa, H 0: M1 = M2(keskiarvot näytteissä 1 ja 2 ovat yhtä suuret.) Jos se hylätään, hyväksytään vaihtoehtoinen hypoteesi, että M 1 enemmän vähemmän) M 2.

Alkuperäiset oletukset tilastolliseen testaukseen:

□ jokainen yhden otoksen edustaja (yhdestä yleisestä populaatiosta) liittyy toisen otoksen edustajaan (toisesta yleisestä populaatiosta);

□ kahden näytteen tiedot korreloivat positiivisesti (muodostavat pareja);

□ tutkitun ominaisuuden jakauma molemmissa otoksissa vastaa normaalilakia.

Lähdetietojen rakenne: jokaiselle kohteelle (jokaiselle parille) on kaksi tutkitun ominaisuuden arvoa.

Rajoitukset: ominaisuuden jakautuminen molemmissa näytteissä ei saisi poiketa merkittävästi normaalista; molempia näytettä vastaavien kahden mittauksen tiedot korreloivat positiivisesti.

Vaihtoehdot: Wilcoxonin T-testi, jos vähintään yhden näytteen jakauma poikkeaa merkittävästi normaalista; t-Student-testi riippumattomille näytteille - jos kahden näytteen tiedot eivät korreloi positiivisesti.

Kaava sillä Studentin t-testin empiirinen arvo kuvastaa sitä tosiasiaa, että erojen analyysiyksikkö on ero (vaihto) ominaisarvot jokaiselle havaintoparille. Sen mukaisesti kunkin N:n attribuuttiarvoparin osalta ero lasketaan ensin d i = x 1 i - x 2 i.

(3) missä M d – arvojen keskimääräinen ero; σ d – erojen keskihajonta.

Laskuesimerkki:

Oletetaan, että koulutuksen tehokkuutta testattaessa jokaiselle ryhmän kahdeksalle jäsenelle kysyttiin "Kuinka usein mielipiteesi osuvat yhteen ryhmän mielipiteiden kanssa?" - kahdesti, ennen ja jälkeen harjoituksen. Vastauksissa käytettiin 10 pisteen asteikkoa: 1 - ei koskaan, 5 - puolet ajasta, 10 - aina. Testattiin hypoteesia, että koulutuksen seurauksena osallistujien mukautumisen itsetunto (halu olla samanlainen kuin muut ryhmässä) nousisi (α = 0,05). Tehdään taulukko välilaskutoimituksia varten (Taulukko 3).

Taulukko 3

Eron aritmeettinen keskiarvo M d = (-6)/8= -0,75. Vähennä tämä arvo jokaisesta d:stä (taulukon toiseksi viimeinen sarake).

Keskihajonnan kaava eroaa vain siinä, että siinä esiintyy d X:n sijaan. Korvaamme kaikki tarvittavat arvot ja saamme

σ d = = 0,886.

Vaihe 1. Laske kriteerin empiirinen arvo käyttämällä kaavaa (3): keskimääräinen ero Md= -0,75; keskihajonta σ d = 0,886; t e = 2,39; df = 7.

Vaihe 2. Määritämme t-Student-kriteerin kriittisten arvojen taulukon avulla p-merkittävyyden. Kun df = 7, empiirinen arvo on kriittisten arvojen p = 0,05 ja p - 0,01 välillä. Siksi s< 0,05.

df R
0,05 0,01 0,001
2,365 3,499 5,408

Vaihe 3. Teemme tilastollisen päätöksen ja muotoilemme johtopäätöksen. Tilastollinen hypoteesi keskiarvojen yhtäläisyydestä hylätään. Johtopäätös: Osallistujien vaatimustenmukaisuuden itsearvioinnin indikaattori koulutuksen jälkeen nousi tilastollisesti merkitsevästi (merkittävyystasolla s< 0,05).

Parametriset menetelmät sisältävät kahden otoksen varianssien vertailu kriteerin mukaan F-Fisher. Joskus tämä menetelmä johtaa arvokkaisiin merkityksellisiin johtopäätöksiin, ja jos vertaillaan riippumattomien näytteiden keskiarvoja, varianssien vertailu on pakollinen menettelyä.

Laskea F em sinun on löydettävä kahden otoksen varianssien suhde ja niin, että suurempi varianssi on osoittajassa ja pienempi on nimittäjässä.

Varianssien vertailu. Menetelmän avulla voit testata hypoteesin, että kahden populaation varianssit, joista verratut otokset on otettu, eroavat toisistaan. Testattu tilastollinen hypoteesi H 0: σ 1 2 = σ 2 2 (näytteen 1 varianssi on yhtä suuri kuin näytteen 2 varianssi). Jos se hylätään, hyväksytään vaihtoehtoinen hypoteesi, että yksi varianssi on suurempi kuin toinen.

Alkuperäiset oletukset: kaksi näytettä otetaan satunnaisesti eri populaatioista, joissa tutkittava piirre jakautuu normaalisti.

Lähdetietojen rakenne: tutkittava ominaisuus mitataan objekteissa (kohteessa), joista kukin kuuluu johonkin verrattavasta näytteestä.

Rajoitukset: piirteen jakaumat kummassakaan otoksessa eivät eroa merkittävästi normaalista.

Vaihtoehtoinen menetelmä: Levenen testi, jonka käyttäminen ei edellytä normaalisuusoletuksen tarkistamista (käytetään SPSS-ohjelmassa).

Kaava Fisherin F-testin empiiriselle arvolle:

(4)

missä σ 1 2 - suuri dispersio ja σ 2 2 - pienempi dispersio. Koska ei etukäteen tiedetä kumpi dispersio on suurempi, niin p-tason määrittämiseen käytetään sitä Taulukko kriittisistä arvoista suuntaamattomille vaihtoehdoille. Jos F e > F Kp vastaavalle määrälle vapausasteita, sitten R < 0,05 и статистическую гипотезу о равенстве дисперсий можно отклонить (для α = 0,05).

Laskuesimerkki:

Lapsille tehtiin säännöllisiä laskutehtäviä, minkä jälkeen yhdelle satunnaisesti valitulle puolelle opiskelijoista kerrottiin, että he olivat läpäisseet kokeen, ja muille kerrottiin päinvastoin. Jokaiselta lapselta kysyttiin sitten, kuinka monta sekuntia heiltä kuluisi samanlaisen ongelman ratkaisemiseen. Kokeen suorittaja laski eron lapsen soittoajan ja suoritetun tehtävän tuloksen välillä (sekunteina). Epäonnistumisen sanoman odotettiin aiheuttavan jonkin verran riittämättömyyttä lapsen itsetunnossa. Testattava hypoteesi (tasolla α = 0,005) oli, että kokonaisitsetunnon varianssi ei riipu onnistumis- tai epäonnistumisraporteista (H 0: σ 1 2 = σ 2 2).

Seuraavat tiedot saatiin:


Vaihe 1. Laske kriteerin empiirinen arvo ja vapausasteiden lukumäärä kaavojen (4) avulla:

Vaihe 2. Fisherin f-kriteerin kriittisten arvojen taulukon mukaan ohjaamaton vaihtoehdot, joille löydämme kriittisen arvon df numero = 11; df tietää= 11. Kriittinen arvo on kuitenkin olemassa vain arvolle df numero= 10 ja df know = 12. On mahdotonta ottaa suurempaa määrää vapausasteita, joten otamme kriittisen arvon df numero= 10: Sillä R = 0,05 F Kp = 3,526; varten R = 0,01 F Kp = 5,418.

Vaihe 3. Tilastollisen päätöksen tekeminen ja mielekäs johtopäätös. Koska empiirinen arvo ylittää kriittisen arvon R= 0,01 (ja vielä enemmän p = 0,05), niin tässä tapauksessa s< 0,01 и принимается альтернативная гипо­теза: дисперсия в группе 1 превышает дисперсию в группе 2 (R< 0,01). Näin ollen epäonnistumisesta kertovan viestin jälkeen itsetunnon riittämättömyys on korkeampi kuin menestystä kertovan viestin jälkeen.

/ käytännön tilastot / referenssimateriaalit / opiskelijan t-testin arvot

Merkityst - Opiskelijan t-testi merkitsevyystasoilla 0,10, 0,05 ja 0,01

ν – vaihtelun vapausasteet

Normaalit Studentin t-testin arvot

Vapausasteiden lukumäärä

Merkitystasot

Vapausasteiden lukumäärä

Merkitystasot

Pöytä XI

Standardi Fisherin testiarvoja käytetään arvioimaan kahden näytteen välisten erojen merkitystä

Vapauden asteet

Merkitsevyystaso

Vapauden asteet

Merkitsevyystaso

Opiskelijan t-testi

Opiskelijan t-testi- Studentin jakaumaan perustuvien hypoteesien (tilastollisten testien) tilastollisen testauksen menetelmien yleinen nimi. Yleisimmät t-testin käyttötavat ovat keskiarvojen yhtäläisyyden testaus kahdessa otoksessa.

t-tilastot rakennetaan yleensä seuraavan yleisperiaatteen mukaan: osoittaja on satunnaismuuttuja, jolla on nolla matemaattista odotusta (jos nollahypoteesi täyttyy), ja nimittäjä on tämän satunnaismuuttujan otos keskihajonnan, joka saadaan satunnaismuuttujan neliöjuurena. sekoittamaton varianssiarvio.

Tarina

Tämän kriteerin on kehittänyt William Gossett arvioidakseen oluen laatua Guinness-yhtiössä. Liikesalaisuuksien paljastamatta jättämistä koskeviin velvollisuuksiin liittyen (Guinnessin johto piti tilastolaitteiston käyttöä työssään sellaisenaan) Gossetin artikkeli julkaistiin vuonna 1908 Biometrics-lehdessä salanimellä "Student".

Tietovaatimukset

Tämän kriteerin soveltamiseksi on välttämätöntä, että alkuperäisellä tiedolla on normaalijakauma. Käytettäessä kahden otoksen testiä riippumattomille näytteille on myös noudatettava varianssien yhtäläisyyden ehtoa. Opiskelijan t-testille on kuitenkin vaihtoehtoja tilanteisiin, joissa varianssit ovat epäyhtenäiset.

Tiedon normaalijakauman vaatimus on välttämätön tarkalle t (\displaystyle t) -testille. Kuitenkin myös muissa datajakaumissa on mahdollista käyttää t (\displaystyle t) -tilastoa. Monissa tapauksissa tällä tilastolla on asymptoottisesti standardi normaalijakauma - N (0, 1) (\displaystyle N(0,1)) , joten tämän jakauman kvantiileja voidaan käyttää. Usein kvanttiileja ei kuitenkaan käytetä tässäkään tapauksessa normaalista normaalijakaumasta, vaan vastaavasta Student-jakaumasta, kuten tarkassa t (\displaystyle t) -testissä. Ne ovat asymptoottisesti ekvivalentteja, mutta pienissä otoksissa Studentin jakauman luottamusvälit ovat leveämpiä ja luotettavampia.

Yhden näytteen t-testi

Käytetään testaamaan nollahypoteesia H 0: E (X) = m (\displaystyle H_(0):E(X)=m) matemaattisen odotuksen E (X) (\displaystyle E(X)) yhtäläisyydestä jokin tunnettu arvo m (\displaystyle m) .

Ilmeisesti, jos nollahypoteesi täyttyy, E (X ¯) = m (\displaystyle E((\overline (X)))=m) . Kun otetaan huomioon havaintojen oletettu riippumattomuus, V (X ¯) = σ 2 / n (\displaystyle V((\overline (X)))=\sigma ^(2)/n) . Käyttämällä puolueetonta varianssiarviota s X 2 = ∑ t = 1 n (X t − X ¯) 2 / (n − 1) (\displaystyle s_(X)^(2)=\sum _(t=1)^( n )(X_(t)-(\overline (X)))^(2)/(n-1)) saamme seuraavat t-tilastot:

t = X ¯ − m s X / n (\displaystyle t=(\frac ((\overline (X))-m)(s_(X)/(\sqrt (n)))))

Nollahypoteesin mukaan tämän tilaston jakauma on t (n − 1) (\displaystyle t(n-1)) . Näin ollen, jos tilaston itseisarvo ylittää tietyn jakauman kriittisen arvon (tietyllä merkitsevyystasolla), nollahypoteesi hylätään.

Kahden näytteen t-testi riippumattomille näytteille

Olkoon kaksi riippumatonta näytettä tilavuuksista n 1, n 2 (\displaystyle n_(1)~,~n_(2)) normaalijakautuneista satunnaismuuttujista X 1, X 2 (\displaystyle X_(1),~X_(2 )). On tarpeen testata nollahypoteesi näiden satunnaismuuttujien matemaattisten odotusten yhtäläisyydestä H 0: M 1 = M 2 (\displaystyle H_(0):~M_(1)=M_(2)) käyttämällä näytedataa.

Tarkastellaan eroa näytekeskiarvojen välillä Δ = X ¯ 1 − X ¯ 2 (\displaystyle \Delta =(\overline (X))_(1)-(\overline (X))_(2)) . Ilmeisesti jos nollahypoteesi on tosi E (Δ) = M 1 − M 2 = 0 (\displaystyle E(\Delta)=M_(1)-M_(2)=0) . Tämän eron varianssi on yhtä suuri näytteiden riippumattomuuden perusteella: V (Δ) = σ 1 2 n 1 + σ 2 2 n 2 (\displaystyle V(\Delta)=(\frac (\sigma _(1) )^(2))( n_(1)))+(\frac (\sigma _(2)^(2))(n_(2)))) . Sitten käyttämällä puolueetonta varianssiestimaattia s 2 = ∑ t = 1 n (X t − X ¯) 2 n − 1 (\displaystyle s^(2)=(\frac (\sum _(t=1)^(n)) ( X_(t)-(\overline (X)))^(2))(n-1))) saamme puolueettoman arvion otoskeskiarvojen välisen eron varianssista: s Δ 2 = s 1 2 n 1 + s 2 2 n 2 (\ displaystyle s_(\Delta )^(2)=(\frac (s_(1)^(2))(n_(1)))+(\frac (s_(2)^( 2))(n_(2) ))) . Siksi nollahypoteesin testaamisen t-tilasto on

T = X ¯ 1 − X ¯ 2 s 1 2 n 1 + s 2 2 n 2 (\displaystyle t=(\frac ((\overline (X))_(1)-(\overline (X))_( 2))(\sqrt ((\frac (s_(1)^(2))(n_(1)))+(\frac (s_(2)^(2))(n_(2))) ))

Jos nollahypoteesi pitää paikkansa, tällä tilastolla on jakauma t (d f) (\displaystyle t(df)), missä d f = (s 1 2 / n 1 + s 2 2 / n 2) 2 (s 1 2 / n 1) 2 / (n 1 - 1) + (s 2 2 / n 2) 2 / (n 2 - 1) (\displaystyle df=(\frac ((s_(1)^(2)/n_(1)) +s_(2)^(2)/n_(2)^(2))((s_(1)^(2)/n_(1))^(2)/(n_(1)-1)+ (s_(2)^(2)/n_(2))^(2)/(n_(2)-1))))

Saman varianssin tapaus

Jos näytteiden varianssien oletetaan olevan yhtä suuret, niin

V (Δ) = σ 2 (1 n 1 + 1 n 2) (\displaystyle V(\Delta)=\sigma ^(2)\left((\frac (1)(n_(1)))+(\ frac (1)(n_(2)))\oikea))

Sitten t-tilasto on:

T = X ¯ 1 - X 2 s X 1 n 1 + 1 n 2, s X = (n 1 - 1) s 1 2 + (n 2 - 1) s 2 2 n 1 + n 2 - 2 (\ displaystyle t=(\frac ((\overline (X))_(1)-(\overline (X))_(2))(s_(X)(\sqrt ((\frac (1)(n_(1)) )))+(\frac (1)(n_(2))))))~,~~s_(X)=(\sqrt (\frac ((n_(1)-1)s_(1)^ ( 2)+(n_(2)-1)s_(2)^(2))(n_(1)+n_(2)-2))))

Tällä tilastolla on jakauma t (n 1 + n 2 − 2) (\displaystyle t(n_(1)+n_(2)-2))

Kahden näytteen t-testi riippuville näytteille

t (\displaystyle t) -kriteerin empiirisen arvon laskemiseksi tilanteessa, jossa testataan hypoteesia kahden riippuvan otoksen eroista (esimerkiksi kaksi saman testin näytettä aikavälillä), käytetään seuraavaa kaavaa:

T = M d s d / n (\displaystyle t=(\frac (M_(d))(s_(d)/(\sqrt (n)))))

missä M d (\displaystyle M_(d)) on arvojen keskimääräinen ero, s d (\displaystyle s_(d)) on erojen keskihajonta ja n on havaintojen määrä

Tällä tilastolla on jakauma t (n − 1) (\displaystyle t(n-1)) .

Lineaarisen rajoitteen testaus lineaarisilla regressioparametreilla

T-testillä voidaan myös testata mielivaltaista (yksittäistä) lineaarista rajoitusta lineaarisen regression parametreille, jotka estimoidaan tavallisilla pienimmän neliösumman avulla. Olkoon tarpeen testata hypoteesia H 0: c T b = a (\displaystyle H_(0):c^(T)b=a) . Ilmeisesti, jos nollahypoteesi täyttyy, E (c T b ^ − a) = c T E (b ^) − a = 0 (\displaystyle E(c^(T)(\hat (b))-a)= c^( T)E((\hat (b)))-a=0) . Tässä käytetään malliparametrien E (b ^) = b (\displaystyle E((\hat (b)))=b) puolueettomien pienimmän neliösumman estimaattien ominaisuutta. Lisäksi V (c T b ^ − a) = c T V (b ^) c = σ 2 c T (X T X) − 1 c (\displaystyle V(c^(T)(\hat (b)))-a )=c^(T)V((\hat (b)))c=\sigma ^(2)c^(T)(X^(T)X)^(-1)c) . Käyttämällä tuntemattoman varianssin sijaan sen puolueetonta estimaattia s 2 = E S S / (n − k) (\displaystyle s^(2)=ESS/(n-k)) saadaan seuraavat t-tilastot:

T = c T b ^ − a s c T (X T X) − 1 c (\displaystyle t=(\frac (c^(T)(\hat (b)))-a)(s(\sqrt (c^(T)) (X^(T)X)^(-1)c)))))

Tällä tilastolla, kun nollahypoteesi täyttyy, on jakauma t (n − k) (\displaystyle t(n-k)) , joten jos tilaston arvo on suurempi kuin kriittinen arvo, niin lineaarisen rajoitteen nollahypoteesi hylätään.

Lineaarisen regressiokertoimen hypoteesien testaus

Lineaarisen rajoitteen erikoistapaus on hypoteesin testaaminen, että regressiokerroin b j (\displaystyle b_(j)) on yhtä suuri kuin tietty arvo a (\displaystyle a) . Tässä tapauksessa vastaava t-tilasto on:

T = b ^ j − a s b ^ j (\displaystyle t=(\frac ((\hat (b))_(j)-a)(s_((\hattu (b))_(j)))))

missä s b ^ j (\displaystyle s_((\hat (b))_(j))) on kerroinestimaatin keskivirhe - kerroinestimaattien kovarianssimatriisin vastaavan diagonaalielementin neliöjuuri.

Jos nollahypoteesi pitää paikkansa, tämän tilaston jakauma on t (n − k) (\displaystyle t(n-k)) . Jos tilaston itseisarvo on suurempi kuin kriittinen arvo, niin kertoimen ja a (\displaystyle a) välinen ero on tilastollisesti merkitsevä (ei-satunnainen), muuten se on merkityksetön (satunnainen eli todellinen kerroin on luultavasti yhtä suuri tai hyvin lähellä arvioitua arvoa (\ näyttötyyli a))

Kommentti

Matemaattisten odotusten yhden otoksen testi voidaan pelkistää lineaarisen regression parametrien lineaarisen rajoitteen testaamiseen. Yhden näytteen testissä tämä on vakion "regressio". Siksi regression s 2 (\displaystyle s^(2)) on näytearvio tutkittavan satunnaismuuttujan varianssista, matriisi X T X (\displaystyle X^(T)X) on yhtä suuri kuin n (\displaystyle n ) , ja mallin ”kertoimen” estimaatti on yhtä suuri kuin otoksen keskiarvo. Tästä saamme yllä olevan yleisen tapauksen t-tilaston lausekkeen.

Vastaavasti voidaan osoittaa, että kahden otoksen testi, jossa on samat otosvarianssit, rajoittuu myös lineaaristen rajoitusten testaamiseen. Kahden otoksen testissä tämä on "regressio" vakiolle ja valemuuttujalle, joka tunnistaa osaotoksen arvosta (0 tai 1) riippuen: y = a + b D (\displaystyle y=a+bD) . Hypoteesi näytteiden matemaattisten odotusten yhtäläisyydestä voidaan muotoilla hypoteesiksi tämän mallin kertoimen b yhtäläisyydestä nollan kanssa. Voidaan osoittaa, että sopiva t-tilasto tämän hypoteesin testaamiseen on yhtä suuri kuin kahden otoksen testille annettu t-tilasto.

Se voidaan myös lyhentää lineaarisen rajoitteen tarkistamiseen eri dispersioiden tapauksessa. Tässä tapauksessa mallivirhevarianssi saa kaksi arvoa. Tästä voit saada myös kahden otoksen testin kaltaisen t-tilaston.

Ei-parametriset analogit

Kahden näytteen testin analogi riippumattomille näytteille on Mann-Whitney U -testi. Riippuvien näytteiden tapauksessa analogit ovat etumerkkitesti ja Wilcoxonin T-testi

Kirjallisuus

Opiskelija. Todennäköinen keskiarvon virhe. // Biometria. 1908. nro 6 (1). s. 1-25.

Linkit

Novosibirskin osavaltion teknisen yliopiston verkkosivuilla olevista kriteereistä keinojen homogeenisuutta koskevien hypoteesien testaamiseksi