Awtomatikong pagkalkula ng T criterion ng mag-aaral online. Pagtukoy sa kahalagahan ng mga pagkakaiba sa pamamagitan ng t - pamantayan ng mag-aaral

Sa karamihan ng mga kaso, upang ihambing ang mga average ng dalawa mga independiyenteng sample(p. 91) ilapat ang t-test ng Mag-aaral. Dahil ang pamantayan ng Estudyante ay parametric, ang paggamit nito ay posible lamang kung ang mga resulta ng pag-aaral ay ipinakita sa anyo ng mga sukat ayon sa sukat ng relasyon(p. 90).

Tinutukoy ang pamantayan ng mag-aaral t at kinakalkula ng formula*:

t = x1 - x2 / √ m1² + m2²

Sa mga kaso kung saan ang bilang ng mga obserbasyon (n) ay higit sa 500, ang antas ng kahalagahan sa p = 0.05 ay naabot sa t = 1.96, ang mga antas ng kahalagahan sa p = 0.01 o p = 0.001, ayon sa pagkakabanggit, ay nakakamit sa t = 2.59 at t = 3.29.

Kung ang bilang ng mga obserbasyon ay mas mababa sa 500, ang kinakailangang halaga ng t para sa iba't ibang antas ng kahalagahan ay tinutukoy mula sa Talahanayan 10.

Bago lumiko sa talahanayan, kinakailangan upang matukoy ang numero antas ng kalayaan. Ang terminong ito ay tumutukoy sa bilang ng mga independiyenteng dami na kasangkot sa pagbuo ng isa o ibang parameter (f). Ang mga patakaran para sa pagtukoy ng mga antas ng kalayaan ay ipinakita sa iba't ibang mga manwal sa mga istatistika ng matematika (Yu.K. Demyanenko, 1968). Kapag kinakalkula ang pamantayan ng Estudyante t, ang kabuuang bilang ng mga antas ng kalayaan (f) ay magiging katumbas ng n1 + n2 - 2.

Kaya, halimbawa, kapag inihambing ang mga resulta na ipinakita ng mga skier ng eksperimental at kontrol na mga grupo sa pagpasa sa control distance, ang mga sumusunod na data ay nakuha: ang average sa experimental group (n = 12 tao) ay x = 34.6 sec, ang error ng mean value m = 0.47 sec ; sa control group (n = 14 na tao), ang mga data na ito ay, ayon sa pagkakabanggit, x = 37.3 sec, m = 0.49 sec.

Ang pagpapalit ng mga halaga sa formula, nakukuha namin ang halaga ng t.

t \u003d 37.3 - 34.6 / √ V 0.49 2 + 0.47 2 \u003d 2.7 / 0.68 \u003d 3.97

Matapos matukoy ang bilang ng mga antas ng kalayaan (f \u003d 12 + 14 - 2 \u003d 24), nakita namin ang halaga ng t mula sa talahanayan. Ang resultang halaga na 3.97 ay lumampas sa halaga ng talahanayan para sa 99% na antas ng kumpiyansa. Samakatuwid, maaari nating sabihin na may mga makabuluhang pagkakaiba sa pagitan ng mga resulta ng dalawang pinaghahambing na grupo sa antas ng kahalagahan p< 0,01.

Sa medyo malaking bilang ng mga sukat, ipinapalagay na kung ang pagkakaiba sa pagitan ng arithmetic means ay katumbas o higit sa tatlo sa mga error nito, ang mga pagkakaiba ay itinuturing na makabuluhan. Sa kasong ito, ang pagiging maaasahan ng mga pagkakaiba ay tinutukoy ng sumusunod na equation:

X E -X K > 3√ ako + mk ²

Sa halimbawa sa itaas, ang mga resulta ng mga kasangkot sa iba't ibang grupo ay inihambing, iyon ay, mga independiyenteng sample. Sa kaso kapag ang mga resulta na nakuha sa simula at pagtatapos ng eksperimento sa parehong grupo ay inihambing, iyon ay, kapag umaasa na mga sample, kalkulahin ang t-test ng Mag-aaral gamit ang karaniwang formula ito ay ipinagbabawal . Ang criterion ng mag-aaral sa kasong ito ay dapat kalkulahin ng formula:

t \u003d X 1 -X 2 / m1 ² + m2² - 2rm1 m2

saan r - koepisyent ng ugnayan sa pagitan ng inisyal at panghuling resulta para sa pinag-aralan na katangian.

Talahanayan 10

Limitahan ang mga halaga t (Pamantayan ng mag-aaral)

f	Mga antas ng kumpiyansa (P)
	95% .	99%	99,9%
	12,71	63.60
	4.30	9.93	31.60
	3.18	5.84	12.94
	2.78	4.60	8.61
	2.57	4.03	6.86
	2.45	3.71	5.96
	2.37	3.50	5.41
	2.31	3.36	5,04
	2.26	3.25	4.78
	2.23	3.17	4.59
P	2.20	3.11	4.44
	2.18	3.06	4.32
	1.16	3.01	4.22
	2.15	2,98	4,14
	2.13	2.95	4.07
	2.12	2,92	4.02
	2.11	2.90	3.97
	2.10	2.88	3.92
	2.09	2.86	3.88
	2.09	2.85	3.85
	2.08	2,83	3.82
	2.07	2.82	3.79
	2.07	2.81	3,77
	2.06	2.80	3.75
	2,06	2.79	3.73
	2.06	2.78	3.71
	2.05	2.77	3.69
	2.05	2.76	3.67
	2.04	2.76	3.66
	2.04	2,75	" 3.65
	2.02	2,70	3.55
	2.01	2.68	3,50
	2.00	2.66	3.46
	1.99	2.64	3.42
	1.98	2.63	3.39
	1.98	2,62	3.37
	1.97	2.60	3.34
	1.96	2,59	3.31
oo	1.96	2.59	3.29
	Mga antas ng kahalagahan (p)
	0,05	0,01	0,001

Pagbubuo ng mga konklusyon

(konklusyon)

Sa pagtatapos ng gawain, ang mga konklusyon ay iginuhit. Ang pagbabalangkas ng mga konklusyon, kasama ang pagbabalangkas ng panimula, ay isa sa pinakamahirap at kritikal na yugto sa disenyo ng anumang term paper.

Ang mga konklusyon ay dapat magpakita ng pinakamahalagang resulta ng pag-aaral.

Mayroong ilang mga karaniwang pagkakamali sa paggawa ng mga konklusyon. Kadalasan ang isang mag-aaral ay gumagawa ng isang pangungusap sa paraang ito ay parang isang deklarasyon ng mga resulta ng gawaing ginawa niya ("pinag-aralan", "binuo", atbp.). Halimbawa:

"Sa kurso ng pag-aaral, ang mga pangunahing probisyon ng eksperimentong pamamaraan ay natukoy ..." o "Natukoy ang mga tagapagpahiwatig na nagpapahintulot sa pagsusuri ng mga kasanayan sa komunikasyon ng mga mag-aaral ng mga pedagogical specialty sa pagpapatupad ng pisikal na edukasyon at gawaing pangkalusugan sa mga mag-aaral .. .”.

Upang ang nasa itaas ay maging konklusyon, ang mga parirala ay dapat na binuo tulad nito: "Ang mga probisyon ng pang-eksperimentong pamamaraan na binuo namin ay nagpapahintulot ..." at, nang naaayon: "Sa mga napiling tagapagpahiwatig, ang pinaka-kaalaman, na nagpapahintulot sa tasahin ang antas ng mga kasanayan sa komunikasyon ng mga mag-aaral mga espesyalidad ng pedagogical, ay...»

Ang isa pang karaniwang pagkakamali ay ang pahayag ng mag-aaral sa pagtatapos ng isang bagay na halata, para sa pahayag kung saan hindi kinakailangan na magsagawa ng espesyal na pananaliksik. Halimbawa:

"Sa mga pisikal na ehersisyo kasama ang mga mag-aaral, kinakailangang isaalang-alang ang mga katangian ng pag-unlad ng isang tinedyer sa edad na ito."

Minsan ang konklusyon ay lumalabas na ganap na walang kahulugan. Karaniwang ito ang unang konklusyon na ginagawa ng isang mag-aaral batay sa pagsusuri sa panitikan. Halimbawa:

"Ang pagsusuri ng siyentipiko at metodolohikal na panitikan ay nagpakita na sa teorya ng pisikal na edukasyon ang tanong ng paggamit ng mga simulator sa pagsasanay sa palakasan ng mga manlalangoy ay hindi pa ganap na isiwalat."

Ang mga konklusyon ay dapat na nagbibigay-kaalaman sa gawaing ginawa ng mag-aaral, ngunit hindi dapat maging verbose.

MGA KINAKAILANGAN NG FORM

MGA GAWA NG KURSO

Ang mga sumusunod na bahagi ng istruktura ay dapat na iharap sa pangwakas na gawaing kwalipikado:

· Pahina ng titulo;

· pagpapakilala;

· pangunahing teksto(kabanata 1, kabanata 2);

· konklusyon (konklusyon);

· bibliograpiya;

· mga aplikasyon(kung kailangan sila).

Ang pinakamainam na dami ng term paper ay 40-50 na pahina ng typewritten text sa 1 ,5 pagitan (kabilang ang mga figure, talahanayan, graph, bibliograpiya at mga apendise).

Laki ng font 14 Times New Roman.

Ang gawain ay iginuhit sa isang computer o sulat-kamay na form (ang pangalawang opsyon ay hindi gaanong kanais-nais).

Sa bersyon ng computer, ang teksto ng trabaho ay naka-print sa isa at kalahating pagitan sa isang gilid ng isang karaniwang sheet ng A4 na papel (210x297 mm). Ang mga margin ng pahina ng trabaho ay dapat magkaroon ng mga sumusunod na sukat: kaliwa - 30 mm, kanan - 10 mm, itaas - 20 mm, ibaba - 25 mm.

Ang mga talahanayan, figure, drawing, diagram, graph ay dapat gawin sa karaniwang A4 sheet (210x297 mm). Ang mga lagda at paliwanag ay dapat nasa harap na bahagi.

Ang lahat ng mga pahina ng huling mga gawa ng pagpapatunay, kabilang ang mga guhit at aplikasyon, ay binibilang sa pagkakasunud-sunod mula sa pahina ng pamagat hanggang sa huling pahina nang walang mga pagtanggal o pag-uulit. Ang pahina ng pamagat ay itinuturing na unang pahina, ang numerong "1" ay hindi inilalagay dito, ang numerong "2" ay inilalagay sa susunod na pahina, atbp. Ang serial number ay inilalagay sa gitna ng ibabang margin ng pahina.

Ang lahat ng materyal ng pangwakas na pagpapatunay ay gumagana alinsunod sa talaan ng mga nilalaman (plano) ay nahahati sa mga talata. Ang pamagat ng mga talata ay dapat tumutugma sa nilalaman at mai-print bilang isang pamagat sa maliliit na titik nang walang salungguhit.

Sa trabaho, karaniwang tinatanggap na mga abbreviation tulad ng "etc", "etc", "etc." "atbp.", "tingnan", "p."

Ang isang sample ng disenyo ng mga talahanayan at mga ilustrasyon ay ibinibigay sa Appendix 3.

Pahina ng titulo

Ang pahina ng pamagat ay impormasyon tungkol sa gawain. Ipinapahiwatig nito ang pangalan ng institusyon kung saan isinagawa ang gawain; apelyido, pangalan, patronymic ng may-akda; pamagat; apelyido, pangalan, patronymic, akademikong degree at akademikong titulo ng superbisor (consultant); lungsod, taon Ang pahina ng pamagat ng mga gawa ng huling pagpapatunay ay ipinapakita sa Figure 1.

Federal State Autonomous Educational Institution

Mataas na edukasyon

"Nizhny Novgorod State University. N.I. Lobachevsky"

sangay ng Arzamas

Faculty ng Likas na Heograpiya

Kagawaran ng Pisikal na Kultura

Takdang-aralin ayon sa disiplina

"Teorya at pamamaraan ng pisikal na kultura"

Naaayon sa paksa:

"Mga tampok na pamamaraan ng pisikal na kultura at mga klase sa libangan

kasama ang mga batang preschool

Nakumpleto:

Ivanov A.V.,

estudyante ng direksyon 034300 (49.03.01)

Pisikal na kultura

profile "Pamamahala sa larangan ng

pisikal na kultura"

anyo ng edukasyon - part-time

(buong panahon ng pag-aaral /

pinabilis na programa sa pag-aaral)

1 (2) kurso ng pag-aaral, pangkat 11(12)

Siyentipikong tagapayo:

PhD, Associate Professor Sidorova T.V.

Arzamas

kanin. 1. Halimbawa ng pahina ng pamagat ng term paper

Ang mga papel sa pagtatapos ay gumagamit ng salitang "talahanayan ng mga nilalaman", hindi "nilalaman". Talaan ng nilalaman ay isang index ng mga heading (kabanata) ng iisang akda, habang nilalaman ay isang indeks ng mga pamagat ng iba't ibang akda na kasama sa publikasyon. Mula sa pananaw ng kultura ng pagbabasa, ang talaan ng mga nilalaman ay inilalagay sa simula ng akda: ito ay mula sa talaan ng mga nilalaman na ang mambabasa ay nagsisimula sa kanyang kakilala sa pag-aaral.

Kapag nagdidisenyo ng talaan ng mga nilalaman, ang bawat subordinate na heading ay dapat na naka-indent sa kanan ng nakaraang pangunahing heading kung saan ito tumutukoy, ilagay ang unang digit sa ilalim ng malaking titik ng heading kung saan ito direktang tinutukoy. Ang lahat ng mga heading ng pantay na grado ay dapat magsimula sa parehong patayong linya. Ang ganitong pagtatayo ng plano ay nagbibigay-daan sa iyo upang malinaw na makita ang subordination ng lahat ng materyal. Halimbawa:

Panimula. . . . . . . . . . . . . . . . . . . . . . . .. . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Ang problema sa pagbuo ng kaalaman ng mga mag-aaral upang mapataas ang kanilang motibasyon para sa mga pisikal na ehersisyo. . . . ………….. . . .
1.	Pisikal na kultura ng mga mag-aaral sa kasalukuyang yugto. . . . ..........
	1.11.1	Pagbabago ng mga priyoridad sa pisikal na pagsasanay para sa mga mag-aaral sa 20-90s. . . . . . . . ………..
	1.1 1.2	Direksyon ng modernong edukasyon ng mga mag-aaral sa larangan ng pisikal na kultura. . . . . . . . …………
2.	Pagbuo ng motibasyon ng mga mag-aaral para sa mga pisikal na ehersisyo. . . . . . . . . . . . . . . . . . . . ……
	2.12.2	Ang saloobin ng mga mag-aaral sa mga pisikal na ehersisyo.
Konklusyon……………………………………………………………… . labing-apat
Bibliograpiya……………………………………………………
Mga aplikasyon

Upang gawing pareho ang mga indent sa talahanayan ng mga nilalaman at ihanay ang mga numero ng pahina, ipinapayong gamitin ang format ng talahanayan, na ang mga linya ay nakatakdang hindi nakikita sa mga parameter.

Sa mga huling gawa ng pagpapatunay, ang rubrication ng teksto ay napakahalaga. Ang mga heading ay nagpapakita ng istraktura ng teksto, nagpapakita ng koneksyon at pagkakaugnay ng mga seksyon at subsection.

Ang mga heading ng mga talata ay dapat na tumpak na sumasalamin sa nilalaman ng teksto na nauugnay sa kanila. Hindi nila dapat bawasan o palawakin ang dami ng semantikong impormasyon na nilalaman ng mga ito.

Ang mga heading ng mga talata at subparagraph ay matatagpuan sa gitna ng isang hiwalay na linya at naka-print sa bold na uri ng roman, sa maliliit na titik, maliban sa unang malaking titik (Larawan 2).

1.1. Ang konsepto ng postura

kanin. 2. Halimbawang disenyo ng pamagat ng talata

Ang heading ay pinaghihiwalay mula sa text na sinusundan ito ng isang interval (isang hindi napi-print na character), at mula sa naunang text ng dalawang interval (dalawang hindi napi-print na character na nakatayo sa ilalim ng isa). Ang pamagat ay hindi maaaring ang huling linya sa pahina.

Ang indent ng talata ay itinakda sa pamamagitan ng mga opsyon na "Format" ® "Paragraph" ® "Mga indent at interval" ® "Unang linya" ® "Indent" ® 1.25 cm (1.27 cm). Ang isang keystroke ay hindi nagtatakda ng isang indent ng talata!

Mga highlight

Ang subordination ng nilalaman sa loob ng talata, ang delimitation ng mga bahagi at elemento ng teksto sa mga tuntunin ng kahalagahan ay ginawa sa pamamagitan ng pag-highlight ng font (ng ibang saturation, na may hilig ng mga stroke ng mga titik, sa espasyo).

Sa mga gawaing pang-agham, kaugalian na gamitin ang subordination ng mga font (Talahanayan 11).

Ang paired Student's t-test ay isa sa mga pagbabago ng paraan ng Student na ginamit upang matukoy ang istatistikal na kahalagahan ng mga pagkakaiba sa ipinares (paulit-ulit) na mga sukat.

1. Kasaysayan ng pagbuo ng t-test

binuo ang t-test William Gosset upang masuri ang kalidad ng beer sa Guinness. Kaugnay ng mga obligasyon sa kumpanya na huwag ibunyag ang mga lihim ng kalakalan, ang artikulo ni Gosset ay nai-publish noong 1908 sa journal Biometrics sa ilalim ng pseudonym na "Student" (Student).

2. Para saan ginagamit ang paired Student's t-test?

Ang paired Student's t-test ay ginagamit sa paghahambing dalawang dependent (pares) na sample. Dependent ay mga sukat na kinuha sa parehong mga pasyente, ngunit sa iba't ibang oras, halimbawa, ang presyon ng dugo sa mga hypertensive na pasyente bago at pagkatapos pag-inom ng antihypertensive na gamot. Ang null hypothesis ay nagsasaad na walang mga pagkakaiba sa pagitan ng mga inihambing na sample, habang ang alternatibong hypothesis ay nagsasaad na may mga makabuluhang pagkakaiba sa istatistika.

3. Kailan maaaring gamitin ang paired Student's t-test?

Ang pangunahing kondisyon ay sample dependence, iyon ay, ang mga inihambing na halaga ay dapat makuha sa pamamagitan ng paulit-ulit na mga sukat ng isang parameter.

Tulad ng kaso ng paghahambing ng mga independiyenteng sample, upang mailapat ang ipinares na t-test, kinakailangan na ang orihinal na data ay mayroong normal na pamamahagi. Kung ang kundisyong ito ay hindi natutugunan, ang mga pamamaraan ay dapat gamitin upang ihambing ang sample na paraan. nonparametric na istatistika, tulad ng Mga palatandaan ng G-test at Wilcoxon t-test.

Magagamit lang ang paired t-test kapag naghahambing dalawa mga sample. Kung kailangan mong ikumpara tatlo o higit pa paulit-ulit na mga sukat, gamitin one-way analysis ng variance para sa paulit-ulit na mga panukala.

4. Paano makalkula ang ipinares na t-test ng Mag-aaral?

Ang ipinares na t-test ng Mag-aaral ay kinakalkula gamit ang sumusunod na formula:

saan M d - ang arithmetic mean ng mga pagkakaiba sa pagitan ng mga indicator na sinusukat bago at pagkatapos, σd - karaniwang paglihis ng mga pagkakaiba ng mga tagapagpahiwatig, n - ang bilang ng mga paksa.

5. Paano mabibigyang kahulugan ang halaga ng t-test ng Mag-aaral?

Ang interpretasyon ng nakuhang halaga ng ipinares na Student's t-test ay hindi naiiba sa pagsusuri ng t-test para sa mga hindi nauugnay na populasyon. Una sa lahat, ito ay kinakailangan upang mahanap ang bilang ng mga antas ng kalayaan f ayon sa sumusunod na formula:

f = n - 1

Pagkatapos nito, tinutukoy namin ang kritikal na halaga ng t-test ng Mag-aaral para sa kinakailangang antas ng kahalagahan (halimbawa, p<0,05) и при данном числе степеней свободы f ayon sa talahanayan ( tingnan sa ibaba).

Inihahambing namin ang mga kritikal at kinakalkula na mga halaga ng criterion:

Kung ang kinakalkula na halaga ng ipinares na Student's t-test katumbas o mas malaki kritikal, na matatagpuan sa talahanayan, napagpasyahan namin na ang mga pagkakaiba sa pagitan ng mga inihambing na halaga ay makabuluhan sa istatistika.
Kung ang halaga ng kinakalkula na ipinares na t-test ng Mag-aaral mas mababa tabular, na nangangahulugan na ang mga pagkakaiba sa pagitan ng mga inihambing na halaga ay hindi makabuluhan sa istatistika.

6. Isang halimbawa ng pagkalkula ng t-test ng Mag-aaral

Upang masuri ang pagiging epektibo ng isang bagong ahente ng hypoglycemic, ang mga antas ng glucose sa dugo ay sinusukat sa mga pasyente na may diabetes mellitus bago at pagkatapos kumuha ng gamot. Bilang resulta, nakuha ang sumusunod na data:

Solusyon:

1. Kalkulahin ang pagkakaiba ng bawat pares ng mga halaga ( d):

Pasyente N	Antas ng glucose sa dugo, mmol/l		Pagkakaiba sa halaga (d)
Pasyente N	bago uminom ng gamot	pagkatapos uminom ng gamot	Pagkakaiba sa halaga (d)
1	9.6	5.7	3.9
2	8.1	5.4	2.7
3	8.8	6.4	2.4
4	7.9	5.5	2.4
5	9.2	5.3	3.9
6	8.0	5.2	2.8
7	8.4	5.1	3.3
8	10.1	6.9	3.2
9	7.8	7.5	2.3
10	8.1	5.0	3.1

2. Hanapin ang arithmetic mean ng mga pagkakaiba gamit ang formula:

3. Hanapin ang standard deviation ng mga pagkakaiba mula sa average sa pamamagitan ng formula:

4. Kalkulahin ang ipinares na t-test ng Mag-aaral:

5. Ihambing natin ang nakuhang halaga ng Student's t-test 8.6 sa tabular value, na, sa bilang ng mga antas ng kalayaan f katumbas ng 10 - 1 = 9 at ang antas ng kahalagahan p=0.05 ay 2.262. Dahil ang nakuhang halaga ay mas malaki kaysa sa kritikal, napagpasyahan namin na may mga istatistikal na makabuluhang pagkakaiba sa mga antas ng glucose sa dugo bago at pagkatapos uminom ng bagong gamot.

Kadalasan sa sikolohikal na pananaliksik, ang mga gawain ay sinusunod upang makilala ang mga pagkakaiba sa pagitan ng dalawa o higit pang mga grupo ng mga palatandaan. Ang paglilinaw ng gayong mga pagkakaiba sa antas ng arithmetic na paraan ay isinasaalang-alang sa pagsusuri ng mga pangunahing istatistika. Gayunpaman, lumilitaw ang tanong kung gaano maaasahan ang mga pagkakaibang ito at kung maaari silang palawigin (extrapolated) sa buong populasyon. Upang malutas ang problemang ito, kadalasang ginagamit nila (sa ilalim ng kondisyon ng isang normal o malapit sa normal na pamamahagi) t - criterion (Pamantayan ng mag-aaral), na idinisenyo upang malaman kung gaano kalaki ang pagkakaiba ng mga tagapagpahiwatig ng isang sample ng mga paksa mula sa iba (para sa halimbawa, kapag ang mga paksa ay nakatanggap bilang isang resulta ng pagsubok sa isang pangkat ng mas mataas na marka kaysa sa mga kinatawan ng isa pa). Isa itong parametric criterion, may dalawang pangunahing anyo:

1) unrelated (odd) t - isang criterion na idinisenyo upang malaman kung may mga pagkakaiba sa pagitan ng mga marka na nakuha kapag gumagamit ng parehong pagsusulit upang subukan ang dalawang grupo na nabuo mula sa magkaibang tao. Halimbawa, ito ay maaaring isang paghahambing ng antas ng katalinuhan o neuropsychic na katatagan, pagkabalisa ng matagumpay at hindi matagumpay na mga mag-aaral, o isang paghahambing ng mga mag-aaral ng iba't ibang klase, edad, antas ng lipunan, atbp., sa mga batayan na ito. Maaaring may mga heterosexual, multinational na sample, pati na rin ang mga subsample sa mga pinag-aralan na sample, na pinili ayon sa isang partikular na katangian. Ang criterion ay tinatawag na "unrelated" dahil ang mga pinaghahambing na grupo ay nabuo mula sa iba't ibang tao;

2) konektado (ipinares) t - isang criterion na ginagamit upang ihambing ang mga tagapagpahiwatig ng dalawang grupo, sa pagitan ng mga elemento kung saan mayroong isang tiyak na relasyon. Nangangahulugan ito na ang bawat elemento ng unang pangkat ay tumutugma sa isang elemento ng pangalawang pangkat, katulad nito sa isang tiyak na parameter ng interes ng mananaliksik. Kadalasan, ang mga parameter ng parehong mga tao ay inihambing bago at pagkatapos ng isang tiyak na kaganapan o aksyon (halimbawa, sa proseso ng pagsasagawa ng isang longitudinal na pag-aaral o isang formative na eksperimento). Samakatuwid, ang pamantayang ito ay ginagamit upang ihambing ang pagganap ng parehong mga indibidwal bago at pagkatapos ng pagsusuri, eksperimento, o paglipas ng isang tiyak na oras.

Kung ang data ay hindi normal na namamahagi, gumamit ng mga nonparametric na pagsusulit na katumbas ng t-test: ang Mann-Whitney test, katumbas ng odd t-test, at ang Wilcoxon two-sample test, katumbas ng isang paired t-test.

Sa tulong ng mga t-test at ang kanilang mga non-parametric na katumbas, maihahambing lamang ng isa ang mga resulta ng dalawang pangkat na nakuha gamit ang parehong pagsubok. Gayunpaman, sa ilang mga kaso, kinakailangan upang ihambing ang ilang mga grupo o mga pagtatasa ng ilang mga uri. Magagawa ito sa mga yugto sa pamamagitan ng paghahati ng gawain sa ilang mga pares ng paghahambing (halimbawa, kung kailangan mong ihambing ang mga pangkat A, B at Y ayon sa mga resulta ng mga pagsusulit X at Y, pagkatapos ay gamit ang t-criterion, unang ihambing ang mga grupo A at B ayon sa mga resulta ng pagsusulit X, pagkatapos ay A at B ayon sa mga resulta ng pagsubok C, A at C ayon sa mga resulta ng pagsusulit X, atbp.). Gayunpaman, ito ay isang napaka-oras na pamamaraan, kaya isang mas kumplikadong paraan ng pagsusuri ng pagkakaiba-iba ang ginamit.

Ang pamamaraan para sa pagtatasa ng pagiging maaasahan ng mga pagkakaiba sa mga paraan ng aritmetika sa pamamagitan ng isang medyo epektibong parametric na pagsusulit ng Mag-aaral ay idinisenyo upang malutas ang isa sa mga problema na madalas na sinusunod sa pagproseso ng data - pagtukoy sa pagiging maaasahan ng mga pagkakaiba sa pagitan ng dalawa o higit pang mga serye ng mga halaga. Ang ganitong pagtatasa ay kadalasang kinakailangan sa paghahambing na pagsusuri ng mga polar group. sila ay nakikilala sa batayan ng iba't ibang kalubhaan ng isang tiyak na target na tampok (katangian) ng hindi pangkaraniwang bagay na pinag-aaralan. Bilang isang patakaran, ang pagsusuri ay nagsisimula sa pagkalkula ng mga pangunahing istatistika ng mga napiling pangkat ", pagkatapos ay tinasa ang kahalagahan ng mga pagkakaiba. Ang t-test ng mag-aaral ay kinakalkula ng formula:

Ang halaga ng pagsusulit ng Mag-aaral para sa tatlong antas ng kumpiyansa (statistikal) kahalagahan (p) ay ibinibigay sa mga sangguniang aklat sa mga istatistika ng matematika. Ang bilang ng mga antas ng kalayaan ay tinutukoy ng formula:

Sa pagpapababa ng mga laki ng sample (n<10) критерий Стьюдента становится чувствительным к форме распределения исследуемого признака в генеральной совокупности. Поэтому в сомнительных случаях рекомендуют использовать непараметрические методы или сравнивать полученные значения с критическими (табл. 2.17) для высшего уровня значимости.

Ang desisyon sa pagiging maaasahan ng mga pagkakaiba ay kinuha kung ang kinakalkula na halaga ng t ay lumampas sa halaga ng tabular para sa isang tiyak na bilang ng mga antas ng kalayaan (d (v)). Sa mga publikasyon o siyentipikong ulat ay nagpapahiwatig ng pinakamataas na antas ng kahalagahan ng tatlo: p<0,05; р <0,01; р <0,001.

Para sa anumang numerical na halaga ng criterion para sa kahalagahan ng pagkakaiba sa pagitan ng mga paraan, ang tagapagpahiwatig na ito ay hindi tinatasa ang antas ng ipinahayag na pagkakaiba (ito ay tinasa ng mismong pagkakaiba sa pagitan ng mga paraan), ngunit tanging ang istatistikal na kahalagahan nito, iyon ay, ang karapatang palawigin ang konklusyon na nakuha sa batayan ng isang paghahambing ng mga sample na mayroong pagkakaiba sa buong phenomenon (ang buong proseso) sa kabuuan. Ang isang mababang kalkuladong pamantayan ng pagkakaiba ay hindi maaaring magsilbing patunay ng kawalan ng pagkakaiba sa pagitan ng dalawang tampok (phenomena), dahil ang kahalagahan nito (kahalagahan) ay nakasalalay hindi lamang sa average na halaga, kundi pati na rin sa bilang ng mga naihambing na sample. Hindi niya itinuturo ang kawalan ng pagkakaiba, ngunit sa katotohanan na sa gayong sukat ng sample na ito ay hindi maaasahan sa istatistika: mayroong isang napakataas na pagkakataon na ang pagkakaiba sa ilalim ng mga kundisyong ito ay random, at ang posibilidad ng pagiging maaasahan nito ay napakaliit.

Talahanayan 2.17. Mga limitasyon ng kumpiyansa para sa t-test (t-test) ng Mag-aaral para sa f degree ng kalayaan

ng average na oras ng pagkumpleto ng gawain sa ikalawang pagtatangka (kumpara sa unang pagsubok) ay hindi makabuluhan.

Ang expression na ito ay hindi katumbas ng isang pahayag tungkol sa statistical homogeneity ng dalawang sample na inihambing. Bilang karagdagan, ang aplikasyon ng pagsusulit ng Estudyante sa kaso ng mga hindi pantay na sample ay hindi masyadong tama sa matematika at, siyempre, nakakaapekto sa huling resulta tungkol sa hindi pagiging maaasahan ng mga pagkakaiba Xav = 9.1 at Xav = 8.5. Gamit ang criterion na ito, hindi nila sinusuri ang antas ng pagiging malapit ng dalawang average, ngunit isinasaalang-alang ang pagtatalaga o seine na dala ng pagkakataon (sa isang naibigay na antas ng kahalagahan). .

kung saan ang f ay ang antas ng kalayaan, na tinukoy bilang

Halimbawa . Dalawang grupo ng mga mag-aaral ang sinanay ayon sa dalawang magkaibang pamamaraan. Sa pagtatapos ng pagsasanay, binigyan sila ng pagsusulit sa buong kurso. Kinakailangang masuri kung gaano kahalaga ang mga pagkakaiba sa nakuhang kaalaman. Ang mga resulta ng pagsusulit ay ipinakita sa talahanayan 4.

Talahanayan 4

Kalkulahin ang sample mean, variance at standard deviation:

Tukuyin ang halaga ng t p sa pamamagitan ng formula na t p = 0.45

Ayon sa talahanayan 1 (tingnan ang Appendix), nakita namin ang kritikal na halaga t k para sa antas ng kahalagahan p = 0.01

Konklusyon: dahil ang kinakalkula na halaga ng criterion ay mas mababa sa kritikal na halaga ng 0.45<2,88 гипотеза Но подтверждается и существенных различий в методиках обучения нет на уровне значимости 0,01.

Algorithm para sa pagkalkula ng t-test ng Mag-aaral para sa mga umaasa na sample ng mga sukat

1. Tukuyin ang kinakalkula na halaga ng t-criterion gamit ang formula

, saan

2. Kalkulahin ang antas ng kalayaan f

3. Tukuyin ang kritikal na halaga ng t-test ayon sa Talahanayan 1 ng Appendix.

4. Ihambing ang kalkulado at kritikal na mga halaga ng t-criterion. Kung ang kinakalkula na halaga ay mas malaki kaysa o katumbas ng kritikal na halaga, kung gayon ang hypothesis ng pagkakapantay-pantay ng mga paraan sa dalawang sample ng pagbabago ay tinanggihan (Ngunit). Sa lahat ng iba pang mga kaso, ito ay kinuha sa isang naibigay na antas ng kahalagahan.

U- pamantayanManna- Whitney

Layunin ng criterion

Ang pamantayan ay idinisenyo upang masuri ang mga pagkakaiba sa pagitan ng dalawang hindi parametric na sample sa mga tuntunin ng antas ng anumang katangian, na sinusukat sa dami. Ito ay nagpapahintulot sa iyo na makilala ang mga pagkakaiba sa pagitan ng maliliit na sample kapag n< 30.

Paglalarawan ng criterion

Tinutukoy ng pamamaraang ito kung ang lugar ng magkasanib na mga halaga sa pagitan ng dalawang serye ay sapat na maliit. Ang mas maliit na lugar na ito, mas malamang na ang mga pagkakaiba ay makabuluhan. Ang empirical na halaga ng U criterion ay nagpapakita kung gaano kalaki ang zone ng coincidence sa pagitan ng mga row. Samakatuwid, ang mas maliit na U, mas malamang na ang mga pagkakaiba ay makabuluhan.

Hypotheses

PERO: Ang antas ng tampok sa pangkat 2 ay hindi mas mababa kaysa sa antas ng tampok sa pangkat 1.

HI: Ang antas ng katangian sa pangkat 2 ay mas mababa kaysa sa antas ng katangian sa pangkat 1.

Algorithm para sa pagkalkula ng Mann-Whitney criterion (u)

Ilipat ang lahat ng data ng mga paksa sa mga indibidwal na card.

Markahan ang mga card ng mga paksa ng sample 1 ng isang kulay, sabihin ang pula, at lahat ng card mula sa sample 2 sa isa pa, halimbawa, asul.

Ilatag ang lahat ng mga card sa isang solong hilera ayon sa antas ng paglago ng katangian, anuman ang sample ng mga ito, na parang nagtatrabaho kami sa isang malaking sample.

kung saan ang n 1 ay ang bilang ng mga paksa sa sample 1;

n 2 - ang bilang ng mga paksa sa sample 2,

T x - ang mas malaki sa dalawang rand sum;

n x - ang bilang ng mga paksa sa pangkat na may mas malaking kabuuan ng mga ranggo.

9. Tukuyin ang mga kritikal na halaga ng U ayon sa talahanayan 2 (tingnan ang Appendix).

Kung U emp.> U kr0.05, kung gayon ang hypothesis na Ngunit ay tinatanggap. Kung U emp. ≤ U cr, tatanggihan ito. Kung mas maliit ang halaga ng U, mas mataas ang pagiging maaasahan ng mga pagkakaiba.

Halimbawa. Paghambingin ang bisa ng dalawang paraan ng pagtuturo sa dalawang grupo. Ang mga resulta ng pagsusulit ay ipinakita sa talahanayan 5.

Talahanayan 5

Ilipat natin ang lahat ng data sa isa pang talahanayan, i-highlight ang data ng pangalawang pangkat na may salungguhit at gawin ang pagraranggo ng kabuuang sample (tingnan ang algorithm ng pagraranggo sa mga alituntunin para sa gawain 3).

Mga halaga

Hanapin ang kabuuan ng mga ranggo ng dalawang sample at piliin ang pinakamalaki sa kanila: T x = 113

Kalkulahin natin ang empirical value ng criterion ayon sa formula 2: U p = 30.

Alamin natin ang kritikal na halaga ng criterion mula sa Talahanayan 2 ng Appendix sa antas ng kahalagahan p = 0.05: U k = 19.

Konklusyon: dahil ang kinakalkula na halaga ng criterionUay mas malaki kaysa sa kritikal na antas sa antas ng kahalagahan p = 0.05 at 30 > 19, pagkatapos ay ang hypothesis ng pagkakapantay-pantay ng mga paraan ay tinatanggap at ang mga pagkakaiba sa mga pamamaraan ng pagtuturo ay hindi gaanong mahalaga..

Ang pamamaraan ay nagbibigay-daan sa iyo upang subukan ang hypothesis na ang average na mga halaga ng dalawang pangkalahatang populasyon mula sa kung saan ang inihambing umaasa ang mga sample ay naiiba sa bawat isa. Ang pagpapalagay ng dependence ay kadalasang nangangahulugan na ang katangian ay sinusukat ng dalawang beses sa parehong sample, halimbawa, bago at pagkatapos ng pagkakalantad. Sa pangkalahatang kaso, ang bawat kinatawan ng isang sample ay itinalaga ng isang kinatawan mula sa isa pang sample (sila ay pinagsama sa mga pares) upang ang dalawang serye ng data ay positibong nauugnay sa isa't isa. Mga mahihinang uri ng pag-asa ng mga sample: sample 1 - mga asawang lalaki, sample 2 - kanilang mga asawa; sample 1 - isang taong gulang na bata, sample 2 ay binubuo ng kambal ng mga bata mula sa sample 1, atbp.

Isang masusubok na istatistikal na hypothesis, tulad ng sa nakaraang kaso, H 0: M 1 = M 2(Mean values sa samples 1 and 2 are equal). Kapag ito ay tinanggihan, isang alternatibong hypothesis ang tinatanggap na M 1 humigit kumulang) M 2 .

Mga Paunang Pagpapalagay para sa statistical verification:

□ bawat kinatawan ng isang sample (mula sa isang pangkalahatang populasyon) ay itinalaga ng isang kinatawan ng isa pang sample (mula sa isa pang pangkalahatang populasyon);

□ positibong nauugnay ang data ng dalawang sample (pinares);

□ ang distribusyon ng katangiang pinag-aaralan sa parehong mga sample ay tumutugma sa normal na batas.

Paunang istraktura ng data: mayroong dalawang halaga ng katangiang pinag-aaralan para sa bawat bagay (para sa bawat pares).

Mga Paghihigpit: ang pamamahagi ng tampok sa parehong mga sample ay hindi dapat magkaiba nang malaki mula sa normal; positibong nauugnay ang data ng dalawang sukat na tumutugma sa isa at sa isa pang sample.

Mga alternatibo: ang T-Wilcoxon test, kung ang distribusyon para sa kahit isang sample ay malaki ang pagkakaiba sa normal; t-student test para sa mga independiyenteng sample - kung ang data para sa dalawang sample ay hindi positibong nauugnay.

Formula dahil ang empirical value ng Student's t-test ay sumasalamin sa katotohanan na ang unit of difference analysis ay pagkakaiba (shift) mga halaga ng tampok para sa bawat pares ng mga obserbasyon. Alinsunod dito, para sa bawat isa sa mga N pares ng mga halaga ng tampok, ang pagkakaiba ay unang kinakalkula d i \u003d x 1 i - x 2 i.

(3) kung saan ang M d ay ang average na pagkakaiba ng mga halaga; σ d ay ang karaniwang paglihis ng mga pagkakaiba.

Halimbawa ng pagkalkula:

Ipagpalagay natin na sa panahon ng pagsubok sa pagiging epektibo ng pagsasanay, ang bawat isa sa 8 miyembro ng grupo ay tinanong ng tanong na "Gaano kadalas ang iyong mga opinyon ay sumasabay sa opinyon ng grupo?" - dalawang beses, bago at pagkatapos ng pagsasanay. Para sa mga sagot, ginamit ang 10-point scale: 1 - hindi kailanman, 5 - sa kalahati ng mga kaso, 10 - palagi. Nasubok ang hypothesis na bilang resulta ng pagsasanay, tataas ang self-assessment ng conformity (ang pagnanais na maging katulad ng iba sa grupo) ng mga kalahok (α = 0.05). Gumawa tayo ng talahanayan para sa mga intermediate na kalkulasyon (Talahanayan 3).

Talahanayan 3

Ang arithmetic mean para sa pagkakaiba M d = (-6)/8= -0.75. Ibawas ang halagang ito mula sa bawat d (ang penultimate column ng talahanayan).

Ang formula para sa standard deviation ay naiiba lamang sa d na lilitaw sa halip na X. Pinapalitan namin ang lahat ng kinakailangang halaga, nakukuha namin

σd = 0.886.

Hakbang 1. Kalkulahin ang empirical value ng criterion gamit ang formula (3): ang average na pagkakaiba M d= -0.75; karaniwang lihis σ d = 0,886; t e = 2,39; df = 7.

Hakbang 2. Tinutukoy namin ang antas ng p-kabuluhan mula sa talahanayan ng mga kritikal na halaga ng t-test ng Estudyante. Para sa df = 7, ang empirical na halaga ay nasa pagitan ng mga kritikal para sa p = 0.05 at p - 0.01. Samakatuwid, p< 0,05.

df	R
0,05	0,01	0,001
	2,365	3,499	5,408

Hakbang 3. Gumagawa kami ng istatistikal na desisyon at bumalangkas ng konklusyon. Ang istatistikal na hypothesis na ang ibig sabihin ay pantay ay tinanggihan. Konklusyon: ang tagapagpahiwatig ng pagtatasa sa sarili ng pagsang-ayon ng mga kalahok pagkatapos ng pagsasanay ay tumaas nang malaki sa istatistika (sa antas ng kahalagahan p< 0,05).

Kasama sa mga parametric na pamamaraan paghahambing ng mga pagkakaiba-iba ng dalawang sample sa pamamagitan ng criterion F-Fischer. Minsan ang pamamaraang ito ay humahantong sa mahalagang makabuluhang konklusyon, at sa kaso ng paghahambing ng mga paraan para sa mga independiyenteng sample, ang paghahambing ng mga pagkakaiba ay sapilitan pamamaraan.

Upang makalkula F emp kailangan mong hanapin ang ratio ng mga pagkakaiba-iba ng dalawang sample, at upang ang mas malaking pagkakaiba ay nasa numerator, at ang mas maliit na denominator.

Paghahambing ng mga pagkakaiba-iba. Ang pamamaraan ay nagbibigay-daan sa iyo upang subukan ang hypothesis na ang mga pagkakaiba-iba ng dalawang pangkalahatang populasyon kung saan ang mga inihambing na sample ay nakuha ay naiiba sa bawat isa. Nasubok na istatistikal na hypothesis H 0: σ 1 2 = σ 2 2 (ang pagkakaiba sa sample 1 ay katumbas ng variance sa sample 2). Kapag ito ay tinanggihan, ang isang alternatibong hypothesis ay tinatanggap na ang isang pagkakaiba ay mas malaki kaysa sa isa.

Mga Paunang Pagpapalagay: dalawang sample ang random na kinukuha mula sa magkakaibang pangkalahatang populasyon na may normal na distribusyon ng katangiang pinag-aaralan.

Paunang istraktura ng data: ang katangiang pinag-aaralan ay sinusukat sa mga bagay (mga paksa), na ang bawat isa ay kabilang sa isa sa dalawang pinaghahambing na mga sample.

Mga Paghihigpit: Ang mga distribusyon ng feature sa parehong sample ay hindi gaanong naiiba sa normal.

Alternatibong pamamaraan: ang Levene "sTest test, ang aplikasyon kung saan ay hindi nangangailangan ng pagsuri sa pagpapalagay ng normalidad (ginamit sa programa ng SPSS).

Formula para sa empirical na halaga ng F-Fisher test:

(4)

kung saan σ 1 2 - malaking dispersion, at σ 2 2 - mas maliit na dispersion. Dahil hindi alam nang maaga kung aling pagkakaiba ang mas malaki, kung gayon upang matukoy ang p-level, Talaan ng mga kritikal na halaga para sa mga alternatibong hindi direksyon. Kung ang F e > F Kp para sa katumbas na bilang ng mga antas ng kalayaan, kung gayon R < 0,05 и статистическую гипотезу о равенстве дисперсий можно отклонить (для α = 0,05).

Halimbawa ng pagkalkula:

Ang mga bata ay binigyan ng karaniwang mga gawain sa aritmetika, pagkatapos kung saan ang isang random na napiling kalahati ng mga mag-aaral ay sinabihan na hindi sila nakapasa sa pagsusulit, at ang natitira - ang kabaligtaran. Pagkatapos ay tinanong ang bawat bata kung ilang segundo ang aabutin niya upang malutas ang isang katulad na problema. Kinakalkula ng eksperimento ang pagkakaiba sa pagitan ng oras na tinawag ng bata at ang resulta ng natapos na gawain (sa mga segundo). Inaasahan na ang pag-uulat ng kabiguan ay magdudulot ng ilang kakulangan sa pagpapahalaga sa sarili ng bata. Ang nasubok na hypothesis (sa antas ng α = 0.005) ay ang pagkakaiba ng populasyon ng mga self-assessment ay hindi nakadepende sa mga ulat ng tagumpay o kabiguan (Н 0: σ 1 2=σ 2 2).

Natanggap ang sumusunod na data:

Hakbang 1. Kalkulahin ang empirical na halaga ng criterion at ang bilang ng mga antas ng kalayaan gamit ang mga formula (4):

Hakbang 2. Ayon sa talahanayan ng mga kritikal na halaga ng f-Fisher criterion para sa hindi nakadirekta mga alternatibong hinahanap namin ang kritikal na halaga para sa numero ng df = 11; tanda ng df= 11. Gayunpaman, mayroong kritikal na halaga para lamang sa numero ng df= 10 at df sign = 12. Ang isang mas malaking bilang ng mga antas ng kalayaan ay hindi maaaring kunin, samakatuwid ay isinasaalang-alang namin ang kritikal na halaga para sa numero ng df= 10: Para sa R = 0,05 F Kp = 3.526; para sa R = 0,01 F Kp = 5,418.

Hakbang 3. Paggawa ng istatistikal na desisyon at makabuluhang konklusyon. Dahil ang empirical na halaga ay lumampas sa kritikal na halaga para sa R= 0.01 (at higit pa para sa p = 0.05), pagkatapos ay sa kasong ito p< 0,01 и принимается альтернативная гипотеза: дисперсия в группе 1 превышает дисперсию в группе 2 (R< 0.01). Dahil dito, pagkatapos mag-ulat ng kabiguan, ang kakulangan ng pagpapahalaga sa sarili ay mas mataas kaysa pagkatapos mag-ulat ng tagumpay.

/ mga praktikal na istatistika / mga sangguniang materyales / mga halaga ng t-test ng mag-aaral

Ibig sabihint - Pagsusulit ng mag-aaral sa antas ng kahalagahan na 0.10, 0.05 at 0.01

ν – antas ng kalayaan sa pagkakaiba-iba

Mga karaniwang halaga ng t-test ng Mag-aaral

Bilang ng antas ng kalayaan	Mga antas ng kahalagahan	Bilang ng antas ng kalayaan	Mga antas ng kahalagahan

mesa XI

Mga karaniwang halaga ng Fisher test na ginamit upang masuri ang kahalagahan ng mga pagkakaiba sa pagitan ng dalawang sample

Mga antas ng kalayaan	Lebel ng kahalagahan	Mga antas ng kalayaan	Lebel ng kahalagahan
Mga antas ng kalayaan		Mga antas ng kalayaan

T-test ng mag-aaral

T-test ng mag-aaral- ang pangkalahatang pangalan para sa isang klase ng mga pamamaraan para sa istatistikal na pagsubok ng mga hypotheses (mga pagsusulit sa istatistika) batay sa pamamahagi ng Estudyante. Ang pinakakaraniwang mga kaso ng paglalapat ng t-test ay nauugnay sa pagsuri sa pagkakapantay-pantay ng mga paraan sa dalawang sample.

t-Ang mga istatistika ay karaniwang binuo ayon sa sumusunod na pangkalahatang prinsipyo: ang numerator ay isang random na variable na may zero na inaasahan sa matematika (kapag ang null hypothesis ay natupad), at ang denominator ay ang sample na standard deviation ng random variable na ito, na nakuha bilang square root ng ang walang halong variance estimate.

Kwento

Ang pamantayang ito ay binuo ni William Gosset upang suriin ang kalidad ng beer sa Guinness. Kaugnay ng mga obligasyon sa kumpanya para sa hindi pagsisiwalat ng mga lihim ng kalakalan (itinuring ng pamunuan ng Guinness ang gayong paggamit ng statistical apparatus sa kanilang trabaho), ang artikulo ni Gosset ay nai-publish noong 1908 sa journal Biometrics sa ilalim ng pseudonym na "Mag-aaral" (Mag-aaral) .

Mga Kinakailangan sa Data

Upang mailapat ang pamantayang ito, kinakailangan na ang orihinal na data ay may normal na distribusyon. Sa kaso ng paglalapat ng dalawang-sample na pagsubok para sa mga independiyenteng sample, kinakailangan ding sumunod sa kondisyon ng pagkakapantay-pantay ng mga pagkakaiba. Gayunpaman, mayroong mga alternatibo sa t-test ng Mag-aaral para sa mga sitwasyong may hindi pantay na pagkakaiba.

Ang pangangailangan na maging normal ang distribusyon ng data ay kinakailangan para sa eksaktong t (\displaystyle t) -test. Gayunpaman, kahit na sa iba pang mga distribusyon ng data, posibleng gamitin ang t (\displaystyle t) -statistic. Sa maraming kaso, ang mga istatistikang ito ay asymptotically ay may karaniwang normal na distribusyon - N (0 , 1) (\displaystyle N(0,1)) , kaya ang dami ng distribusyon na ito ay maaaring gamitin. Gayunpaman, madalas kahit na sa kasong ito, ang mga quantile ay ginagamit hindi mula sa karaniwang normal na distribusyon, ngunit mula sa kaukulang distribusyon ng Mag-aaral, tulad ng sa eksaktong t (\displaystyle t) -test. Ang mga ito ay asymptotically equivalent, ngunit sa maliliit na sample, ang confidence interval ng distribusyon ng Student ay mas malawak at mas maaasahan.

Isang sample na t-test

Ito ay ginagamit upang subukan ang null hypothesis H 0: E (X) = m (\displaystyle H_(0):E(X)=m) tungkol sa pagkakapantay-pantay ng inaasahan E (X) (\displaystyle E(X)) sa ilang kilalang halaga m ( \displaystyle m) .

Malinaw, sa ilalim ng null hypothesis E (X ¯) = m (\displaystyle E((\overline (X)))=m) . Dahil sa ipinapalagay na kalayaan ng mga obserbasyon, V (X ¯) = σ 2 / n (\displaystyle V((\overline (X)))=\sigma ^(2)/n) . Gamit ang walang pinapanigan na pagtatantya ng variance s X 2 = ∑ t = 1 n (X t − X ¯) 2 / (n − 1) (\displaystyle s_(X)^(2)=\sum _(t=1)^( n )(X_(t)-(\overline (X)))^(2)/(n-1)) nakukuha natin ang sumusunod na t-statistic:

t = X ¯ − m s X / n (\displaystyle t=(\frac ((\overline (X))-m)(s_(X)/(\sqrt (n)))))

Sa ilalim ng null hypothesis, ang distribusyon ng istatistikang ito ay t (n − 1) (\displaystyle t(n-1)) . Samakatuwid, kung ang halaga ng mga istatistika sa ganap na halaga ay lumampas sa kritikal na halaga ng distribusyon na ito (sa isang naibigay na antas ng kahalagahan), ang null hypothesis ay tinatanggihan.

Dalawang-sample na t-test para sa mga independiyenteng sample

Hayaang magkaroon ng dalawang independiyenteng sample ng mga laki n 1 , n 2 (\displaystyle n_(1)~,~n_(2)) ng mga random na variable na karaniwang ipinamamahagi X 1 , X 2 (\displaystyle X_(1),~X_(2 )) . Kinakailangang subukan ang null hypothesis ng pagkakapantay-pantay ng mga inaasahan sa matematika ng mga random na variable na ito H 0: M 1 = M 2 (\displaystyle H_(0):~M_(1)=M_(2)) gamit ang sample na data.

Isaalang-alang ang pagkakaiba ng sample ay nangangahulugang Δ = X ¯ 1 − X ¯ 2 (\displaystyle \Delta =(\overline (X))_(1)-(\overline (X))_(2)) . Malinaw, kung ang null hypothesis ay nasiyahan E (Δ) = M 1 − M 2 = 0 (\displaystyle E(\Delta)=M_(1)-M_(2)=0) . Ang pagkakaiba ng pagkakaibang ito ay, batay sa kalayaan ng mga sample: V (Δ) = σ 1 2 n 1 + σ 2 2 n 2 (\displaystyle V(\Delta)=(\frac (\sigma _(1) ^(2))( n_(1)))+(\frac (\sigma _(2)^(2))(n_(2)))) . Pagkatapos ay gamit ang walang pinapanigan na pagtatantya ng variance s 2 = ∑ t = 1 n (X t − X ¯) 2 n − 1 (\displaystyle s^(2)=(\frac (\sum _(t=1)^(n) ( X_(t)-(\overline (X)))^(2))(n-1))) nakakakuha kami ng walang pinapanigan na pagtatantya ng pagkakaiba ng pagkakaiba sa pagitan ng sample na ibig sabihin: s Δ 2 = s 1 2 n 1 + s 2 2 n 2 (\ displaystyle s_(\Delta )^(2)=(\frac (s_(1)^(2))(n_(1)))+(\frac (s_(2)^ (2))(n_(2) ))) . Samakatuwid, ang t-statistic para sa pagsubok ng null hypothesis ay

T = X ¯ 1 − X ¯ 2 s 1 2 n 1 + s 2 2 n 2 (\displaystyle t=(\frac ((\overline (X))_(1)-(\overline (X))_( 2))(\sqrt ((\frac (s_(1)^(2))(n_(1)))+(\frac (s_(2)^(2))(n_(2))))) ))

Ang istatistikang ito, sa ilalim ng null hypothesis, ay may distribusyon t (d f) (\displaystyle t(df)) , kung saan d f = (s 1 2 / n 1 + s 2 2 / n 2) 2 (s 1 2 / n 1 ) 2 / (n 1 − 1) + (s 2 2 / n 2) 2 / (n 2 − 1) (\displaystyle df=(\frac ((s_(1)^(2)/n_(1)+ s_(2 )^(2)/n_(2))^(2))((s_(1)^(2)/n_(1))^(2)/(n_(1)-1)+( s_(2 )^(2)/n_(2))^(2)/(n_(2)-1))))

Parehong variance case

Kung ang mga sample na pagkakaiba ay ipinapalagay na pareho, kung gayon

V (Δ) = σ 2 (1 n 1 + 1 n 2) (\displaystyle V(\Delta)=\sigma ^(2)\left((\frac (1)(n_(1)))+(\ frac (1)(n_(2)))\kanan))

Pagkatapos ang t-statistic ay:

T = X ¯ 1 − X ¯ 2 s X 1 n 1 + 1 n 2 , s X = (n 1 − 1) s 1 2 + (n 2 − 1) s 2 2 n 1 + n 2 − 2 (\ displaystyle t=(\frac ((\overline (X))_(1)-(\overline (X))_(2))(s_(X)(\sqrt ((\frac (1)(n_(1) )))+(\frac (1)(n_(2)))))))~,~~s_(X)=(\sqrt (\frac ((n_(1)-1)s_(1)^ (2)+(n_(2)-1)s_(2)^(2))(n_(1)+n_(2)-2))))

Ang istatistikang ito ay may distribusyon t (n 1 + n 2 − 2) (\displaystyle t(n_(1)+n_(2)-2))

Dalawang-sample na t-test para sa mga umaasa na sample

Upang kalkulahin ang empirical value ng t (\displaystyle t) -criterion sa isang sitwasyon ng pagsubok ng hypothesis tungkol sa mga pagkakaiba sa pagitan ng dalawang dependent sample (halimbawa, dalawang sample ng parehong pagsubok na may time interval), ang sumusunod na formula ay ginagamit :

T = M d s d / n (\displaystyle t=(\frac (M_(d))(s_(d)/(\sqrt (n)))))

kung saan ang M d (\displaystyle M_(d)) ay ang ibig sabihin ng pagkakaiba ng mga value, ang s d (\displaystyle s_(d)) ay ang standard deviation ng mga pagkakaiba, at n ang bilang ng mga obserbasyon

Ang istatistikang ito ay may distribusyon na t (n − 1) (\displaystyle t(n-1)) .

Pagsubok ng Linear Constraint sa Mga Parameter ng Linear Regression

Ang t-test ay maaari ding sumubok ng isang arbitrary (solong) linear constraint sa mga parameter ng isang linear regression na tinatantya ng ordinaryong hindi bababa sa mga parisukat. Hayaang kailangang subukan ang hypothesis H 0: c T b = a (\displaystyle H_(0):c^(T)b=a) . Malinaw, sa ilalim ng null hypothesis E (c T b ^ − a) = c T E (b ^) − a = 0 (\displaystyle E(c^(T)(\hat (b))-a)=c^( T)E((\hat (b)))-a=0) . Dito ginagamit namin ang property ng walang pinapanigan na mga pagtatantya ng hindi bababa sa mga parisukat ng mga parameter ng modelo E (b ^) = b (\displaystyle E((\hat (b)))=b) . Bilang karagdagan, V (c T b ^ − a) = c T V (b ^) c = σ 2 c T (X T X) − 1 c (\displaystyle V(c^(T)(\hat (b))-a )=c^(T)V((\hat (b)))c=\sigma ^(2)c^(T)(X^(T)X)^(-1)c) . Gamit sa halip na ang hindi kilalang variance nito walang pinapanigan na pagtatantya s 2 = E S S / (n − k) (\displaystyle s^(2)=ESS/(n-k)) makuha natin ang sumusunod na t-statistic:

T = c T b ^ − a s c T (X T X) − 1 c (\displaystyle t=(\frac (c^(T)(\hat (b))-a)(s(\sqrt (c^(T) (X^(T)X)^(-1)c)))))

Ang istatistikang ito, sa ilalim ng null hypothesis, ay may distribusyon na t (n − k) (\displaystyle t(n-k)) , kaya kung ang halaga ng istatistika ay mas malaki kaysa sa kritikal na halaga, kung gayon ang null hypothesis ng isang linear constraint ay tinanggihan.

Pagsubok ng mga hypotheses tungkol sa koepisyent ng linear regression

Ang isang espesyal na kaso ng isang linear constraint ay upang subukan ang hypothesis na ang regression coefficient b j (\displaystyle b_(j)) ay katumbas ng ilang value a (\displaystyle a) . Sa kasong ito, ang kaukulang t-statistic ay:

T = b ^ j − a s b ^ j (\displaystyle t=(\frac ((\hat (b))_(j)-a)(s_((\hat (b))_(j)))))

kung saan ang s b ^ j (\displaystyle s_((\hat (b))_(j))) ay ang karaniwang error ng coefficient estimate - ang square root ng kaukulang diagonal na elemento ng covariance matrix ng coefficient estima.

Sa ilalim ng null hypothesis, ang distribusyon ng istatistikang ito ay t (n − k) (\displaystyle t(n-k)) . Kung ang ganap na halaga ng istatistika ay mas mataas kaysa sa kritikal na halaga, kung gayon ang pagkakaiba ng koepisyent mula sa isang (\displaystyle a) ay makabuluhan sa istatistika (hindi random), kung hindi, ito ay hindi gaanong mahalaga (random, iyon ay, ang tunay na koepisyent ay malamang na katumbas o napakalapit sa inaasahang halaga ng isang (\ display style a))

Magkomento

Ang isang-sample na pagsubok para sa mga inaasahan sa matematika ay maaaring bawasan sa pagsubok ng isang linear na hadlang sa mga parameter ng linear regression. Sa isang isang sample na pagsubok, ito ay isang "regression" sa isang pare-pareho. Samakatuwid, ang s 2 (\displaystyle s^(2)) ng regression ay isang sample na pagtatantya ng variance ng random variable na pinag-aaralan, ang matrix X T X (\displaystyle X^(T)X) ay katumbas ng n (\displaystyle n) , at ang pagtatantya ng "coefficient" ng modelo ay sample mean. Mula dito nakuha namin ang expression para sa t-statistic na ibinigay sa itaas para sa pangkalahatang kaso.

Katulad nito, maaari itong ipakita na ang isang dalawang-sample na pagsubok na may pantay na sample na mga pagkakaiba-iba ay nababawasan din sa pagsubok ng mga linear na hadlang. Sa isang dalawang-sample na pagsubok, ito ay isang "regression" sa isang constant at isang dummy variable na tumutukoy sa isang subsample depende sa value (0 o 1): y = a + b D (\displaystyle y=a+bD) . Ang hypothesis tungkol sa pagkakapantay-pantay ng mga mathematical na inaasahan ng mga sample ay maaaring bumalangkas bilang hypothesis tungkol sa pagkakapantay-pantay ng coefficient b ng modelong ito sa zero. Maipapakita na ang kaukulang t-statistic para sa pagsubok sa hypothesis na ito ay katumbas ng t-statistic na ibinigay para sa two-sample na pagsubok.

Maaari din itong bawasan sa pagsuri sa linear constraint sa kaso ng iba't ibang mga pagkakaiba-iba. Sa kasong ito, ang pagkakaiba ng mga error sa modelo ay tumatagal ng dalawang halaga. Mula dito, maaari ding makakuha ng t-statistic na katulad ng ibinigay para sa dalawang sample na pagsubok.

Mga nonparametric na analog

Ang isang analogue ng dalawang-sample na pagsubok para sa mga independiyenteng sample ay ang Mann-Whitney U-test. Para sa sitwasyon na may mga umaasa na sample, ang mga analogue ay ang sign test at ang Wilcoxon T-test

Panitikan

mag-aaral. Ang posibleng pagkakamali ng isang mean. // Biometrika. 1908. Blg. 6 (1). P. 1-25.

Mga link

Sa pamantayan para sa pagsubok ng mga hypotheses tungkol sa homogeneity ng mga paraan sa website ng Novosibirsk State Technical University