Tələbənin T kriteriyasının onlayn avtomatik hesablanması. Fərqlərin əhəmiyyətinin t - Tələbə meyarı ilə müəyyən edilməsi

Əksər hallarda, iki orta müqayisə etmək müstəqil nümunələr(səh. 91) Tələbənin t-testini tətbiq edin. Tələbə meyarı parametrik olduğundan, onun istifadəsi yalnız tədqiqatın nəticələrinə uyğun olaraq ölçmələr şəklində təqdim edildikdə mümkündür. əlaqə miqyası(səh. 90).

Tələbə meyarı işarələnmişdir t və formula* ilə hesablanır:

t = x1 - x2 / √ m1² + m2²

Müşahidələrin sayının (n) 500-dən çox olduğu hallarda, p = 0,05-də əhəmiyyətlilik səviyyəsi t = 1,96-da əldə edilir, müvafiq olaraq p = 0,01 və ya p = 0,001-də əhəmiyyətlilik səviyyələri t = 2,59-da əldə edilir və t = 3.29.

Əgər müşahidələrin sayı 500-dən azdırsa, müxtəlif əhəmiyyət səviyyələri üçün t-nin tələb olunan qiyməti 10-cu cədvəldən müəyyən edilir.

Cədvələ keçməzdən əvvəl nömrəni müəyyən etmək lazımdır sərbəstlik dərəcələri. Bu termin bu və ya digər parametrin (f) formalaşmasında iştirak edən müstəqil kəmiyyətlərin sayına aiddir. Sərbəstlik dərəcələrinin müəyyən edilməsi qaydaları riyazi statistika üzrə müxtəlif dərsliklərdə təqdim olunur (Yu.K. Demyanenko, 1968). Tələbə kriteriyası t hesablanarkən, sərbəstlik dərəcələrinin ümumi sayı (f) n1-ə bərabər olacaqdır. + n2 - 2.

Beləliklə, məsələn, eksperimental və nəzarət qruplarının xizəkçilərinin nəzarət məsafəsini qət edərkən göstərdikləri nəticələri müqayisə edərkən aşağıdakı məlumatlar əldə edildi: eksperimental qrupda orta göstərici (n = 12 nəfər) x = 34,6 san idi. orta dəyərin xətası m = 0,47 san; nəzarət qrupunda (n = 14 nəfər), bu məlumatlar müvafiq olaraq x = 37,3 san, m = 0,49 san idi.

Dəyərləri düsturla əvəz edərək t dəyərini alırıq.

t \u003d 37,3 - 34,6 / √ V 0,49 2 + 0,47 2 \u003d 2,7 / 0,68 \u003d 3,97

Sərbəstlik dərəcələrinin sayını təyin etdikdən sonra (f \u003d 12 + 14 - 2 \u003d 24) cədvəldən t dəyərini tapırıq. Nəticədə 3.97 dəyəri 99% etibarlılıq səviyyəsi üçün cədvəl dəyərini aşır. Beləliklə, iki müqayisə edilən qrupun nəticələri arasında p əhəmiyyət səviyyəsində əhəmiyyətli fərqlərin olduğunu söyləyə bilərik.< 0,01.



Nisbətən çox sayda ölçmə ilə şərti olaraq qəbul edilir ki, arifmetik ortalar arasındakı fərq onun üç səhvinə bərabər və ya ondan çox olarsa, fərqlər əhəmiyyətli hesab olunur. Bu halda fərqlərin etibarlılığı aşağıdakı tənliklə müəyyən edilir:

X E -X K > 3√ me + mk ²

Yuxarıdakı misalda müxtəlif qruplarda iştirak edənlərin nəticələri müqayisə edilmişdir, yəni müstəqil nümunələr. Təcrübənin əvvəlində və sonunda eyni qrupda alınan nəticələr müqayisə edildikdə, yəni nə vaxt asılı nümunələr, adi düsturdan istifadə edərək Student t-testini hesablayın qadağandır . Bu halda tələbə meyarı düsturla hesablanmalıdır:

t \u003d X 1 -X 2 / m1 ² + m2² - 2rm1 m2

harada r - öyrənilən əlamət üzrə ilkin və son nəticələr arasında korrelyasiya əmsalı.

Cədvəl 10

Məhdud dəyərlər t (Tələbə meyarı)

f Güvən səviyyələri (P)
95% . 99% 99,9%
12,71 63.60
4.30 9.93 31.60
3.18 5.84 12.94
2.78 4.60 8.61
2.57 4.03 6.86
2.45 3.71 5.96
2.37 3.50 5.41
2.31 3.36 5,04
2.26 3.25 4.78
2.23 3.17 4.59
P 2.20 3.11 4.44
2.18 3.06 4.32
1.16 3.01 4.22
2.15 2,98 4,14
2.13 2.95 4.07
2.12 2,92 4.02
2.11 2.90 3.97
2.10 2.88 3.92
2.09 2.86 3.88
2.09 2.85 3.85
2.08 2,83 3.82
2.07 2.82 3.79
2.07 2.81 3,77
2.06 2.80 3.75
2,06 2.79 3.73
2.06 2.78 3.71
2.05 2.77 3.69
2.05 2.76 3.67
2.04 2.76 3.66
2.04 2,75 " 3.65
2.02 2,70 3.55
2.01 2.68 3,50
2.00 2.66 3.46
1.99 2.64 3.42
1.98 2.63 3.39
1.98 2,62 3.37
1.97 2.60 3.34
1.96 2,59 3.31
oo 1.96 2.59 3.29
Əhəmiyyət səviyyələri (p)
0,05 0,01 0,001

Nəticələrin formalaşdırılması

(nəticə)

İşin sonunda nəticələr çıxarılır. Nəticələrin tərtibi, girişin tərtibi ilə yanaşı, istənilən kurs işinin tərtibatında ən çətin və kritik mərhələlərdən biridir.

Nəticələr tədqiqatın ən əhəmiyyətli nəticələrini əks etdirməlidir.

Nəticə çıxararkən bir neçə ümumi səhv var. Çox vaxt şagird elə bir cümlə qurur ki, bu, gördüyü işin nəticələrinin bəyanı kimi səslənsin (“öyrəndiyi”, “inkişaf etdirdiyi” və s.). Misal üçün:

"Tədqiqat zamanı eksperimental metodologiyanın əsas müddəaları müəyyən edilmişdir ..." və ya "Məktəblilərlə bədən tərbiyəsi və sağlamlıq işinin həyata keçirilməsində pedaqoji ixtisas tələbələrinin kommunikativ bacarıqlarını qiymətləndirməyə imkan verən göstəricilər müəyyən edilmişdir .. .”.

Yuxarıda göstərilənlərin nəticə olması üçün ifadələr belə qurulmalı idi: "Bizim tərəfimizdən tərtib edilmiş eksperimental metodologiyanın müddəaları imkan verir ..." və müvafiq olaraq: "Seçilmiş göstəricilərdən ən məlumatlandırıcı, imkan verən tələbələrin ünsiyyət bacarıqlarının səviyyəsini qiymətləndirmək pedaqoji ixtisaslar, var...»

Başqa bir ümumi səhv, tələbənin açıq-aydın bir şeyin yekununda ifadə etməsidir, bunun üçün xüsusi araşdırma aparmaq tələb olunmur. Misal üçün:

“Məktəblilərlə fiziki məşqlər edərkən bu yaşda olan yeniyetmənin inkişaf xüsusiyyətlərini nəzərə almaq lazımdır”.

Bəzən nəticə tamamilə mənasız olur. Adətən bu, tələbənin ədəbiyyat təhlili əsasında çıxardığı ilk nəticədir. Misal üçün:

“Elmi-metodiki ədəbiyyatın təhlili göstərdi ki, bədən tərbiyəsi nəzəriyyəsində üzgüçülərin idman hazırlığında simulyatorlardan istifadə məsələsi hələ tam açıqlanmayıb”.

Nəticələr tələbənin gördüyü işi informativ şəkildə əks etdirməli, lakin ətraflı olmamalıdır.


FORMA TƏLƏBLƏRİ

KURS İŞLƏRİ

Yekun ixtisas işində aşağıdakı struktur komponentlər təqdim edilməlidir:

· başlıq səhifəsi;

· giriş;

· əsas mətn(1-ci fəsil, 2-ci fəsil);

· nəticələr (nəticə);

· biblioqrafiya;

· tətbiqlər(lazım olduqda).

Kurs işinin optimal miqdarı 1-də 40-50 səhifəlik maşınla yazılmış mətndir ,5 interval (şəkillər, cədvəllər, qrafiklər, biblioqrafiya və əlavələr daxil olmaqla).

Şrift ölçüsü 14 Times New Roman.

İş kompüterdə və ya əlyazma şəklində tərtib edilir (ikinci seçim daha az arzuolunandır).

Kompüter versiyasında işin mətni standart A4 kağız vərəqinin (210x297 mm) bir tərəfində bir yarım intervalla çap olunur. İş səhifəsinin kənarları aşağıdakı ölçülərə malik olmalıdır: sol - 30 mm, sağ - 10 mm, yuxarı - 20 mm, aşağı - 25 mm.

Cədvəllər, rəqəmlər, çertyojlar, diaqramlar, qrafiklər standart A4 vərəqlərində (210x297 mm) tərtib edilməlidir. İmzalar və izahatlar ön tərəfdə olmalıdır.

Yekun attestasiya işlərinin bütün səhifələri, o cümlədən illüstrasiyalar və ərizələr buraxılış və təkrarlar olmadan başlıq səhifəsindən sonuncu səhifəyə qədər nömrələnir. Baş səhifə birinci səhifə hesab edilir, onun üzərinə “1” rəqəmi qoyulmur, növbəti səhifəyə “2” rəqəmi qoyulur və s. Seriya nömrəsi səhifənin aşağı kənarının ortasında yerləşdirilir.

Mündəricata (plana) uyğun olaraq yekun attestasiya işlərinin bütün materialları paraqraflara bölünür. Paraqrafların başlığı məzmuna uyğun olmalı və altdan xətt çəkilmədən kiçik hərflərlə başlıq kimi çap edilməlidir.

Əsərdə "və s", "və s.", "və s." kimi standart ümumi qəbul edilmiş abbreviaturalar. "və s.", "bax", "səh."

Cədvəllərin və illüstrasiyaların dizayn nümunəsi Əlavə 3-də verilmişdir.

Başlıq səhifəsi

Başlıq səhifəsi iş haqqında məlumatdır. İşin görüldüyü qurumun adını göstərir; müəllifin soyadı, adı, atasının adı; başlıq; elmi rəhbərin (məsləhətçinin) soyadı, adı, atasının adı, elmi dərəcəsi və elmi adı; şəhər, il Yekun attestasiya işlərinin baş səhifəsi Şəkil 1-də göstərilmişdir.

Federal Dövlət Muxtar Təhsil Təşkilatı

Ali təhsil

"Nijni Novqorod Dövlət Universiteti. N.İ. Lobaçevski"

Arzamas filialı

Təbii Coğrafiya Fakültəsi

Bədən Tərbiyəsi Kafedrası

İntizam üzrə kurs işi

“Bədən tərbiyəsi nəzəriyyəsi və metodları”

mövzuda:

“Bədən tərbiyəsi və istirahət dərslərinin metodik xüsusiyyətləri

məktəbəqədər uşaqlar ilə

Tamamlandı:

İvanov A.V.,

034300 (49.03.01) istiqamətinin tələbəsi

Bədən Tərbiyəsi

profili "Sahəsində idarəetmə

bədən tərbiyəsi"

təhsil forması - qiyabi

(tam təhsil müddəti /

sürətləndirilmiş təlim proqramı)

1 (2) təhsil kursu, qrup 11(12)

Nəzarətçi:

fəlsəfə doktoru, dosent Sidorova T.V.

Arzamas

düyü. 1. Kurs işinin baş səhifəsinin nümunəsi

Buraxılış işlərində "məzmun" deyil, "mündəricat" sözü istifadə olunur. Mündəricat tək əsərin başlıqlarının (fəsillərinin) göstəricisidir, isə məzmun nəşrə daxil edilmiş müxtəlif əsərlərin adlarının göstəricisidir. Oxu mədəniyyəti nöqteyi-nəzərindən mündəricat əsərin əvvəlində yerləşdirilir: oxucu tədqiqatla tanışlığına mündəricatdan başlayır.

Mündəricat tərtib edilərkən, hər bir tabeliyində olan başlıq birbaşa istinad etdiyi başlığın baş hərfinin altında birinci rəqəmi qoyaraq, istinad etdiyi əvvəlki əsas başlığın sağında boşluq qoyulmalıdır. Eyni dərəcəli bütün başlıqlar eyni şaquli xəttdən başlamalıdır. Planın belə bir qurulması bütün materialın tabeçiliyini aydın görməyə imkan verir. Misal üçün:

Giriş. . . . . . . . . . . . . . . . . . . . . . . ... . . . ... . . . . . . . . . . . . . . . . . . . . . . . . . . .
Fiziki məşqlərə həvəsini artırmaq üçün şagirdlərin biliklərinin formalaşdırılması problemi. . . . ……………… . .
1. Müasir mərhələdə tələbələrin bədən tərbiyəsi. . . . .…………
1.11.1 20-90-cı illərdə tələbələr üçün fiziki məşqlərdə prioritetlərin dəyişdirilməsi. . . . . . . . ………..
1.1 1.2 Bədən tərbiyəsi sahəsində tələbələrin müasir təhsilinin istiqaməti. . . . . . . . …………
2. Tələbələrin fiziki məşqlərə motivasiyasının formalaşdırılması. . . . . . . . . . . . . . . . . . . . ………
2.12.2 Tələbələrin fiziki məşqlərə münasibəti.
Nəticə…………………………………………………………………. on dörd
Biblioqrafiya……………………………………………………………
Proqramlar

Mündəricatdakı abzasları eyni etmək və səhifə nömrələrini uyğunlaşdırmaq üçün parametrlərdə sətirləri görünməz şəkildə təyin edilmiş cədvəl formatından istifadə etmək məsləhətdir.

Yekun attestasiya işlərində mətnin rubrikasiyası böyük əhəmiyyət kəsb edir. Başlıqlar mətnin strukturunu açır, bölmə və yarımbölmələrin əlaqəsini və qarşılıqlı asılılığını göstərir.

Paraqrafların başlıqları onlara aid mətnin məzmununu dəqiq əks etdirməlidir. Onlar ehtiva etdikləri semantik məlumatların miqdarını azaltmamalı və genişləndirməməlidirlər.

Paraqrafların və yarımbəndlərin başlıqları ayrıca sətrin ortasında yerləşdirilir və birinci böyük hərf istisna olmaqla, qalın rum şriftində, kiçik hərflərlə çap olunur (şək. 2).

1.1. Duruş anlayışı

düyü. 2. Nümunə paraqraf başlığının dizaynı

Başlıq özündən sonrakı mətndən bir intervalla (bir çap edilə bilməyən simvol) və əvvəlki mətndən iki intervalla (bir-birinin altında duran iki çap edilə bilməyən simvol) ayrılır. Başlıq səhifədəki son sətir ola bilməz.

Abzas abzası "Format" ® "Abzas" ® "Girişlər və intervallar" ® "Birinci sətir" ® "Giriş" ® 1,25 sm (1,27 sm) seçimləri vasitəsilə təyin edilir. Klaviaturanın vuruşu abzas abzasını təyin etmir!

Vurğulananlar

Abzas daxilində məzmunun subordinasiyası, mətnin hissələrinin və elementlərinin əhəmiyyətinə görə sərhədlənməsi şriftin (fərqli doymada, hərflərin vuruşlarının meyli ilə, intervalda) vurğulanmaqla həyata keçirilir.

Elmi əsərlərdə şriftlərin tabeliyindən istifadə etmək adətdir (cədvəl 11).

Cütlənmiş Tələbənin t-testi cütləşdirilmiş (təkrarlanan) ölçmələrdəki fərqlərin statistik əhəmiyyətini müəyyən etmək üçün istifadə edilən Tələbə metodunun modifikasiyalarından biridir.

1. T-testinin inkişaf tarixi

t-testi hazırlanmışdır William Gosset Ginnesdə pivənin keyfiyyətini qiymətləndirmək. Kommersiya sirrini açıqlamamaq üzrə şirkət qarşısında öhdəlikləri ilə əlaqədar olaraq, Qossetin məqaləsi 1908-ci ildə “Biometrics” jurnalında “Student” (Student) təxəllüsü ilə dərc edilmişdir.

2. Qoşalaşmış Student t-testi nə üçün istifadə olunur?

Müqayisə üçün Paired Student's t-test istifadə olunur iki asılı (qoşalaşmış) nümunə. Eyni xəstələrdə, lakin müxtəlif vaxtlarda, məsələn, hipertansif xəstələrdə qan təzyiqi ölçülməsi asılıdır əvvəl və sonra antihipertenziv dərman qəbul etmək. Sıfır fərziyyə müqayisə edilən nümunələr arasında heç bir fərqin olmadığını, alternativ fərziyyə isə statistik cəhətdən əhəmiyyətli fərqlərin olduğunu bildirir.

3. Qoşalaşmış Student t-testi nə vaxt istifadə edilə bilər?

Əsas şərtdir nümunə asılılığı, yəni müqayisə edilən dəyərlər bir parametrin təkrar ölçmələri ilə əldə edilməlidir.

Müstəqil nümunələrin müqayisəsi vəziyyətində olduğu kimi, qoşalaşmış t-testini tətbiq etmək üçün ilkin məlumatların normal paylanma. Bu şərt yerinə yetirilmədikdə, nümunə vasitələrini müqayisə etmək üçün metodlardan istifadə edilməlidir. qeyri-parametrik statistika, məsələn G-test əlamətləriWilcoxon t-testi.

Qoşalaşmış t-testi yalnız müqayisə zamanı istifadə edilə bilər iki nümunələri. Əgər müqayisə etmək lazımdırsa üç və ya daha çox təkrar ölçmələr, istifadə təkrar ölçmələr üçün birtərəfli dispersiya təhlili.

4. Cütlənmiş Tələbənin t-testi necə hesablanır?

Qoşalaşmış Tələbənin t-testi aşağıdakı düsturla hesablanır:

harada M d - əvvəl və sonra ölçülən göstəricilər arasındakı fərqlərin arifmetik ortası; σd - göstəricilər arasındakı fərqlərin standart sapması; n - subyektlərin sayı.

5. Student t-testinin qiymətini necə şərh etmək olar?

Cütlənmiş Tələbənin t-testinin əldə edilmiş dəyərinin şərhi əlaqəsi olmayan populyasiyalar üçün t-testinin qiymətləndirilməsindən fərqlənmir. Hər şeydən əvvəl sərbəstlik dərəcələrinin sayını tapmaq lazımdır f aşağıdakı düstura görə:

f = n - 1

Bundan sonra, tələb olunan əhəmiyyət səviyyəsi üçün Student t-testinin kritik dəyərini təyin edirik (məsələn, p<0,05) и при данном числе степеней свободы f cədvələ görə ( aşağıya baxın).

Kriteriyanın kritik və hesablanmış dəyərlərini müqayisə edirik:

  • Əgər qoşalaşmış Tələbənin t-testinin hesablanmış dəyəri bərabər və ya daha çox kritik, cədvəldə tapılan, müqayisə edilən dəyərlər arasındakı fərqlərin statistik cəhətdən əhəmiyyətli olduğu qənaətinə gəlirik.
  • Cütlənmiş Tələbənin t-testinin hesablanmış dəyəri varsa daha kiçik cədvəldir, yəni müqayisə edilən dəyərlər arasındakı fərqlər statistik cəhətdən əhəmiyyətli deyil.

6. Tələbənin t-testinin hesablanması nümunəsi

Yeni hipoqlikemik agentin effektivliyini qiymətləndirmək üçün şəkərli diabetli xəstələrdə dərman qəbul etməzdən əvvəl və sonra qanda qlükoza səviyyəsi ölçüldü. Nəticədə aşağıdakı məlumatlar əldə edildi:

Qərar:

1. Hər bir dəyər cütünün fərqini hesablayın ( d):

Xəstə N Qanda qlükoza səviyyəsi, mmol/l Dəyər fərqi (d)
dərman qəbul etməzdən əvvəl dərman qəbul etdikdən sonra
1 9.6 5.7 3.9
2 8.1 5.4 2.7
3 8.8 6.4 2.4
4 7.9 5.5 2.4
5 9.2 5.3 3.9
6 8.0 5.2 2.8
7 8.4 5.1 3.3
8 10.1 6.9 3.2
9 7.8 7.5 2.3
10 8.1 5.0 3.1

2. Düsturdan istifadə edərək fərqlərin arifmetik ortasını tapın:

3. Düsturla orta qiymətdən fərqlərin standart kənarlaşmasını tapın:

4. Qoşalaşmış Tələbənin t-testini hesablayın:

5. Tələbənin t-testi 8.6-nın əldə edilmiş qiymətini sərbəstlik dərəcələrinin sayı ilə cədvəl dəyəri ilə müqayisə edək. f 10 - 1 = 9-a bərabərdir və əhəmiyyət səviyyəsi p=0,05 2,262-dir. Əldə edilən dəyər kritikdən böyük olduğundan, yeni dərman qəbul etməzdən əvvəl və sonra qan qlükoza səviyyələrində statistik əhəmiyyətli fərqlərin olduğu qənaətinə gəlirik.

Çox vaxt psixoloji tədqiqatlarda iki və ya daha çox əlamət qrupu arasındakı fərqləri müəyyən etmək üçün tapşırıqlar müşahidə edilir. Bu cür fərqlərin arifmetik vasitələr səviyyəsində aydınlaşdırılması ilkin statistikanın təhlilində nəzərə alınır. Bununla belə, sual yaranır ki, bu fərqlər nə dərəcədə etibarlıdır və onları bütün əhaliyə şamil etmək (ekstrapolyasiya etmək) mümkündür. Bu problemi həll etmək üçün onlar ən çox (normal və ya normal paylanma şərti ilə) t - meyardan (Tələbə meyarı) istifadə edirlər ki, bu da bir fənnin bir nümunəsinin göstəricilərinin digərindən nə dərəcədə əhəmiyyətli dərəcədə fərqləndiyini öyrənmək üçün hazırlanmışdır (üçün). Məsələn, subyektlər test nəticəsində bir qrup digərinin nümayəndələrindən daha yüksək bal aldıqda). Bu parametrik meyardır, iki əsas formaya malikdir:

1) əlaqəli olmayan (tək) t - fərqli insanlardan yaradılmış iki qrupu yoxlamaq üçün eyni testdən istifadə edərkən alınan ballar arasında fərqlərin olub olmadığını öyrənmək üçün nəzərdə tutulmuş meyar. Məsələn, bu, intellekt səviyyəsinin və ya nevropsik sabitliyin müqayisəsi, uğurlu və uğursuz tələbələrin narahatlığı və ya müxtəlif sinif, yaş, sosial səviyyə və s.-nin bu əsaslarla şagirdlərinin müqayisəsi ola bilər. Tədqiq olunan nümunələrdə müəyyən bir xüsusiyyətə görə seçilən heteroseksual, çoxmillətli nümunələr, həmçinin alt nümunələr ola bilər. Meyar “əlaqəsi olmayan” adlanır, çünki müqayisə edilən qruplar müxtəlif insanlardan formalaşır;

2) əlaqəli (qoşalaşmış) t - elementləri arasında xüsusi əlaqə olan iki qrupun göstəricilərini müqayisə etmək üçün istifadə olunan meyar. Bu o deməkdir ki, birinci qrupun hər bir elementi tədqiqatçını maraqlandıran müəyyən parametrdə ona bənzər ikinci qrupun elementinə uyğun gəlir. Çox vaxt eyni şəxslərin parametrləri müəyyən bir hadisədən və ya hərəkətdən əvvəl və sonra müqayisə edilir (məsələn, uzununa tədqiqat və ya formalaşma təcrübəsinin aparılması prosesində). Buna görə də, bu meyar eyni şəxslərin imtahandan, təcrübədən və ya müəyyən bir zaman keçməsindən əvvəl və sonra fəaliyyətini müqayisə etmək üçün istifadə olunur.

Məlumatlar normal şəkildə paylanmırsa, t-testinə ekvivalent qeyri-parametrik testlərdən istifadə edin: tək t-testinə ekvivalent olan Mann-Whitney testi və qoşalaşmış t-testinə ekvivalent olan Wilcoxon iki nümunəli test.

T-testlərinin və onların qeyri-parametrik ekvivalentlərinin köməyi ilə yalnız eyni testdən istifadə etməklə əldə edilən iki qrupun nəticələrini müqayisə etmək olar. Bununla belə, bəzi hallarda bir neçə qrupu və ya bir neçə növ qiymətləndirməni müqayisə etmək zərurəti yaranır. Bu, tapşırığı bir neçə cüt müqayisəyə bölmək yolu ilə mərhələlərlə həyata keçirilə bilər (məsələn, X və Y testlərinin nəticələrinə görə A, B və Y qruplarını müqayisə etmək lazımdırsa, sonra t meyarından istifadə edərək əvvəlcə qrupları müqayisə edin. X testinin nəticələrinə görə A və B, sonra C testinin nəticələrinə görə A və B, X testinin nəticələrinə görə A və C və s.). Lakin bu, çox vaxt aparan üsuldur, ona görə də dispersiya təhlili üçün daha mürəkkəb metoda müraciət edilir.

Kifayət qədər effektiv parametrik Tələbə testi ilə arifmetik vasitələrdəki fərqlərin etibarlılığının qiymətləndirilməsi metodu məlumatların işlənməsi zamanı ən çox müşahidə olunan problemlərdən birini həll etmək üçün nəzərdə tutulmuşdur - iki və ya daha çox dəyər seriyası arasındakı fərqlərin etibarlılığının müəyyən edilməsi. Qütb qruplarının müqayisəli təhlili zamanı belə qiymətləndirmə çox vaxt lazımdır. onlar tədqiq olunan hadisənin müəyyən hədəf xüsusiyyətinin (xarakterikliyinin) müxtəlif şiddəti əsasında fərqləndirilir. Bir qayda olaraq, təhlil seçilmiş qrupların ilkin statistik göstəricilərinin hesablanması ilə başlayır ", sonra fərqlərin əhəmiyyəti qiymətləndirilir. Tələbənin t-testi aşağıdakı düsturla hesablanır:

Üç etimad səviyyəsi (statistik) əhəmiyyəti (p) üçün Tələbə testinin dəyəri riyazi statistikaya dair arayış kitablarında verilmişdir. Sərbəstlik dərəcələrinin sayı düsturla müəyyən edilir:

Nümunə ölçülərinin azalması ilə (n<10) критерий Стьюдента становится чувствительным к форме распределения исследуемого признака в генеральной совокупности. Поэтому в сомнительных случаях рекомендуют использовать непараметрические методы или сравнивать полученные значения с критическими (табл. 2.17) для высшего уровня значимости.

Fərqlərin etibarlılığı haqqında qərar, t-nin hesablanmış dəyəri müəyyən sayda sərbəstlik dərəcəsi (d (v)) üçün cədvəl dəyərindən artıq olduqda qəbul edilir. Nəşrlərdə və ya elmi hesabatlarda üçünün ən yüksək əhəmiyyəti göstərilir: səh<0,05; р <0,01; р <0,001.

Vasitələr arasındakı fərqin əhəmiyyəti meyarının istənilən ədədi dəyəri üçün bu göstərici aşkar edilmiş fərqin dərəcəsini qiymətləndirmir (vasitələr arasındakı fərqlə qiymətləndirilir), ancaq onun statistik əhəmiyyəti, yəni bütövlükdə bütün fenomen (bütün proses) üçün fərq olduğu nümunələrin müqayisəsi əsasında əldə edilən nəticəni genişləndirmək hüququ. Aşağı hesablanmış fərq meyarı iki əlamət (hadisə) arasında fərqin olmamasının sübutu ola bilməz, çünki onun əhəmiyyəti (əhəmiyyəti) təkcə orta qiymətdən deyil, həm də müqayisə edilən nümunələrin sayından asılıdır. O, fərqin olmamasına deyil, belə bir seçmə ölçüsü ilə onun statistik cəhətdən etibarsız olmasına işarə edir: bu şərtlərdə fərqin təsadüfi olması şansı çox yüksəkdir və etibarlılıq ehtimalı çox azdır.

Cədvəl 2.17. f sərbəstlik dərəcələri üçün Tələbənin t-testi (t-test) üçün güvən məhdudiyyətləri

ikinci cəhddə tapşırığın orta tamamlanma müddəti (birinci sınaqla müqayisədə) əhəmiyyətli deyil.

Bu ifadə müqayisə edilən iki nümunənin statistik homojenliyi haqqında ifadəyə ekvivalent deyil. Bundan əlavə, belə qeyri-bərabər nümunələr halında Tələbə testinin tətbiqi riyazi cəhətdən tamamilə düzgün deyil və təbii ki, Xav = 9.1 və Xav = 8.5 fərqlərinin etibarsızlığı ilə bağlı yekun nəticəyə təsir göstərir. Bu meyardan istifadə edərək, onlar iki orta göstəricinin yaxınlıq dərəcəsini qiymətləndirmirlər, lakin təsadüfən (müəyyən bir əhəmiyyət səviyyəsində) tapşırığı və ya sein daşımağı nəzərdən keçirirlər. .

burada f kimi müəyyən edilən sərbəstlik dərəcəsidir

Misal . Tələbələrdən ibarət iki qrup iki müxtəlif üsula uyğun olaraq təlim keçdi. Təlimin sonunda onlara kurs boyu sınaq imtahanı verilib. Qazanılan biliklərdəki fərqlərin nə dərəcədə əhəmiyyətli olduğunu qiymətləndirmək lazımdır. Test nəticələri cədvəl 4-də təqdim olunur.

Cədvəl 4

Nümunə orta, dispersiya və standart kənarlaşmanı hesablayın:

t p = 0,45 düsturu ilə t p-nin dəyərini təyin edin

Cədvəl 1-ə əsasən (Əlavə bax) p = 0.01 əhəmiyyət səviyyəsi üçün kritik dəyəri t k tapırıq.

Nəticə: kriteriyanın hesablanmış dəyəri kritik dəyərdən 0,45 az olduğundan<2,88 гипотеза Но подтверждается и существенных различий в методиках обучения нет на уровне значимости 0,01.

Ölçmələrin asılı nümunələri üçün Student t-testinin hesablanması alqoritmi

1. Düsturdan istifadə edərək t-kriteriyasının hesablanmış qiymətini təyin edin

, harada

2. Sərbəstlik dərəcəsini hesablayın f

3. Əlavənin 1-ci cədvəlinə əsasən t-testinin kritik qiymətini təyin edin.

4. t-kriteriyasının hesablanmış və kritik qiymətlərini müqayisə edin. Hesablanmış qiymət kritik qiymətdən böyük və ya ona bərabərdirsə, onda iki dəyişiklik nümunəsində vasitələrin bərabərliyi fərziyyəsi rədd edilir (Amma). Bütün digər hallarda, verilən əhəmiyyət səviyyəsində qəbul edilir.

U- meyarManna- Whitney

Kriteriyanın məqsədi

Meyar kəmiyyətcə ölçülən hər hansı əlamətin səviyyəsi baxımından iki qeyri-parametrik nümunə arasındakı fərqləri qiymətləndirmək üçün nəzərdə tutulmuşdur. Bu, n olduqda kiçik nümunələr arasındakı fərqləri müəyyən etməyə imkan verir< 30.

Kriteriyanın təsviri

Bu üsul iki seriya arasında üst-üstə düşən dəyərlər sahəsinin kifayət qədər kiçik olub olmadığını müəyyən edir. Bu sahə nə qədər kiçik olsa, fərqlərin əhəmiyyətli olması ehtimalı bir o qədər yüksəkdir. U kriteriyasının empirik dəyəri cərgələr arasında təsadüf zonasının nə qədər böyük olduğunu əks etdirir. Buna görə də, U nə qədər kiçik olsa, fərqlərin əhəmiyyətli olması ehtimalı bir o qədər yüksəkdir.

Hipotezlər

AMMA: 2-ci qrupdakı xüsusiyyətin səviyyəsi 1-ci qrupdakı xüsusiyyətin səviyyəsindən aşağı deyil.

HI: 2-ci qrupdakı xüsusiyyətin səviyyəsi 1-ci qrupdakı xüsusiyyətin səviyyəsindən aşağıdır.

Mann-Whitney kriteriyasının hesablanması alqoritmi (u)

    Subyektlərin bütün məlumatlarını fərdi kartlara köçürün.

    1-ci nümunənin subyektlərinin kartlarını bir rənglə, deyək ki, qırmızı ilə və 2-ci nümunədəki bütün kartları başqa bir rənglə, məsələn, mavi ilə qeyd edin.

    Bütün kartları atributun böyümə dərəcəsinə görə, hansı nümunəyə aid olmasından asılı olmayaraq, bir böyük nümunə ilə işləyirik kimi bir sıra düzün.


burada n 1 1-ci nümunədəki subyektlərin sayıdır;

n 2 - 2-ci nümunədəki subyektlərin sayı,

T x - iki rand məbləğindən böyük olanı;

n x - rütbələrin daha böyük cəmi olan qrupdakı subyektlərin sayı.

9. Cədvəl 2-yə uyğun olaraq U-nun kritik dəyərlərini təyin edin (Əlavə bax).

Əgər U emp.> U kr0,05 olarsa, onda But hipotezi qəbul edilir. U emp ≤ U cr olarsa, o, rədd edilir. U dəyəri nə qədər kiçik olsa, fərqlərin etibarlılığı bir o qədər yüksəkdir.

Misal. İki qrupda iki tədris metodunun effektivliyini müqayisə edin. Test nəticələri cədvəl 5-də təqdim olunur.

Cədvəl 5

Gəlin bütün məlumatları başqa bir cədvələ köçürük, ikinci qrupun məlumatlarını altını xətt ilə vurğulayaq və ümumi nümunənin sıralamasını edək (3-cü tapşırıq üçün təlimatlarda sıralama alqoritminə baxın).

Dəyərlər

İki nümunənin dərəcələrinin cəmini tapın və onlardan ən böyüyünü seçin: T x = 113

Kriteriyanın empirik qiymətini 2-ci düstura görə hesablayaq: U p = 30.

Əlavənin 2-ci cədvəlindən kriteriyanın kritik qiymətini p = 0,05 əhəmiyyətlilik səviyyəsində müəyyən edək: U k = 19.

Nəticə: kriteriyanın hesablanmış dəyərindən bəriUəhəmiyyətlilik səviyyəsində kritik səviyyədən böyükdür p = 0,05 və 30 > 19, onda vasitələrin bərabərliyi fərziyyəsi qəbul edilir və tədris metodlarında fərqlər əhəmiyyətsiz olur..

Metod, müqayisə edildiyi iki ümumi populyasiyanın orta dəyərinin olduğu fərziyyəsini sınamağa imkan verir asılı nümunələri bir-birindən fərqlidir. Asılılıq fərziyyəsi çox vaxt əlamətin eyni nümunədə, məsələn, məruz qalmadan əvvəl və sonra iki dəfə ölçülməsi deməkdir. Ümumi halda, bir nümunənin hər bir nümayəndəsinə başqa bir nümunədən bir nümayəndə təyin edilir (onlar cüt-cüt birləşir) belə ki, iki məlumat seriyası bir-biri ilə müsbət korrelyasiya olsun. Nümunələrin daha zəif asılılıq növləri: nümunə 1 - ərlər, nümunə 2 - onların arvadları; nümunə 1 - bir yaşlı uşaqlar, nümunə 2 1-ci nümunədən olan uşaqların əkizlərindən ibarətdir və s.

Test edilə bilən statistik fərziyyə,əvvəlki vəziyyətdə olduğu kimi, H 0: M 1 = M 2(1 və 2-ci nümunələrdə orta qiymətlər bərabərdir). Rədd edildikdə, alternativ fərziyyə qəbul edilir ki, M 1 daha az) M 2.

İlkin fərziyyələr statistik yoxlama üçün:

□ bir seçmənin hər bir nümayəndəsinə (bir ümumi populyasiyadan) başqa bir seçmənin (digər ümumi populyasiyadan) nümayəndəsi təyin edilir;

□ iki nümunənin məlumatları müsbət korrelyasiyaya malikdir (qoşalaşmışdır);

□ hər iki nümunədə tədqiq olunan əlamətin paylanması normal qanuna uyğundur.

İlkin məlumat strukturu: hər bir obyekt üçün (hər bir cüt üçün) tədqiq olunan əlamətin iki dəyəri var.

Məhdudiyyətlər: hər iki nümunədə xüsusiyyətin paylanması normaldan əhəmiyyətli dərəcədə fərqlənməməlidir; bir və digər nümunəyə uyğun gələn iki ölçmənin məlumatları müsbət əlaqələndirilir.

Alternativlər: T-Wilcoxon testi, əgər ən azı bir nümunə üçün paylanma normaldan əhəmiyyətli dərəcədə fərqlənirsə; müstəqil nümunələr üçün t-tələbə testi - iki nümunə üçün məlumatlar müsbət korrelyasiya yoxdursa.

Düstur Tələbənin t-testinin empirik dəyəri üçün fərq təhlili vahidinin olması faktını əks etdirir fərq (növbə) hər bir müşahidə cütü üçün xüsusiyyət dəyərləri. Müvafiq olaraq, N cüt xüsusiyyət dəyərinin hər biri üçün əvvəlcə fərq hesablanır d i \u003d x 1 i - x 2 i.

(3) burada M d qiymətlərin orta fərqidir; σ d fərqlərin standart kənarlaşmasıdır.

Hesablama nümunəsi:

Tutaq ki, təlimin effektivliyinin yoxlanılması zamanı qrupun 8 üzvündən hər birinə “Fikirləriniz qrupun rəyi ilə nə qədər üst-üstə düşür?” sualı verilib. - iki dəfə, məşqdən əvvəl və sonra. Cavablar üçün 10 ballıq şkala istifadə edilmişdir: 1 - heç vaxt, 5 - yarım hallarda, 10 - həmişə. Təlim nəticəsində iştirakçıların öz-özünə uyğunluq qiymətləndirməsinin (qrupda başqaları kimi olmaq istəyi) artacağına dair fərziyyə yoxlanılıb (α = 0,05). Aralıq hesablamalar üçün cədvəl tərtib edək (cədvəl 3).

Cədvəl 3

M d = (-6)/8= -0,75 fərqinin arifmetik ortası. Bu dəyəri hər d-dən çıxarın (cədvəlin sondan əvvəlki sütunu).

Standart kənarlaşma düsturu yalnız X əvəzinə d görünməsi ilə fərqlənir. Bütün lazımi dəyərləri əvəz edirik, alırıq

σd = 0,886.

Addım 1. (3) düsturu ilə kriteriyanın empirik dəyərini hesablayın: orta fərq M d= -0,75; standart sapma σ d = 0,886; t e = 2,39; df = 7.

Addım 2. Tələbənin t-testinin kritik dəyərləri cədvəlindən p-əhəmiyyət səviyyəsini təyin edirik. df = 7 üçün empirik dəyər p = 0,05 və p - 0,01 üçün kritik olanlar arasındadır. Buna görə də, s< 0,05.

df R
0,05 0,01 0,001
2,365 3,499 5,408

Addım 3. Biz statistik qərar qəbul edirik və nəticəni formalaşdırırıq. Vasitələrin bərabər olması ilə bağlı statistik fərziyyə rədd edilir. Nəticə: təlimdən sonra iştirakçıların uyğunluğunun özünü qiymətləndirmə göstəricisi statistik cəhətdən əhəmiyyətli dərəcədə artmışdır (əhəmiyyət səviyyəsində səh< 0,05).

Parametrik üsullara daxildir kriteriya üzrə iki nümunənin dispersiyasının müqayisəsi F-Fischer. Bəzən bu üsul dəyərli mənalı nəticələrə gətirib çıxarır və müstəqil nümunələr üçün vasitələrin müqayisəsi zamanı dispersiyaların müqayisəsi aparılır. məcburi prosedur.

Hesablamaq üçün F emp iki nümunənin dispersiyalarının nisbətini tapmaq lazımdır ki, daha böyük dispersiya payda, kiçik məxrəcdə olsun.

Variasiyaların müqayisəsi. Metod müqayisə edilən nümunələrin çıxarıldığı iki ümumi populyasiyanın dispersiyalarının bir-birindən fərqli olması ilə bağlı fərziyyəni yoxlamağa imkan verir. Test edilmiş statistik fərziyyə H 0: σ 1 2 = σ 2 2 (1-ci nümunədəki dispersiya 2-ci nümunədəki dispersiyaya bərabərdir). Rədd edildikdə, bir variasiyanın digərindən böyük olduğuna dair alternativ bir fərziyyə qəbul edilir.

İlkin fərziyyələr: tədqiq olunan əlamətin normal paylanması ilə müxtəlif ümumi populyasiyalardan təsadüfi iki nümunə götürülür.

İlkin məlumat strukturu: tədqiq olunan əlamət hər biri müqayisə edilən iki nümunədən birinə aid olan obyektlərdə (subyektlərdə) ölçülür.

Məhdudiyyətlər: Hər iki nümunədə xüsusiyyətin paylanması normaldan əhəmiyyətli dərəcədə fərqlənmir.

Alternativ üsul: tətbiqi normallıq fərziyyəsinin yoxlanılmasını tələb etməyən Levene "sTest testi (SPSS proqramında istifadə olunur).

Düstur F-Fisher testinin empirik dəyəri üçün:

(4)

burada σ 1 2 - böyük dispersiya və σ 2 2 - daha kiçik dispersiya. Hansı dispersiyanın daha böyük olduğu əvvəlcədən bilinmədiyi üçün p-səviyyəsini təyin etmək üçün, İstiqamətsiz alternativlər üçün kritik dəyərlər cədvəli.Əgər a F e > F Kp sərbəstlik dərəcələrinin müvafiq sayı üçün, onda R < 0,05 и статистическую гипотезу о равенстве дисперсий можно отклонить (для α = 0,05).

Hesablama nümunəsi:

Uşaqlara adi arifmetik tapşırıqlar verildi, bundan sonra tələbələrin təsadüfi seçilmiş yarısına testdən keçmədikləri, qalanlarına isə əksinə bildirildi. Sonra hər bir uşaqdan oxşar problemi həll etmək üçün ona neçə saniyə lazım olduğu soruşuldu. Təcrübəçi uşağın çağırdığı vaxt ilə tamamlanan tapşırığın nəticəsi (saniyələr) arasındakı fərqi hesabladı. Hesabatda uğursuzluğun uşağın özünə inamında müəyyən qeyri-adekvatlığa səbəb olacağı gözlənilirdi. Sınaq edilmiş fərziyyə (α = 0,005 səviyyəsində) özünüqiymətləndirmələrin populyasiyasının dispersiyasının müvəffəqiyyət və ya uğursuzluq hesabatlarından asılı olmaması idi (Н 0: σ 1 2=σ 2 2).

Aşağıdakı məlumatlar alındı:


Addım 1. Düsturlardan (4) istifadə edərək kriteriyanın empirik dəyərini və sərbəstlik dərəcələrinin sayını hesablayın:

Addım 2. f-Fisher meyarının kritik dəyərlər cədvəlinə uyğun olaraq istiqamətsiz alternativlər üçün kritik dəyər tapırıq df nömrəsi = 11; df işarəsi= 11. Bununla belə, yalnız üçün kritik dəyər var df nömrəsi= 10 və df işarəsi = 12. Daha çox sayda sərbəstlik dərəcəsi alına bilməz, ona görə də biz kritik qiyməti alırıq df nömrəsi= 10: Üçün R = 0,05 F Kp = 3.526; üçün R = 0,01 F Kp = 5,418.

Addım 3. Statistik qərar və mənalı nəticənin qəbul edilməsi. Empirik dəyər kritik dəyəri keçdiyi üçün R= 0,01 (və daha çox üçün p = 0.05), onda bu halda s< 0,01 и принимается альтернативная гипо­теза: дисперсия в группе 1 превышает дисперсию в группе 2 (R< 0,01). Nəticə etibarı ilə, uğursuzluğu bildirdikdən sonra, özünə hörmətin qeyri-adekvatlığı müvəffəqiyyəti bildirdikdən sonra daha yüksəkdir.

/ təcrübə statistikası / istinad materialları / tələbə t-testi dəyərləri

Mənat - 0.10, 0.05 və 0.01 əhəmiyyətlilik səviyyəsində tələbə testi

ν – dəyişmə azadlığı dərəcələri

Tələbənin t-testinin standart dəyərləri

Sərbəstlik dərəcələrinin sayı

Əhəmiyyət səviyyələri

Sərbəstlik dərəcələrinin sayı

Əhəmiyyət səviyyələri

Cədvəl XI

Fisher testinin standart dəyərləri iki nümunə arasındakı fərqlərin əhəmiyyətini qiymətləndirmək üçün istifadə olunur

Azadlıq dərəcələri

Əhəmiyyət səviyyəsi

Azadlıq dərəcələri

Əhəmiyyət səviyyəsi

Tələbənin t-testi

Tələbənin t-testi- Tələbə paylanmasına əsaslanan fərziyyələrin (statistik testlərin) statistik yoxlanılması üçün metodlar sinfinin ümumi adı. T-testinin tətbiqi ilə bağlı ən çox rast gəlinən hallar iki nümunədə vasitələrin bərabərliyinin yoxlanılması ilə bağlıdır.

t-statistika adətən aşağıdakı ümumi prinsipə əsasən qurulur: pay riyazi gözləntiləri sıfır olan təsadüfi kəmiyyətdir (null fərziyyə yerinə yetirildikdə), məxrəc isə bu təsadüfi kəmənin kvadrat kökü kimi alınan nümunə standart sapmasıdır. qarışıq olmayan dispersiya təxmini.

Hekayə

Bu meyar Ginnesdə pivənin keyfiyyətini qiymətləndirmək üçün William Gosset tərəfindən hazırlanmışdır. Kommersiya sirrinin açıqlanmaması ilə bağlı şirkət qarşısında öhdəlikləri ilə əlaqədar olaraq (Ginnesin rəhbərliyi öz işlərində statistik aparatın belə istifadəsini hesab edirdi) Qossetin məqaləsi 1908-ci ildə “Tələbə” (Tələbə) təxəllüsü ilə “Biometrics” jurnalında dərc edilmişdir. .

Məlumat Tələbləri

Bu meyarı tətbiq etmək üçün ilkin məlumatların normal paylanması lazımdır. Müstəqil nümunələr üçün iki nümunəli testin tətbiqi vəziyyətində, həmçinin dispersiyaların bərabərliyi şərtinə riayət etmək lazımdır. Bununla belə, qeyri-bərabər dispersiyaları olan vəziyyətlər üçün Student t-testinə alternativlər var.

Məlumatların paylanmasının normal olması tələbi dəqiq t (\displaystyle t) -testi üçün lazımdır. Bununla belə, digər məlumat paylamaları ilə belə, t (\displaystyle t) -statistikasından istifadə etmək mümkündür. Bir çox hallarda bu statistikalar asimptotik olaraq standart normal paylanmaya malikdir - N (0 , 1) (\displaystyle N(0,1)) , ona görə də bu paylanmanın kvantillərindən istifadə etmək olar. Lakin, çox vaxt hətta bu halda, kvantillər standart normal paylanmadan deyil, dəqiq t (\displaystyle t) -testində olduğu kimi müvafiq Student paylanmasından istifadə olunur. Onlar asimptotik ekvivalentdir, lakin kiçik nümunələrdə Tələbə paylanmasının etibarlılıq intervalları daha geniş və etibarlıdır.

Bir nümunəli t-testi

O, sıfır hipotezini yoxlamaq üçün istifadə olunur H 0: E (X) = m (\displaystyle H_(0):E(X)=m) gözləntinin bərabərliyi haqqında E (X) (\displaystyle E(X)) bəzi məlum dəyərə m ( \displaystyle m) .

Aydındır ki, sıfır hipotezi altında E (X ¯) = m (\displaystyle E((\overline (X)))=m) . Müşahidələrin fərz edilən müstəqilliyini nəzərə alaraq, V (X ¯) = σ 2 / n (\displaystyle V((\overline (X)))=\sigma ^(2)/n) . Qərəzsiz dispersiya qiymətləndirməsindən istifadə etməklə s X 2 = ∑ t = 1 n (X t − X ¯) 2 / (n − 1) (\displaystyle s_(X)^(2)=\sum _(t=1)^( n )(X_(t)-(\overline (X)))^(2)/(n-1)) aşağıdakı t-statistikasını alırıq:

t = X ¯ − m s X / n (\displaystyle t=(\frac ((\overline (X))-m)(s_(X)/(\sqrt (n)))))

Sıfır fərziyyəyə əsasən, bu statistikanın paylanması t (n − 1) (\displaystyle t(n-1)) təşkil edir. Buna görə də, əgər statistik göstəricilərin mütləq dəyərdə dəyəri bu paylanmanın kritik qiymətindən artıq olarsa (verilmiş əhəmiyyət səviyyəsində), sıfır hipotezi rədd edilir.

Müstəqil nümunələr üçün iki nümunəli t-testi

Normal paylanmış təsadüfi dəyişənlərin n 1 , n 2 (\displaystyle n_(1)~,~n_(2)) ölçülü iki müstəqil nümunəsi olsun X 1 , X 2 (\displaystyle X_(1),~X_(2) )) . Nümunə məlumatlarından istifadə etməklə bu təsadüfi dəyişənlərin riyazi gözləntilərinin bərabərliyinin sıfır hipotezini H 0: M 1 = M 2 (\displaystyle H_(0):~M_(1)=M_(2)) yoxlamaq lazımdır.

Nümunə vasitələrinin fərqini nəzərə alın Δ = X ¯ 1 − X ¯ 2 (\displaystyle \Delta =(\overline (X))_(1)-(\overline (X))_(2)) . Aydındır ki, sıfır fərziyyə təmin olunarsa E (Δ) = M 1 − M 2 = 0 (\displaystyle E(\Delta)=M_(1)-M_(2)=0) . Bu fərqin dispersiyası nümunələrin müstəqilliyinə əsaslanır: V (Δ) = σ 1 2 n 1 + σ 2 2 n 2 (\displaystyle V(\Delta)=(\frac (\sigma _(1)) ^(2))( n_(1)))+(\frac (\sigma _(2)^(2))(n_(2)))) . Sonra qərəzsiz dispersiya qiymətləndirməsindən istifadə etməklə s 2 = ∑ t = 1 n (X t − X ¯) 2 n − 1 (\displaystyle s^(2)=(\frac (\sum _(t=1)^(n)) ( X_(t)-(\overline (X)))^(2))(n-1))) seçmə vasitələri arasındakı fərqin qərəzsiz qiymətləndirilməsini alırıq: s Δ 2 = s 1 2 n 1 + s 2 2 n 2 (\ displaystyle s_(\Delta )^(2)=(\frac (s_(1)^(2))(n_(1))))+(\frac (s_(2)^ (2))(n_(2) ))) . Beləliklə, sıfır fərziyyəni yoxlamaq üçün t-statistika belədir

T = X ¯ 1 − X ¯ 2 s 1 2 n 1 + s 2 2 n 2 (\displaystyle t=(\frac ((\overline (X))_(1)-(\overline (X))_() 2))(\sqrt ((\frac (s_(1)^(2))(n_(1)))+(\frac (s_(2)^(2))(n_(2))))) ))

Bu statistik, sıfır fərziyyə altında, paylanmaya malikdir t (d f) (\displaystyle t(df)) , burada d f = (s 1 2 / n 1 + s 2 2 / n 2) 2 (s 1 2 / n 1) ) 2 / (n 1 − 1) + (s 2 2 / n 2) 2 / (n 2 − 1) (\displaystyle df=(\frac ((s_(1)^(2)/n_(1)+) s_(2 )^(2)/n_(2))^(2))((s_(1)^(2)/n_(1))^(2)/(n_(1)-1)+( s_(2 )^(2)/n_(2))^(2)/(n_(2)-1))))

Eyni fərqlilik halı

Nümunə fərqlərinin eyni olduğu qəbul edilirsə, o zaman

V (Δ) = σ 2 (1 n 1 + 1 n 2) (\displaystyle V(\Delta)=\sigma ^(2)\left((\frac (1)(n_(1))))+(\ frac (1)(n_(2)))\sağ))

Sonra t-statistika belədir:

T = X ¯ 1 − X ¯ 2 s X 1 n 1 + 1 n 2 , s X = (n 1 − 1) s 1 2 + (n 2 − 1) s 2 2 n 1 + n 2 − 2 (\ displaystyle t=(\frac ((\overline (X))_(1)-(\overline (X))_(2))(s_(X)(\sqrt ((\frac (1)(n_(1) )))+(\frac (1)(n_(2)))))))~,~~s_(X)=(\sqrt (\frac ((n_(1)-1)s_(1)^ (2)+(n_(2)-1)s_(2)^(2))(n_(1)+n_(2)-2))))

Bu statistikanın paylanması t (n 1 + n 2 − 2) (\displaystyle t(n_(1)+n_(2)-2))

Asılı nümunələr üçün iki nümunəli t-testi

İki asılı nümunə (məsələn, vaxt intervalı ilə eyni testin iki nümunəsi) arasındakı fərqlər haqqında fərziyyənin yoxlanılması vəziyyətində t (\displaystyle t) -meyarının empirik dəyərini hesablamaq üçün aşağıdakı düsturdan istifadə olunur. :

T = M d s d / n (\displaystyle t=(\frac (M_(d))(s_(d)/(\sqrt (n)))))

burada M d (\displaystyle M_(d)) dəyərlərin orta fərqidir, s d (\displaystyle s_(d)) fərqlərin standart kənarlaşması, n isə müşahidələrin sayıdır.

Bu statistik t (n − 1) (\displaystyle t(n-1)) paylanmasına malikdir.

Xətti Reqressiya Parametrləri üzrə Xətti Məhdudiyyətin Test Edilməsi

t-testi həmçinin adi ən kiçik kvadratlarla təxmin edilən xətti reqressiyanın parametrləri üzrə ixtiyari (tək) xətti məhdudiyyəti sınaqdan keçirə bilər. H 0 hipotezini yoxlamaq lazım gəlsin: c T b = a (\displaystyle H_(0):c^(T)b=a) . Aydındır ki, sıfır hipotezi altında E (c T b ^ − a) = c T E (b ^) − a = 0 (\displaystyle E(c^(T)(\hat (b))-a)=c^( T)E((\şapka (b)))-a=0) . Burada biz E (b ^) = b (\displaystyle E((\hat (b)))=b) model parametrlərinin qərəzsiz ən kiçik kvadratlar təxminləri xassəsindən istifadə edirik. Bundan əlavə, V (c T b ^ − a) = c T V (b ^) c = σ 2 c T (X T X) − 1 c (\displaystyle V(c^(T)(\şapka (b))-a )=c^(T)V((\hat (b)))c=\sigma ^(2)c^(T)(X^(T)X)^(-1)c) . Naməlum dispersiya əvəzinə onun qərəzsiz qiymətləndirməsindən istifadə edərək s 2 = E S S / (n − k) (\displaystyle s^(2)=ESS/(n-k)) aşağıdakı t-statistikasını əldə edirik:

T = c T b ^ − a s c T (X T X) − 1 c (\displaystyle t=(\frac (c^(T)(\şapka (b))-a)(s(\sqrt (c^(T)) (X^(T)X)^(-1)c)))))

Bu statistik, sıfır fərziyyə altında, t (n − k) (\displaystyle t(n-k)) paylanmasına malikdir, ona görə də əgər statistik qiymət kritik dəyərdən böyükdürsə, onda xətti məhdudiyyətin sıfır hipotezi belədir. rədd edildi.

Xətti reqressiya əmsalı haqqında fərziyyələrin yoxlanması

Xətti məhdudiyyətin xüsusi halı reqressiya əmsalının b j (\displaystyle b_(j)) a (\displaystyle a) bəzi qiymətinə bərabər olması fərziyyəsini yoxlamaqdır. Bu halda müvafiq t-statistika belədir:

T = b ^ j − a s b ^ j (\displaystyle t=(\frac ((\papaq (b))_(j)-a)(s_((\papaq (b))_(j)))))

burada s b ^ j (\displaystyle s_((\hat (b))_(j))) əmsalın qiymətləndirilməsinin standart xətasıdır - əmsal təxminlərinin kovariasiya matrisinin müvafiq diaqonal elementinin kvadrat kökü.

Sıfır fərziyyəyə əsasən, bu statistikanın paylanması t (n − k) (\displaystyle t(n-k)) təşkil edir. Statistikanın mütləq qiyməti kritik qiymətdən yüksəkdirsə, əmsalın a (\displaystyle a) fərqi statistik əhəmiyyətlidir (təsadüfi deyil), əks halda əhəmiyyətsizdir (təsadüfi, yəni həqiqi əmsal ehtimal ki, gözlənilən dəyərə bərabər və ya çox yaxındır (\ ekran tərzi a))

Şərh

Riyazi gözləntilər üçün bir nümunə testi xətti reqressiya parametrləri üzrə xətti məhdudiyyətin sınaqdan keçirilməsinə endirilə bilər. Bir nümunəli testdə bu, sabit bir "reqressiya"dır. Buna görə də, reqressiyanın s 2 (\displaystyle s^(2)) tədqiq olunan təsadüfi dəyişənin dispersiyasının nümunə qiymətləndirilməsidir, X T X (\displaystyle X^(T)X) matrisi n-ə bərabərdir (\displaystyle s^(2)) n) , və modelin “əmsalının” qiymətləndirilməsi seçmə ortadır. Buradan ümumi hal üçün yuxarıda verilmiş t-statistikasının ifadəsini alırıq.

Eynilə, eyni nümunə fərqləri ilə iki nümunəli testin xətti məhdudiyyətlərin sınaqdan keçirilməsinə də azaldığını göstərmək olar. İki nümunəli testdə bu, dəyərdən (0 və ya 1) asılı olaraq alt nümunəni müəyyən edən sabit və dummy dəyişən üzrə "reqressiya"dır: y = a + b D (\displaystyle y=a+bD) . Nümunələrin riyazi gözləntilərinin bərabərliyi haqqında fərziyyə bu modelin b əmsalının sıfıra bərabərliyi haqqında fərziyyə kimi formalaşdırıla bilər. Göstərilə bilər ki, bu fərziyyəni yoxlamaq üçün müvafiq t-statistika iki nümunəli test üçün verilmiş t-statistikaya bərabərdir.

O, həmçinin müxtəlif fərqlər halında xətti məhdudiyyəti yoxlamaq üçün azaldıla bilər. Bu halda model xətalarının dispersiyası iki qiymət alır. Bundan, iki nümunəli test üçün verilənə oxşar t-statistikasını da əldə etmək olar.

Parametrik olmayan analoqlar

Müstəqil nümunələr üçün iki nümunəli testin analoqu Mann-Whitney U-testidir. Asılı nümunələrlə vəziyyət üçün analoqlar işarə testi və Wilcoxon T-testidir

Ədəbiyyat

tələbə. Ortalamanın ehtimal olunan səhvi. // Biometrika. 1908. № 6 (1). S. 1-25.

Bağlantılar

Novosibirsk Dövlət Texniki Universitetinin saytında vasitələrin homojenliyi ilə bağlı fərziyyələrin sınaqdan keçirilməsi meyarları haqqında