Öğrencinin T kriteri çevrimiçi otomatik hesaplama. Farklılıkların öneminin Öğrenci t testi kullanılarak belirlenmesi

Çoğu durumda, iki ortalama değeri karşılaştırmak için bağımsız örnekler(s. 91) Öğrenci t testini uygulayın. Öğrenci testi parametrik olduğundan kullanımı ancak çalışmanın sonuçlarının aşağıdakilere göre ölçümler şeklinde sunulması durumunda mümkündür. ilişki ölçeği(s. 90).

Öğrencinin t testi belirtilir T ve aşağıdaki formülle hesaplanır*:

T = x1 – x2 / √ m1² + m2²

Gözlem sayısının (n) 500'den fazla olduğu durumlarda p = 0,05'teki anlamlılık düzeyine t = 1,96'da, p = 0,01 veya p = 0,001'deki anlamlılık düzeylerine t = 2,59'da ulaşılır ve t = 3,29.

Gözlem sayısının 500'den az olması durumunda çeşitli anlamlılık düzeyleri için gerekli t değeri Tablo 10'dan belirlenir.

Tabloya dönmeden önce sayıyı belirlemeniz gerekir. özgürlük derecesi. Bu terim, belirli bir parametrenin (f) oluşumunda yer alan bağımsız büyüklüklerin sayısını ifade eder. Serbestlik derecelerini belirlemeye yönelik kurallar, matematiksel istatistik üzerine çeşitli kılavuzlarda sunulmaktadır (Yu.K. Demyanenko, 1968). Öğrenci t testi hesaplanırken toplam serbestlik derecesi sayısı (f) n1'e eşit olacaktır. + n2 - 2.

Örneğin, deney ve kontrol grubu kayakçılarının kontrol mesafesini tamamlama konusunda gösterdiği sonuçları karşılaştırırken şu veriler elde edildi: Deney grubundaki (n = 12 kişi) ortalama gösterge x = 34,6 saniyeydi, ortalama değerin hatası m = 0,47 saniyeydi; kontrol grubunda (n=14 kişi) bu veriler sırasıyla x=37,3 saniye, m=0,49 saniye idi.

Değerleri formülde yerine koyarak t değerini elde ederiz.

t = 37,3 - 34,6 / √ V 0,49 2 + 0,47 2 = 2,7 / 0,68 = 3,97

Serbestlik derecesi sayısını (f = 12 + 14 - 2 = 24) belirledikten sonra tablodan t değerini buluyoruz. Ortaya çıkan 3,97 değeri %99 güven düzeyi için tablo değerini aşıyor. Bu, karşılaştırılan iki grubun sonuçları arasında p anlamlılık düzeyinde anlamlı farklılıklar olduğunu iddia edebileceğimiz anlamına gelir.< 0,01.



Göreceli olarak çok sayıda ölçümle, aritmetik ortalamalar arasındaki farkın hataların üçüne eşit veya daha fazla olması durumunda farkların güvenilir olduğu geleneksel olarak kabul edilir. Bu durumda farkların güvenilirliği aşağıdaki denklemle belirlenir:

Х E -Х К >3√ me + mк ²

Yukarıdaki örnekte farklı gruplarda yer alan kişilerin sonuçları karşılaştırıldı; yani bağımsız örnekler. Aynı grupta deneyin başında ve sonunda elde edilen sonuçların karşılaştırılması durumunda, yani bağımlı örnekler, Her zamanki formülü kullanarak Öğrencinin testini hesaplayın yasaktır . Bu durumda Öğrencinin kriteri aşağıdaki formül kullanılarak hesaplanmalıdır:

t = X 1 -X 2 / m1 ² + m2 ² - 2rm1 m2

Nerede R - incelenen karakteristik için başlangıç ​​ve nihai sonuçlar arasındaki korelasyon katsayısı.

Tablo 10

Sınır değerleri T (Öğrencinin t testi)

F Güven düzeyleri (P)
95% . 99% 99,9%
12,71 63.60
4.30 9.93 31.60
3.18 5.84 12.94
2.78 4.60 8.61
2.57 4.03 6.86
2.45 3.71 5.96
2.37 3.50 5.41
2.31 3.36 5,04
2.26 3.25 4.78
2.23 3.17 4.59
P 2.20 3.11 4.44
2.18 3.06 4.32
1.16 3.01 4.22
2.15 2,98 4,14
2.13 2.95 4.07
2.12 2,92 4.02
2.11 2.90 3.97
2.10 2.88 3.92
2.09 2.86 3.88
2.09 2.85 3.85
2.08 2,83 3.82
2.07 2.82 3.79
2.07 2.81 3,77
2.06 2.80 3.75
2,06 2.79 3.73
2.06 2.78 3.71
2.05 2.77 3.69
2.05 2.76 3.67
2.04 2.76 3.66
2.04 2,75 " 3.65
2.02 2,70 3.55
2.01 2.68 3,50
2.00 2.66 3.46
1.99 2.64 3.42
1.98 2.63 3.39
1.98 2,62 3.37
1.97 2.60 3.34
1.96 2,59 3.31
ah 1.96 2.59 3.29
Anlamlılık seviyeleri (p)
0,05 0,01 0,001

Sonuçların formülasyonu

(çözüm)

Çalışmanın sonunda sonuçlar çıkarılır. Sonuçların formüle edilmesi, girişin formüle edilmesiyle birlikte, herhangi bir ders çalışmasının hazırlanmasındaki en zor ve önemli aşamalardan biridir.

Sonuçlar çalışmanın en önemli sonuçlarını yansıtmalıdır.

Sonuç çıkarırken birkaç yaygın hata vardır. Çoğu zaman bir öğrenci, yaptığı çalışmanın sonuçlarının ("çalışılan", "geliştirilen" vb.) bir beyanı gibi görünecek şekilde bir teklif oluşturur. Örneğin:

“Çalışma sırasında deneysel metodolojinin ana hükümleri belirlendi…” veya “Okul çocukları ile beden eğitimi ve sağlık çalışmalarının uygulanmasında pedagojik uzmanlık öğrencilerinin iletişim becerilerini değerlendirmeye izin veren göstergeler belirlendi... ”.

Yukarıdakilerin sonuç olabilmesi için, ifadelerin şu şekilde yapılandırılması gerekir: “Formüle ettiğimiz deneysel metodolojinin hükümleri izin veriyor…” ve buna göre: “Seçilen göstergelerden en bilgilendirici olanı bize izin veriyor” Öğrencilerin iletişim becerilerinin düzeyini değerlendirmek pedagojik uzmanlıklar,...”

Bir diğer yaygın hata, öğrencinin sonuç kısmında, özel bir araştırma gerektirmeyen bariz bir şeyi belirtmesidir. Örneğin:

"Okul çocukları ile yapılan fiziksel egzersiz derslerinde bu yaştaki bir gencin gelişimsel özelliklerinin dikkate alınması gerekir."

Bazen sonucun tamamen anlamsız olduğu ortaya çıkıyor. Bu genellikle bir öğrencinin literatür analizine dayanarak vardığı ilk sonuçtur. Örneğin:

"Bilimsel ve metodolojik literatürün analizi, beden eğitimi teorisinde, yüzücülerin spor eğitiminde simülatörlerin kullanılması konusunun henüz tam olarak ele alınmadığını göstermiştir."

Sonuçlar öğrencinin yaptığı çalışmayı bilgilendirici bir şekilde yansıtmalı ancak ayrıntılı olmamalıdır.


KAYIT İÇİN ŞARTLAR

DERS ÇALIŞMALARI

Nihai eleme çalışması aşağıdaki yapısal bileşenleri içermelidir:

· Giriş sayfası;

· giriiş;

· ana yazı(Bölüm 1, Bölüm 2);

· sonuçlar (sonuç);

· kaynakça;

· uygulamalar(eğer bunlara ihtiyaç varsa).

Optimum ders hacmi, 1'den sonra 40-50 sayfalık daktilo edilmiş metindir. ,5 aralık (şekiller, tablolar, grafikler, kaynakça ve ekler dahil).

Yazı tipi boyutu 14 Times New Roman.

Çalışma bilgisayar veya el yazısıyla hazırlanır (ikinci seçenek daha az tercih edilir).

Bilgisayar versiyonunda eserin metni standart bir A4 kağıdın (210x297 mm) bir yüzüne bir buçuk aralıklarla basılmaktadır. Çalışma sayfasının kenar boşlukları şu boyutlarda olmalıdır: sol - 30 mm, sağ - 10 mm, üst - 20 mm, alt - 25 mm.

Tablolar, resimler, çizimler, diyagramlar, grafikler standart A4 sayfalara (210x297 mm) yapılmalıdır. İmzalar ve açıklamalar ön tarafta yer almalıdır.

Nihai sertifika çalışmalarının tüm sayfaları, resimler ve ekler de dahil olmak üzere, başlık sayfasından son sayfaya kadar herhangi bir eksiklik veya tekrar olmadan numaralandırılır. İlk sayfa başlık sayfası sayılır, üzerine “1” rakamı konulmaz, sonraki sayfaya “2” rakamı konulur vb. Seri numarası sayfanın alt kenar boşluğunun ortasına yerleştirilir.

Nihai belgelendirme çalışmalarının tüm materyalleri içindekiler tablosuna (plan) uygun olarak paragraflara bölünmüştür. Paragraf adları içeriğe uygun olmalı ve alt çizgi olmadan küçük harflerle başlık olarak basılmalıdır.

Eserde “vb.”, “vb.”, “vb.” vb. gibi genel kabul görmüş standart kısaltmalar kabul edilmektedir. "vb.", "bakın", "sayfa."

Tablo ve illüstrasyonlardan oluşan örnek bir tasarım Ek 3'te verilmiştir.

Baş sayfa

Başlık sayfası eserle ilgili bilgilerdir. İşin yapıldığı kurumun adını belirtir; yazarın soyadı, adı, soyadı; İsim; bilimsel danışmanın (danışman) soyadı, adı, soyadı, akademik derecesi ve akademik unvanı; şehir, yıl Nihai sertifikasyon çalışmalarının başlık sayfası Şekil 1'de gösterilmektedir.

Federal Eyalet Özerk Eğitim Kurumu

Yüksek öğretim

"Nizhny Novgorod Devlet Üniversitesi adını almıştır. N.I. Lobaçevski"

Arzamas şubesi

Doğal Coğrafya Fakültesi

Beden Eğitimi Bölümü

Disiplin alanında ders çalışması

“Fiziksel kültürün teorisi ve metodolojisi”

konuyla ilgili:

"Beden eğitimi ve sağlık derslerinin metodolojik özellikleri

okul öncesi çocuklarla"

Tamamlanmış:

Ivanov A.V.,

öğrenci yönlendirmesi 034300 (49.03.01)

Fiziksel Kültür

profil "Sahada yönetim

fiziksel Kültür"

eğitim şekli - yazışma

(tüm eğitim dönemi /

hızlandırılmış eğitim programı)

1 (2) çalışma kursu, grup 11(12)

Bilim danışmanı:

Doktora, Doçent Sidorova T.V.

Arzamalar

Pirinç. 1. Dönem ödevinin örnek başlık sayfası

Nihai sertifikasyon evraklarında “içindekiler” değil, “içindekiler” kelimesi kullanılmaktadır. İçindekiler tek bir eserin başlıklarının (bölümlerinin) indeksidir; içerik yayında yer alan çeşitli eserlerin başlıklarının bir indeksidir. Okuma kültürü açısından içindekiler kısmı eserin başına yerleştirilmiştir: okuyucu, içindekiler kısmından çalışmayı tanımaya başlar.

İçindekiler tablosu hazırlanırken her alt başlık, ilgili olduğu önceki ana başlığın sağına doğru yazılmalı ve ilk rakam doğrudan ilgili olduğu başlığın büyük harfinin altına yerleştirilmelidir. Eşit seviyedeki tüm başlıklar aynı dikey çizgiden başlamalıdır. Böyle bir plan, tüm malzemenin tabiiyetini açıkça görmenizi sağlar. Örneğin:

Giriiş. . . . . . . . . . . . . . . . . . . . . . . .. . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Fiziksel egzersiz yapma motivasyonlarını artırmak için öğrenciler arasında bilgi geliştirme sorunu. . . . ………….. . . .
1. Şu andaki öğrencilerin fiziksel kültürü. . . . .......
1.11.1 20-90'lı yıllarda öğrencilerin fiziksel egzersizlerinde değişen öncelikler. . . . . . . . ………..
1.1 1.2 Öğrencilerin fiziksel kültür alanında modern eğitiminin yönü. . . . . . . . …………
2. Öğrencilerin fiziksel egzersizlere katılma motivasyonunun oluşturulması. . . . . . . . . . . . . . . . . . . . ………
2.12.2 Öğrencilerin fiziksel egzersizlere yönelik tutumları.
Çözüm…………………………………………………………………… . 14
Kaynakça……………………………………………………………
Uygulamalar

İçindekiler tablosundaki girintileri aynı yapmak ve sayfa numaralarını hizalamak için satırları parametrelerde görünmez olacak şekilde ayarlanmış bir tablo formatının kullanılması tavsiye edilir.

Nihai tasdik çalışmalarında metnin rubrikasyonu büyük önem taşımaktadır. Rubrikler metnin yapısını ortaya koyar, bölümlerin ve alt bölümlerin bağlantısını ve birbirine bağlılığını gösterir.

Paragraf başlıkları, ilgili metnin içeriğini doğru bir şekilde yansıtmalıdır. İçlerinde bulunan anlamsal bilgi miktarını azaltmamalı veya genişletmemelidirler.

Paragraf ve alt paragrafların başlıkları ayrı bir satırın ortasında bulunur ve ilk büyük harfler hariç, kalın, düz yazı tipiyle, küçük harflerle yazdırılır (Şekil 2).

1.1. Duruş kavramı

Pirinç. 2. Paragraf başlığı örneği

Başlık, kendisini takip eden metinden bir boşlukla (basılmayan bir karakter) ve önceki metinden iki boşlukla (birbirinin altında iki yazdırılmayan karakter) ayrılır. Başlık sayfanın son satırı olamaz.

Paragraf girintisi “Biçim” ® “Paragraf” ® “Girintiler ve Aralıklar” ® “İlk Satır” ® “Girinti” ® 1,25 cm (1,27 cm) seçenekleriyle ayarlanır. Paragraf girintisi bir tuşa basılarak ayarlanamaz!

Yazı tipi vurguları

Bir paragraf içindeki içeriğin ikincilleştirilmesi, metnin bölümlerinin ve öğelerinin anlamlara göre sınırlandırılması, yazı tipi seçimi (farklı bir ağırlıkta, harflerin vuruşları eğimli, rakam sırasına göre) kullanılarak resmileştirilir.

Bilimsel çalışmalarda yazı tipi sıralamasının kullanılması gelenekseldir (Tablo 11).

Eşleştirilmiş Öğrenci t-testi, eşleştirilmiş (tekrarlanan) ölçümlerdeki farklılıkların istatistiksel önemini belirlemek için kullanılan Öğrenci yönteminin modifikasyonlarından biridir.

1. T-testinin gelişim tarihi

t-testi geliştirildi William Gossett Guinness şirketindeki biranın kalitesini değerlendirmek için. Ticari sırların ifşa edilmemesi konusunda şirkete karşı yükümlülükler nedeniyle Gosset'in makalesi 1908 yılında Biometrics dergisinde "Öğrenci" takma adıyla yayınlandı.

2. Eşleştirilmiş Öğrenci t testi ne için kullanılır?

Karşılaştırma için Eşleştirilmiş Öğrenci t testi kullanılır iki bağımlı (eşleştirilmiş) örnek. Aynı hasta üzerinde ancak farklı zamanlarda alınan ölçümler bağımlıdır; örneğin hipertansiyonlu hastalarda kan basıncı önce ve sonra antihipertansif ilaç almak. Sıfır hipotezi, karşılaştırılan örnekler arasında hiçbir fark olmadığını, alternatif hipotez ise istatistiksel olarak anlamlı farkların olduğunu belirtir.

3. Eşleştirilmiş Öğrenci t-testini hangi durumlarda kullanabilirsiniz?

Ana koşul: örnek bağımlılığı yani karşılaştırılan değerlerin bir parametrenin tekrarlanan ölçümlerinden elde edilmesi gerekir.

Bağımsız örneklerin karşılaştırılması durumunda olduğu gibi, eşleştirilmiş bir t-testi kullanmak için orijinal verilerin normal dağılım. Bu koşul karşılanmazsa numune ortalamalarını karşılaştırmak için yöntemler kullanılmalıdır. parametrik olmayan istatistikler, örneğin G işareti testi Ve Wilcoxon T testi.

Eşleştirilmiş t testi yalnızca karşılaştırma yaparken kullanılabilir ikiörnekler. Karşılaştırmanız gerekiyorsa üç veya daha fazla tekrarlanan ölçümler kullanılmalıdır Tekrarlanan ölçümler için tek yönlü ANOVA.

4. Eşleştirilmiş Öğrenci t testi nasıl hesaplanır?

Eşleştirilmiş Öğrenci t testi aşağıdaki formül kullanılarak hesaplanır:

Nerede MD - öncesi ve sonrası ölçülen göstergeler arasındaki farkların aritmetik ortalaması, σd - göstergelerdeki farklılıkların standart sapması, N - çalışılan konuların sayısı.

5. Öğrenci t-testi değeri nasıl yorumlanır?

Ortaya çıkan eşleştirilmiş Öğrenci t-testi değerinin yorumlanması, ilgisiz popülasyonlar için t-testinin değerlendirilmesinden farklı değildir. Öncelikle serbestlik derecesi sayısını bulmanız gerekir. F aşağıdaki formüle göre:

f = n - 1

Bundan sonra gerekli anlamlılık düzeyi için Öğrenci t-testinin kritik değerini belirleriz (örneğin, p<0,05) и при данном числе степеней свободы F tabloya göre ( aşağıya bakınız).

Kriterin kritik ve hesaplanan değerlerini karşılaştırıyoruz:

  • Eşleştirilmiş Öğrenci t-testinin hesaplanan değeri eşit veya daha büyük kritik, tablodan bulduğumuz, karşılaştırılan değerler arasındaki farkların istatistiksel olarak anlamlı olduğu sonucuna varıyoruz.
  • Hesaplanan eşleştirilmiş Öğrenci t-testinin değeri az tablo halinde, yani karşılaştırılan değerler arasındaki farklar istatistiksel olarak anlamlı değildir.

6. Öğrenci t-testini hesaplama örneği

Yeni hipoglisemik ilacın etkinliğini değerlendirmek için, diyabetli hastalarda ilacı almadan önce ve aldıktan sonra kan şekeri seviyeleri ölçüldü. Sonuç olarak aşağıdaki veriler elde edildi:

Çözüm:

1. Her değer çiftinin farkını hesaplayın ( D):

Hasta N Kan şekeri seviyesi, mmol/l Fark (d)
ilacı almadan önce ilacı aldıktan sonra
1 9.6 5.7 3.9
2 8.1 5.4 2.7
3 8.8 6.4 2.4
4 7.9 5.5 2.4
5 9.2 5.3 3.9
6 8.0 5.2 2.8
7 8.4 5.1 3.3
8 10.1 6.9 3.2
9 7.8 7.5 2.3
10 8.1 5.0 3.1

2. Aşağıdaki formülü kullanarak farkların aritmetik ortalamasını bulun:

3. Aşağıdaki formülü kullanarak ortalamadan farkların standart sapmasını bulun:

4. Eşleştirilmiş Öğrenci t-testini hesaplayın:

5. Öğrenci t-testi 8.6'nın elde edilen değerini, serbestlik derecesi sayısını içeren tablo değeriyle karşılaştıralım. F 10 - 1 = 9'a eşit olup anlamlılık düzeyi p=0,05 2,262'dir. Elde edilen değer kritik değerden büyük olduğundan, yeni ilacı almadan önce ve aldıktan sonra kan şekeri seviyelerinde istatistiksel olarak anlamlı farklılıklar olduğu sonucuna varıyoruz.

Psikolojik araştırmalarda en yaygın görev, iki veya daha fazla özellik grubu arasındaki farklılıkları belirlemektir. Bu tür farklılıkların aritmetik ortalama düzeyinde belirlenmesi, birincil istatistiklerin analiz edilmesi prosedüründe dikkate alınır. Ancak, bu farklılıkların ne kadar güvenilir olduğu ve bunların tüm popülasyona genişletilip genişletilemeyeceği (tahmini) sorusu ortaya çıkıyor. Bu sorunu çözmek için, çoğunlukla (normal veya normale yakın bir dağılım varsayarak) bir denek örneğinin göstergelerinin diğerinden ne kadar güvenilir bir şekilde farklılaştığını bulmayı amaçlayan t - testini (Öğrenci testi) kullanırlar (örneğin, denekler bir grubun test edilmesi sonucunda diğer grubun temsilcilerinden daha yüksek puanlar aldığında). Bu parametrik bir kriterdir ve iki ana biçimi vardır:

1) ilgisiz (tek) t - farklı kişilerden oluşan iki grubu test etmek için aynı testi kullanırken elde edilen puanlar arasında fark olup olmadığını bulmak için tasarlanmış bir test. Örneğin bu, başarılı ve başarısız öğrencilerin zeka düzeylerinin veya nöropsikotik stabilitelerinin, kaygılarının karşılaştırılması veya farklı sınıf, yaş, sosyal düzey ve benzeri öğrencilerin bu özellikler açısından karşılaştırılması olabilir. İncelenen örneklerde farklı cinsiyetlerden, farklı milletlerden örnekler olabileceği gibi, belirli bir özelliğe göre belirlenen alt örnekler de bulunabilir. Kriter "ilgisiz" olarak adlandırılıyor çünkü karşılaştırılan gruplar farklı kişilerden oluşuyor;

2) bağlı (eşleştirilmiş) t - belirli bir bağlantının bulunduğu öğeler arasında iki grubun göstergelerini karşılaştırmak için kullanılan test. Bu, birinci grubun her bir öğesinin, araştırmacının ilgisini çeken belirli bir parametreye göre ona benzer şekilde ikinci grubun bir öğesine karşılık geldiği anlamına gelir. Çoğu zaman, aynı bireylerin parametreleri belirli bir olay veya eylemden önce ve sonra karşılaştırılır (örneğin, boylamsal bir çalışma veya biçimlendirici bir deney sırasında). Bu nedenle bu kriter aynı bireylerin bir araştırma, deney öncesi ve sonrasındaki veya belirli bir süre sonrasındaki performanslarını karşılaştırmak için kullanılır.

Veriler normal dağılıma tabi değilse, t - testine eşdeğer parametrik olmayan testler kullanın: tek t - testine eşdeğer Mann-Whitney testi ve eşleştirilmiş t - testine eşdeğer İki Örnekli Wilcoxon testi.

T testlerini ve bunların parametrik olmayan eşdeğerlerini kullanarak yalnızca aynı testi kullanarak elde edilen iki grubun sonuçlarını karşılaştırabilirsiniz. Ancak bazı durumlarda birden fazla grubu veya çeşitli türden değerlendirmeleri karşılaştırmak gerekli olabilir. Bu, görevi birkaç karşılaştırma çiftine bölerek aşamalar halinde yapılabilir (örneğin, A, B ve Y gruplarını X ve Y testlerinin sonuçlarına göre karşılaştırmanız gerekiyorsa, o zaman t - testini kullanarak önce karşılaştırabilirsiniz) X testinin sonuçlarına göre A ve B grupları, ardından C testinin sonuçlarına göre A ve B grupları, X testinin sonuçlarına göre A ve C, vb.). Ancak bu çok emek yoğun bir yöntem olduğundan, varyans analizinin daha karmaşık yöntemine başvuruyorlar.

Oldukça etkili bir parametrik Öğrenci testi kullanarak aritmetik ortalamalardaki farklılıkların güvenilirliğini değerlendirme yöntemi, veri işleme sırasında en sık gözlemlenen sorunlardan birini çözmeyi amaçlamaktadır - iki veya daha fazla değer dizisi arasındaki farkların güvenilirliğini belirlemek. Böyle bir değerlendirme, kutup gruplarının karşılaştırmalı analizinde sıklıkla gereklidir. incelenen olgunun belirli bir hedef işaretinin (özelliklerinin) farklı ifadelerine dayanarak ayırt edilirler. Kural olarak, analiz seçilen grupların birincil istatistiklerinin hesaplanmasıyla başlar, ardından farklılıkların önemi değerlendirilir. Öğrencinin kriteri aşağıdaki formül kullanılarak hesaplanır:

Öğrenci testinin üç güven seviyesi (istatistiksel) anlamlılığı (p) için değeri, matematiksel istatistiklerle ilgili referans kitaplarında verilmiştir. Serbestlik derecesinin sayısı aşağıdaki formülle belirlenir:

Örneklem boyutlarının azalmasıyla (n<10) критерий Стьюдента становится чувствительным к форме распределения исследуемого признака в генеральной совокупности. Поэтому в сомнительных случаях рекомендуют использовать непараметрические методы или сравнивать полученные значения с критическими (табл. 2.17) для высшего уровня значимости.

Farkların güvenilirliğine ilişkin karar, hesaplanan t değerinin belirli bir serbestlik derecesi (d(v)) için tablo değerini aşması durumunda verilir. Yayınlar veya bilimsel raporlar şu üçünden yüksek düzeyde önem taşıdığını göstermektedir: p<0,05; р <0,01; р <0,001.

Ortalamalar arasındaki farkın güvenilirliğine ilişkin kriterin herhangi bir sayısal değeri için, bu gösterge belirlenen farkın derecesini değerlendirmez (ortalamaların kendisi arasındaki farkla değerlendirilir), yalnızca istatistiksel güvenilirliğini değerlendirir, yani, bir farkın varlığına ilişkin örneklerin karşılaştırılması temelinde elde edilen sonucu bir bütün olarak fenomenin tamamına (tüm sürece) genişletme hakkı. Hesaplanan düşük fark kriteri, iki özellik (olgu) arasında bir farkın olmadığının kanıtı olamaz çünkü bunun önemi (güvenilirlik derecesi) yalnızca ortalamaların büyüklüğüne değil, aynı zamanda karşılaştırılan örneklerin sayısına da bağlıdır. Bu, bir farkın olmadığını göstermez, ancak böyle bir örneklem büyüklüğü ile istatistiksel olarak güvenilmez olduğu gerçeğini gösterir: bu koşullardaki farkın rastgele olma ihtimali çok yüksektir, güvenilirlik olasılığı ise çok düşüktür.

Tablo 2.17. F serbestlik derecesi için Öğrenci testinin (t-testi) güven sınırları

İkinci denemede görevi tamamlamak için geçen ortalama süredeki değişiklik (ilk denemeyle karşılaştırıldığında) güvenilir değildir.

Bu ifade, karşılaştırılan iki örneğin istatistiksel homojenliğine ilişkin bir ifadeye eşdeğer değildir. Ayrıca bu tür eşit olmayan örneklerde Öğrenci kriterinin uygulanması matematiksel olarak tamamen doğru değildir ve elbette Xav = 9,1 ile Xav = 8,5 arasındaki farkların nihai güvenilmezliğini etkiler. Bu kriteri kullanarak, iki ortalamanın yakınlık derecesi değerlendirilmez, ancak rastgelelik ataması veya seçimi (belirli bir anlamlılık düzeyinde) dikkate alınır. .

burada f, şu şekilde tanımlanan serbestlik derecesidir:

Örnek . İki grup öğrenciye iki farklı yöntem kullanılarak eğitim verildi. Eğitimin sonunda kurs boyunca bir test uygulandı. Edinilen bilgilerdeki farklılıkların ne kadar önemli olduğunu değerlendirmek gerekir. Test sonuçları Tablo 4'te sunulmaktadır.

Tablo 4

Örnek ortalamasını, varyansını ve standart sapmasını hesaplayalım:

t p = 0,45 formülünü kullanarak t p'nin değerini belirleyelim.

Tablo 1'i kullanarak (bkz. ek) p = 0,01 anlamlılık düzeyi için kritik t k değerini buluyoruz.

Sonuç: Kriterin hesaplanan değeri 0,45 olan kritik değerden küçük olduğundan<2,88 гипотеза Но подтверждается и существенных различий в методиках обучения нет на уровне значимости 0,01.

Bağımlı ölçüm örnekleri için Öğrenci t-testini hesaplamaya yönelik algoritma

1. Formülü kullanarak t-testinin hesaplanan değerini belirleyin

, Nerede

2. Serbestlik derecesini hesaplayın f

3. Ekteki Tablo 1'e göre t-testinin kritik değerini belirleyin.

4. T testinin hesaplanan ve kritik değerini karşılaştırın. Hesaplanan değer kritik değerden büyük veya ona eşitse, iki değişiklik örneğindeki ortalama değerlerin eşitliği hipotezi reddedilir (Ho). Diğer tüm durumlarda, belirli bir anlamlılık düzeyinde kabul edilir.

sen- kriterKudret helvası- Whitney

Kriterin amacı

Kriterin amacı, niceliksel olarak ölçülen herhangi bir özelliğin düzeyi açısından parametrik olmayan iki örnek arasındaki farkları değerlendirmektir. Küçük numuneler arasındaki farkları tanımlamanıza olanak tanır.< 30.

Kriterin açıklaması

Bu yöntem, iki seri arasındaki örtüşen değerlerin alanının yeterince küçük olup olmadığını belirler. Bu alan ne kadar küçükse, farkların anlamlı olma ihtimali de o kadar yüksektir. U kriterinin ampirik değeri, satırlar arasındaki anlaşma alanının ne kadar büyük olduğunu yansıtır. Bu nedenle, U ne kadar küçük olursa, farkların anlamlı olma olasılığı o kadar artar.

hipotezler

AMA: 2. gruptaki özelliğin düzeyi 1. gruptaki özelliğin düzeyinden daha düşük değildir.

HI: Grup 2'deki özelliğin düzeyi, grup 1'deki özelliğin düzeyinden düşüktür.

Mann-Whitney kriterini hesaplamak için algoritma (u)

    Tüm test deneklerinin verilerini bireysel kartlara aktarın.

    Örnek 1'deki deneklerin kartlarını tek bir renkle, örneğin kırmızıyla ve örnek 2'deki tüm kartları başka bir renkle, örneğin maviyle işaretleyin.

    Tüm kartları, hangi örneğe ait olduğuna bakılmaksızın, sanki tek bir büyük örnekle çalışıyormuşuz gibi, özelliğin artış derecesine göre tek bir sıraya yerleştirin.


burada n1, örnek 1'deki deneklerin sayısıdır;

n 2 – örnek 2'deki denek sayısı,

T x – iki rant tutarından büyük olanı;

n x – gruptaki sıralama toplamı daha büyük olan deneklerin sayısı.

9. Tablo 2'ye göre U'nun kritik değerlerini belirleyin (eke bakınız).

Eğer U em.> U cr0.05 ise, bu durumda Ama hipotezi kabul edilir. U em.≤ U cr ise reddedilir. U değeri ne kadar küçük olursa, farkların güvenilirliği o kadar yüksek olur.

Örnek. İki gruptaki iki öğretim yönteminin etkililiğini karşılaştırın. Test sonuçları Tablo 5'te sunulmaktadır.

Tablo 5

Tüm verileri başka bir tabloya aktaralım, ikinci grubun verilerini alt çizgiyle vurgulayalım ve toplam numunenin sıralamasını yapalım (görev 3 için yönergelerdeki sıralama algoritmasına bakın).

Değerler

İki örneğin sıralarının toplamını bulalım ve büyük olanı seçelim: T x = 113

Kriterin ampirik değerini formül 2'yi kullanarak hesaplayalım: U p = 30.

Ekteki tablo 2'yi kullanarak kriterin kritik değerini p = 0,05 anlamlılık seviyesinde belirliyoruz: U k = 19.

Çözüm: kriterin hesaplanan değerinden bu yanasenp = 0,05 ve 30 > 19 anlamlılık düzeyinde kritikten büyükse, ortalamaların eşitliği hipotezi kabul edilir ve öğretim yöntemlerindeki farklılıklar önemsizdir.

Yöntem, karşılaştırılanların çıkarıldığı iki genel popülasyonun ortalama değerlerinin olduğu hipotezini test etmenize olanak sağlar. bağımlıörnekler birbirinden farklıdır. Bağımlılık varsayımı çoğunlukla özelliğin aynı örnek üzerinde örneğin müdahaleden önce ve sonra olmak üzere iki kez ölçülmesi anlamına gelir. Genel durumda, bir numunenin her temsilcisine başka bir numuneden bir temsilci atanır (çiftler halinde birleştirilirler), böylece iki veri serisi birbiriyle pozitif korelasyona sahip olur. Daha zayıf örnek bağımlılığı türleri: örnek 1 - kocalar, örnek 2 - eşleri; örnek 1 - bir yaşındaki çocuklar, örnek 2, örnek 1'deki çocukların ikizlerinden oluşur, vb.

Test edilebilir istatistiksel hipotez,önceki durumda olduğu gibi, H 0: M1 = M2(1. ve 2. örnekteki ortalama değerler eşittir.) Reddedilmesi durumunda alternatif hipotez kabul edilir. M1 az çok) M2.

İlk varsayımlar istatistiksel testler için:

□ bir örneğin (bir genel popülasyondan) her bir temsilcisi, başka bir örneğin (başka bir genel popülasyondan) bir temsilcisi ile ilişkilendirilir;

□ iki örnekten elde edilen veriler pozitif korelasyona sahiptir (form çiftleri);

□ incelenen özelliğin her iki örnekteki dağılımı normal yasaya karşılık gelir.

Kaynak veri yapısı: her nesne için (her çift için) incelenen özelliğin iki değeri vardır.

Kısıtlamalar: her iki numunedeki özelliğin dağılımı normalden önemli ölçüde farklı olmamalıdır; her iki numuneye karşılık gelen iki ölçümün verileri pozitif olarak ilişkilidir.

Alternatifler: Wilcoxon T testi, en az bir örneğin dağılımı normalden önemli ölçüde farklıysa; t-Bağımsız örnekler için öğrenci testi - eğer iki örnek için veriler pozitif korelasyona sahip değilse.

FormülÖğrenci t testinin ampirik değeri, farklar için analiz biriminin şu olduğu gerçeğini yansıtır: fark (kayma) her gözlem çifti için karakteristik değerler. Buna göre, N çift nitelik değerinin her biri için ilk olarak fark hesaplanır. d ben = x 1 ben - x 2 ben.

(3) burada M d – değerlerin ortalama farkı; σ d – farkların standart sapması.

Hesaplama örneği:

Eğitimin etkililiğini test ederken, 8 grup üyesinin her birine "Sizin görüşleriniz grubun görüşleriyle ne sıklıkla örtüşüyor?" sorusunun sorulduğunu varsayalım. - antrenmandan önce ve sonra iki kez. Yanıtlar için 10 puanlık bir ölçek kullanıldı: 1 - hiçbir zaman, 5 - yarı yarıya, 10 - her zaman. Eğitim sonucunda katılımcıların uyum öz saygısının (gruptaki diğer kişiler gibi olma arzusunun) artacağı hipotezi test edildi (α = 0,05). Ara hesaplamalar için bir tablo oluşturalım (Tablo 3).

Tablo 3

Md = (-6)/8= -0,75 farkının aritmetik ortalaması. Bu değeri her d'den (tablonun sondan bir önceki sütunu) çıkarın.

Standart sapma formülü yalnızca içinde X yerine d'nin görünmesi nedeniyle farklılık gösterir. Gerekli tüm değerleri yerine koyarız ve şunu elde ederiz:

σ d = = 0,886.

Adım 1. Formül (3)'ü kullanarak kriterin ampirik değerini hesaplayın: ortalama fark MD= -0,75; standart sapma σ d = 0,886; t e = 2,39; df = 7.

Adım 2. T-Student kriterinin kritik değerleri tablosunu kullanarak p anlamlılık seviyesini belirliyoruz. df = 7 için ampirik değer, p = 0,05 ile p - 0,01 için kritik değerler arasındadır. Bu nedenle, p< 0,05.

df R
0,05 0,01 0,001
2,365 3,499 5,408

Adım 3. İstatistiksel bir karar veriyoruz ve bir sonuç çıkarıyoruz. Ortalamaların eşitliğine ilişkin istatistiksel hipotez reddedilir. Sonuç: Katılımcıların eğitim sonrası uygunluğuna ilişkin öz değerlendirme göstergesi istatistiksel olarak anlamlı derecede arttı (önem düzeyinde p< 0,05).

Parametrik yöntemler şunları içerir: iki örneğin varyanslarının kritere göre karşılaştırılması F-Fisher. Bazen bu yöntem değerli anlamlı sonuçlara yol açar ve bağımsız örnekler için ortalamaların karşılaştırılması durumunda, varyansların karşılaştırılması zorunlu prosedür.

Hesaplamak Kadın iki örneğin varyanslarının oranını bulmanız gerekir; böylece büyük varyans payda, küçük varyans ise paydada olur.

Varyansların Karşılaştırılması. Yöntem, karşılaştırılan örneklerin alındığı iki popülasyonun varyanslarının birbirinden farklı olduğu hipotezini test etmenize olanak tanır. Test edilmiş istatistiksel hipotez H 0: σ 1 2 = σ 2 2 (örnek 1'deki varyans, örnek 2'deki varyansa eşittir). Reddedilmesi durumunda varyanslardan birinin diğerinden büyük olduğu yönündeki alternatif hipotez kabul edilir.

İlk varsayımlar: İncelenen özelliğin normal dağılımına sahip farklı popülasyonlardan rastgele iki örnek alınır.

Kaynak veri yapısı: incelenen karakteristik, her biri karşılaştırılan iki örnekten birine ait olan nesnelerde (konularda) ölçülür.

Kısıtlamalar:özelliğin her iki örnekteki dağılımları normalden önemli ölçüde farklı değildir.

Alternatif yöntem: Kullanımı normallik varsayımının kontrol edilmesini gerektirmeyen Levene testi (SPSS programında kullanılır).

Formül Fisher's F testinin ampirik değeri için:

(4)

nerede σ 1 2 - büyük dağılım ve σ 2 2 - daha küçük dağılım. Hangi dağılımın daha büyük olduğu önceden bilinmediğinden p-düzeyini belirlemek için kullanılır. Yönsüz alternatifler için kritik değerler tablosu. Eğer Fe > F Kp karşılık gelen serbestlik derecesi sayısı için, o zaman R < 0,05 и статистическую гипотезу о равенстве дисперсий можно отклонить (для α = 0,05).

Hesaplama örneği:

Çocuklara düzenli aritmetik problemleri verildi, ardından öğrencilerin rastgele seçilen yarısına sınavda başarısız oldukları söylendi, geri kalanlara ise tam tersi söylendi. Daha sonra her çocuğa benzer bir problemi çözmelerinin kaç saniye süreceği soruldu. Deneyci, çocuğun aradığı süre ile tamamlanan görevin sonucu arasındaki farkı (saniye cinsinden) hesapladı. Başarısızlık mesajının çocuğun özgüveninde bir miktar yetersizliğe neden olması bekleniyordu. Test edilen hipotez (α = 0,005 düzeyinde), toplam öz saygının varyansının başarı ya da başarısızlık raporlarına bağlı olmamasıydı (H 0: σ 1 2 = σ 2 2).

Aşağıdaki veriler elde edildi:


Adım 1. Formül (4)'ü kullanarak kriterin ampirik değerini ve serbestlik derecesi sayısını hesaplayın:

Adım 2. Fisher f kriterinin kritik değerleri tablosuna göre yönsüz kritik değerini bulduğumuz alternatifler df numarası = 11; biliyorum= 11. Ancak sadece için kritik bir değer vardır. df numarası= 10 ve biliyorum = 12. Daha fazla sayıda serbestlik derecesi almak mümkün olmadığından kritik değeri alıyoruz. df numarası= 10: İçin R = 0,05 FKp = 3.526; İçin R = 0,01 FKp = 5,418.

Adım 3. İstatistiksel bir karar verme ve anlamlı sonuç çıkarma. Ampirik değer kritik değeri aştığı için R= 0,01 (ve hatta daha fazlası için) p = 0,05), bu durumda p< 0,01 и принимается альтернативная гипо­теза: дисперсия в группе 1 превышает дисперсию в группе 2 (R< 0.01). Sonuç olarak, başarısızlıkla ilgili bir mesajdan sonra benlik saygısının yetersizliği, başarıyla ilgili bir mesajdan sonra daha yüksektir.

/ pratik istatistikler / referans materyalleri / öğrenci t-testi değerleri

AnlamT -0.10, 0.05 ve 0.01 anlamlılık düzeylerinde Öğrenci t testi

ν – varyasyon serbestliği dereceleri

Standart Öğrenci t-testi değerleri

Serbestlik derecesi sayısı

Önem seviyeleri

Serbestlik derecesi sayısı

Önem seviyeleri

Masa XI

İki numune arasındaki farkların önemini değerlendirmek için kullanılan Standart Fisher test değerleri

Özgürlük derecesi

Önem düzeyi

Özgürlük derecesi

Önem düzeyi

Öğrenci t testi

Öğrenci t testi- Öğrenci dağılımına dayalı olarak hipotezlerin istatistiksel testlerine (istatistiksel testler) yönelik bir yöntem sınıfının genel adı. T testinin en yaygın kullanım alanları, iki örnekteki ortalamaların eşitliğinin test edilmesini içerir.

T-istatistikler genellikle aşağıdaki genel prensibe göre oluşturulur: pay, sıfır matematiksel beklentiye sahip bir rastgele değişkendir (eğer sıfır hipotezi karşılanırsa) ve payda, bu rastgele değişkenin örnek standart sapmasıdır ve bu sayının karekökü olarak elde edilir. karıştırılmamış varyans tahmini.

Hikaye

Bu kriter William Gossett tarafından Guinness şirketindeki biranın kalitesini değerlendirmek için geliştirildi. Ticari sırların ifşa edilmemesine ilişkin şirkete yönelik yükümlülüklerle bağlantılı olarak (Guinness yönetimi, çalışmalarında istatistiksel cihazların kullanımını bu şekilde değerlendirmiştir), Gosset'in makalesi 1908 yılında Biometrics dergisinde "Öğrenci" takma adı altında yayınlandı.

Veri gereksinimleri

Bu kriterin uygulanabilmesi için orijinal verilerin normal dağılıma sahip olması gerekmektedir. Bağımsız örneklemler için iki örneklem testi uygulanması durumunda varyansların eşitliği koşulunun da sağlanması gerekmektedir. Ancak varyansların eşit olmadığı durumlar için Öğrenci t testinin alternatifleri de vardır.

Doğru bir t (\displaystyle t) testi için verilerin normal dağılımının gerekliliği gereklidir. Ancak diğer veri dağılımlarında bile t (\displaystyle t) -istatistiklerini kullanmak mümkündür. Çoğu durumda, bu istatistik asimptotik olarak standart bir normal dağılıma sahiptir - N (0, 1) (\displaystyle N(0,1)) , dolayısıyla bu dağılımın yüzdelikleri kullanılabilir. Bununla birlikte, bu durumda bile, tam t (\displaystyle t) testinde olduğu gibi, genellikle standart normal dağılıma ait değil, karşılık gelen Öğrenci dağılımına ait nicelikler kullanılır. Asimptotik olarak eşdeğerdirler ancak küçük örneklerde Öğrenci dağılımının güven aralıkları daha geniş ve daha güvenilirdir.

Tek örnek t testi

Matematiksel beklenti E (X) (\displaystyle E(X)) ile eşitliği hakkındaki sıfır hipotezi H 0: E (X) = m (\displaystyle H_(0):E(X)=m)'yi test etmek için kullanılır bilinen bazı değerler m ( \displaystyle m) .

Açıkçası, eğer sıfır hipotezi karşılanırsa, E (X ¯) = m (\displaystyle E((\overline (X))))=m) . Gözlemlerin varsayılan bağımsızlığı dikkate alındığında, V (X ¯) = σ 2 / n (\displaystyle V((\overline (X)))=\sigma ^(2)/n) . Tarafsız bir varyans tahmini kullanma s X 2 = ∑ t = 1 n (X t − X ¯) 2 / (n − 1) (\displaystyle s_(X)^(2)=\sum _(t=1)^( n )(X_(t)-(\overline (X)))^(2)/(n-1)) aşağıdaki t istatistiklerini elde ederiz:

t = X ¯ − m s X / n (\displaystyle t=(\frac ((\overline (X))-m)(s_(X)/(\sqrt (n)))))

Sıfır hipotezi altında, bu istatistiğin dağılımı t (n − 1) (\displaystyle t(n-1)) şeklindedir. Sonuç olarak, eğer istatistiklerin mutlak değeri belirli bir dağılımın kritik değerini (belirli bir anlamlılık düzeyinde) aşarsa, sıfır hipotezi reddedilir.

Bağımsız örnekler için iki örnekli t testi

Normal dağılmış rastgele değişkenler X 1, X 2 (\displaystyle X_(1),~X_(2)'nin n 1, n 2 (\displaystyle n_(1)~,~n_(2)) hacimlerinin iki bağımsız örneği olsun. )). Örnek verileri kullanarak, bu rastgele değişkenlerin H 0: M 1 = M 2 (\displaystyle H_(0):~M_(1)=M_(2)) matematiksel beklentilerinin eşitliğine ilişkin sıfır hipotezini test etmek gerekir.

Örnek ortalamalar arasındaki farkı düşünün Δ = X ¯ 1 − X ¯ 2 (\displaystyle \Delta =(\overline (X))_(1)-(\overline (X))_(2)) . Açıkçası, eğer sıfır hipotezi doğruysa E (Δ) = M 1 − M 2 = 0 (\displaystyle E(\Delta)=M_(1)-M_(2)=0) . Örneklerin bağımsızlığına bağlı olarak bu farkın varyansı eşittir: V (Δ) = σ 1 2 n 1 + σ 2 2 n 2 (\displaystyle V(\Delta)=(\frac (\sigma _(1) )^(2))( n_(1)))+(\frac (\sigma _(2)^(2))(n_(2)))) . Daha sonra tarafsız varyans tahminini kullanarak s 2 = ∑ t = 1 n (X t − X ¯) 2 n − 1 (\displaystyle s^(2)=(\frac (\sum _(t=1)^(n) ( X_(t)-(\overline (X)))^(2))(n-1))) örnek ortalamalar arasındaki farkın varyansının tarafsız bir tahminini elde ederiz: s Δ 2 = s 1 2 n 1 + s 2 2 n 2 (\ görüntü stili s_(\Delta )^(2)=(\frac (s_(1)^(2))(n_(1)))+(\frac (s_(2)^( 2))(n_(2) ))) . Bu nedenle sıfır hipotezini test etmek için kullanılan t istatistiği şu şekildedir:

T = X ¯ 1 − X ¯ 2 s 1 2 n 1 + s 2 2 n 2 (\displaystyle t=(\frac ((\overline (X))_(1)-(\overline (X))_( 2))(\sqrt ((\frac (s_(1)^(2))(n_(1))))+(\frac (s_(2)^(2))(n_(2))))) ))

Sıfır hipotezi doğruysa, bu istatistiğin t (d f) (\displaystyle t(df)) dağılımı vardır; burada d f = (s 1 2 / n 1 + s 2 2 / n 2) 2 (s 1 2 / n) 1) 2 / (n 1 − 1) + (s 2 2 / n 2) 2 / (n 2 − 1) (\displaystyle df=(\frac ((s_(1)^(2)/n_(1) +s_(2 )^(2)/n_(2))^(2))((s_(1)^(2)/n_(1))^(2)/(n_(1)-1)+ (s_(2 )^(2)/n_(2))^(2)/(n_(2)-1))))

Eşit varyans durumu

Örneklemlerin varyanslarının eşit olduğu varsayılırsa, o zaman

V (Δ) = σ 2 (1 n 1 + 1 n 2) (\displaystyle V(\Delta)=\sigma ^(2)\left((\frac (1)(n_(1)))+(\ frac (1)(n_(2)))\right))

O halde t istatistiği:

T = X ¯ 1 − X ¯ 2 s X 1 n 1 + 1 n 2 , s X = (n 1 − 1) s 1 2 + (n 2 − 1) s 2 2 n 1 + n 2 − 2 (\ görüntüleme stili t=(\frac ((\overline (X))_(1)-(\overline (X))_(2))(s_(X)(\sqrt ((\frac (1)(n_(1) ))))+(\frac (1)(n_(2))))))~,~~s_(X)=(\sqrt (\frac ((n_(1)-1)s_(1)^ ( 2)+(n_(2)-1)s_(2)^(2))(n_(1)+n_(2)-2))))

Bu istatistik t (n 1 + n 2 − 2) (\displaystyle t(n_(1)+n_(2)-2)) dağılımına sahiptir.

Bağımlı örnekler için iki örnekli t testi

İki bağımlı örnek (örneğin, aynı testin belirli bir zaman aralığına sahip iki örneği) arasındaki farklara ilişkin bir hipotezin test edilmesi durumunda t (\displaystyle t) kriterinin ampirik değerini hesaplamak için aşağıdaki formül kullanılır:

T = M d s d / n (\displaystyle t=(\frac (M_(d))(s_(d)/(\sqrt (n)))))

burada M d (\displaystyle M_(d)) değerlerin ortalama farkıdır, s d (\displaystyle s_(d)) farkların standart sapmasıdır ve n gözlem sayısıdır

Bu istatistiğin t (n − 1) (\displaystyle t(n-1)) dağılımı vardır.

Doğrusal Regresyon Parametrelerinde Doğrusal Kısıtlamanın Test Edilmesi

T testi aynı zamanda sıradan en küçük kareler tarafından tahmin edilen bir doğrusal regresyonun parametreleri üzerindeki keyfi (tek) doğrusal kısıtlamayı da test edebilir. H 0: c T b = a (\displaystyle H_(0):c^(T)b=a) hipotezini test etmek gerekli olsun. Açıkçası, eğer sıfır hipotezi karşılanırsa, E (c T b ^ − a) = c T E (b ^) − a = 0 (\displaystyle E(c^(T)(\hat (b))-a)= c^( T)E((\hat (b)))-a=0) . Burada E (b ^) = b (\displaystyle E((\hat (b)))=b) model parametrelerinin tarafsız en küçük kareler tahminleri özelliğini kullanıyoruz. Ek olarak, V (c T b ^ − a) = c T V (b ^) c = σ 2 c T (X T X) − 1 c (\displaystyle V(c^(T)(\hat (b))-a )=c^(T)V((\hat (b)))c=\sigma ^(2)c^(T)(X^(T)X)^(-1)c) . Bilinmeyen varyans yerine onun tarafsız tahminini kullanarak s 2 = E S S / (n − k) (\displaystyle s^(2)=ESS/(n-k)) aşağıdaki t-istatistiğini elde ederiz:

T = c T b ^ − a s c T (X T X) − 1 c (\displaystyle t=(\frac (c^(T)(\hat (b))-a)(s(\sqrt (c^(T) (X^(T)X)^(-1)c))))))

Sıfır hipotezi karşılandığında bu istatistik, t (n − k) (\displaystyle t(n-k)) dağılımına sahiptir, dolayısıyla istatistiğin değeri kritik değerden yüksekse, o zaman doğrusal kısıtlamanın sıfır hipotezi reddedildi.

Doğrusal regresyon katsayısına ilişkin hipotezlerin test edilmesi

Doğrusal kısıtlamanın özel bir durumu, regresyon katsayısı b j (\displaystyle b_(j))'nin belirli bir a (\displaystyle a) değerine eşit olduğu hipotezini test etmektir. Bu durumda karşılık gelen t istatistiği şöyledir:

T = b ^ j - a s b ^ j (\displaystyle t=(\frac ((\hat (b))_(j)-a)(s_((\hat (b))_(j))))

burada s b ^ j (\displaystyle s_((\hat (b))_(j))) katsayı tahmininin standart hatasıdır - katsayı tahminlerinin kovaryans matrisinin karşılık gelen köşegen öğesinin karekökü.

Sıfır hipotezi doğruysa, bu istatistiğin dağılımı t (n − k) (\displaystyle t(n-k)) olur. İstatistiğin mutlak değeri kritik değerden yüksekse, o zaman katsayı ile a (\displaystyle a) arasındaki fark istatistiksel olarak anlamlıdır (rastgele değildir), aksi halde anlamsızdır (rastgele, yani gerçek katsayı muhtemelen a'nın tahmini değerine eşit veya çok yakın (\ görüntü stili a))

Yorum

Matematiksel beklentilere yönelik tek örnekli bir test, doğrusal regresyon parametreleri üzerindeki doğrusal bir kısıtlamanın test edilmesine indirgenebilir. Tek örnekli bir testte bu, bir sabit üzerinde bir "regresyondur". Bu nedenle, regresyonun s 2 (\displaystyle s^(2))'si, üzerinde çalışılan rastgele değişkenin varyansının örnek bir tahminidir; X T X (\displaystyle X^(T)X) matrisi, n'ye (\displaystyle n) eşittir ) ve modelin "katsayısı" tahmini örnek ortalamasına eşittir. Buradan genel durum için yukarıda verilen t-istatistikinin ifadesini elde ederiz.

Benzer şekilde, eşit örnek varyanslarına sahip iki örnekli bir testin de doğrusal kısıtlamaların test edilmesini azalttığı gösterilebilir. İki örnekli bir testte bu, (0 veya 1) değerine bağlı olarak alt örneği tanımlayan bir sabit ve kukla değişken üzerinde bir "regresyondur": y = a + b D (\displaystyle y=a+bD) . Örneklemlerin matematiksel beklentilerinin eşitliğine ilişkin hipotez, bu modelin b katsayısının sıfıra eşitliğine ilişkin bir hipotez olarak formüle edilebilir. Bu hipotezi test etmek için uygun t istatistiğinin, iki örneklem testi için verilen t istatistiğine eşit olduğu gösterilebilir.

Farklı dağılımlar durumunda doğrusal kısıtlamanın kontrol edilmesine de indirgenebilir. Bu durumda model hata varyansı iki değer alır. Bundan ayrıca iki örnekli test için verilene benzer bir t-istatistiği elde edebilirsiniz.

Parametrik olmayan analoglar

Bağımsız örnekler için iki örnek testinin bir benzeri Mann-Whitney U testidir. Bağımlı örneklerin olduğu durum için analoglar işaret testi ve Wilcoxon T testidir.

Edebiyat

Öğrenci. Ortalamanın olası hatası. // Biyometrika. 1908. Sayı 6 (1). S.1-25.

Bağlantılar

Novosibirsk Devlet Teknik Üniversitesi'nin web sitesinde araçların homojenliğine ilişkin hipotezleri test etme kriterleri üzerine