Obliczono T. Klasyczne metody statystyki: test t-Studenta

Metoda pozwala na przetestowanie hipotezy, że wyodrębniane są wartości średnie z dwóch populacji ogólnych, z których porównywane są zależny próbki różnią się od siebie. Założenie zależności najczęściej oznacza, że ​​cecha jest mierzona dwukrotnie na tej samej próbie, np. przed interwencją i po niej. W ogólnym przypadku każdemu przedstawicielowi jednej próby przydziela się przedstawiciela innej próby (łączy się ich w pary), tak aby obydwa szeregi danych były ze sobą dodatnio skorelowane. Słabsze typy zależności próby: próbka 1 – mężowie, próbka 2 – ich żony; próbka 1 – dzieci jednoroczne, próbkę 2 stanowią bliźniaki dzieci z próby 1 itd.

Testowalna hipoteza statystyczna, jak w poprzednim przypadku, H 0: M 1 = M 2(średnie wartości w próbkach 1 i 2 są równe) W przypadku odrzucenia przyjmuje się hipotezę alternatywną M 1 mniej więcej) M 2.

Wstępne założenia do testów statystycznych:

□ każdy przedstawiciel jednej próby (z jednej populacji ogólnej) jest powiązany z przedstawicielem innej próby (z innej populacji ogólnej);

□ dane z dwóch próbek są ze sobą dodatnio skorelowane (tworzą pary);

□ rozkład badanej cechy w obu próbach odpowiada prawu normalnemu.

Struktura danych źródłowych: dla każdego obiektu (dla każdej pary) przypadają dwie wartości badanej cechy.

Ograniczenia: rozkład cechy w obu próbach nie powinien znacząco różnić się od normalnego; dane z dwóch pomiarów odpowiadające obu próbkom są dodatnio skorelowane.

Alternatywy: test T Wilcoxona, jeśli rozkład dla co najmniej jednej próbki różni się istotnie od normalnego; Test t-Studenta dla prób niezależnych – jeśli dane dla dwóch próbek nie są dodatnio skorelowane.

Formuła gdyż wartość empiryczna testu t-Studenta odzwierciedla fakt, że jednostką analizy różnic jest różnica (przesunięcie) wartości charakterystyczne dla każdej pary obserwacji. Odpowiednio, dla każdej z N par wartości atrybutów najpierw obliczana jest różnica re ja = x 1 ja - x 2 ja.

(3) gdzie M d – średnia różnica wartości; σ d – odchylenie standardowe różnic.

Przykład obliczeń:

Załóżmy, że podczas testowania efektywności szkolenia każdemu z 8 członków grupy zadano pytanie „Jak często Twoje opinie pokrywają się z opiniami grupy?” - dwukrotnie, przed i po treningu. Do odpowiedzi zastosowano 10-punktową skalę: 1 – nigdy, 5 – w połowie przypadków, 10 – zawsze. Testowano hipotezę, że w wyniku szkolenia wzrośnie samoocena konformizmu (chęć bycia jak inni w grupie) uczestników (α = 0,05). Utwórzmy tabelę do obliczeń pośrednich (Tabela 3).

Tabela 3

Średnia arytmetyczna różnicy M d = (-6)/8= -0,75. Odejmij tę wartość od każdego d (przedostatnia kolumna tabeli).

Wzór na odchylenie standardowe różni się tylko tym, że zamiast X pojawia się w nim d. Podstawiamy wszystkie niezbędne wartości i otrzymujemy

σd = = 0,886.

Krok 1. Oblicz wartość empiryczną kryterium korzystając ze wzoru (3): różnica średnia lekarz= -0,75; odchylenie standardowe σ re = 0,886; t mi = 2,39; zm = 7.

Krok 2. Korzystając z tabeli wartości krytycznych kryterium t-Studenta, określamy poziom istotności p. Dla df = 7 wartość empiryczna mieści się pomiędzy wartościami krytycznymi dla p = 0,05 i p - 0,01. Dlatego str< 0,05.

zm R
0,05 0,01 0,001
2,365 3,499 5,408

Krok 3. Podejmujemy decyzję statystyczną i formułujemy wniosek. Statystyczna hipoteza o równości środków zostaje odrzucona. Wniosek: wskaźnik samooceny zgodności uczestników po szkoleniu wzrósł istotnie statystycznie (na poziomie istotności p< 0,05).

Metody parametryczne obejmują porównanie wariancji dwóch próbek według kryterium F-Fisher. Czasami metoda ta prowadzi do wartościowych, znaczących wniosków, a w przypadku porównywania średnich dla niezależnych próbek, porównywanie wariancji obowiązkowy procedura.

Liczyć F.em musisz znaleźć stosunek wariancji dwóch próbek, tak aby większa wariancja znajdowała się w liczniku, a mniejsza w mianowniku.

Porównanie wariancji. Metoda pozwala na sprawdzenie hipotezy, że wariancje dwóch populacji, z których losowane są porównywane próby, różnią się od siebie. Testowana hipoteza statystyczna H 0: σ 1 2 = σ 2 2 (wariancja w próbie 1 jest równa wariancji w próbie 2). Jeśli zostanie odrzucona, przyjmuje się alternatywną hipotezę, że jedna wariancja jest większa od drugiej.

Wstępne założenia: dwie próbki są losowo pobierane z różnych populacji o rozkładzie normalnym badanej cechy.

Struktura danych źródłowych: badaną cechę mierzy się w obiektach (podmiotach), z których każdy należy do jednej z dwóch porównywanych próbek.

Ograniczenia: rozkłady cechy w obu próbach nie odbiegają znacząco od normy.

Alternatywna metoda: Test Levene’a, którego zastosowanie nie wymaga sprawdzania założenia normalności (stosowanego w programie SPSS).

Formuła dla wartości empirycznej testu F Fishera:

(4)

gdzie σ 1 2 - duża dyspersja, a σ 2 2 - mniejsza dyspersja. Ponieważ nie wiadomo z góry, która dyspersja jest większa, stosuje się ją do określenia poziomu p Tabela wartości krytycznych dla alternatyw bezkierunkowych. Jeśli Fe > F Kp wówczas dla odpowiedniej liczby stopni swobody R < 0,05 и статистическую гипотезу о равенстве дисперсий можно отклонить (для α = 0,05).

Przykład obliczeń:

Dzieciom zadano regularne zadania z matematyki, po czym losowo wybranej połowie uczniów powiedziano, że nie zaliczyła testu, a pozostałym powiedziano coś przeciwnego. Następnie każde dziecko zostało zapytane, ile sekund zajmie im rozwiązanie podobnego problemu. Eksperymentator obliczył różnicę pomiędzy czasem, w którym dziecko zadzwoniło, a wynikiem wykonania zadania (w sekundach). Oczekiwano, że wiadomość o porażce spowoduje pewne niedobory w poczuciu własnej wartości dziecka. Testowana hipoteza (na poziomie α = 0,005) głosiła, że ​​wariancja zagregowanej samooceny nie zależy od doniesień o sukcesie lub porażce (H 0: σ 1 2 = σ 2 2).

Uzyskano następujące dane:


Krok 1. Oblicz wartość empiryczną kryterium i liczbę stopni swobody korzystając ze wzorów (4):

Krok 2. Zgodnie z tabelą wartości krytycznych kryterium f Fishera dla bezkierunkowy alternatyw, dla których znajdujemy wartość krytyczną numer df = 11; wiem= 11. Jednakże istnieje wartość krytyczna tylko dla numer df= 10 i df wiem = 12. Nie da się przyjąć większej liczby stopni swobody, dlatego przyjmujemy wartość krytyczną numer df= 10: Dla R = 0,05 F Kp = 3,526; Dla R = 0,01 F Kp = 5,418.

Krok 3. Podjęcie statystycznej decyzji i sensowne wnioski. Ponieważ wartość empiryczna przekracza wartość krytyczną dla R= 0,01 (a tym bardziej dla p = 0,05), to w tym przypadku p< 0,01 и принимается альтернативная гипо­теза: дисперсия в группе 1 превышает дисперсию в группе 2 (R< 0,01). W konsekwencji po komunikacie o porażce niedostateczna samoocena jest większa niż po komunikacie o sukcesie.

/ statystyki praktyczne / materiały referencyjne / wartości testu t-Studenta

OznaczającyT -Test t-Studenta na poziomach istotności 0,10, 0,05 i 0,01

ν – stopnie swobody zmienności

Standardowe wartości testu t-Studenta

Liczba stopni swobody

Poziomy istotności

Liczba stopni swobody

Poziomy istotności

Tabela XI

Standardowe wartości testu Fishera stosowane do oceny istotności różnic pomiędzy dwiema próbkami

Stopnie swobody

Poziom istotności

Stopnie swobody

Poziom istotności

Test t-Studenta

Test t-Studenta- ogólna nazwa klasy metod statystycznego testowania hipotez (testów statystycznych) w oparciu o rozkład Studenta. Najczęstsze zastosowania testu t obejmują testowanie równości średnich w dwóch próbach.

T-statystyka jest zwykle konstruowana według następującej ogólnej zasady: licznik jest zmienną losową o zerowych oczekiwaniach matematycznych (jeśli spełniona jest hipoteza zerowa), a mianownikiem jest odchylenie standardowe próbki tej zmiennej losowej, otrzymane jako pierwiastek kwadratowy z niezmieszana estymacja wariancji.

Fabuła

Kryterium to zostało opracowane przez Williama Gossetta w celu oceny jakości piwa w firmie Guinness. W związku ze zobowiązaniami wobec firmy dotyczącymi nieujawniania tajemnic handlowych (zarząd Guinnessa rozważał wykorzystanie w swojej pracy aparatury statystycznej jako takiej) artykuł Gosseta został opublikowany w 1908 roku w czasopiśmie Biometrics pod pseudonimem „Student”.

Wymagania dotyczące danych

Aby zastosować to kryterium, konieczne jest, aby dane oryginalne miały rozkład normalny. W przypadku zastosowania testu dwupróbkowego dla prób niezależnych należy także spełnić warunek równości wariancji. Istnieją jednak alternatywy dla testu t-Studenta dla sytuacji z nierównymi wariancjami.

Do dokładnego testu t (\ displaystyle t) niezbędny jest wymóg rozkładu normalnego danych. Jednak nawet w przypadku innych rozkładów danych możliwe jest użycie -statystyk. W wielu przypadkach ta statystyka ma asymptotycznie standardowy rozkład normalny - N (0, 1) (\ displaystyle N (0,1)) , więc można zastosować kwantyle tego rozkładu. Jednak nawet w tym przypadku często stosuje się kwantyle nie ze standardowego rozkładu normalnego, ale z odpowiedniego rozkładu Studenta, jak w dokładnym teście t (\ displaystyle t). Są one asymptotycznie równoważne, ale w małych próbach przedziały ufności rozkładu Studenta są szersze i bardziej wiarygodne.

Test t dla jednej próby

Służy do testowania hipotezy zerowej o równości oczekiwań matematycznych H. 0: mi (X) = m (\ displaystyle H_ (0): E (X) = m) do E (X) (\ displaystyle E (X)) pewna znana wartość m ( \displaystyle m) .

Oczywiście, jeśli hipoteza zerowa jest spełniona, mi (X ¯) = m (\ displaystyle E ({\ overline (X)}) = m) . Biorąc pod uwagę założoną niezależność obserwacji, V (X ¯) = σ 2 / n (\ Displaystyle V ({\ overline (X)}) = \ sigma ^ (2)/n) . Stosując bezstronne oszacowanie wariancji s X 2 = ∑ t = 1 n (X t - X ¯) 2 / (n - 1) (\ Displaystyle s_ (X) ^ (2) = \ suma _ (t = 1) ^ ( n )(X_(t)-(\overline (X)))^(2)/(n-1)) otrzymujemy następującą statystykę t:

t = X ¯ - m s X / n (\ Displaystyle t = (\ Frac ({\ overline (X)) -m) (s_ (X) / (\ sqrt (n)}}}

Zgodnie z hipotezą zerową rozkład tej statystyki wynosi t (n - 1) (\ displaystyle t (n-1)} . W konsekwencji, jeżeli wartość bezwzględna statystyki przekracza wartość krytyczną danego rozkładu (na danym poziomie istotności), hipoteza zerowa zostaje odrzucona.

Test t dla dwóch prób dla próbek niezależnych

Niech będą dwie niezależne próbki objętości n 1, n 2 (\ displaystyle n_ (1) ~, ~ n_ (2)) zmiennych losowych o rozkładzie normalnym X 1, X 2 (\ displaystyle X_ (1), ~ X_ (2 )). Konieczne jest przetestowanie hipotezy zerowej o równości oczekiwań matematycznych tych zmiennych losowych przy użyciu przykładowych danych.

Rozważ różnicę między średnimi próbki Δ = X ¯ 1 - X ¯ 2 (\ Displaystyle \ Delta = (\ overline (X)) _ (1) - (\ overline (X)) _ (2)} . Oczywiście, jeśli hipoteza zerowa jest prawdziwa, mi (Δ) = M 1 - M 2 = 0 (\ Displaystyle E (\ Delta) = M_ (1) -M_ (2) = 0) . Wariancja tej różnicy jest równa, w oparciu o niezależność próbek: V (Δ) = σ 1 2 n 1 + σ 2 2 n 2 (\ Displaystyle V (\ Delta) = (\ Frac (\ sigma _ (1 )^(2))( n_(1)))+(\frac (\sigma _(2)^(2))(n_(2)))) . Następnie używając nieobciążonego oszacowania wariancji s 2 = ∑ t = 1 n (X t - X ¯) 2 n - 1 (\ Displaystyle s ^ (2) = (\ Frac (\ suma _ (t = 1) ^ (n) ( X_(t)-(\overline (X)))^(2))(n-1))) otrzymujemy nieobciążoną estymację wariancji różnicy pomiędzy średnimi z próby: s Δ 2 = s 1 2 n 1 + s 2 2 n 2 (\ Displaystyle s _ (\ Delta) ^ (2) = (\ Frac (s_ (1) ^ (2)) (n_ (1))) + (\ Frac (s_ (2) ^ ( 2))(n_(2) ))) . Dlatego statystyka t do testowania hipotezy zerowej wynosi

T = X ¯ 1 - X ¯ 2 s 1 2 n 1 + s 2 2 n 2 (\ Displaystyle t = (\ Frac ({\ overline (X)) _ (1) - (\ overline (X)) _ ( 2))(\sqrt ((\frac (s_(1)^(2))(n_(1)))+(\frac (s_(2)^(2))(n_(2))))) ))

Jeśli hipoteza zerowa jest prawdziwa, statystyka ta ma rozkład t (d f) (\ displaystyle t (df)), gdzie re f = (s 1 2 / n 1 + s 2 2 / n 2) 2 (s 1 2 / n 1) 2 / (n 1 - 1) + (s 2 2 / n 2) 2 / (n 2 - 1) (\ Displaystyle df = (\ Frac ((s_ (1) ^ (2) / n_ (1) +s_(2 )^(2)/n_(2))^(2))((s_(1)^(2)/n_(1))^(2)/(n_(1)-1)+ (s_(2 )^(2)/n_(2))^(2)/(n_(2)-1))))

Przypadek równej wariancji

Jeżeli założymy, że wariancje próbek są równe, to

V (Δ) = σ 2 (1 n 1 + 1 n 2) (\ Displaystyle V (\ Delta) = \ sigma ^ (2) \ lewo ({\ Frac (1) (n_ (1))) + (\ frac (1)(n_(2)))\right))

Zatem statystyka t wynosi:

T = X ¯ 1 - X ¯ 2 s X 1 n 1 + 1 n 2 , s X = (n 1 - 1) s 1 2 + (n 2 - 1) s 2 2 n 1 + n 2 - 2 (\ displaystyle t = (\ Frac ({\ overline (X)) _ (1) - (\ overline (X)) _ (2)) (s_ (X) (\ sqrt ({\ frac (1) (n_ (1) )))+(\frac (1)(n_(2))))))~,~~s_(X)=(\sqrt (\frac ((n_(1)-1)s_(1)^ ( 2)+(n_(2)-1)s_(2)^(2))(n_(1)+n_(2)-2))))

Ta statystyka ma rozkład t (n 1 + n 2 - 2) (\ Displaystyle t (n_ (1) + n_ (2) -2))

Test t dla dwóch prób dla próbek zależnych

Aby obliczyć wartość empiryczną kryterium t (\ displaystyle t) w sytuacji testowania hipotezy o różnicach między dwiema próbami zależnymi (na przykład dwiema próbami tego samego testu w odstępie czasu), stosuje się następujący wzór:

T = M re s re / n (\ Displaystyle t = (\ Frac (M_ (d)) (s_ (d) / (\ sqrt (n)}}

gdzie M d (\ displaystyle M_ (d)) to średnia różnica wartości, s d (\ displaystyle s_ (d)) to odchylenie standardowe różnic, a n to liczba obserwacji

Ta statystyka ma rozkład t (n - 1) (\ displaystyle t (n-1)) .

Testowanie wiązania liniowego na parametrach regresji liniowej

Test t może również przetestować dowolne (pojedyncze) ograniczenie liniowe parametrów regresji liniowej oszacowanej metodą zwykłych najmniejszych kwadratów. Niech konieczne będzie przetestowanie hipotezy H. 0: do T b = za (\ displaystyle H_ (0): c ^ (T) b = a) . Oczywiście, jeśli hipoteza zerowa jest spełniona, mi (c T b ^ - a) = do T mi (b ^) - a = 0 (\ displaystyle E (c ^ (T) (\ kapelusz (b)) -a) = c^( T)E((\hat (b)))-a=0) . Tutaj używamy własności nieobciążonych szacunków parametrów modelu metodą najmniejszych kwadratów. E (b ^) = b (\displaystyle E({\hat (b)})=b) . Ponadto V (c T b ^ - a) = do T V (b ^) do = σ 2 do T (X T X) - 1 do (\ Displaystyle V (c ^ (T) (\ kapelusz (b)) -a )=c^(T)V((\hat (b)))c=\sigma ^(2)c^(T)(X^(T)X)^(-1)c) . Używając zamiast nieznanej wariancji jej bezstronnego oszacowania, otrzymujemy następującą statystykę t:

T = do T b ^ - za s do T (X T X) - 1 do (\ Displaystyle t = (\ Frac (c ^ (T) (\ kapelusz (b)) -a) (s (\ sqrt (c ^ (T) (X^(T)X)^(-1)c)))))

Statystyka ta, gdy spełniona jest hipoteza zerowa, ma rozkład , więc jeśli wartość statystyki jest wyższa niż wartość krytyczna, wówczas hipoteza zerowa ograniczenia liniowego zostaje odrzucony.

Testowanie hipotez dotyczących współczynnika regresji liniowej

Szczególnym przypadkiem ograniczenia liniowego jest testowanie hipotezy, że współczynnik regresji jest równy pewnej wartości a (\ displaystyle a) . W tym przypadku odpowiednia statystyka t wynosi:

T = b ^ jot - za s b ^ jot (\ Displaystyle t = (\ Frac ({\ kapelusz (b)) _ (j) -a) (s _ ({\ kapelusz (b)) _ (j)}}}

gdzie jest błędem standardowym oszacowania współczynnika - pierwiastkiem kwadratowym odpowiedniego elementu diagonalnego macierzy kowariancji oszacowań współczynników.

Jeśli hipoteza zerowa jest prawdziwa, rozkład tej statystyki wynosi t (n - k) (\ displaystyle t (nk)) . Jeżeli wartość bezwzględna statystyki jest wyższa niż wartość krytyczna, wówczas różnica między współczynnikiem a (\ displaystyle a) jest istotna statystycznie (nielosowa), w przeciwnym razie jest nieistotna (losowa, czyli prawdziwy współczynnik wynosi prawdopodobnie równa lub bardzo zbliżona do szacunkowej wartości a (\ styl wyświetlania a))

Komentarz

Test oczekiwań matematycznych na jednej próbie można sprowadzić do testowania ograniczenia liniowego parametrów regresji liniowej. W teście jednej próbki jest to „regresja” na stałej. Dlatego s 2 (\ Displaystyle s ^ (2)) regresji jest próbnym oszacowaniem wariancji badanej zmiennej losowej, macierz jest równa n (\ displaystyle n ), a oszacowanie „współczynnika” modelu jest równe średniej z próby. Stąd otrzymujemy wyrażenie na statystykę t podaną powyżej dla przypadku ogólnego.

Podobnie można wykazać, że test dwóch próbek z równymi wariancjami próbek również ogranicza się do testowania ograniczeń liniowych. W teście dwóch próbek jest to „regresja” stałej i zmiennej fikcyjnej identyfikującej podpróbę w zależności od wartości (0 lub 1): y = a + b D (\ displaystyle y = a+bD). Hipotezę o równości oczekiwań matematycznych próbek można sformułować jako hipotezę o równości współczynnika b tego modelu do zera. Można wykazać, że odpowiednia statystyka t do testowania tej hipotezy jest równa statystyce t podanej dla testu dwóch próbek.

Można to również sprowadzić do sprawdzenia więzu liniowego w przypadku różnych dyspersji. W tym przypadku wariancja błędu modelu przyjmuje dwie wartości. Na tej podstawie można również uzyskać statystykę t podobną do tej podanej dla testu dwóch próbek.

Analogi nieparametryczne

Analogiem testu dwóch próbek dla próbek niezależnych jest test U Manna-Whitneya. W przypadku próbek zależnych analogami są test znaków i test T Wilcoxona

Literatura

Student. Prawdopodobny błąd średniej. // Biometria. 1908. Nr 6 (1). Str. 1-25.

Spinki do mankietów

O kryteriach testowania hipotez o jednorodności środków na stronie internetowej Państwowego Uniwersytetu Technicznego w Nowosybirsku

Fabuła

Kryterium to zostało opracowane przez Williama Gossetta w celu oceny jakości piwa w Guinness. W związku ze zobowiązaniami wobec firmy dotyczącymi nieujawniania tajemnic handlowych (zarząd Guinnessa rozważał wykorzystanie w swojej pracy aparatury statystycznej jako takiej) artykuł Gosseta został opublikowany w 1908 roku w czasopiśmie Biometrics pod pseudonimem „Student”.

Wymagania dotyczące danych

Aby zastosować to kryterium, konieczne jest, aby dane oryginalne miały rozkład normalny. W przypadku zastosowania testu dwupróbkowego dla prób niezależnych należy także spełnić warunek równości wariancji. Istnieją jednak alternatywy dla testu t-Studenta dla sytuacji z nierównymi wariancjami.

Test t dla dwóch prób dla próbek niezależnych

W przypadku nieco innej liczebności próby stosuje się uproszczony wzór do obliczeń przybliżonych:

Jeżeli wielkość próby różni się znacznie, stosuje się bardziej złożony i dokładny wzór:

Gdzie M 1 ,M 2 - średnie arytmetyczne, σ 1, σ 2 - odchylenia standardowe, oraz N 1 ,N 2 - rozmiary próbek.

Test t dla dwóch prób dla próbek zależnych

Do obliczenia wartości empirycznej testu t w sytuacji testowania hipotezy o różnicach pomiędzy dwiema próbami zależnymi (np. dwiema próbami tego samego testu w odstępie czasu) stosuje się następujący wzór:

Gdzie M D jest średnią różnicą wartości, oraz σ D- odchylenie standardowe różnic.

Liczbę stopni swobody oblicza się ze wzoru

Test t dla jednej próby

Służy do testowania hipotezy o różnicy między wartością średnią a pewną znaną wartością:

Liczbę stopni swobody oblicza się ze wzoru

Analogi nieparametryczne

Analogiem testu dwóch próbek dla próbek niezależnych jest test U Manna-Whitneya. W przypadku próbek zależnych analogami są test znaków i test T Wilcoxona

Automatyczne obliczanie testu t-Studenta


Fundacja Wikimedia. 2010.

  • Guinnessa
  • Zbiornik geochemiczny

Zobacz, co oznacza „test T-Studenta” w innych słownikach:

    Test t-c studenta- Kryterium Studenta lub t c. lub S. test t jest kryterium statystycznym istotności różnicy pomiędzy porównywanymi średnimi. Określony przez stosunek tej różnicy do błędu różnicy: Dla wartości t... ... Genetyka. słownik encyklopedyczny

    Test t-Studenta- Test t-Studenta to ogólna nazwa klasy metod statystycznego testowania hipotez (testów statystycznych) w oparciu o porównanie z rozkładem Studenta. Najczęstsze przypadki stosowania testu t są związane ze sprawdzaniem równości... ...Wikipedia

    Test t-Studenta- Stjūdento kriterijus statusas T sritis augalininkystė apibrėžtis spódnica tarp dviejų vidurkių patikimumo rodiklis, išreiškiamas spódnicumo ir jo paklaidos santykiu. atitikmenys: pol. Test studencki rus. Test studenta... Žemės ūkio augalų selekcijos ir sėklininkystės terminų žodynas

    Test t-Studenta- Test statystyczny, w którym przy założeniu hipotezy zerowej użyte statystyki odpowiadają rozkładowi t (rozkładowi Studenta). Notatka. Oto przykłady zastosowania tego kryterium: 1. sprawdzenie równości średniej z... ... Słownik statystyki socjologicznej

    KRYTERIUM STUDENTA- Biometryczny wskaźnik wiarygodności różnicy (td) pomiędzy średnimi wartościami dwóch grup zwierząt w porównaniu do siebie (M1 i M2) dla dowolnej cechy. Wiarygodność różnicy określa wzór: Otrzymaną wartość td porównuje się z... ... Terminy i definicje stosowane w hodowli, genetyce i rozrodzie zwierząt gospodarskich

    KRYTERIUM STUDENTA- ocenia bliskość dwóch wartości średnich z punktu widzenia zakwalifikowania ich jako przypadkowych (na danym poziomie istotności) lub nie, odpowiadając na pytanie, czy wartości średnie różnią się od siebie istotnie statystycznie /B.A. Ashmarin. - M., 1978.


  • Żeleznyak, Yu.D., Petrov P.K. Podstawy działalności naukowo-metodologicznej w kulturze fizycznej i sporcie [Tekst]: Podręcznik. pomoc dla studentów wyższa stopa. instytucje edukacyjne / Yu.D. Żeleznyak, P.K. Pietrow. – M.: Centrum Wydawnicze „Akademia”, 2002, - 264 s.

  • Kuramshin, Yu.F. Teoria i metodologia kultury fizycznej [Tekst]: podręcznik / Yu.F. Kuramshin. – M.: Sport Radziecki, 2004. – 464 s.

  • Nowikow, A.M. Praca naukowo-eksperymentalna w instytucji edukacyjnej [Tekst] / A.M. Nowikow. – M.: Kształcenie zawodowe, 1998. – 134 s.

  • Petrov, P.K. Kultura fizyczna [Tekst]: zajęcia i końcowe prace kwalifikacyjne / P.K. Pietrow. - M.: Wydawnictwo VLADOS-PRESS, 2003.- 112 s.

  • Program do uzyskania końcowego świadectwa państwowego w specjalności 050720.65 - Wychowanie fizyczne, kwalifikacja nauczyciela wychowania fizycznego [Tekst] / komp. W I. Shalginova, OA Pawluczenko, A.V. Fominych. – Abakan: Wydawnictwo Uniwersytetu Stanowego Khakass im. N.F.Katanova, 2010.

  • Ulyaeva, L.G. Kultura fizyczna. Część 5 Teoria i metody kultury fizycznej [Tekst] / L.G. Ulajjewa, S.V. Shepel. – M.: Modern State University Kształcenie na odległość, 2003. – s. 32-55.
  • Aneks 1(wymagany)

    Formularz okładki pracy dyplomowej
    ^ MINISTERSTWO EDUKACJI I NAUKI ROSJI


    ^

    STANOWISKO
    UKOŃCZENIE SZKOŁY

    ^ PRACA KWALIFIKUJĄCA
    Student ___________________

    Dyrektor naukowy

    _______________________________

    (imię i nazwisko, stopień naukowy, tytuł naukowy)

    Abakan 2014

    Załącznik 2(wymagany)

    Forma strony tytułowej pracy dyplomowej

    ^ MINISTERSTWO EDUKACJI I NAUKI ROSJI

    Federalna państwowa instytucja edukacyjna budżetowa

    wyższe wykształcenie zawodowe

    „UNIWERSYTET STANU KHAKASS nazwany na cześć. N.F. KATANOWA”
    ^ WYDZIAŁ WYCHOWANIA FIZYCZNEGO
    Katedra Teorii i Metodologii Kultury Fizycznej i Sportu

    Specjalność 050720.65 „Wychowanie fizyczne”

    STANOWISKO

    ^ PRACA KWALIFIKUJĄCA ABSOLWENTA
    Absolwent ______________ __________________

    (podpis) (imię i nazwisko)

    Konsultant ______________ __________________

    (podpis) (imię i nazwisko)

    Doradca naukowy ______________ __________________

    (podpis) (imię i nazwisko)

    Recenzent ______________ __________________

    (podpis) (imię i nazwisko)

    „Przyznaj się do ochrony”

    Głowa dział: ____________

    _________________________
    „____”___________20___

    Abakan, 2014

    Dodatek 3(wymagany)

    Przykład projektu spisu treści
    Spis treści

    Wstęp………………………………………………………………………………………….3

    Rozdział 1. Przegląd literatury dotyczącej tematu badań...........................................................7


      1. Pojęcie zdolności koordynacyjnych……………………………...…………...…7
    1.2. Koordynacja funkcji organizmu podstawą kontroli ruchu………………………………………………………………………………….……….. .13

    1.2.1. Zasada korekcji sensorycznej w kontroli ruchu…………………...…..13

    1.2.2. Rola układów sensorycznych w sterowaniu ruchem…………………………………17

    1.3. Charakterystyka anatomiczno-fizjologiczna i psychologiczno-pedagogiczna dzieci w wieku 13-14 lat………………………………………………………..…………………………… ………………………………… ....21

    Rozdział 2. Metody i organizacja badań………………………………..………….39

    2.1. Metody badawcze…………………………………..……………………………......39

    2.2. Organizacja badania. ……………………………………………………………………………41

    Rozdział 3. Wyniki badań i dyskusja………………………..……...........48

    Wniosek……………………………………………………............................. ..................56

    Bibliografia……………..……………………………………………………………......58

    Aplikacje……………..……………………………………………………...………….59

    Dodatek 4

    Przykłady opisów bibliograficznych różnych typów publikacji
    ^ Materiały legislacyjne

    Federacja Rosyjska. Konstytucja (1993). Konstytucja Federacji Rosyjskiej [Tekst]: oficjalny. tekst. – M.: Marketing, 2001. – 39 s.

    Zasady

    Zasady bezpieczeństwa dotyczące obsługi konstrukcji hydraulicznych i urządzeń hydromechanicznych organizacji dostarczających energię [Tekst]: RD 153-34.0-03.205–2001: zatwierdzony. Ministerstwo Energii Rosji. Federacja 13.04.01: wejście. obowiązuje od 01.11.01. – M.: ENAS, 2001. – 158 s.

    Książki

    Agafonowa, N. N. Prawo cywilne [Tekst]: podręcznik. podręcznik dla uniwersytetów / N. N. Agafonova, T. V. Bogacheva, L. I. Glushkova; pod. całkowity wyd. A. G. Kalpina; automatyczny wejście Sztuka. N. N. Polivaev; M-w ogóle i prof. Edukacja Federacji Rosyjskiej, Moskwa. państwo prawny akad. – wyd. 2., poprawione i dodatkowe – M.: Yurist, 2002. – 542 s.

    Rozprawy

    Belozerov, I. V. Polityka religijna Złotej Ordy na Rusi w XIII–XIV wieku. [Tekst]: diss. ...cad. jest. Nauki: 07.00.02: chroniony 01.22.02: zatwierdzony. 15.07.02 / Biełozerow Iwan Walentinowicz. – M., 2002. – 215 s.

    Czasopismo

    Aktualne problemy współczesnej nauki [Tekst]: analityk informacji. czasopismo / założyciel firmy Sputnik+ Sp. – 2001, czerwiec – . – M.: Sputnik+, 2001–. - Dwa miesiące. – ISSN 1680-2721.

    2001, nr 1–3. – 2000 egzemplarzy.

    Artykuł w gazecie

    Balsevich, V.K. Sport olimpijski i wychowanie fizyczne: relacje i dysocjacje // Teoria i praktyka kultury fizycznej. - 1996, nr 10. - s. 2-7.
    ^ WYDANIA WIELOtomowe

    Dokument jako całość

    Gippius, Z. N. Dzieła [Tekst]: w 2 tomach / Zinaida Gippius; [wstęp. Art., przygotowany. tekst i komentarz. T. G. Yurchenko; Rossa. akad. Nauki, Instytut Naukowy. Informacja przez społeczeństwo nauki]. – M.: Lakom-książka: Gabestro, 2001. – 22 cm – (Złota proza ​​srebrnego wieku). - Na pasie. tylko automat i czapka. ser. – 3500 egzemplarzy. – ISBN 5-85647-056-7 (przetłumaczony).

    T. 1: Powieści. – 367 s. – Bibliografia w notatce: s. 360–366. – Zawartość: bez talizmanu; Zwycięzcy; Zmierzch Ducha. – W załączniku: Z. N. Gippius / V. Bryusov. – ISBN 5-85647-057-5.

    T. 2: Powieści. – 415 s. – Zawartość: lalka diabła; Biografia w rozdziale 33. ; Roman-Carewicz: historia jednego przedsięwzięcia; Miłość kogoś innego. – ISBN 5-85647-058-3.

    Gippius, Z. N. Dzieła [Tekst]: w 2 tomach / Zinaida Gippius; [wstęp. Art., przygotowany. tekst i komentarz. T. G. Yurchenko; Rossa. akad. Nauki, Instytut Naukowy. Informacja przez społeczeństwo nauki]. – M.: Lakom-książka: Gabestro, 2001. – 2

    T. ; 22 cm – (Złota proza ​​srebrnego wieku). - Na pasie. tylko automat i czapka. ser. – 3500 egzemplarzy. – ISBN 5-85647-056-7 (przetłumaczony).

    ^ Oddzielny tom

    Kazmin, V. D. Informator lekarza rodzinnego [Tekst]: o godzinie 3 / Władimir Kazmin. – M.: AST: Astrel, 2001–. – 21 cm – ISBN

    5-17-011142-8 (AST).

    Część 2: Choroby wieku dziecięcego. – 2002. – 503, s. 2002. : chory. – 8000 egzemplarzy. – numer ISBN

    5-17-011143-6 (AST) (na pasie).

    ^ Artykuł z...

    ...książka lub inna publikacja jednorazowa

    Dvinyaninova, G. S. Komplement: Status komunikacyjny lub strategia w dyskursie [Tekst] / G. S. Dvinyaninova // Społeczna siła języka: zbiór. naukowy tr. / Woroneż. międzyregionalny Instytut Stowarzyszeń. Nauki, Woroneż. państwo Uniwersytet, Fak. rzymsko-germański. historie. – Woroneż, 2001. – s. 101–106.
    ... publikacja seryjna

    Michajłow, SA Jadąc drogą europejską [Tekst]: system płatnych dróg w Rosji znajduje się na początku swojej drogi. etapy rozwoju / Siergiej Michajłow // Gaz Nezavisimaya. – 2002 r. – 17 czerwca.

    Nadeszła jesień, a to oznacza, że ​​czas rozpocząć nowy projekt tematyczny „Analiza statystyczna z R”. Przyjrzymy się w nim metodom statystycznym pod kątem ich zastosowania w praktyce: dowiemy się, jakie metody istnieją, w jakich przypadkach i jak je realizować. Moim zdaniem test Studenta, czyli test t jest idealny jako wprowadzenie w świat analizy statystycznej. Test t-Studenta jest dość prosty i orientacyjny, a także wymaga minimum podstawowej wiedzy ze statystyki, z którą czytelnik może zapoznać się czytając ten artykuł.

    Notatka 1: tutaj i w innych artykułach nie zobaczysz wzorów i wyjaśnień matematycznych, ponieważ... Informacje przeznaczone są dla studentów kierunków przyrodniczych i humanistycznych, którzy stawiają dopiero pierwsze kroki w statystyce. analiza.

    Co to jest test t i w jakich przypadkach należy go stosować?

    Na początek warto powiedzieć, że w statystyce często obowiązuje zasada brzytwy Ockhama, która głosi, że nie ma sensu przeprowadzać skomplikowanych analiz statystycznych, jeśli można zastosować prostszą (nie należy kroić chleba piłą łańcuchową, jeśli się ma nóż). Dlatego pomimo swojej prostoty, test t to poważne narzędzie, jeśli wiesz, co to jest i w jakich przypadkach należy go używać.

    Ciekawe, że tę metodę stworzył William Gosset, chemik zaproszony do pracy w fabryce Guinnessa. Opracowany przez niego test początkowo służył do oceny jakości piwa. Chemikom fabryki zakazano jednak samodzielnego publikowania prac naukowych pod własnym nazwiskiem. Dlatego w 1908 roku William opublikował swój artykuł w czasopiśmie „Biometrika” pod pseudonimem „Student”. Później wybitny matematyk i statystyk Ronald Fisher udoskonalił tę metodę, która następnie rozpowszechniła się pod nazwą testu t-Studenta.

    Test Studenta (test t) to metoda statystyczna, która pozwala porównać średnie wartości dwóch próbek i na podstawie wyników badań wyciągnąć wniosek, czy różnią się one od siebie statystycznie, czy nie. Jeśli chcesz wiedzieć czy średnia długość życia w Twoim regionie odbiega od średniej krajowej; porównać plony ziemniaków na różnych obszarach; lub czy ciśnienie krwi zmienia się przed i po przyjęciu nowego leku test t może Ci się przydać. Dlaczego może? Ponieważ aby to przeprowadzić, Konieczne jest, aby przykładowe dane miały rozkład zbliżony do normalnego. W tym celu istnieją metody oceny, które pozwalają stwierdzić, czy w danym przypadku dopuszczalne jest założenie, że dane mają rozkład normalny, czy też nie. Porozmawiajmy o tym bardziej szczegółowo.

    Rozkład normalny danych i metody jego estymacji qqplot i shapiro.test

    Rozkład normalny danych jest typowy dla danych ilościowych, na których rozkład ma wpływ wiele czynników lub jest losowy. Rozkład normalny charakteryzuje się kilkoma cechami:

    • Jest zawsze symetryczny i ma kształt dzwonu.
    • Wartości średnie i mediany są takie same.
    • 68,2% wszystkich danych mieści się w obrębie jednego odchylenia standardowego w obu kierunkach, w obrębie dwóch – 95,5%, w obrębie trzech – 99,7%

    Stwórzmy próbkę losową o rozkładzie normalnym na , gdzie całkowita liczba pomiarów = 100, średnia arytmetyczna = 5 i odchylenie standardowe = 1. Następnie wykreślmy to w postaci histogramu:

    moje dane<- rnorm(100, mean = 5, sd = 1) hist(mydata, col = "light green")

    Twój wykres może nieznacznie różnić się od mojego, ponieważ liczby są generowane losowo. Jak widać, dane nie są idealnie symetryczne, ale wydają się utrzymywać kształt rozkładu normalnego. Będziemy jednak używać bardziej obiektywnych metod w celu określenia normalności danych.

    Jednym z najprostszych testów normalności jest wykres kwantylowy (qqplot). Istota testu jest prosta: jeśli dane mają rozkład normalny, to nie powinny znacznie odbiegać od linii kwantyli teoretycznych i wychodzić poza przedziały ufności. Zróbmy ten test w R.

    pakiet „samochód” w środowisku R qqPlot(mydata) #uruchom test

    Jak widać z wykresu, nasze dane nie wykazują poważnych odchyleń od teoretycznego rozkładu normalnego. Ale czasami z pomocą wykres qq Nie da się udzielić jednoznacznej odpowiedzi. W takim przypadku powinieneś użyć Test Shapiro-Wilka , który opiera się na hipotezie zerowej, że nasze dane mają rozkład normalny. Jeśli wartość P jest mniejsza niż 0,05 ( wartość p < 0.05), то мы вынуждены отклонить нулевую гипотезу. P-значение в этом случае будет говорить о том, что вероятность ошибки при отклонении нулевой гипотезы будет равна менее 5%.

    Uruchomienie testu Shapiro-Wilka w R jest łatwe. Aby to zrobić, wystarczy wywołać funkcję shapiro.test i wstawić nazwę swoich danych w nawiasach. W naszym przypadku wartość p powinna być znacznie większa niż 0,05, co nie pozwala na odrzucenie hipotezy zerowej, że nasze dane mają rozkład normalny.

    Uruchamianie testu t-Studenta w środowisku R

    Jeśli zatem dane z próbek mają rozkład normalny, można bezpiecznie przystąpić do porównywania średnich z tych próbek. Istnieją trzy główne typy testu t, które są stosowane w różnych sytuacjach. Przyjrzyjmy się każdemu z nich na ilustrujących przykładach.

    Test t dla jednej próby

    Należy wybrać test t dla jednej próby jeśli porównasz próbkę z dobrze znaną średnią. Na przykład, czy średni wiek mieszkańców Północnokaukaskiego Okręgu Federalnego różni się od ogólnego wieku w Rosji? Istnieje opinia, że ​​​​klimat Kaukazu i cechy kulturowe zamieszkujących go ludów przyczyniają się do przedłużania życia. Aby przetestować tę hipotezę, pobierzemy dane z RosStat (tabele średniej długości życia według regionów Rosji) i zastosujemy test t dla jednej próby. Ponieważ test t-Studenta opiera się na testowaniu hipotez statystycznych, za hipotezę zerową przyjmiemy, że nie ma różnic pomiędzy średnim oczekiwanym poziomem trwania dla Rosji i republik Północnego Kaukazu. Jeżeli różnice istnieją, to w celu uznania ich za istotne statystycznie wartość p powinna być mniejsza niż 0,05 (logika jest taka sama jak w opisanym powyżej teście Shapiro-Wilka).

    Załadujmy dane do R. W tym celu utworzymy wektor ze średnimi wartościami dla republik Kaukazu (w tym Adygei). Następnie przeprowadźmy test t dla jednej próby, określając w parametrze muŚrednia długość życia w Rosji wynosi 70,93.

    rosstat<-c(79.42, 75.83, 74.16, 73.91, 73.82, 73.06, 72.01) qqPlot(rosstat) shapiro.test(rosstat) t.test(rosstat, mu = 70,93)

    Mimo że w próbie mamy tylko 7 punktów, generalnie przechodzą one testy normalności i możemy na nich polegać, ponieważ dane te zostały już uśrednione dla regionu.

    Wyniki testu t wskazują, że średnia długość życia mieszkańców Kaukazu Północnego (74,6 lat) jest rzeczywiście wyższa od średniej rosyjskiej (70,93 lat), a wyniki testu są istotne statystycznie (p< 0.05).

    Niezależny test t dla dwóch próbek

    Stosuje się test t dla dwóch próbek, podczas porównywania dwóch niezależnych próbek. Załóżmy, że chcemy sprawdzić, czy plony ziemniaków różnią się na północy i południu regionu. W tym celu zebraliśmy dane z 40 gospodarstw: 20 z nich znajdowało się na północy i tworzyło próbę „Północ”, a pozostałe 20 znajdowało się na południu, tworząc próbę „Południe”.

    Załadujmy dane do środowiska R. Oprócz sprawdzenia normalności danych przydatne będzie utworzenie „wykresu wąsów”, na którym będzie można zobaczyć mediany i rozrzut danych dla obu próbek.

    Północ<- c(122, 150, 136, 129, 169, 158, 132, 162, 143, 179, 139, 193, 155, 160, 165, 149, 173, 173, 141, 166) qqPlot(Północ) shapiro.test(Północ) Południe<- c(170, 163, 178, 150, 166, 142, 157, 149, 151, 164, 163, 161, 159, 139, 180, 155, 144, 139, 151, 160) qqPlot(Północ) shapiro.test(Północ) boxplot(Północ, Południe)

    Jak widać z wykresu, mediany próbek nie różnią się zbytnio od siebie, jednak rozrzut danych jest znacznie większy na północy. Sprawdźmy, czy wartości średnie różnią się statystycznie, korzystając z funkcji t.test. Tym razem jednak w miejsce parametru mu podajemy nazwę drugiej próbki. Wyniki badań, które widać na poniższym rysunku, wskazują, że średni plon ziemniaków na północy nie różni się statystycznie od plonów na południu ( P = 0.6339).

    Dwie próbki dla próbek zależnych ( zależne dwie próbki T-test)

    Trzeci rodzaj testu t stosuje się, gdy jeśli elementy próbek zależą od siebie. Jest idealny dla kontrole powtarzalności eksperyment: jeśli powtórzone dane nie różnią się statystycznie od oryginału, to powtarzalność danych jest wysoka. Powszechnie stosowany jest również test t dla dwóch prób dla próbek zależnych w badaniach medycznych podczas badania wpływu leku na organizm przed i po podaniu.

    Aby uruchomić go w R należy wprowadzić tę samą funkcję t.test. Jednakże w nawiasach po tabelach danych należy wpisać dodatkowy argument pair = TRUE. Argument ten mówi, że Twoje dane są od siebie zależne. Na przykład:

    t.test(eksperyment, povtor.experimenta, sparowany = PRAWDA) t.test(davlenie.do.priema, davlenie.posle.priema, sparowany = PRAWDA)

    Istnieją również dwa dodatkowe argumenty funkcji t.test, które mogą poprawić jakość wyników testu: var.equal i alternatywny . Jeśli wiesz, że różnice między próbkami są równe, wstaw argument var.equal = TRUE . Jeżeli chcesz przetestować hipotezę, że różnica pomiędzy średnimi w próbach jest znacząco mniejsza lub większa od 0, wpisz argument alternatywny="mniej" lub alternatywny="większy" (domyślnie hipoteza alternatywna mówi, że próbki po prostu różnią się od siebie przyjacielem: alternatywa="two.sided" ).

    Wniosek

    Artykuł okazał się dość długi, ale teraz już wiesz: czym jest test Studenta i rozkład normalny; jak korzystać z funkcji wykres qq I shapiro.test sprawdź normalność danych w R; a także przeanalizował trzy rodzaje testów t i przeprowadził je w środowisku R.

    Temat nie jest łatwy dla tych, którzy dopiero zaczynają zapoznawać się z analizą statystyczną. Dlatego nie wahajcie się zadawać pytań, chętnie na nie odpowiem. Guru statystyki, popraw mnie, jeśli gdzieś popełniłem błąd. Ogólnie rzecz biorąc, napiszcie swoje komentarze, przyjaciele!