Тестирање на хипотезата за нормалната распределба на населението со помош на критериумот Пирсон. Критериуми за добросостојба за дистрибуции

Тестот за корелација Пирсон е метод на параметарска статистика што ви овозможува да го одредите присуството или отсуството на линеарна врска помеѓу два квантитативни показатели, како и да ја оцените неговата близина и статистичка значајност. Со други зборови, тестот за корелација Пирсон ви овозможува да одредите дали постои линеарна врска помеѓу промените во вредностите на две променливи. Во статистичките пресметки и заклучоци, коефициентот на корелација обично се означува како r xyили Rxy.

1. Историја на развојот на критериумот на корелација

Тестот за корелација Пирсон беше развиен од тим британски научници предводени од Карл Пирсон(1857-1936) во 90-тите години на 19 век, за да се поедностави анализата на коваријансата на две случајни променливи. Покрај Карл Пирсон, луѓето работеа и на критериумот за корелација Пирсон Френсис ЕџвортИ Рафаел Велдон.

2. За што се користи Пирсон тестот за корелација?

Тестот за корелација Пирсон ви овозможува да ја одредите близината (или јачината) на корелацијата помеѓу два индикатора измерени на квантитативна скала. Користејќи дополнителни пресметки, можете исто така да одредите колку е статистички значајна идентификуваната врска.

На пример, користејќи го критериумот за корелација Пирсон, можете да одговорите на прашањето дали постои врска помеѓу температурата на телото и содржината на леукоцити во крвта за време на акутни респираторни инфекции, помеѓу висината и тежината на пациентот, помеѓу содржината на флуор во водата за пиење и инциденцата на забен кариес кај населението.

3. Услови и ограничувања за примена на Пирсон хи-квадрат тест

  1. Споредливите индикатори мора да се мерат во квантитативна скала(на пример, пулс, телесна температура, број на бели крвни зрнца на 1 ml крв, систолен крвен притисок).
  2. Користејќи го тестот за корелација Пирсон, можеме само да одредиме присуство и сила на линеарна врскапомеѓу количините. Другите карактеристики на врската, вклучувајќи ја насоката (директна или обратна), природата на промените (праволиниски или криволинеарни), како и присуството на зависност на една променлива од друга, се одредуваат со помош на регресивна анализа.
  3. Бројот на споредени количини мора да биде еднаков на два. Во случај на анализа на односот на три или повеќе параметри, треба да го користите методот факторска анализа.
  4. Тестот за корелација Пирсон е параметарски, и затоа услов за негово користење е нормална дистрибуцијаспоредени променливи. Доколку е неопходно да се изврши корелациона анализа на индикаторите чија дистрибуција се разликува од нормалната, вклучувајќи ги и оние измерени на редна скала, треба да се користи коефициентот на корелација на ранг на Спирман.
  5. Треба јасно да се разликуваат концептите на зависност и корелација. Зависноста на количините го одредува присуството на корелација меѓу нив, но не и обратно.

На пример, висината на детето зависи од неговата возраст, односно колку е постаро детето толку е повисоко. Ако земеме две деца на различна возраст, тогаш со висок степен на веројатност растот на постарото дете ќе биде поголем од оној на помалото. Овој феномен се нарекува зависност, што имплицира причинско-последична врска помеѓу индикаторите. Се разбира, меѓу нив има и корелација врска, што значи дека промените во еден индикатор се придружени со промени во друг индикатор.

Во друга ситуација, разгледајте ја врската помеѓу висината на детето и отчукувањата на срцето (HR). Како што е познато, и двете од овие вредности директно зависат од возраста, така што во повеќето случаи, децата со поголема висина (а со тоа и постара возраст) ќе имаат пониски вредности на срцевиот ритам. Тоа е, корелација врскаќе се набљудува и може да има доста висока гужва. Меѓутоа, ако ги земеме децата на иста возраст, Но различни висини, тогаш, најверојатно, нивниот пулс ќе се разликува незначително, и затоа можеме да заклучиме дека независностОтчукувањата на срцето од висина.

Горенаведениот пример покажува колку е важно да се прави разлика помеѓу основните концепти во статистиката. комуникацииИ зависностииндикатори за донесување правилни заклучоци.

4. Како да се пресмета коефициентот на корелација на Пирсон?

Коефициентот на корелација на Пирсон се пресметува со следнава формула:

5. Како да се протолкува вредноста на Пирсоновиот коефициент на корелација?

Вредностите на коефициентот на корелација на Пирсон се толкуваат врз основа на нивните апсолутни вредности. Можните вредности на коефициентот на корелација варираат од 0 до ±1. Колку е поголема апсолутната вредност на r xy, толку е поголема блискоста на односот помеѓу двете величини. r xy = 0 укажува на целосен недостаток на комуникација. r xy = 1 – означува присуство на апсолутна (функционална) врска. Ако вредноста на критериумот за корелација Пирсон се покаже дека е повеќе од 1 или помала од -1, направена е грешка во пресметките.

За да се процени затегнатоста или силата на корелацијата, обично се користат општоприфатени критериуми, според кои апсолутните вредности на r xy< 0.3 свидетельствуют о слабврска, r xy вредности од 0,3 до 0,7 - за поврзување просекзатегнатост, вредности на r xy > 0,7 - o силнакомуникации.

Попрецизна проценка на јачината на корелацијата може да се добие ако користите Чадок маса:

Одделение статистичка значајностКоефициентот на корелација r xy се изведува со користење на t-тестот, пресметан со следнава формула:

Добиената t r вредност се споредува со критичната вредност на одредено ниво на значајност и бројот на степени на слобода n-2. Ако t r надминува t крит, тогаш се донесува заклучок за статистичката значајност на идентификуваната корелација.

6. Пример за пресметување на коефициентот на корелација на Пирсон

Целта на студијата беше да се идентификува, да се утврди блискоста и статистичката значајност на корелацијата помеѓу два квантитативни индикатори: нивото на тестостерон во крвта (X) и процентот на мускулна маса во телото (Y). Почетните податоци за примерок составен од 5 субјекти (n = 5) се сумирани во табелата.

Во некои случаи, истражувачот не знае однапред точно според кој закон се распределуваат набљудуваните вредности на карактеристиката што се проучува. Но, тој може да има доста добри причини да претпостави дека распределбата е предмет на еден или друг закон, на пример, нормална или униформа. Во овој случај, се поставуваат главните и алтернативните статистички хипотези од следниот тип:

    Х 0: распределбата на набљудуваната карактеристика е предмет на законот за распределба А,

    Х 1: дистрибуцијата на набљудуваната карактеристика се разликува од А;

каде што како Аможе да се појави еден или друг закон за распределба: нормален, униформен, експоненцијален итн.

Тестирањето на хипотезата за очекуваниот закон за дистрибуција се врши со користење на таканаречените критериуми за добрина на одговарање. Постојат неколку критериуми за договор. Најуниверзален од нив е критериумот Пирсон, бидејќи е применлив за секаков вид дистрибуција.

-Пирсон критериум

Типично, емпириските и теоретските фреквенции се разликуваат. Дали несовпаѓањето на фреквенцијата е случајно? Пирсоновиот критериум дава одговор на ова прашање; сепак, како и секој статистички критериум, тој не ја докажува валидноста на хипотезата во строго математичка смисла, туку само ја утврдува нејзината согласност или несогласување со податоците од набљудувањето на одредено ниво на значајност.

Значи, нека се добие статистичка дистрибуција на вредностите на атрибутите од волуменски примерок, каде што се набљудуваните вредности на атрибутот и се соодветните фреквенции:

Суштината на критериумот Пирсон е да се пресмета критериумот користејќи ја следната формула:

каде е бројот на цифри на набљудуваните вредности и е теоретските фреквенции на соодветните вредности.

Јасно е дека колку се помали разликите, толку емпириската дистрибуција е поблиска до емпириската, затоа, колку е помала вредноста на критериумот, толку посигурно може да се констатира дека емпириската и теоретската дистрибуција подлежат на истиот закон.

Алгоритам за критериум Пирсон

Алгоритмот за критериум Пирсон е едноставен и се состои од извршување на следните чекори:

Значи, единственото нетривијално дејство во овој алгоритам е определувањето на теоретските фреквенции. Тие, се разбира, зависат од законот за распределба, и затоа се различно дефинирани за различни закони.

Пирсон тест

Пирсон тест, или χ 2 тест- најчесто користен критериум за тестирање на хипотезата за законот за распределба. Во многу практични проблеми, точниот закон за распределба е непознат, односно тоа е хипотеза која бара статистичка проверка.

Да ја означиме со X случајната променлива што се проучува. Да претпоставиме дека сакаме да тестираме хипотеза Х 0 дека оваа случајна променлива го почитува законот за распределба Ф(x) . За да ја тестираме хипотезата, ќе направиме примерок составен од n независни набљудувања на случајната променлива X. Користејќи го примерокот, можеме да конструираме емпириска дистрибуција Ф * (x) од случајната променлива што се проучува. Споредба на емпириски Ф * (x) и теоретските распределби се направени со помош на специјално избрана случајна променлива - критериумот за доброто одговарање. Еден од овие критериуми е критериумот Пирсон.

Критериум статистика

За проверка на критериумот, се внесува статистика:

Каде - проценета веројатност за удирање јас-интервал, - соодветната емпириска вредност, n јас- број на примерок елементи од јас-ти интервал.

Оваа количина, пак, е случајна (поради случајноста на X) и мора да ја почитува распределбата χ 2.

Критериумско правило

Пред да се формулира правило за прифаќање или отфрлање на хипотеза, потребно е да се земе предвид тоа Пирсоновиот критериум има десна критична област.

Правило.
Ако добиената статистика го надминува квантилот на законот за распределба на дадено ниво на значајност со или со степени на слобода, каде што k е бројот на набљудувања или бројот на интервали (за случај на серија на варијации на интервали), а p е бројот на проценетите параметри на законот за распределба, тогаш хипотезата се отфрла. Во спротивно, хипотезата се прифаќа на наведеното ниво на значајност.

Литература

  • Кендал М., Стјуарт А.Статистички заклучоци и врски. - М.: Наука, 1973 година.

исто така види

  • Критериум Пирсон на веб-страницата на Државниот универзитет во Новосибирск
  • Хи-квадратни тестови на веб-страницата на Државниот технички универзитет во Новосибирск (Препораки за стандардизација R 50.1.033–2001)
  • За изборот на бројот на интервали на веб-страницата на Државниот технички универзитет во Новосибирск
  • За критериумот Никулин на веб-страницата на Државниот технички универзитет Новосибирск

Фондацијата Викимедија. 2010 година.

Погледнете што е „критериумот Пирсон“ во другите речници:

    Пирсоновиот тест или х² тестот (Chi квадрат) е најчесто користен критериум за тестирање на хипотезата за законот за распределба. Во многу практични проблеми, точниот закон за распределба е непознат, односно хипотеза е дека ... ... Википедија

    Или Колмогоров Смирнов тест за добрина е статистички тест кој се користи за да се утврди дали две емпириски распределби го почитуваат истиот закон или дали добиената дистрибуција го почитува претпоставениот модел... ... Википедија

    - (максимален критериум) еден од критериумите за одлучување во услови на неизвесност. Критериум за екстремен песимизам. Историја Валдовиот критериум беше предложен од Абрахам Валд во 1955 година за примероци со еднаква големина, а потоа се прошири на ... Википедија

    Тестот Валис е дизајниран да ја тестира еднаквоста на медијаните на неколку примероци. Овој критериум е повеќедимензионална генерализација на тестот Wilcoxon-Mann-Whitney. Критериумот Крускал Валис е критериум за рангирање, па затоа е непроменлив во однос на која било... ... Википедија

    - (F тест, φ* тест, тест со најмалку значајна разлика) постериори статистички тест кој се користи за споредување на варијансите на две варијации серии, односно за одредување значајни разлики помеѓу групните средини во ... ... Википедија

    Кохран тестот се користи кога се споредуваат три или повеќе примероци со иста големина. Несовпаѓањето помеѓу варијансите се смета за случајно на избраното ниво на значајност ако: каде е квантилот на случајната променлива со бројот на сумирани... ... Википедија

    Статистички тест именуван по Хуберт Лилифорс, професор по статистика на Универзитетот Џорџ Вашингтон, кој е модификација на тестот Колмогоров-Смирнов. Се користи за тестирање на нултата хипотеза дека примерокот... ... Википедија

    За да се подобри овој напис, пожелно е?: Најдете и распоредете ги во форма на фусноти врски до авторитетни извори кои го потврдуваат напишаното. Додадете илустрации. Т Крит ... Википедија

    Во статистиката, Колмогоров тест за добрина (исто така познат како тест за добросостојба на Колмогоров-Смирнов) се користи за да се утврди дали две емпириски дистрибуции го почитуваат истиот закон или за да се утврди дали ... ... Википедија

    критериум за независност- за табелите за непредвидени ситуации, ја тестира хипотезата дека променливите на редот и колоната се независни. Таквите критериуми вклучуваат хи-квадрат тест за независност (Пирсон) и точен тест на Фишер... Речник на социолошка статистика

Книги

  • Критериуми за проверка на отстапувањето на распределбата од единствениот закон. Водич за употреба: монографија, Лемешко Б.Ју.. Книгата е наменета за специјалисти кои во еден или друг степен во своите активности се соочуваат со прашања од статистичка анализа на податоци со обработка на експериментални резултати, примена...

Статистички тест

Правилото со кое се отфрла или прифаќа хипотезата I 0 се нарекува статистички критериум.Името на критериумот, по правило, содржи буква што означува специјално составена карактеристика од клаузула 2 од алгоритмот за тестирање на статистичка хипотеза (види клаузула 4.1), пресметана во критериумот. Под условите на овој алгоритам, критериумот би се повикал „В-критериуми".

При тестирање на статистичките хипотези, можни се два типа на грешки:

  • - Грешка од типот I(можете да ја отфрлите хипотезата I 0 кога таа е всушност вистинита);
  • - Грешка од тип II(можете да ја прифатите хипотезата I 0 кога таа всушност не е точна).

Веројатност Асе нарекува правење грешка од првиот тип ниво на значајност на критериумот.

Ако за Розначете ја веројатноста да се направи грешка од втор тип, тогаш (л - R) -веројатноста да не се направи грешка од вториот тип, која се нарекува моќ на критериумот.

Пирсон х 2 тест за добрина на фит

Постојат неколку видови на статистички хипотези:

  • - за законот за распределба;
  • - хомогеност на примероците;
  • - нумерички вредности на параметрите на дистрибуција итн.

Ќе ја разгледаме хипотезата за законот за распределба користејќи го примерот на Пирсоновиот x 2 тест за добрина на одговарање.

Критериум за договорсе нарекува статистички критериум за тестирање на нултата хипотеза за претпоставениот закон на непозната распределба.

Пирсоновиот тест за добрина на одговарање се заснова на споредба на емпириски (набљудувани) и теоретски фреквенции на набљудувања пресметани под претпоставка на одреден закон за распределба. Хипотезата #0 овде е формулирана на следниов начин: според карактеристиката што се проучува, популацијата е нормално распределена.

Алгоритам за тестирање на статистичка хипотеза #0 за критериум x 1Пирсон:

  • 1) ја поставуваме хипотезата I 0 - според карактеристиката што се проучува, општата популација е распределена нормално;
  • 2) пресметајте ја средната вредност на примерокот и стандардното отстапување на примерокот О V;

3) според достапната големина на примерокот Пние пресметуваме специјално составена карактеристика,

каде што: i, се емпириски фреквенции, - теоретски фреквенции,

П -големина на примерокот,

ч- големината на интервалот (разликата помеѓу две соседни опции),

Нормализирани вредности на набљудуваната карактеристика,

- функција на маса. Исто така, теоретски фреквенции

може да се пресмета со користење на стандардната функција MS Excel NORMIDIST користејќи ја формулата;

4) користејќи ја распределбата на примерокот, ја одредуваме критичната вредност на специјално составена карактеристика xl П

5) кога хипотезата # 0 е отфрлена, кога хипотезата # 0 е прифатена.

Пример.Да го разгледаме знакот X- вредноста на индикаторите за тестирање на осудените лица во една од поправните колонии за некоја психолошка карактеристика, претставена во форма на варијација:

На ниво на значајност од 0,05, тестирајте ја хипотезата за нормалната распределба на населението.

1. Врз основа на емпириската дистрибуција, може да се постави хипотеза H 0: според проучуваниот критериум „вредноста на индикаторот за тестирање за дадена психолошка карактеристика“, општата популација

очекувано се дистрибуира нормално. Алтернативна хипотеза 1: според проучуваниот критериум „вредноста на тест индикаторот за дадена психолошка карактеристика“, општата популација на осуденици не е нормално распределена.

2. Да ги пресметаме карактеристиките на нумеричкиот примерок:

Интервали

x g y

X) sch

3. Да ја пресметаме специјално составената карактеристика j 2 . За да го направите ова, во претпоследната колона од претходната табела ги наоѓаме теоретските фреквенции користејќи ја формулата, а во последната колона

Да ги пресметаме карактеристиките % 2. Добиваме x 2 = 0,185.

За јасност, ќе конструираме многуаголник на емпириската дистрибуција и нормална крива врз основа на теоретски фреквенции (сл. 6).

Ориз. 6.

4. Определи го бројот на степени на слобода с: k = 5, t = 2, s = 5-2-1 = 2.

Според табелата или со користење на стандардната функција MS Excel „HI20BR“ за бројот на степени на слобода 5 = 2 и нивото на значајност a = 0,05 ќе ја најдеме критичната вредност на критериумот xl П.=5,99. За нивото на значење А= 0,01 критична критериумска вредност X%. = 9,2.

5. Забележана критериумска вредност X=0,185 помалку од сите пронајдени вредности Hk R.->затоа, хипотезата I 0 е прифатена на двете нивоа на значајност. Несовпаѓањето помеѓу емпириските и теоретските фреквенции е незначително. Затоа, податоците од набљудувањето се во согласност со хипотезата за нормална дистрибуција на населението. Така, според проучуваниот критериум „вредноста на индикаторот за тестирање за дадена психолошка карактеристика“, општата популација на осуденици се распределува нормално.

  • 1. Корјачко А.В., Куличенко А.Г. Виша математика и математички методи во психологијата: водич за практична настава за студенти на Факултетот за психологија. Рјазан, 1994 година.
  • 2. Наследов А.Д. Математички методи на психолошко истражување. Анализа и толкување на податоци: Учебник, прирачник. Санкт Петербург, 2008 година.
  • 3. Сидоренко Е.В. Методи на математичка обработка во психологијата. Санкт Петербург, 2010 година.
  • 4. Сошникова Л.А. и други.Мултиваријантна статистичка анализа по економија: Учебник, прирачник за универзитети. М., 1999 година.
  • 5. Суходолски Е.В. Математички методи во психологијата. Харков, 2004 година.
  • 6. Шмоилова Р.А., Минашкин В.Е., Садовникова Н.А. Работилница за теорија на статистика: Учебник, прирачник. М., 2009 година.
  • Гмурман В.Е. Теорија на веројатност и математичка статистика. Стр. 465.

Пирсон критериум за тестирање на хипотезата за формата на законот за распределба на случајна променлива. Тестирање хипотези за нормални, експоненцијални и униформни распределби со помош на критериумот Пирсон. Колмогоров критериум. Приближен метод за проверка на нормалноста на дистрибуцијата, поврзан со проценките на коефициентите на искривување и куртоза.

Во претходното предавање беа разгледани хипотези во кои се претпоставуваше дека е познат законот за распределба на населението. Сега ќе започнеме со тестирање на хипотези за наводниот закон за непозната распределба, односно ќе ја тестираме нултата хипотеза дека популацијата е распределена според некој познат закон. Вообичаено, статистичките тестови за тестирање на таквите хипотези се нарекуваат тестови за добросостојба.

Предноста на критериумот Пирсон е неговата универзалност: може да се користи за тестирање хипотези за различни закони за дистрибуција.

1. Тестирање на хипотезата за нормална дистрибуција.

Нека се добие доволно голем примерок Псо голем број на различни значења опција. За погодност на неговата обработка, ние го делиме интервалот од најмалата до најголемата вредност на опцијата на седнакви делови и ќе претпоставиме дека вредностите варираат

мравките кои паѓаат во секој интервал се приближно еднакви на бројот што ја дефинира средината на интервалот. Со броење на бројот на опции што спаѓаат во секој интервал, ќе создадеме таканаречен групиран примерок:

опции X 1 X 2 x с

фреквенции П 1 П 2 n s ,

Каде x i- вредности на средините на интервалите и n i- број на опции вклучени во јас-интервал (емпириски фреквенции).

Од добиените податоци, можете да ја пресметате просечната вредност на примерокот и стандардното отстапување на примерокот σ Б. Да ја провериме претпоставката дека населението е распределено според нормален закон со параметри М(X) = , Д(X) = . Потоа можете да го најдете бројот на броеви од големината на примерокот П, што треба да биде во секој интервал според оваа претпоставка (односно, теоретски фреквенции). За да го направите ова, користејќи ја табелата со вредности на функцијата Лаплас, ја наоѓаме веројатноста да влеземе јасти интервал:

,

Каде и јасИ b i- граници јас-ти интервал. Со множење на добиените веројатности со големината на примерокот n, ги наоѓаме теоретските фреквенции: p i =n?p i. Нашата цел е да ги споредиме емпириските и теоретските фреквенции, кои, се разбира, се разликуваат една од друга, и да откриеме дали овие разлики се незначителни, не ја побиваат хипотезата за нормална дистрибуција на случајната променлива што се проучува или се тие толку големи што се во спротивност со оваа хипотеза. За таа цел се користи критериум во форма на случајна променлива

. (20.1)

Неговото значење е очигледно: се сумираат деловите што квадратите на отстапувањата на емпириските фреквенции од теоретските ги сочинуваат од соодветните теоретски фреквенции. Може да се докаже дека, без оглед на реалниот закон за распределба на општата популација, законот за распределба на случајната променлива (20.1) се стреми кон законот за распределба (види предавање 12) со бројот на степени на слобода k = s - 1 - р, Каде р- бројот на параметри на очекуваната дистрибуција проценет од податоците од примерокот. Според тоа, нормалната дистрибуција се карактеризира со два параметри k = s - 3. За избраниот критериум се конструира деснострана критична област, определена со условот


(20.2)

Каде α - ниво на значајност. Следствено, критичниот регион е даден со нееднаквоста а областа на прифаќање на хипотезата е .

Значи, да се тестира нултата хипотеза Н 0: популацијата е нормално распределена - треба да ја пресметате набљудуваната вредност на критериумот од примерокот:

, (20.1`)

и користејќи ја табелата со критични точки на распределбата χ 2, пронајдете ја критичната точка користејќи познати вредности на α и k = s - 3. Ако - нултата хипотеза е прифатена, доколку се отфрли.

2. Тестирање на хипотезата за рамномерна дистрибуција.

Кога се користи критериумот Пирсон за тестирање на хипотезата за униформа дистрибуција на населението со проценета густина на веројатност

Потребно е, откако ќе се пресмета вредноста од достапниот примерок, да се проценат параметрите АИ бспоред формулите:

Каде А*И б*- оценки АИ б. Навистина, за униформа дистрибуција М(X) = , , каде што можете да добиете систем за одредување А*И б*: , чие решение се изразите (20.3).

Потоа, под претпоставка дека , можете да ги најдете теоретските фреквенции користејќи ги формулите

Еве с- бројот на интервали на кои е поделен примерокот.

Набљудуваната вредност на критериумот Пирсон се пресметува со формулата (20.1`), а критичната вредност се пресметува со помош на табелата, земајќи го предвид фактот дека бројот на степени на слобода k = s - 3. По ова, границите на критичниот регион се одредуваат на ист начин како и за тестирање на хипотезата за нормална распределба.

3. Тестирање на хипотезата за експоненцијалната распределба.

Во овој случај, откако го поделивме постоечкиот примерок на интервали со еднаква должина, ја разгледуваме низата опции, еднакво распоредени една од друга (претпоставуваме дека сите опции што спаѓаат во јасти интервал, земете вредност што се совпаѓа со нејзината средина) и нивните соодветни фреквенции n i(број на опции за примероци вклучени во јас-ти интервал). Дозволете ни да пресметаме од овие податоци и да го земеме како проценка на параметарот λ големина. Потоа теоретските фреквенции се пресметуваат со помош на формулата

Потоа се споредуваат набљудуваната и критичната вредност на критериумот Пирсон, земајќи го предвид фактот дека бројот на степени на слобода k = s - 2.