Интервал на доверба за проценка на средната вредност (позната е варијансата) во MS EXCEL.

Интервал на доверба- ограничувачките вредности на статистичка големина што, со дадена веројатност за доверба γ, ќе биде во овој интервал при земање примероци на поголем волумен. Означено како P(θ - ε. Во пракса, веројатноста за доверба γ е избрана од вредности сосема блиски до единството: γ = 0,9, γ = 0,95, γ = 0,99.

Цел на услугата. Користејќи ја оваа услуга, можете да одредите:

  • интервал на доверба за општата средина, интервал на доверба за варијансата;
  • интервал на доверба за стандардното отстапување, интервал на доверба за општото учество;
Резултираното решение е зачувано во датотека Word (види пример). Подолу е видео-инструкција како да ги пополните првичните податоци.

Пример бр. 1. На колективна фарма, од вкупно стадо од 1000 овци, 100 овци биле подложени на селективно контролно стрижење. Како резултат на тоа, беше воспоставено просечно сечење на волна од 4,2 кг по овца. Да се ​​определи со веројатност од 0,99 средна квадратна грешка на примерокот при определување на просечното стрижење на волна по овца и границите во кои се содржи вредноста на стрижењето ако варијансата е 2,5. Примерокот не се повторува.
Пример бр. 2. Од серија увезени производи на поштата на Московската северна царина, земени се 20 примероци од производот „А“ по случаен избор, повторено земање мостри. Како резултат на тестот, беше утврдена просечната содржина на влага на производот „А“ во примерокот, што се покажа дека е еднаква на 6% со стандардно отстапување од 1%.
Определете ги со веројатност 0,683 границите на просечната содржина на влага на производот во целата серија на увезени производи.
Пример бр. 3. Истражувањето на 36 студенти покажа дека просечниот број на учебници што ги читал во текот на учебната година е еднаков на 6. Ако се претпостави дека бројот на учебници што ги чита студент по семестар има нормален закон за распределба со стандардна девијација еднаква на 6, најдете : А) со веродостојност од 0,99 интервална проценка за математичкото очекување на оваа случајна променлива; Б) со која веројатност можеме да кажеме дека просечниот број на учебници што ги чита студент по семестар, пресметан од овој примерок, ќе отстапува од математичкото очекување во апсолутна вредност не повеќе од 2.

Класификација на интервали на доверба

Според типот на параметар што се проценува:

По тип на примерок:

  1. Интервал на доверба за бесконечен примерок;
  2. Интервал на доверба за конечниот примерок;
Примерокот се нарекува повторен примерок, доколку избраниот објект се врати на популацијата пред да се избере следниот. Примерокот се нарекува неповторлив, доколку избраниот објект не се врати во популацијата. Во пракса, ние обично се занимаваме со примероци кои не се повторуваат.

Пресметка на просечната грешка при земање примероци за случајно земање примероци

Несовпаѓањето помеѓу вредностите на индикаторите добиени од примерокот и соодветните параметри на општата популација се нарекува репрезентативна грешка.
Означување на главните параметри на општата популација и примерокот.
Формули за просечни грешки при земање примероци
реизборповторете го изборот
за просекза споделувањеза просекза споделување
Врската помеѓу границата на грешка при земање мостри (Δ) гарантирана со одредена веројатност Р(t),а просечната грешка при земање примероци има форма: или Δ = t·μ, каде т– коефициент на доверба, определен во зависност од нивото на веројатност P(t) според табелата на Лапласовата интегрална функција.

Формули за пресметување на големината на примерокот користејќи чисто случаен метод на земање примероци

Проценка на интервали на доверба

Цели на учење

Статистиката го разгледува следново две главни задачи:

    Имаме одредена проценка заснована на примерок од податоци и сакаме да дадеме некоја веројатност за тоа каде лежи вистинската вредност на проценетиот параметар.

    Имаме специфична хипотеза која треба да се тестира со користење на примерок податоци.

Во оваа тема ја разгледуваме првата задача. Да ја воведеме и дефиницијата за интервал на доверба.

Доверлив интервал е интервал кој е изграден околу проценетата вредност на параметарот и покажува каде се наоѓа вистинската вредност на проценетиот параметар со априори одредена веројатност.

Откако го проучувавте материјалот на оваа тема, вие:

    дознајте што е интервал на доверба за проценка;

    да научи да ги класифицира статистичките проблеми;

    совладување на техниката на конструирање интервали на доверба, и со користење на статистички формули и со користење на софтверски алатки;

    научете да ги одредите потребните големини на примероци за да постигнете одредени параметри на точноста на статистичките проценки.

Дистрибуции на карактеристиките на примерокот

Т-дистрибуција

Како што беше дискутирано погоре, распределбата на случајната променлива е блиска до стандардизираната нормална дистрибуција со параметрите 0 и 1. Бидејќи не ја знаеме вредноста на σ, ја заменуваме со одредена проценка на s. Количината веќе има различна распределба, имено или Студентска распределба, што се одредува со параметарот n -1 (бројот на степени на слобода). Оваа распределба е блиску до нормалната распределба (колку е поголема n, толку поблиску се распределбите).

На сл. 95
претставена е студентската распределба со 30 степени на слобода. Како што можете да видите, тоа е многу блиску до нормалната дистрибуција.

Слично на функциите за работа со нормална дистрибуција NORMIDIST и NORMINV, постојат функции за работа со t-дистрибуција - STUDIST (TDIST) и СТУДРАСОБР (TINV). Пример за користење на овие функции може да се види во датотеката STUDRASP.XLS (шаблон и решение) и на сл. 96
.

Дистрибуции на други карактеристики

Како што веќе знаеме, за да се одреди точноста на проценката на математичкото очекување, потребна ни е t-распределба. За да се проценат други параметри, како што е варијансата, потребни се различни распределби. Две од нив се F-дистрибуцијата и x 2 -дистрибуција.

Интервал на доверба за средната вредност

Интервал на доверба- ова е интервал кој се гради околу проценетата вредност на параметарот и покажува каде се наоѓа вистинската вредност на проценетиот параметар со априори одредена веројатност.

Настанува изградба на интервал на доверба за просечната вредност на следниот начин:

Пример

Ресторанот за брза храна планира да го прошири својот асортиман со нов вид сендвичи. За да ја процени побарувачката за него, менаџерот планира по случаен избор да избере 40 посетители од оние кои веќе го пробале и да побара од нив да го оценат својот став кон новиот производ на скала од 1 до 10. Менаџерот сака да го процени очекуваното број на поени што ќе ги добие новиот производ и ќе изгради интервал на доверба од 95% за оваа проценка. Како да го направите ова? (видете ја датотеката SANDWICH1.XLS (шаблон и решение).

Решение

За да го решите овој проблем можете да користите. Резултатите се претставени на сл. 97
.

Интервал на доверба за вкупната вредност

Понекогаш, користејќи примерок податоци, неопходно е да се процени не математичкото очекување, туку вкупниот збир на вредности. На пример, во ситуација со ревизор, интересот може да биде да не се процени просечната големина на сметката, туку збирот на сите сметки.

Нека N е вкупниот број на елементи, n големината на примерокот, T 3 збирот на вредностите во примерокот, T" проценката за збирот на целата популација, потоа , а интервалот на доверба се пресметува со формулата, каде што s е проценка на стандардното отстапување за примерокот и е проценка на средната вредност за примерокот.

Пример

Да речеме дека даночната агенција сака да го процени вкупниот поврат на данок за 10.000 даночни обврзници. Даночниот обврзник или добива поврат или плаќа дополнителни даноци. Најдете го интервалот на доверливост од 95% за износот на рефундирање, претпоставувајќи големина на примерок од 500 луѓе (видете ја датотеката AMOUNT OF REFUND.XLS (образец и решение).

Решение

StatPro нема посебна процедура за овој случај, но може да се забележи дека границите може да се добијат од границите за просекот врз основа на горенаведените формули (сл. 98
).

Интервал на доверба за пропорција

Нека p е математичкото очекување на уделот на клиентите, и нека p b е проценката на овој удел добиен од примерок со големина n. Може да се покаже дека за доволно големи распределбата на оценувањето ќе биде блиску до нормалата со математичко очекување p и стандардна девијација . Стандардната грешка на проценката во овој случај се изразува како , а интервалот на доверба е како .

Пример

Ресторанот за брза храна планира да го прошири својот асортиман со нов вид сендвичи. За да ја процени побарувачката за него, менаџерот по случаен избор избра 40 посетители од оние кои веќе го пробале и побарал од нив да го оценат својот став кон новиот производ на скала од 1 до 10. Менаџерот сака да го процени очекуваниот дел од клиенти кои го оценуваат новиот производ со најмалку 6 поени (очекува дека овие клиенти ќе бидат потрошувачи на новиот производ).

Решение

Првично, создаваме нова колона врз основа на атрибутот 1 ако оцената на клиентот е повеќе од 6 поени, а во спротивно 0 (види датотека SANDWICH2.XLS (шаблон и решение).

Метод 1

Со броење на бројот од 1, го проценуваме уделот, а потоа ги користиме формулите.

Вредноста zcr се зема од специјални табели за нормална дистрибуција (на пример, 1,96 за 95% интервал на доверба).

Користејќи го овој пристап и конкретни податоци за да се изгради интервал од 95%, ги добиваме следните резултати (сл. 99
). Критичната вредност на параметарот zcr е 1,96. Стандардната грешка на проценката е 0,077. Долната граница на интервалот на доверба е 0,475. Горната граница на интервалот на доверба е 0,775. Така, менаџерот има право да верува со 95% доверба дека процентот на клиенти кои го оценуваат новиот производ со 6 поени или повеќе ќе биде помеѓу 47,5 и 77,5.

Метод 2

Овој проблем може да се реши со користење на стандардни StatPro алатки. За да го направите ова, доволно е да се забележи дека уделот во овој случај се совпаѓа со просечната вредност на колоната Тип. Следно аплицираме StatPro/Статистички заклучоци/Анализа со еден примерокда се конструира интервал на доверба на средната вредност (проценка на математичкото очекување) за колоната Тип. Добиените резултати во овој случај ќе бидат многу блиску до резултатите од првиот метод (сл. 99).

Интервал на доверба за стандардно отстапување

s се користи како проценка на стандардното отстапување (формулата е дадена во Дел 1). Функцијата за густина на проценката s е функцијата хи-квадрат, која, како и t-распределбата, има n-1 степени на слобода. Постојат посебни функции за работа со оваа дистрибуција CHIDIST и CHIINV.

Интервалот на доверба во овој случај повеќе нема да биде симетричен. Конвенционален граничен дијаграм е прикажан на сл. 100 .

Пример

Машината мора да произведува делови со пречник од 10 см.Но, поради различни околности, се појавуваат грешки. Контролорот за квалитет е загрижен за две околности: прво, просечната вредност треба да биде 10 cm; второ, дури и во овој случај, ако отстапувањата се големи, тогаш многу делови ќе бидат отфрлени. Секој ден прави примерок од 50 делови (види датотека QUALITY CONTROL.XLS (шаблон и решение) Какви заклучоци може да даде таков примерок?

Решение

Ајде да изградиме 95% интервали на доверба за средната и стандардната девијација користејќи StatPro/Статистички заклучоци/Анализа со еден примерок(Сл. 101
).

Следно, користејќи ја претпоставката за нормална дистрибуција на дијаметри, го пресметуваме процентот на неисправни производи, поставувајќи максимално отстапување од 0,065. Користејќи ги можностите на табелата за замена (случај на два параметри), ја цртаме зависноста на процентот на дефекти од просечната вредност и стандардното отстапување (сл. 102
).

Интервал на доверба за разликата помеѓу две средства

Ова е една од најважните примени на статистичките методи. Примери на ситуации.

    Менаџерот на продавница за облека би сакал да знае колку повеќе или помалку просечниот женски клиент троши во продавницата од просечниот машки клиент.

    Двете авиокомпании летаат на слични линии. Една организација на потрошувачи би сакала да ја спореди разликата помеѓу просечното очекувано време на одложување на летот за двете авиокомпании.

    Компанијата испраќа купони за одредени видови стоки во еден град, а не во друг. Менаџерите сакаат да го споредат просечниот обем на набавки на овие производи во следните два месеци.

    Дилер на автомобили често се занимава со брачни парови на презентации. За да се разберат нивните лични реакции на презентацијата, паровите честопати се интервјуирани одделно. Менаџерот сака да ја оцени разликата во оценките дадени од мажи и жени.

Случај на независни примероци

Разликата помеѓу средствата ќе има t-распределба со n 1 + n 2 - 2 степени на слобода. Интервалот на доверба за μ 1 - μ 2 се изразува со релацијата:

Овој проблем може да се реши не само со користење на горенаведените формули, туку и со користење на стандардни StatPro алатки. За да го направите ова, доволно е да се користи

Интервал на доверба за разликата помеѓу пропорциите

Нека биде математичкото очекување на акциите. Нека се нивните проценки на примероци, конструирани од примероци со големина n 1 и n 2, соодветно. Потоа е проценка за разликата. Затоа, интервалот на доверба на оваа разлика се изразува како:

Овде z cr е вредност добиена од нормална дистрибуција со помош на специјални табели (на пример, 1,96 за 95% интервал на доверба).

Стандардната грешка на проценката во овој случај се изразува со релацијата:

.

Пример

Продавницата, подготвувајќи се за голема распродажба, го презеде следното маркетинг истражување. Најдобрите 300 купувачи беа избрани и по случаен избор поделени во две групи од по 150 членови. На сите избрани клиенти им беа испратени покани за учество во распродажбата, но само членовите од првата група добија купон кој им дава право на попуст од 5%. При продажбата евидентирани се набавките на сите 300 избрани купувачи. Како може менаџерот да ги протолкува резултатите и да донесе пресуда за ефективноста на купоните? (видете ја датотеката COUPONS.XLS (шаблон и решение)).

Решение

За нашиот конкретен случај, од 150 клиенти кои добиле купон за попуст, 55 купиле на распродажба, а меѓу 150 кои не добиле купон, само 35 купиле (сл. 103
). Тогаш вредностите на пропорциите на примерокот се 0,3667 и 0,2333, соодветно. И разликата во примерокот меѓу нив е еднаква на 0,1333, соодветно. Претпоставувајќи 95% интервал на доверба, наоѓаме од табелата за нормална дистрибуција z cr = 1,96. Пресметката на стандардната грешка на разликата во примерокот е 0,0524. Конечно откриваме дека долната граница на интервалот на доверба од 95% е 0,0307, ​​а горната граница е 0,2359, соодветно. Добиените резултати може да се толкуваат на тој начин што на секои 100 клиенти кои добиле купон за попуст, можеме да очекуваме од 3 до 23 нови клиенти. Сепак, мора да имаме на ум дека овој заклучок сам по себе не значи и ефективност од користењето купони (бидејќи со обезбедување на попуст губиме добивка!). Ајде да го демонстрираме ова со конкретни податоци. Да претпоставиме дека просечната големина за купување е 400 рубли, од кои 50 рубли. има профит за продавницата. Тогаш очекуваната добивка на 100 клиенти кои не добиле купон е:

50 0,2333 100 = 1166,50 руб.

Слични пресметки за 100 клиенти кои добиле купон даваат:

30 0,3667 100 = 1100,10 руб.

Намалувањето на просечната добивка на 30 се објаснува со фактот дека, користејќи го попустот, клиентите кои добиле купон во просек ќе купат 380 рубли.

Така, конечниот заклучок укажува на неефикасноста на користењето на вакви купони во оваа конкретна ситуација.

Коментар. Овој проблем може да се реши со користење на стандардни StatPro алатки. За да го направите ова, доволно е овој проблем да се сведе на проблемот со проценка на разликата помеѓу два просеци користејќи го методот, а потоа да се примени StatPro/Статистички заклучок/Анализа со два примероцида се конструира интервал на доверба за разликата помеѓу две просечни вредности.

Контрола на должината на интервалот на доверба

Должината на интервалот на доверба зависи од следните услови:

    податоци директно (стандардна девијација);

    ниво на значење;

    големина на примерокот.

Големина на примерокот за проценка на средната вредност

Прво, да го разгледаме проблемот во општиот случај. Дозволете ни да ја означиме вредноста на половина од должината на интервалот на доверба што ни е даден како B (сл. 104
). Знаеме дека интервалот на доверба за средната вредност на некоја случајна променлива X се изразува како , Каде . Верувајќи:

и изразувајќи n, добиваме .

За жал, не ја знаеме точната вредност на варијансата на случајната променлива X. Покрај тоа, не ја знаеме вредноста на tcr, бидејќи зависи од n преку бројот на степени на слобода. Во оваа ситуација, можеме да го направиме следново. Наместо варијанса s, користиме одредена проценка на варијансата врз основа на која било достапна имплементација на случајната променлива што се проучува. Наместо вредноста t cr, ја користиме вредноста z cr за нормална распределба. Ова е сосема прифатливо, бидејќи функциите за густина на дистрибуција за нормалната и t-распределбата се многу блиски (освен за случајот со мало n). Така, потребната формула има форма:

.

Бидејќи формулата дава, општо земено, нецелобројни резултати, заокружувањето со вишок од резултатот се зема како саканата големина на примерокот.

Пример

Ресторанот за брза храна планира да го прошири својот асортиман со нов вид сендвичи. За да ја процени побарувачката за него, менаџерот планира по случаен избор да избере одреден број посетители од оние кои веќе го пробале и да побара од нив да го оценат својот став кон новиот производ на скала од 1 до 10. Менаџерот сака да процени очекуваниот број на поени што новиот производ ќе ги добие производот и ќе изгради интервал на доверба од 95% за оваа проценка. Во исто време, тој сака половина ширина на интервалот на доверба да не надминува 0,3. Колку посетители треба да интервјуира?

како што следи:

Еве р отсе проценка на пропорцијата p, а B е дадена половина од должината на интервалот на доверба. Преценето за n може да се добие со помош на вредноста р отс= 0,5. Во овој случај, должината на интервалот на доверба нема да ја надмине одредената вредност B за која било вистинска вредност на стр.

Пример

Нека менаџерот од претходниот пример планира да го процени уделот на клиенти кои претпочитаат нов тип на производ. Тој сака да изгради интервал на доверба од 90%, чија половина должина не надминува 0,05. Колку клиенти треба да бидат вклучени во случајниот примерок?

Решение

Во нашиот случај, вредноста на z cr = 1,645. Затоа, потребната количина се пресметува како .

Ако менаџерот има причина да верува дека саканата p-вредност е, на пример, приближно 0,3, тогаш со замена на оваа вредност во горната формула, ќе добиеме помала вредност на случаен примерок, имено 228.

Формула за одредување случајна големина на примерокот во случај на разлика помеѓу две средининапишано како:

.

Пример

Некои компјутерски компании имаат центар за услуги на клиентите. Неодамна се зголеми бројот на поплаки на клиентите за лошиот квалитет на услугата. Во сервисниот центар главно работат два вида вработени: оние кои немаат големо искуство, а имаат завршено посебни подготвителни курсеви и оние кои имаат големо практично искуство, но немаат завршено посебни курсеви. Компанијата сака да ги анализира поплаките на клиентите во изминатите шест месеци и да го спореди просечниот број на поплаки за секоја од двете групи вработени. Се претпоставува дека бројките во примероците за двете групи ќе бидат исти. Колку вработени мора да бидат вклучени во примерокот за да се добие интервал од 95% со половина должина не повеќе од 2?

Решение

Овде σ ots е проценка на стандардното отстапување на двете случајни променливи под претпоставка дека тие се блиски. Така, во нашиот проблем треба некако да ја добиеме оваа проценка. Ова може да се направи, на пример, на следниов начин. Откако ги разгледа податоците за поплаките на клиентите во изминатите шест месеци, менаџерот може да забележи дека секој вработен обично добива од 6 до 36 поплаки. Знаејќи дека за нормална дистрибуција речиси сите вредности не се оддалечени повеќе од три стандардни отстапувања од средната вредност, тој разумно може да верува дека:

, од каде σ ots = 5.

Заменувајќи ја оваа вредност во формулата, добиваме .

Формула за одредување случајна големина на примерокот во случај на проценка на разликата помеѓу пропорциитеима форма:

Пример

Некоја компанија има две фабрики кои произведуваат слични производи. Менаџер на компанија сака да го спореди процентот на неисправни производи во двете фабрики. Според достапните информации, стапката на дефекти во двете фабрики се движи од 3 до 5%. Наменет е да се конструира 99% интервал на доверба со половина должина не повеќе од 0,005 (или 0,5%). Колку производи треба да се изберат од секоја фабрика?

Решение

Овде p 1ots и p 2ots се проценки на два непознати удели на дефекти во 1-та и 2-та фабрика. Ако ставиме p 1ots = p 2ots = 0,5, тогаш добиваме преценета вредност за n. Но бидејќи во нашиот случај имаме некои априори информации за овие акции, ја земаме горната проценка на овие акции, имено 0,05. Добиваме

Кога се проценуваат некои параметри на популацијата од податоците од примерокот, корисно е да се даде не само точка проценка на параметарот, туку и да се обезбеди интервал на доверба што покажува каде може да лежи точната вредност на параметарот што се проценува.

Во ова поглавје се запознавме и со квантитативните односи кои ни овозможуваат да конструираме такви интервали за различни параметри; научив начини за контрола на должината на интервалот на доверба.

Забележете исто така дека проблемот со проценка на големини на примероци (проблемот за планирање експеримент) може да се реши со користење на стандардни StatPro алатки, имено StatPro/Статистички заклучок/Избор на големина на примерок.

Интервалот на доверба ни доаѓа од областа на статистиката. Ова е одреден опсег кој служи за проценка на непознат параметар со висок степен на доверливост. Најлесен начин да се објасни ова е со пример.

Да претпоставиме дека треба да проучите некоја случајна променлива, на пример, брзината на одговор на серверот на барање на клиентот. Секој пат кога корисникот ќе ја напише адресата на одредена локација, серверот реагира со различна брзина. Така, времето на одговор што се проучува е случајно. Значи, интервалот на доверба ни овозможува да ги одредиме границите на овој параметар, а потоа можеме да кажеме дека со 95% веројатност серверот ќе биде во опсегот што го пресметавме.

Или треба да дознаете колку луѓе знаат за трговската марка на компанијата. Кога ќе се пресмета интервалот на доверба, ќе може да се каже, на пример, дека со 95% веројатност уделот на потрошувачите свесни за тоа е во опсег од 27% до 34%.

Тесно поврзана со овој термин е вредноста на веројатноста за доверба. Ја претставува веројатноста дека саканиот параметар е вклучен во интервалот на доверба. Колку голем ќе биде нашиот посакуван опсег зависи од оваа вредност. Колку е поголема вредноста што ја зема, толку е потесен интервалот на доверба и обратно. Вообичаено е поставено на 90%, 95% или 99%. Вредноста 95% е најпопуларна.

Овој индикатор е исто така под влијание на дисперзијата на набљудувањата и неговата дефиниција се заснова на претпоставката дека карактеристиката што се испитува се покорува.Оваа изјава е позната и како Гаусовиот закон. Според него, нормално е распределба на сите веројатности на континуирана случајна променлива што може да се опише со густина на веројатност. Ако претпоставката за нормална распределба е неточна, тогаш проценката може да биде неточна.

Прво, ајде да дознаеме како да го пресметаме интервалот на доверба за Постојат два можни случаи овде. Дисперзијата (степенот на ширење на случајна променлива) може или не може да биде позната. Ако е познато, тогаш нашиот интервал на доверба се пресметува со следнава формула:

xsr - t*σ / (sqrt(n))<= α <= хср + t*σ / (sqrt(n)), где

α - знак,

t - параметар од табелата за распределба на Лаплас,

σ е квадратен корен на варијансата.

Ако варијансата е непозната, тогаш може да се пресмета ако ги знаеме сите вредности на саканата карактеристика. За ова се користи следнава формула:

σ2 = х2ср - (хср)2, каде

х2ср - просечна вредност на квадратите на проучуваната карактеристика,

(хср)2 е квадратот на оваа карактеристика.

Формулата со која се пресметува интервалот на доверба во овој случај малку се менува:

xsr - t*s / (sqrt(n))<= α <= хср + t*s / (sqrt(n)), где

xsr - примерок просек,

α - знак,

t е параметар што се наоѓа со помош на табелата за распределба на Student t = t(ɣ;n-1),

sqrt(n) - квадратен корен од вкупната големина на примерокот,

s е квадратниот корен на варијансата.

Размислете за овој пример. Да претпоставиме дека врз основа на резултатите од 7 мерења, проучената карактеристика е одредена дека е еднаква на 30, а варијансата на примерокот е еднаква на 36. Неопходно е да се најде, со веројатност од 99%, интервал на доверба кој ја содржи вистинската вредност на измерениот параметар.

Прво, да одредиме што е еднакво на t: t = t (0,99; 7-1) = 3,71. Користејќи ја горната формула, добиваме:

xsr - t*s / (sqrt(n))<= α <= хср + t*s / (sqrt(n))

30 - 3,71*36 / (sqrt(7))<= α <= 30 + 3.71*36 / (sqrt(7))

21.587 <= α <= 38.413

Интервалот на доверливост за варијансата се пресметува и во случај на позната средина и кога нема податоци за математичкото очекување, а позната е само вредноста на точката непристрасна проценка на варијансата. Ние нема да дадеме формули за пресметување овде, бидејќи тие се доста сложени и, по желба, секогаш може да се најдат на Интернет.

Само да забележиме дека е погодно да се одреди интервалот на доверливост користејќи Excel или мрежна услуга, која се нарекува така.

Интервали на доверба.

Пресметката на интервалот на доверба се заснова на просечната грешка на соодветниот параметар. Интервал на доверба покажува во кои граници со веројатност (1-а) лежи вистинската вредност на проценетиот параметар. Овде a е нивото на значајност, (1-а) се нарекува и веројатност на доверба.

Во првото поглавје покажавме дека, на пример, за аритметичката средина, вистинската популациска средина во приближно 95% од случаите лежи во рамките на 2 стандардни грешки од средната вредност. Така, границите на интервалот на доверливост од 95% за средната вредност ќе бидат одвоени од средната вредност на примерокот со двојно поголема средна грешка на средната вредност, т.е. ја множиме просечната грешка на средната вредност со одреден коефициент во зависност од нивото на доверба. За просекот и разликата на просеците се зема студентскиот коефициент (критична вредност на Студентскиот тест), за учеството и разликата на акциите критичната вредност на критериумот z. Производот на коефициентот и просечната грешка може да се нарече максимална грешка на даден параметар, т.е. максимумот што можеме да го добиеме кога го оценуваме.

Интервал на доверба за аритметичко значење : .

Еве го примерокот значи;

Просечна грешка на аритметичката средина;

s -стандардна девијација на примерокот;

n

f = n-1 (Студентски коефициент).

Интервал на доверба за разлики на аритметичките средини :

Еве ја разликата помеѓу средствата за примероци;

- просечна грешка на разликата помеѓу аритметичките средини;

с 1 , с 2 -примерок стандардни отстапувања;

n1, n2

Критичната вредност на Студентскиот тест за дадено ниво на значајност а и бројот на степени на слобода f=n 1 +n 2-2 (Студентски коефициент).

Интервал на доверба за акции :

.

Овде d е фракцијата на примерокот;

– просечна грешка на дропка;

n– големина на примерокот (големина на групата);

Интервал на доверба за разлика на акции :

Еве ја разликата во примерокот акции;

– просечна грешка на разликата помеѓу аритметичките средини;

n1, n2– волумени на примероци (број на групи);

Критичната вредност на критериумот z на дадено ниво на значајност a ( , , ).

Пресметувајќи ги интервалите на доверба за разликата помеѓу индикаторите, ние, прво, директно ги гледаме можните вредности на ефектот, а не само неговата проценка на поени. Второ, можеме да извлечеме заклучок за прифаќање или отфрлање на нултата хипотеза и, трето, можеме да извлечеме заклучок за моќта на тестот.

Кога тестирате хипотези користејќи интервали на доверба, мора да се придржувате до следново правило:

Ако интервалот на доверба од 100(1-а) проценти на разликата во средини не содржи нула, тогаш разликите се статистички значајни на ниво на значајност a; напротив, ако овој интервал содржи нула, тогаш разликите не се статистички значајни.

Навистина, ако овој интервал содржи нула, тоа значи дека индикаторот што се споредува може да биде или поголем или помал во една од групите во споредба со другата, т.е. забележаните разлики се должат на случајноста.

Моќта на тестот може да се процени според локацијата на нула во интервалот на доверба. Доколку нулата е блиску до долната или горната граница на интервалот, тогаш можно е со поголем број групи кои се споредуваат, разликите да достигнат статистичка значајност. Ако нулата е блиску до средината на интервалот, тогаш тоа значи дека и зголемувањето и намалувањето на индикаторот во експерименталната група се подеднакво веројатни и, веројатно, навистина нема разлики.

Примери:

Да се ​​спореди хируршката смртност при користење на два различни типа на анестезија: 61 лице биле оперирани со првиот тип на анестезија, 8 починале, со вториот тип – 67 лица, 10 починале.

d 1 = 8/61 = 0,131; d2 = 10/67 = 0,149; d1-d2 = - 0,018.

Разликата во смртноста на споредените методи ќе биде во опсегот (-0,018 - 0,122; -0,018 + 0,122) или (-0,14; 0,104) со веројатност од 100(1-a) = 95%. Интервалот содржи нула, т.е. хипотезата за еднаква смртност со два различни типа на анестезија не може да се отфрли.

Така, стапката на смртност може и ќе се намали на 14% и ќе се зголеми на 10,4% со веројатност од 95%, т.е. нулата е приближно во средината на интервалот, така што може да се тврди дека, најверојатно, овие два методи навистина не се разликуваат во смртоносноста.

Во примерот што беше дискутиран претходно, просечното време на притискање за време на тестот за прислушување беше споредено кај четири групи студенти кои се разликуваа во резултатите од испитите. Да ги пресметаме интервалите на доверба за просечното време на притискање за учениците кои го положиле испитот со оценки 2 и 5 и интервалот на доверба за разликата помеѓу овие просеци.

Студентските коефициенти се наоѓаат со помош на табелите за распределба на Студентот (види додаток): за првата група: = t(0,05;48) = 2,011; за втората група: = t(0,05;61) = 2,000. Така, интервали на доверба за првата група: = (162,19-2,011 * 2,18; 162,19 + 2,011 * 2,18) = (157,8; 166,6), за втората група (156,55- 2,000 * 1,88; 158,28,00) = 160,3). Значи, за оние кои го положиле испитот со 2, просечното време на притискање се движи од 157,8 ms до 166,6 ms со веројатност од 95%, за оние кои го положиле испитот со 5 – од 152,8 ms до 160,3 ms со веројатност од 95%. .

Можете исто така да ја тестирате нултата хипотеза користејќи интервали на доверба за средствата, а не само за разликата во средствата. На пример, како и во нашиот случај, ако интервалите на доверба за средствата се преклопуваат, тогаш нултата хипотеза не може да се отфрли. За да се отфрли хипотеза на избрано ниво на значајност, соодветните интервали на доверба не смеат да се преклопуваат.

Да го најдеме интервалот на доверба за разликата во просечното време на притискање во групите што го положиле испитот со оценки 2 и 5. Разлика на просеци: 162,19 – 156,55 = 5,64. Студентски коефициент: = t(0,05;49+62-2) = t(0,05;109) = 1,982. Групните стандардни отстапувања ќе бидат еднакви на: ; . Ја пресметуваме просечната грешка на разликата меѓу средствата: . Интервал на доверба: =(5,64-1,982*2,87; 5,64+1,982*2,87) = (-0,044; 11,33).

Значи, разликата во просечното време на притискање во групите што го положиле испитот со 2 и 5 ќе биде во опсег од -0,044 ms до 11,33 ms. Овој интервал вклучува нула, т.е. Просечното време на притисок за оние кои добро го положиле испитот може или да се зголеми или да се намали во споредба со оние кои го положиле испитот незадоволително, т.е. нултата хипотеза не може да се отфрли. Но, нулата е многу блиску до долната граница, а времето на притискање е многу поверојатно да се намали за оние кои поминале добро. Така, можеме да заклучиме дека сè уште има разлики во просечното време на притискање меѓу оние кои поминале 2 и 5, едноставно не можевме да ги откриеме со оглед на промената во просечното време, ширењето на просечното време и големини на примероци.



Моќта на тестот е веројатноста за отфрлање на неточна нулта хипотеза, т.е. најдете разлики таму каде што тие всушност постојат.

Моќта на тестот се одредува врз основа на нивото на значајност, големината на разликите помеѓу групите, ширењето на вредностите во групи и големината на примероците.

За студентски t тест и анализа на варијанса, може да се користат дијаграми за чувствителност.

Моќта на критериумот може да се искористи за прелиминарно одредување на потребниот број на групи.

Интервалот на доверба покажува во кои граници се наоѓа вистинската вредност на проценетиот параметар со дадена веројатност.

Користејќи интервали на доверба, можете да тестирате статистички хипотези и да извлечете заклучоци за чувствителноста на критериумите.

ЛИТЕРАТУРА.

Glanz S. – Поглавје 6,7.

Реброва О.Ју. – стр.112-114, стр.171-173, стр.234-238.

Сидоренко Е.В. – стр.32-33.

Прашања за самотестирање на ученици.

1. Која е моќта на критериумот?

2. Во кои случаи е потребно да се оцени моќта на критериумите?

3. Методи за пресметување на моќноста.

6. Како да се тестира статистичка хипотеза користејќи интервал на доверба?

7. Што може да се каже за моќта на критериумот при пресметување на интервалот на доверба?

Задачи.

„Катрен-стил“ го продолжува објавувањето на серијата на Константин Кравчик за медицинска статистика. Во два претходни написи, авторот се занимаваше со објаснување на концепти како и.

Константин Кравчик

Математичар-аналитичар. Специјалист за статистички истражувања во медицината и хуманистичките науки

град Москва

Многу често во написите за клинички студии можете да најдете мистериозна фраза: „интервал на доверба“ (95 % CI или 95 % CI - интервал на доверба). На пример, една статија може да напише: „За да се процени значајноста на разликите, студентскиот t-тест беше искористен за да се пресмета интервалот на доверба од 95 %.

Која е вредноста на „95 % интервал на доверба“ и зошто да се пресмета?

Што е интервал на доверба? - Ова е опсегот во кој вистинската популација значи лага. Дали има „невистинити“ просеци? Во извесна смисла, да, тие го прават тоа. Во објаснивме дека е невозможно да се измери параметарот на интерес кај целата популација, така што истражувачите се задоволни со ограничен примерок. Во овој примерок (на пример, врз основа на телесната тежина) има една просечна вредност (одредена тежина), според која ја оценуваме просечната вредност во целата популација. Сепак, малку е веројатно дека просечната тежина во примерокот (особено мал) ќе се совпадне со просечната тежина во општата популација. Затоа, поправилно е да се пресмета и користи опсегот на просечните вредности на населението.

На пример, замислете дека интервалот на доверливост од 95% (95% CI) за хемоглобинот е од 110 до 122 g/L. Ова значи дека постои 95% шанса вистинската средна вредност на хемоглобинот кај популацијата да биде помеѓу 110 и 122 g/L. Со други зборови, не ја знаеме просечната вредност на хемоглобинот во популацијата, но можеме, со 95 % веројатност, да укажеме на опсег на вредности за оваа особина.

Интервалите на доверба се особено релевантни за разликите во средствата помеѓу групите или големината на ефектот како што се нарекуваат.

Да речеме дека ја споредивме ефективноста на два препарати за железо: еден што е на пазарот долго време и оној што штотуку е регистриран. По текот на терапијата, ја проценивме концентрацијата на хемоглобинот во испитуваните групи пациенти, а статистичката програма пресмета дека разликата помеѓу просечните вредности на двете групи е, со веројатност од 95%, во опсег од 1,72 до 14,36 g/l (Табела 1).

Табела 1. Тест за независни примероци
(групите се споредуваат според нивото на хемоглобин)

Ова треба да се толкува на следниов начин: кај некои пациенти од општата популација кои земаат нов лек, хемоглобинот ќе биде во просек повисок за 1,72-14,36 g/l отколку кај оние кои земале веќе познат лек.

Со други зборови, кај општата популација, разликата во просечните вредности на хемоглобинот помеѓу групите е во овие граници со веројатност од 95%. Ќе зависи од истражувачот да процени дали ова е многу или малку. Поентата на сето ова е дека не работиме со една просечна вредност, туку со опсег на вредности, затоа, посигурно ја проценуваме разликата во параметар помеѓу групите.

Во статистичките пакети, по дискреција на истражувачот, можете самостојно да ги стесните или проширите границите на интервалот на доверба. Со намалување на веројатностите на интервалот на доверба, го стеснуваме опсегот на средствата. На пример, при 90 % CI опсегот на средствата (или разликата во средствата) ќе биде потесен отколку на 95 %.

Спротивно на тоа, зголемувањето на веројатноста до 99 % го проширува опсегот на вредности. Кога се споредуваат групите, долната граница на CI може да ја премине нултата ознака. На пример, ако ги прошириме границите на интервалот на доверба до 99 %, тогаш границите на интервалот се движеа од –1 до 16 g/l. Тоа значи дека во општата популација има групи, разликата во средини меѓу кои за карактеристиката што се проучува е еднаква на 0 (M = 0).

Користејќи интервал на доверба, можете да тестирате статистички хипотези. Ако интервалот на доверба ја премине нултата вредност, тогаш нултата хипотеза, која претпоставува дека групите не се разликуваат по параметарот што се проучува, е вистинита. Примерот е опишан погоре каде што ги проширивме границите на 99 %. Некаде во општата популација најдовме групи кои во никој случај не се разликуваа.

95% интервал на доверба на разликата во хемоглобинот, (g/l)


Сликата го покажува интервалот на доверливост од 95% за разликата во средните вредности на хемоглобинот помеѓу двете групи. Линијата минува низ нултата ознака, затоа постои разлика помеѓу средната вредност на нула, што ја потврдува нултата хипотеза дека групите не се разликуваат. Опсегот на разлика помеѓу групите е од -2 до 5 g/L. Тоа значи дека хемоглобинот може или да се намали за 2 g/L или да се зголеми за 5 g/L.

Интервалот на доверба е многу важен индикатор. Благодарение на него, можете да видите дали разликите во групите навистина се должат на разликата во средствата или поради големиот примерок, бидејќи со голем примерок шансите да се најдат разлики се поголеми отколку со мал.

Во пракса може да изгледа вака. Зедовме примерок од 1000 луѓе, го измеривме нивото на хемоглобин и откривме дека интервалот на доверба за разликата во средствата се движи од 1,2 до 1,5 g/l. Нивото на статистичка значајност во овој случај стр

Гледаме дека концентрацијата на хемоглобинот е зголемена, но речиси незабележливо, затоа, статистичката значајност се појави токму поради големината на примерокот.

Интервалите на доверба може да се пресметаат не само за средствата, туку и за пропорциите (и соодносите на ризик). На пример, ние сме заинтересирани за интервалот на доверба на пропорциите на пациенти кои постигнале ремисија додека земале развиен лек. Да претпоставиме дека 95 % CI за пропорциите, т.е. за процентот на такви пациенти, лежи во опсег од 0,60-0,80. Така, можеме да кажеме дека нашиот лек има терапевтски ефект во 60 до 80 % од случаите.