Интервал на доверба. ABC на медицинска статистика

Ајде да конструираме интервал на доверба во MS EXCEL за да ја процениме средната вредност на распределбата во случај на позната вредност на дисперзија.

Се разбира изборот ниво на довербацелосно зависи од проблемот што се решава. Така, степенот на доверба на патникот во воздух во доверливоста на авионот несомнено треба да биде повисок од степенот на доверба на купувачот во доверливоста на електричната сијалица.

Формулација на проблем

Да претпоставиме дека од популацијаоткако е земен примерголемина n. Се претпоставува дека Стандардна девијацијаоваа дистрибуција е позната. Потребно е врз основа на ова примероциоцени го непознатото дистрибутивна средина(μ, ) и конструирај го соодветниот двострано интервал на доверба.

Точка проценка

Како што е познато од статистика(да го означиме X просечно) е непристрасна проценка на средната вредностова популацијаи има распределба N(μ;σ 2 /n).

Забелешка: Што да направите ако треба да изградите интервал на довербаво случај на распределба која не е нормално?Во овој случај, доаѓа на помош, во која се наведува дека со доволно голема големина примероци n од дистрибуција не битие нормално, дистрибуција на примероци на статистика X просечноќе приближноодговараат нормална дистрибуцијасо параметри N(μ;σ 2 /n).

Значи, бодовна проценка просек дистрибутивни вредностиимаме - ова примерок значи, т.е. X просечно. Сега да почнеме интервал на доверба.

Конструирање интервал на доверба

Обично, знаејќи ја дистрибуцијата и нејзините параметри, можеме да ја пресметаме веројатноста случајната променлива да земе вредност од интервалот што го одредуваме. Сега да го направиме спротивното: најдете го интервалот во кој случајната променлива ќе падне со дадена веројатност. На пример, од својствата нормална дистрибуцијапознато е дека со веројатност од 95%, распределена е случајна променлива нормален закон, ќе падне во опсег од приближно +/- 2 од средна вредност(види статија за). Овој интервал ќе ни послужи како прототип интервал на доверба.

Сега да видиме дали ја знаеме дистрибуцијата , да се пресмета овој интервал? За да одговориме на прашањето, мора да ја наведеме формата на дистрибуцијата и нејзините параметри.

Ја знаеме формата на дистрибуција - ова е нормална дистрибуција(запомнете дека зборуваме за дистрибуција на примероци статистика X просечно).

Параметарот μ ни е непознат (само треба да се процени со користење интервал на доверба), но имаме проценка за тоа X просечно,пресметано врз основа на примероци,кои можат да се користат.

Втор параметар - стандардна девијација на средната вредност на примерокот ќе го сметаме за познато, тоа е еднакво на σ/√n.

Бидејќи не знаеме μ, тогаш ќе го изградиме интервалот +/- 2 стандардни отстапувањане од средна вредност, и од неговата позната проценка X просечно. Оние. при пресметување интервал на довербатоа НЕМА да го претпоставуваме X просечноспаѓа во опсегот +/- 2 стандардни отстапувањаод μ со веројатност од 95%, и ќе претпоставиме дека интервалот е +/- 2 стандардни отстапувањаод X просечносо 95% веројатност ќе покрие μ – просек од општата популација,од кој е земен пример. Овие две тврдења се еквивалентни, но втората изјава ни овозможува да конструираме интервал на доверба.

Дополнително, да го разјасниме интервалот: случајна променлива дистрибуирана нормален закон, со 95% веројатност спаѓа во интервалот +/- 1,960 стандардни отстапувања,не +/- 2 стандардни отстапувања. Ова може да се пресмета со помош на формулата =NORM.ST.REV((1+0,95)/2), цм. пример интервал на лист со датотека.

Сега можеме да формулираме веројатност што ќе ни послужи да го формираме интервал на доверба:
„Веројатноста дека популација значилоциран од примерок просекво рок од 1.960" стандардни отстапувања на средната вредност на примерокот", еднакво на 95%“.

Вредноста на веројатноста спомената во изјавата има посебно име , кој е поврзан сониво на значајност α (алфа) со едноставен израз ниво на доверба =1 . Во нашиот случај ниво на значајност α =1-0,95=0,05 .

Сега, врз основа на оваа веројатност, пишуваме израз за пресметување интервал на доверба:

каде Z α/2 стандарден нормална дистрибуција(оваа вредност на случајната променлива z, Што П(z>=Z α/2 )=α/2).

Забелешка: Горна α/2-квантилаја дефинира ширината интервал на довербаВ стандардни отстапувања примерок значи. Горна α/2-квантила стандарден нормална дистрибуцијасекогаш поголем од 0, што е многу погодно.

Во нашиот случај, со α=0,05, горна α/2-квантила изнесува 1.960. За други нивоа на значајност α (10%; 1%) горна α/2-квантила Z α/2 може да се пресмета со помош на формулата =NORM.ST.REV(1-α/2) или, ако е познато ниво на доверба, =NORM.ST.OBR((1+ ниво на доверба)/2).

Обично кога се гради интервали на доверба за проценка на средната вредносткористете само горен α/2-квантили не користете пониски α/2-квантил. Ова е можно затоа што стандарден нормална дистрибуцијасиметрично околу оската x ( неговата густина на дистрибуцијасиметрично за просек, т.е. 0). Затоа, нема потреба да се пресметува пониска α/2-квантила(тоа едноставно се нарекува α /2-квантила), бидејќи тоа е еднакво горен α/2-квантилсо знак минус.

Да потсетиме дека, и покрај обликот на распределбата на вредноста x, соодветната случајна променлива X просечнодистрибуирани приближно Добро N(μ; σ 2 /n) (види статија за). Затоа, генерално, горенаведениот израз за интервал на довербае само приближна. Ако вредноста x се дистрибуира над нормален закон N(μ;σ 2 /n), потоа изразот за интервал на довербае точен.

Пресметка на интервал на доверба во MS EXCEL

Ајде да го решиме проблемот.
Времето на одговор на електронската компонента на влезниот сигнал е важна карактеристика на уредот. Инженерот сака да изгради интервал на доверба за просечното време на одговор на ниво на доверба од 95%. Од претходното искуство, инженерот знае дека стандардното отстапување на времето на одговор е 8 ms. Познато е дека за да се оцени времето на одговор, инженерот направил 25 мерења, просечната вредност била 78 ms.

Решение: Инженерот сака да го знае времето на одговор на електронскиот уред, но разбира дека времето на одговор не е фиксна вредност, туку случајна променлива која има своја дистрибуција. Значи, најдоброто на што може да се надева е да ги одреди параметрите и обликот на оваа дистрибуција.

За жал, од проблематичните услови не ја знаеме формата на распределбата на времето на одговор (не мора да биде нормално). , оваа дистрибуција е исто така непозната. Само тој е познат Стандардна девијацијаσ=8. Затоа, додека не можеме да ги пресметаме веројатностите и да конструираме интервал на доверба.

Сепак, и покрај тоа што не ја знаеме распределбата време посебен одговор, знаеме дека според CPT, дистрибуција на примероци просечно време на одговоре приближно нормално(ќе претпоставиме дека условите CPTсе спроведуваат, бидејќи големина примероцидоста голем (n=25)) .

Згора на тоа, просековаа распределба е еднаква на средна вредностдистрибуција на еден одговор, т.е. μ. А Стандардна девијацијана оваа распределба (σ/√n) може да се пресмета со формулата =8/ROOT(25) .

Познато е и дека инженерот примил бодовна проценкапараметар μ еднаков на 78 ms (X средна). Затоа, сега можеме да пресметаме веројатности, бидејќи ја знаеме формата на дистрибуција ( нормално) и неговите параметри (X avg и σ/√n).

Инженерот сака да знае очекуваната вредностμ распределби на времето на одговор. Како што е наведено погоре, ова μ е еднакво на математичко очекување на распределбата на примерокот на просечното време на одговор. Доколку користиме нормална дистрибуција N(X avg; σ/√n), тогаш саканиот μ ќе биде во опсегот +/-2*σ/√n со веројатност од приближно 95%.

Ниво на значајностеднакво на 1-0,95=0,05.

Конечно, да ја најдеме левата и десната граница интервал на доверба.
Лева граница: =78-NORM.ST.REV(1-0.05/2)*8/ROOT(25) = 74,864
Десна граница: =78+NORM.ST.INV(1-0.05/2)*8/ROOT(25)=81.136

Лева граница: =NORM.REV(0,05/2; 78; 8/ROOT(25))
Десна граница: =NORM.REV(1-0,05/2; 78; 8/ROOT(25))

Одговори: интервал на довербана 95% ниво на доверба и σ=8msecеднакви 78+/-3,136 ms.

ВО пример датотека на листот Сигмапознат, создаде образец за пресметка и конструкција двострано интервал на довербаза произволни примероцисо дадени σ и ниво на значење.

Функција DOFIDENCE.NORM().

Доколку вредностите примероцисе во опсегот Б20: Б79 , А ниво на значајностеднакво на 0,05; потоа формулата MS EXCEL:
=ПРОСЕК(B20:B79)-ДОВЕРБА.НОРМА(0.05;σ; COUNT(B20:B79))
ќе ја врати левата граница интервал на доверба.

Истата граница може да се пресмета со формулата:
=ПРОСЕК(B20:B79)-NORM.ST.REV(1-0.05/2)*σ/ROOT(COUNT(B20:B79))

Забелешка: Функцијата CONFIDENCE.NORM() се појави во MS EXCEL 2010. Во претходните верзии на MS EXCEL, се користеше функцијата TRUST().

интервали на доверба ( Англиски Интервали на доверба) еден од видовите проценки на интервали кои се користат во статистиката, кои се пресметуваат за дадено ниво на значајност. Тие ни овозможуваат да дадеме изјава дека вистинската вредност на непознат статистички параметар на популацијата е во рамките на добиениот опсег на вредности со веројатност што е специфицирана со избраното ниво на статистичка значајност.

Нормална дистрибуција

Кога е позната варијансата (σ 2) на популацијата на податоци, z-оценката може да се користи за пресметување на границите на доверба (крајните точки на интервалот на доверба). Во споредба со користењето на t-дистрибуцијата, користењето на z-оценката ќе ви овозможи да изградите не само потесен интервал на доверба, туку и посигурни проценки на очекуваната вредност и стандардното отстапување (σ), бидејќи z-оценката се заснова на нормална дистрибуција.

Формула

За да се одредат граничните точки на интервалот на доверба, под услов да се знае стандардното отстапување на популацијата на податоци, се користи следнава формула

L = X - Z α/2 σ
√n

Пример

Да претпоставиме дека големината на примерокот е 25 набљудувања, очекуваната вредност на примерокот е 15, а стандардното отстапување на популацијата е 8. За ниво на значајност од α=5%, Z-оценката е Z α/2 =1,96. Во овој случај, долните и горните граници на интервалот на доверба ќе бидат

L = 15 - 1,96 8 = 11,864
√25
L = 15 + 1,96 8 = 18,136
√25

Така, можеме да кажеме дека со 95% веројатност математичкото очекување на населението ќе падне во опсег од 11.864 до 18.136.

Методи за стеснување на интервалот на доверба

Да претпоставиме дека опсегот е премногу широк за целите на нашата студија. Постојат два начини да се намали опсегот на интервалот на доверба.

  1. Намалете го нивото на статистичка значајност α.
  2. Зголемете ја големината на примерокот.

Намалувајќи го нивото на статистичка значајност на α=10%, добиваме Z-оценка еднаква на Z α/2 =1,64. Во овој случај, долните и горните граници на интервалот ќе бидат

L = 15 - 1,64 8 = 12,376
√25
L = 15 + 1,64 8 = 17,624
√25

И самиот интервал на доверба може да се напише во форма

Во овој случај, можеме да направиме претпоставка дека со 90% веројатност математичкото очекување на населението ќе падне во опсегот.

Ако сакаме да не го намалиме нивото на статистичка значајност α, тогаш единствената алтернатива е да ја зголемиме големината на примерокот. Зголемувајќи го на 144 набљудувања, ги добиваме следните вредности на граници на доверба

L = 15 - 1,96 8 = 13,693
√144
L = 15 + 1,96 8 = 16,307
√144

Самиот интервал на доверба ќе ја има следната форма

Така, стеснувањето на интервалот на доверба без намалување на нивото на статистичка значајност е можно само со зголемување на големината на примерокот. Ако зголемувањето на големината на примерокот не е можно, тогаш стеснувањето на интервалот на доверба може да се постигне единствено со намалување на нивото на статистичка значајност.

Конструирање интервал на доверба за дистрибуција различна од нормалната

Ако стандардното отстапување на популацијата не е познато или дистрибуцијата е различна од нормалната, t-распределбата се користи за да се изгради интервал на доверба. Оваа техника е поконзервативна, што се рефлектира во пошироки интервали на доверба, во споредба со техниката базирана на Z-оценката.

Формула

За да ги пресметате долните и горните граници на интервалот на доверба врз основа на т-дистрибуцијата, користете ги следните формули

L = X - t α σ
√n

Студентската распределба или t-дистрибуцијата зависи само од еден параметар - бројот на степени на слобода, што е еднаков на бројот на поединечни вредности на атрибутот (бројот на набљудувања во примерокот). Вредноста на Студентскиот t-тест за даден број степени на слобода (n) и нивото на статистичка значајност α може да се најдат во референтните табели.

Пример

Да претпоставиме дека големината на примерокот е 25 поединечни вредности, очекуваната вредност на примерокот е 50, а стандардната девијација на примерокот е 28. Потребно е да се изгради интервал на доверба за нивото на статистичка значајност α=5%.

Во нашиот случај, бројот на степени на слобода е 24 (25-1), па затоа соодветната табела вредност на Студентскиот t-тест за нивото на статистичка значајност α=5% е 2,064. Затоа, долните и горните граници на интервалот на доверба ќе бидат

L = 50 - 2,064 28 = 38,442
√25
L = 50 + 2,064 28 = 61,558
√25

И самиот интервал може да се напише во форма

Така, можеме да кажеме дека со 95% веројатност математичкото очекување на населението ќе биде во опсегот .

Користењето на распределбата t ви овозможува да го стесните интервалот на доверба или со намалување на статистичката значајност или со зголемување на големината на примерокот.

Намалувајќи ја статистичката значајност од 95% на 90% во условите на нашиот пример, ја добиваме соодветната табела вредност на Студентскиот t-тест од 1,711.

L = 50 - 1.711 28 = 40,418
√25
L = 50 + 1,711 28 = 59,582
√25

Во овој случај, можеме да кажеме дека со 90% веројатност математичкото очекување на населението ќе биде во опсегот .

Ако не сакаме да ја намалиме статистичката значајност, тогаш единствената алтернатива е да ја зголемиме големината на примерокот. Да речеме дека се работи за 64 поединечни набљудувања, а не 25 како во првобитната состојба на примерот. Табелата вредност на Студентскиот t-тест за 63 степени на слобода (64-1) и нивото на статистичка значајност α=5% е 1,998.

L = 50 - 1.998 28 = 43,007
√64
L = 50 + 1,998 28 = 56,993
√64

Ова ни овозможува да кажеме дека со 95% веројатност математичкото очекување на населението ќе биде во опсегот.

Големи примероци

Големите примероци се примероци од популација на податоци во кои бројот на поединечни набљудувања надминува 100. Статистичките студии покажаа дека поголемите примероци имаат тенденција да бидат нормално распределени, дури и ако распределбата на популацијата не е нормална. Дополнително, за такви примероци, употребата на z-оценка и t-распределба дава приближно исти резултати при конструирање интервали на доверба. Така, за големи примероци, прифатливо е да се користи z-оценката за нормална дистрибуција наместо t-дистрибуција.

Ајде да го сумираме

Интервал на доверба(CI; на англиски, интервал на доверба - CI) добиен во студија со примерок дава мерка за точноста (или несигурноста) на резултатите од студијата со цел да се извлечат заклучоци за популацијата на сите такви пациенти (општата популација). Точната дефиниција за 95% CI може да се формулира на следниов начин: 95% од таквите интервали ќе ја содржат вистинската вредност во популацијата. Оваа интерпретација е нешто помалку точна: CI е опсегот на вредности во кои можете да бидете 95% сигурни дека ја содржи вистинската вредност. Кога се користи CI, акцентот е на одредување квантитативен ефект, за разлика од вредноста P што произлегува од тестирањето на статистичката значајност. Вредноста P не проценува ниту една количина, туку повеќе служи како мерка за јачината на доказите против нултата хипотеза за „нема ефект“. Вредноста на P сама по себе не ни кажува ништо за големината на разликата, па дури и за нејзината насока. Затоа, независните вредности на P се апсолутно неинформативни во статиите или апстрактите. Спротивно на тоа, CI укажува и на големината на ефектот од непосреден интерес, како што е користа од третманот, и на силата на доказите. Затоа, DI е директно поврзана со практиката на EBM.

Пристапот за проценка на статистичка анализа, пример со CI, има за цел да ја измери количината на ефектот од интерес (чувствителност на дијагностички тест, стапка на предвидени случаи, релативно намалување на ризикот со третман итн.) и исто така да ја измери несигурноста во тоа ефект. Најчесто, CI е опсегот на вредности од двете страни на проценката во кој најверојатно ќе лежи вистинската вредност, и можете да бидете сигурни 95% во тоа. Договорот за користење на 95% веројатност е произволен, како и вредноста P.<0,05 для оценки статистической значимости, и авторы иногда используют 90% или 99% ДИ. Заметим, что слово «интервал» означает диапазон величин и поэтому стоит в единственном числе. Две величины, которые ограничивают интервал, называются «доверительными пределами».

CI се заснова на идејата дека истата студија изведена на различни примероци на пациенти нема да даде идентични резултати, туку дека нивните резултати ќе бидат дистрибуирани околу вистинска, но непозната вредност. Со други зборови, CI го опишува како „променливост зависна од примерокот“. КИ не одразува дополнителна несигурност поради други причини; особено, не го вклучува влијанието на селективна загуба за следење, слаба усогласеност или неточно мерење на исходот, недостаток на заслепување итн. Затоа CI секогаш го потценува вкупниот износ на неизвесност.

Пресметка на интервал на доверба

Табела А1.1. Стандардни грешки и интервали на доверба за избрани клинички мерења

Вообичаено, CI се пресметува од набљудуваната проценка на количината, како што е разликата (г) помеѓу две пропорции и стандардната грешка (SE) во проценката на таа разлика. Приближниот 95% CI добиен на овој начин е d ± 1,96 SE. Формулата се менува според природата на мерката за исходот и опсегот на CI. На пример, во рандомизирано, плацебо контролирано испитување на ацелуларна вакцина против пертусис, 72 од 1670 (4,3%) доенчиња кои ја примиле вакцината развиле пертусис и 240 од 1665 (14,4%) во контролната група. Процентуалната разлика, позната како апсолутно намалување на ризикот, е 10,1%. SE на оваа разлика е 0,99%. Според тоа, 95% CI е 10,1% + 1,96 x 0,99%, т.е. од 8,2 до 12,0.

И покрај нивните различни филозофски пристапи, CI и тестовите за статистичка значајност се тесно поврзани математички.

Така, вредноста P е „значајна“, т.е. Р<0,05 соответствует 95% ДИ, который исключает величину эффекта, указывающую на отсутствие различия. Например, для различия между двумя средними пропорциями это ноль, а для относительного риска или отношения шансов - единица. При некоторых обстоятельствах эти два подхода могут быть не совсем эквивалентны. Преобладающая точка зрения: оценка с помощью ДИ - предпочтительный подход к суммированию результатов исследования, но ДИ и величина Р взаимодополняющи, и во многих статьях используются оба способа представления результатов.

Несигурноста (неточноста) на проценката, изразена во CI, е во голема мера поврзана со квадратниот корен на големината на примерокот. Малите примероци даваат помалку информации од големите, а CI е соодветно поширок во помал примерок. На пример, една статија која ги споредува перформансите на три тестови користени за дијагностицирање на инфекција со Helicobacter pylori, објави чувствителност на тестот за здив со уреа од 95,8% (95% CI 75-100). Иако бројката од 95,8% е импресивна, малиот примерок од 24 возрасни пациенти со J. pylori значи дека постои значителна несигурност во оваа проценка, како што е прикажано со широкиот CI. Навистина, долната граница од 75% е многу помала од проценката од 95,8%. Доколку истата чувствителност би била забележана кај примерок од 240 луѓе, 95% CI би бил 92,5-98,0, што дава повеќе уверување дека тестот е многу чувствителен.

Во рандомизирани контролирани испитувања (RCTs), незначајните резултати (т.е. оние со P>0,05) се особено подложни на погрешно толкување. CI е особено корисен овде бидејќи покажува колку се конзистентни резултатите со клинички корисниот вистински ефект. На пример, во RCT споредување на шиење на дебелото црево и основна анастомоза, инфекцијата на раната се развила кај 10,9% и 13,5% од пациентите, соодветно (P = 0,30). 95% CI за оваа разлика е 2,6% (-2 до +8). Дури и во оваа студија на 652 пациенти, останува можно да постои скромна разлика во инциденцата на инфекции кои произлегуваат од двете процедури. Колку помалку истражувања, толку е поголема неизвесноста. Сунг и сор. изведе RCT за да ја спореди инфузијата на октреотид со акутна склеротерапија за акутно варикозно крварење кај 100 пациенти. Во групата на октреотиди, стапката на контрола на крварењето беше 84%; во групата за склеротерапија - 90%, што дава P = 0,56. Забележете дека стапките на тековно крварење се слични на оние за инфекција на раната во споменатата студија. Во овој случај, сепак, 95% CI за разликата помеѓу интервенциите е 6% (-7 до +19). Овој опсег е доста широк во споредба со разликата од 5% што би била од клинички интерес. Јасно е дека студијата не исклучува значителна разлика во ефективноста. Затоа, заклучокот на авторите „инфузијата со октреотид и склеротерапијата се подеднакво ефикасни во третманот на крварење од проширени вени“ е дефинитивно невалиден. Во случаи како овој, каде што, како овде, 95% CI за намалување на апсолутниот ризик (ARR) вклучува нула, CI за NNT (број што е потребен за лекување) е доста тешко да се толкува. NPL и неговиот CI се добиваат од реципроците на ACP (се множат со 100 ако овие вредности се дадени во проценти). Овде добиваме NPL = 100: 6 = 16,6 со 95% CI од -14,3 до 5,3. Како што може да се види од фуснотата „г“ во табелата. A1.1, овој CI вклучува вредности на NPL од 5,3 до бесконечност и NPL од 14,3 до бесконечност.

CI може да се конструираат за најчесто користени статистички проценки или споредби. За RCTs, ја вклучува разликата помеѓу средните пропорции, релативните ризици, коефициентите на шансите и NLRs. Слично, CI може да се добијат за сите главни проценки направени во студиите за точноста на дијагностичките тестови - чувствителност, специфичност, позитивна предвидлива вредност (сите се едноставни пропорции) и коефициенти на веројатност - проценки добиени во мета-анализи и споредба-со-контрола студии. Програма за персонален компјутер што покрива многу од овие употреби на MDI е достапна со второто издание на Statistics with Confidence. Макроата за пресметување CI за пропорции се достапни бесплатно за Excel и статистичките програми SPSS и Minitab на http://www.uwcm.ac.uk/study/medicine/epidemiology_statistics/research/statistics/proportions, htm.

Повеќекратни проценки на ефектот на третманот

Додека CI се пожелни за резултатите од примарните студии, тие не се неопходни за сите резултати. CI се однесува на клинички важни споредби. На пример, кога се споредуваат две групи, точниот CI е оној конструиран за разликата помеѓу групите, како што е прикажано во примерите погоре, а не CI што може да се конструира за проценката во секоја група. Не само што не е корисно да се обезбедат посебни CI за проценки во секоја група, оваа презентација може да биде погрешна. Слично на тоа, правилниот пристап кога се споредува ефективноста на третманите во различни подгрупи е директно да се споредат две (или повеќе) подгрупи. Неточно е да се претпостави дека третманот е ефикасен само во една подгрупа ако неговата CI ја исклучува вредноста што одговара на никаков ефект, а другите не. CI се исто така корисни кога се споредуваат резултатите во повеќе подгрупи. На сл. А 1.1 го покажува релативниот ризик од еклампсија кај жени со прееклампсија кај подгрупи жени од плацебо контролирана RCT на магнезиум сулфат.

Ориз. А1.2. Шумската парцела ги прикажува резултатите од 11 рандомизирани клинички испитувања на вакцина против говеда ротавирус за спречување на дијареа во споредба со плацебо. Беше користен интервал на доверба од 95% за да се процени релативниот ризик од дијареа. Големината на црниот квадрат е пропорционална на количината на информации. Дополнително, прикажана е збирната проценка на ефективноста на третманот и интервалот на доверба од 95% (означен со дијамант). Мета-анализата користеше модел на случајни ефекти поголем од некои претходно одредени; на пример, ова може да биде големината што се користи при пресметувањето на големината на примерокот. Построг критериум бара целиот опсег на CI да покаже корист поголема од предодредениот минимум.

Веќе разговаравме за заблудата на земањето на недостаток на статистичка значајност како индикација дека два третмани се подеднакво ефикасни. Подеднакво е важно да не се поистоветува статистичката значајност со клиничката важност. Клиничкото значење може да се претпостави кога резултатот е статистички значаен и големината на проценката на ефективноста на третманот

Студиите можат да покажат дали резултатите се статистички значајни и кои се клинички важни, а кои не се. На сл. А1.2 ги прикажува резултатите од четири тестови, за кои целиот CI<1, т.е. их результаты статистически значимы при Р <0,05 , . После высказанного предположения о том, что клинически важным различием было бы сокращение риска диареи на 20% (ОР = 0,8), все эти испытания показали клинически значимую оценку сокращения риска, и лишь в исследовании Treanor весь 95% ДИ меньше этой величины. Два других РКИ показали клинически важные результаты, которые не были статистически значимыми. Обратите внимание, что в трёх испытаниях точечные оценки эффективности лечения были почти идентичны, но ширина ДИ различалась (отражает размер выборки). Таким образом, по отдельности доказательная сила этих РКИ различна.

И други.Сите тие се проценки на нивните теоретски аналози, кои би можеле да се добијат доколку не беше достапен примерок, туку општа популација. Но, за жал, општата популација е многу скапа и често недостапна.

Концептот на проценка на интервалот

Секоја проценка на примерокот има одредено ширење, бидејќи е случајна променлива во зависност од вредностите во одреден примерок. Затоа, за поверодостојни статистички заклучоци, треба да се знае не само проценката на поени, туку и интервалот, кој со голема веројатност γ (гама) го опфаќа оценетиот индикатор θ (тета).

Формално, ова се две такви вредности (статистички податоци) Т 1 (X)И Т 2 (X), Што Т 1< T 2 , за што на дадено ниво на веројатност γ е исполнет условот:

Накратко, веројатно е γ или повеќе вистинскиот индикатор е помеѓу точките Т 1 (X)И Т 2 (X), кои се нарекуваат долна и горна граница интервал на доверба.

Еден од условите за конструирање на интервали на доверба е неговата максимална теснотија, т.е. треба да биде што е можно пократко. Желбата е сосема природна, бидејќи ... истражувачот се обидува попрецизно да ја локализира локацијата на саканиот параметар.

Следи дека интервалот на доверба мора да ги покрие максималните веројатности на распределбата. а самата проценка треба да биде во центарот.

Односно, веројатноста за отстапување (на вистинскиот индикатор од проценката) нагоре е еднаква на веројатноста за отстапување надолу. Исто така, треба да се забележи дека за асиметрични распределби, интервалот десно не е еднаков на интервалот лево.

Сликата погоре јасно покажува дека колку е поголема веројатноста за доверба, толку е поширок интервалот - директна врска.

Ова беше краток вовед во теоријата на интервална проценка на непознати параметри. Ајде да продолжиме кон наоѓање граници на доверба за математичкото очекување.

Интервал на доверба за математичко очекување

Ако оригиналните податоци се дистрибуираат преку , тогаш просекот ќе биде нормална вредност. Ова произлегува од правилото дека линеарната комбинација на нормални вредности има и нормална дистрибуција. Затоа, за пресметување на веројатностите би можеле да го искористиме математичкиот апарат на законот за нормална распределба.

Сепак, ова ќе бара познавање на два параметри - очекување и варијанса, кои обично се непознати. Се разбира, можете да користите проценки наместо параметри (аритметичка средина и ), но тогаш распределбата на просекот нема да биде сосема нормална, таа ќе биде малку срамнета надолу. Овој факт е паметно забележан од граѓанинот Вилијам Госет од Ирска, објавувајќи го своето откритие во март 1908 година во списанието Биометрика. Заради тајност, Госет се потпишал себеси Студент. Вака се појави Студентската т-дистрибуција.

Меѓутоа, нормалната дистрибуција на податоците, користена од К. Затоа, најдобро е да се отфрли претпоставката за нормалност и да се користат методи кои не зависат од дистрибуцијата на оригиналните податоци.

Се поставува прашањето: каква е распределбата на аритметичката средина ако се пресметува од податоците на непозната распределба? Одговорот го дава добро познатата во теоријата на веројатност Теорема на централна граница(CPT). Во математиката, постојат неколку негови варијанти (формулациите се рафинирани со текот на годините), но сите тие, грубо кажано, се сведуваат на изјавата дека збирот на голем број независни случајни променливи го почитува законот за нормална распределба.

При пресметување на аритметичката средина се користи збирот на случајни променливи. Од тука излегува дека аритметичката средина има нормална дистрибуција, во која очекувањето е очекување на оригиналниот податок, а варијансата е .

Паметните луѓе знаат како да докажат CLT, но ние ќе го потврдиме тоа со помош на експеримент спроведен во Excel. Ајде да симулираме примерок од 50 рамномерно распределени случајни променливи (со користење на функцијата Excel RANDBETWEEN). Потоа ќе направиме 1000 такви примероци и ќе ја пресметаме аритметичката средина за секој. Да ја погледнеме нивната дистрибуција.

Се гледа дека распределбата на просекот е блиска до нормалниот закон. Ако големината и бројот на примерокот се направат уште поголеми, сличноста ќе биде уште подобра.

Сега кога со свои очи ја видовме валидноста на CLT, можеме, користејќи , да пресметаме интервали на доверба за аритметичката средина, кои ја покриваат вистинската средина или математичкото очекување со дадена веројатност.

За да ги утврдите горните и долните граници, треба да ги знаете параметрите на нормалната дистрибуција. Како по правило, нема, затоа се користат проценки: аритметичко значењеИ варијанса на примерокот. Повторувам, овој метод дава добра апроксимација само со големи примероци. Кога примероците се мали, често се препорачува да се користи дистрибуцијата Студент. Не верувајте! Студентската распределба за средната вредност се јавува само кога оригиналните податоци се нормално дистрибуирани, односно речиси никогаш. Затоа, подобро е веднаш да се постави минимална лента за количината на потребните податоци и да се користат асимптотички точни методи. Велат доволни се 30 набљудувања. Земете 50 - нема да погрешите.

Т 1.2– долните и горните граници на интервалот на доверба

– примерок аритметичка средина

с 0– стандардна девијација на примерокот (непристрасно)

n - големина на примерокот

γ - веројатност за доверба (обично еднаква на 0,9, 0,95 или 0,99)

c γ =Φ -1 ((1+γ)/2)– инверзната вредност на стандардната функција за нормална дистрибуција. Едноставно кажано, ова е бројот на стандардни грешки од аритметичката средина до долната или горната граница (овие три веројатности одговараат на вредностите од 1,64, 1,96 и 2,58).

Суштината на формулата е дека се зема аритметичката средина и потоа се издвојува одредена количина од неа ( со γ) стандардни грешки ( s 0 /√n). Се е познато, земете го и размислете.

Пред широката употреба на персоналните компјутери, тие се користат за добивање на вредностите на функцијата за нормална дистрибуција и нејзината инверзна. Тие се користат и денес, но поефективно е да се користат готови формули на Excel. Сите елементи од формулата погоре ( , и ) може лесно да се пресметаат во Excel. Но, постои готова формула за пресметување на интервалот на доверба - ДОВЕРБА.НОРМА. Неговата синтакса е како што следува.

DOFIDENCE.NORM(алфа;стандардна_исклучена;големина)

алфа– ниво на значајност или ниво на доверба, кое во ознаката усвоена погоре е еднаква на 1- γ, т.е. веројатноста дека математичкатаочекувањето ќе биде надвор од интервалот на доверба. Со ниво на доверба од 0,95, алфата е 0,05, итн.

стандардно_исклучено– стандардно отстапување на податоците од примерокот. Нема потреба да се пресметува стандардната грешка; самиот Excel ќе се подели со коренот на n.

големина– големина на примерокот (n).

Резултатот од функцијата НОРМА НА ДОВЕРБА е вториот член од формулата за пресметување на интервалот на доверба, т.е. полу-интервал Според тоа, долните и горните точки се просечната ± добиената вредност.

Така, можно е да се конструира универзален алгоритам за пресметување на интервали на доверба за аритметичката средина, што не зависи од распределбата на оригиналните податоци. Цената за универзалноста е нејзината асимптотична природа, т.е. потребата да се користат релативно големи примероци. Меѓутоа, во ерата на модерната технологија, собирањето на потребната количина на податоци обично не е тешко.

Тестирање на статистички хипотези користејќи интервали на доверба

(модул 111)

Еден од главните проблеми што се решаваат во статистиката е. Нејзината суштина е накратко како што следува. Се прави претпоставка, на пример, дека очекувањата на општата популација се еднакви на некоја вредност. Потоа се конструира дистрибуција на примерок средства што може да се набљудуваат за дадено очекување. Следно, тие гледаат каде во оваа условна распределба се наоѓа реалниот просек. Ако ги надмине прифатливите граници, тогаш појавата на таков просек е многу мала, а ако експериментот се повтори еднаш, тоа е речиси невозможно, што е во спротивност со поставената хипотеза, која е успешно отфрлена. Ако просекот не оди подалеку од критичното ниво, тогаш хипотезата не се отфрла (но и не се докажува!).

Значи, со помош на интервали на доверба, во нашиот случај за очекување, можете да тестирате и некои хипотези. Тоа е многу лесно да се направи. Да речеме дека аритметичката средина за одреден примерок е еднаква на 100. Се тестира хипотезата дека очекуваната вредност е, да речеме, 90. Односно, ако го поставиме прашањето примитивно, тоа звучи вака: дали е тоа така со точното вредност на средната вредност еднаква на 90, забележаниот просек испадна 100?

За да одговорите на ова прашање, дополнително ќе ви требаат информации за стандардното отстапување и големината на примерокот. Да претпоставиме дека стандардното отстапување е 30, а бројот на набљудувања е 64 (за лесно да се извлече коренот). Тогаш стандардната грешка на средната вредност е 30/8 или 3,75. За да пресметате интервал на доверба од 95%, ќе треба да додадете две стандардни грешки на секоја страна од средната вредност (поточно, 1,96). Интервалот на доверба ќе биде приближно 100±7,5 или од 92,5 до 107,5.

Понатамошното размислување е како што следува. Ако вредноста што се тестира спаѓа во интервалот на доверба, тогаш тоа не е во спротивност со хипотезата, бидејќи спаѓа во границите на случајни флуктуации (со веројатност од 95%). Ако точката што се проверува падне надвор од интервалот на доверба, тогаш веројатноста за таков настан е многу мала, во секој случај под прифатливото ниво. Тоа значи дека хипотезата е отфрлена како контрадикторна со набљудуваните податоци. Во нашиот случај, хипотезата за очекуваната вредност е надвор од интервалот на доверба (тестираната вредност 90 не е вклучена во интервалот 100±7,5), па затоа треба да се отфрли. Одговарајќи на примитивното прашање погоре, треба да се каже: не, не може, во секој случај, ова се случува исклучително ретко. Често, тие укажуваат на специфичната веројатност за погрешно отфрлање на хипотезата (p-ниво), а не на одреденото ниво на кое е изграден интервалот на доверба, туку повеќе за тоа друг пат.

Како што можете да видите, да се изгради интервал на доверба за просекот (или математичкото очекување) не е тешко. Главната работа е да ја сфатите суштината, а потоа работите ќе продолжат понатаму. Во пракса, повеќето случаи користат интервал на доверливост од 95%, што е приближно две стандардни грешки широки на двете страни од средната вредност.

Тоа е се за сега. Се најдобро!

ИНТЕРВАЛИ НА ДОВЕРБА ЗА ФРЕКЕНЦИИ И ДРОПКИ

© 2008 година

Национален институт за јавно здравје, Осло, Норвешка

Статијата го опишува и дискутира пресметувањето на интервалите на доверливост за фреквенции и пропорции со помош на методите Wald, Wilson, Clopper - Pearson, користејќи аголна трансформација и методот Wald со Agresti - Coull корекција. Презентираниот материјал дава општи информации за методите за пресметување интервали на доверливост за фреквенции и пропорции и е наменет да го разбуди интересот на читателите на списанието не само за користење интервали на доверба при презентирање на резултатите од сопственото истражување, туку и за читање специјализирана литература пред да започнете со работа. на идните публикации.

Клучни зборови: интервал на доверба, фреквенција, пропорција

Една од претходните публикации накратко го спомна описот на квалитативните податоци и објави дека нивната проценка на интервалот се претпочита отколку проценката на точка за опишување на зачестеноста на појавата на карактеристиката што се проучува кај популацијата. Навистина, бидејќи истражувањето се спроведува со користење на податоци од примерокот, проекцијата на резултатите врз популацијата мора да содржи елемент на непрецизност при земање примероци. Интервалот на доверба е мерка за точноста на параметарот што се проценува. Интересно е што некои книги за основна статистика за лекарите целосно ја игнорираат темата за интервали на доверба за фреквенциите. Во оваа статија ќе разгледаме неколку начини за пресметување на интервалите на доверливост за фреквенциите, што подразбира такви карактеристики на примерокот како неповторливост и репрезентативност, како и независност на набљудувањата едни од други. Во овој напис, фреквенцијата не се сфаќа како апсолутен број што покажува колку пати одредена вредност се јавува во агрегат, туку како релативна вредност што го одредува процентот на учесници во студијата кај кои се јавува проучуваната карактеристика.

Во биомедицинските истражувања најчесто се користат 95% интервали на доверба. Овој интервал на доверба е областа во која вистинската пропорција паѓа 95% од времето. Со други зборови, со 95% сигурност можеме да кажеме дека вистинската вредност на фреквенцијата на појава на особина кај популацијата ќе биде во рамките на интервалот на доверба од 95%.

Повеќето статистички прирачници за медицински истражувачи известуваат дека грешката во фреквенцијата се пресметува со помош на формулата

каде што p е фреквенцијата на појавување на карактеристиката во примерокот (вредност од 0 до 1). Повеќето домашни научни написи укажуваат на фреквенцијата на појава на особина во примерок (p), како и нејзината грешка (и) во форма p ± s. Сепак, посоодветно е да се прикаже интервал на доверливост од 95% за фреквенцијата на појава на особина кај популацијата, што ќе вклучува вредности од

пред.

Некои прирачници препорачуваат за мали примероци да се замени вредноста од 1,96 со вредност од t за N – 1 степени на слобода, каде што N е бројот на набљудувања во примерокот. Вредноста t се наоѓа од табелите за т-дистрибуција, достапна во скоро сите учебници за статистика. Употребата на t дистрибуцијата за Wald методот не обезбедува видливи предности во споредба со другите методи дискутирани подолу, и затоа не е препорачана од некои автори.

Методот претставен погоре за пресметување интервали на доверливост за фреквенции или пропорции е наречен Валд во чест на Абрахам Валд (1902–1950), бидејќи неговата широка употреба започна по објавувањето на Валд и Волфовиц во 1939 година. Сепак, самиот метод беше предложен од Пјер Симон Лаплас (1749–1827) уште во 1812 година.

Методот Wald е многу популарен, но неговата примена е поврзана со значителни проблеми. Методот не се препорачува за мали големини на примероци, како и во случаи кога фреквенцијата на појава на карактеристика се стреми кон 0 или 1 (0% или 100%) и е едноставно невозможна за фреквенции од 0 и 1. Покрај тоа, приближувањето на нормалната дистрибуција, што се користи при пресметување на грешката, „не функционира“ во случаи кога n · p< 5 или n · (1 – p) < 5 . Более консервативные статистики считают, что n · p и n · (1 – p) должны быть не менее 10 . Более детальное рассмотрение метода Вальда показало, что полученные с его помощью доверительные интервалы в большинстве случаев слишком узки, то есть их применение ошибочно создает слишком оптимистичную картину, особенно при удалении частоты встречаемости признака от 0,5, или 50 % . К тому же при приближении частоты к 0 или 1 доверительный интревал может принимать отрицательные значения или превышать 1, что выглядит абсурдно для частот. Многие авторы совершенно справедливо не рекомендуют применять данный метод не только в уже упомянутых случаях, но и тогда, когда частота встречаемости признака менее 25 % или более 75 % . Таким образом, несмотря на простоту расчетов, метод Вальда может применяться лишь в очень ограниченном числе случаев. Зарубежные исследователи более категоричны в своих выводах и однозначно рекомендуют не применять этот метод для небольших выборок , а ведь именно с такими выборками часто приходится иметь дело исследователям-медикам.

Бидејќи новата променлива е нормално распределена, долните и горните граници на 95% интервалот на доверба за променливата φ ќе бидат φ-1,96 и φ+1,96лево">

Наместо 1,96 за мали примероци, се препорачува вредноста t да се замени со N – 1 степени на слобода. Овој метод не произведува негативни вредности и овозможува попрецизни проценки на интервалите на доверба за фреквенциите од методот Wald. Покрај тоа, тој е опишан во многу домашни референтни книги за медицинска статистика, што, сепак, не доведе до негова широка употреба во медицинските истражувања. Пресметувањето на интервалите на доверба со користење на аголна трансформација не се препорачува за фреквенции кои се приближуваат до 0 или 1.

Овде обично завршува описот на методите за проценка на интервалите на доверба во повеќето книги за основите на статистиката за медицинските истражувачи, а овој проблем е типичен не само за домашната, туку и за странската литература. Двата методи се засноваат на централната гранична теорема, што подразбира голем примерок.

Земајќи ги предвид недостатоците во проценувањето на интервалите на доверливост со користење на горенаведените методи, Клопер и Пирсон во 1934 година предложиле метод за пресметување на таканаречениот точен интервал на доверба, со оглед на биномната дистрибуција на особината што се проучува. Овој метод е достапен во многу онлајн калкулатори, но интервалите на доверливост добиени на овој начин во повеќето случаи се премногу широки. Во исто време, овој метод се препорачува за употреба во случаи кога е неопходна конзервативна проценка. Степенот на конзервативност на методот се зголемува како што се намалува големината на примерокот, особено кога Н< 15 . описывает применение функции биномиального распределения для анализа качественных данных с использованием MS Excel, в том числе и для определения доверительных интервалов, однако расчет последних для частот в электронных таблицах не «затабулирован» в удобном для пользователя виде, а потому, вероятно, и не используется большинством исследователей.

Според многу статистичари, најоптималната проценка на интервалите на доверливост за фреквенциите се врши со методот Вилсон, предложен уште во 1927 година, но практично не се користи во домашните биомедицински истражувања. Овој метод не само што овозможува да се проценат интервали на доверба и за многу мали и за многу големи фреквенции, туку е применлив и за мал број на набљудувања. Општо земено, интервалот на доверба според формулата на Вилсон ја има формата



каде што ја зема вредноста 1,96 при пресметување на интервалот на доверба од 95%, N е бројот на набљудувања, а p е фреквенцијата на појавување на карактеристиката во примерокот. Овој метод е достапен во онлајн калкулаторите, така што неговата употреба не е проблематична. и не препорачуваме користење на овој метод за n стр< 4 или n · (1 – p) < 4 по причине слишком грубого приближения распределения р к нормальному в такой ситуации, однако зарубежные статистики считают метод Уилсона применимым и для малых выборок .

Покрај методот Вилсон, се верува дека и методот Валд со корекција на Agresti-Coll обезбедува оптимална проценка на интервалот на доверба за фреквенциите. Agresti-Coll корекцијата е замена во формулата Wald на фреквенцијата на појавување на карактеристика во примерок (p) со p`, кога се пресметува која 2 се додава на броителот и 4 се додава на именителот, т.е. p` = (X + 2) / (N + 4), каде што X е бројот на учесници во студијата кои ја имаат карактеристиката што се проучува, а N е големината на примерокот. Оваа модификација дава резултати многу слични на формулата на Вилсон, освен кога фреквенцијата на настанот се приближува до 0% или 100%, а примерокот е мал. Покрај горенаведените методи за пресметување на интервалите на доверливост за фреквенциите, предложени се корекции на континуитет и за методите Wald и Wilson за мали примероци, но студиите покажаа дека нивната употреба е несоодветна.

Да ја разгледаме примената на горенаведените методи за пресметување на интервали на доверба користејќи два примери. Во првиот случај, проучуваме голем примерок од 1.000 случајно избрани учесници во студијата, од кои 450 ја имаат карактеристиката што се испитува (ова може да биде фактор на ризик, исход или која било друга карактеристика), што претставува фреквенција од 0,45 или 45 %. Во вториот случај, студијата се спроведува со користење на мал примерок, да речеме, само 20 луѓе, а само 1 учесник во студијата (5%) ја има карактеристиката што се проучува. Интервалите на доверливост со помош на методот Wald, методот Wald со Agresti–Coll корекција и методот Wilson беа пресметани со помош на онлајн калкулатор развиен од Џеф Сауро (http://www. /wald. htm). Вилсоновите интервали на доверба поправени со континуитет беа пресметани со помош на калкулаторот обезбеден од Wassar Stats: Web Site for Statistical Computation (http://faculty.vassar.edu/lowry/prop1.html). Пресметките на Аголна Фишер трансформација беа извршени рачно користејќи ја критичната вредност t за 19 и 999 степени на слобода, соодветно. Резултатите од пресметката се претставени во табелата за двата примери.

Интервали на доверба пресметани на шест различни начини за два примери опишани во текстот

Метод за пресметување на интервалот на доверба

P=0,0500, или 5%

95% CI за X=450, N=1000, P=0,4500 или 45%

–0,0455–0,2541

Wald со Agresti–Coll корекција

<,0001–0,2541

Вилсон со корекција на континуитет

Клопер-Пирсон „точен метод“

Аголна трансформација

<0,0001–0,1967

Како што може да се види од табелата, за првиот пример интервалот на доверливост пресметан со помош на „општо прифатениот“ Wald метод влегува во негативниот регион, што не може да биде случај за фреквенциите. За жал, ваквите инциденти не се невообичаени во руската литература. Традиционалниот начин на прикажување на податоците во однос на фреквенцијата и нивната грешка делумно го маскира овој проблем. На пример, ако фреквенцијата на појава на особина (во проценти) е претставена како 2,1 ± 1,4, тогаш тоа не е толку „навредливо за окото“ како 2,1% (95% CI: -0,7; 4,9), иако и значи истото. Валдовиот метод со Agresti-Coll корекција и пресметка со помош на аголна трансформација дава долна граница која се стреми кон нула. Вилсоновиот метод поправен со континуитет и „точниот метод“ произведуваат пошироки интервали на доверба од методот на Вилсон. За вториот пример, сите методи даваат приближно исти интервали на доверба (разликите се појавуваат само во илјадити), што не е изненадувачки, бидејќи зачестеноста на појавата на настанот во овој пример не се разликува многу од 50%, а големината на примерокот е доста голем.

За читателите кои се заинтересирани за овој проблем, можеме да ги препорачаме делата на Р. Од домашните прирачници ја препорачуваме книгата и во која покрај деталниот опис на теоријата се претставени методите на Валд и Вилсон, како и метод за пресметување на интервали на доверба земајќи ја предвид биномната фреквентна дистрибуција. Покрај бесплатните онлајн калкулатори (http://www. /wald. htm и http://faculty. vassar. edu/lowry/prop1.html), интервалите на доверба за фреквенциите (и не само!) може да се пресметаат со помош на Програма на ЦИА (Анализа на интервали на доверба), која може да се преземе од http://www. медицинско училиште. сотон. ак. uk/cia/.

Следната статија ќе ги разгледа униваријантните начини за споредување на квалитативните податоци.

Библиографија

Банерџи А.Медицинска статистика на јасен јазик: воведен курс / А. Банерџи. – М.: Практична медицина, 2007. – 287 стр. Медицинска статистика / . – М.: Агенција за медицински информации, 2007. – 475 стр. Гланц С.Медицинска и биолошка статистика / S. Glanz. – М.: Практика, 1998 г. Типови на податоци, тестирање на дистрибуција и описна статистика // Човечка екологија – 2008. – бр. 1. – стр. 52–58. Жижин К.С.. Медицинска статистика: учебник / . – Ростов н/д: Феникс, 2007. – 160 стр. Применета медицинска статистика / , . – Санкт Петербург. : Foliot, 2003. – 428 стр. Лакин Г. Ф. Биометрика / . – М.: Виша школа, 1990. – 350 стр. Медицина В.А. Математичка статистика во медицината / , . – М.: Финансии и статистика, 2007. – 798 стр. Математичка статистика во клиничките истражувања / , . – М.: ГЕОТАР-МЕД, 2001. – 256 стр. Јункеров В. И. Медицинска и статистичка обработка на податоци од медицинските истражувања / , . – Санкт Петербург. : VmedA, 2002. – 266 стр. Агрести А.Приближното е подобро од точното за интервална проценка на биномни пропорции / А. Агрести, Б. Коул // Американски статистичар. – 1998. – N 52. – стр. 119–126. Алтман Д.Статистика со доверба // D. Altman, D. Machin, T. Bryant, M. J. Gardner. – Лондон: BMJ Books, 2000. – 240 стр. Браун Л.Д.Проценка на интервал за биномна пропорција / L. D. Brown, T. T. Cai, A. Dasgupta // Статистичка наука. – 2001. – N 2. – P. 101–133. Клопер Ц.Ј.Употребата на доверливост или фидуцијални граници илустрирани во случајот со биномот / C. J. Clopper, E. S. Pearson // Biometrika. – 1934. – N 26. – P. 404–413. Гарсија-Перез М.А. За интервалот на доверба за биномниот параметар / M. A. Garcia-Perez // Квалитет и квантитет. – 2005. – N 39. – P. 467–481. Мотулски Х.Интуитивна биостатистика // H. Motulsky. – Oxford: Oxford University Press, 1995. – 386 стр. Њукомб Р. Г.Двострани интервали на доверба за единствената пропорција: споредба на седум методи / R. G. Newcombe // Статистика во медицината. – 1998. – N. 17. – P. 857–872. Сауро Ј.Проценка на стапките на завршување од мали примероци користејќи интервали на биномна доверба: споредби и препораки / Ј. Сауро, Ј. Р. Луис // Годишен состанок на здружението за човечки фактори и ергономија. - Орландо, Флорида, 2005 година. Валд А.Граници на доверба за функциите на континуирана дистрибуција // А. Валд, Ј. Волфовиц // Анали на математичка статистика. – 1939. – N 10. – P. 105–118. Вилсон Е.Б. Веројатно заклучување, закон за сукцесија и статистичко заклучување / Е. Б. Вилсон // Весник на Американската статистичка асоцијација. – 1927. – N 22. – P. 209–212.

ИНТЕРВАЛИ НА ДОВЕРБА ЗА ПРОПОРЦИИ

А. М.Грибовски

Национален институт за јавно здравје, Осло, Норвешка

Во написот се претставени неколку методи за пресметување на интервали на доверливост за биномни пропорции, имено, методите Wald, Wilson, arcsine, Agresti-Coull и точните Clopper-Pearson. Трудот дава само општ вовед во проблемот со проценката на интервалот на доверливост на биномна пропорција и неговата цел е не само да ги стимулира читателите да користат интервали на доверба при презентирањето на резултатите од нивните сопствени емпириски истражувања, туку и да ги поттикне да се консултираат со статистички книги. пред да се анализираат сопствените податоци и да се подготват ракописи.

Клучни зборови: интервал на доверба, пропорција

Контакт информации:

Виш советник, Национален институт за јавно здравје, Осло, Норвешка