Usaldusvahemik. Meditsiinistatistika ABC

Koostame MS EXCELis usaldusvahemiku jaotuse keskmise väärtuse hindamiseks dispersiooni teadaoleva väärtuse korral.

Muidugi valik usalduse tase oleneb täielikult käsil olevast ülesandest. Seega peaks lennureisija kindlustunne lennuki töökindluse suhtes loomulikult olema suurem kui ostja kindlustunne lambipirni töökindluse suhtes.

Ülesande formuleerimine

Oletame, et alates elanikkonnast olles võtnud näidis suurus n. Eeldatakse, et standardhälve see jaotus on teada. Selle põhjal vajalik proovid hindama tundmatut jaotuse keskmine(μ, ) ja konstrueerida vastav kahepoolsed usaldusvahemik.

Punktide hinnang

Nagu on teada alates statistika(nimetagem seda X vrd) on an keskmise erapooletu hinnang see elanikkonnast ja selle jaotus on N(μ;σ 2 /n).

Märge: Mis siis, kui teil on vaja ehitada usaldusvahemik levitamise korral, mis ei ole normaalne? Sel juhul tuleb appi, mis ütleb, et piisavalt suure suurusega proovid n levitamisest mitte- normaalne, statistika valimijaotus Х keskm tahe umbes vastama normaaljaotus parameetritega N(μ;σ 2 /n).

Niisiis, punkthinnang keskel jaotuse väärtused meil on näidis keskmine, st. X vrd. Nüüd hakkame tegutsema usaldusvahemik.

Usaldusvahemiku loomine

Tavaliselt, teades jaotust ja selle parameetreid, saame arvutada tõenäosuse, et juhuslik muutuja võtab meie määratud intervalli väärtuse. Nüüd teeme vastupidi: leiame intervalli, millesse juhuslik suurus antud tõenäosusega langeb. Näiteks kinnistutelt normaaljaotus on teada, et 95% tõenäosusega on juhuslik suurus jaotatud tavaline seadus, jääb vahemikku ligikaudu +/- 2 alates keskmine väärtus(vt artiklit selle kohta). See intervall toimib meie prototüübina usaldusvahemik.

Nüüd vaatame, kas me teame jaotust , selle intervalli arvutamiseks? Küsimusele vastamiseks peame täpsustama jaotuse vormi ja selle parameetrid.

Me teame, et levitamise vorm on normaaljaotus(pidage meeles, et me räägime valimi jaotus statistika X vrd).

Parameeter μ on meile tundmatu (seda tuleb lihtsalt hinnata kasutades usaldusvahemik), kuid meil on selle hinnang X vrd, põhjal arvutatud näidis, mida saab kasutada.

Teine parameeter on valimi keskmine standardhälve saab teada, on see võrdne σ/√n.

Sest me ei tea μ, siis koostame intervalli +/- 2 standardhälbed mitte pärit keskmine väärtus, kuid selle teadaoleva hinnangu põhjal X vrd. Need. arvutamisel usaldusvahemik me EI eelda seda X vrd jääb intervallisse +/- 2 standardhälbedμ-st 95% tõenäosusega ja eeldame, et intervall on +/- 2 standardhälbed alates X vrd tõenäosusega 95% katab μ - üldrahvastiku keskmine, millest näidis. Need kaks väidet on samaväärsed, kuid teine ​​väide võimaldab meil konstrueerida usaldusvahemik.

Lisaks täpsustame intervalli: juhuslik muutuja, mis on jaotatud tavaline seadus, jääb 95% tõenäosusega vahemikku +/- 1,960 standardhälbed, mitte +/- 2 standardhälbed. Seda saab arvutada valemi abil \u003d NORM.ST.OBR ((1 + 0,95) / 2), cm. näidisfail Sheet Spacing.

Nüüd saame sõnastada tõenäosusliku väite, mis aitab meil moodustada usaldusvahemik:
"Tõenäosus, et rahvaarvu keskmine asub alates valimi keskmine 1,960 tolli piires valimi keskmise standardhälbed", võrdub 95%.

Avalduses mainitud tõenäosusväärtusel on eriline nimi , mis on seotud olulisuse tase α (alfa) lihtsa avaldise abil usalduse tase =1 . Meie puhul olulisuse tase α =1-0,95=0,05 .

Nüüd kirjutame selle tõenäosusliku väite põhjal avaldise arvutamiseks usaldusvahemik:

kus Zα/2 standard normaaljaotus(selline juhusliku suuruse väärtus z, mida P(z>=Zα/2 )=α/2).

Märge: Ülemine α/2-kvantiil määrab laiuse usaldusvahemik sisse standardhälbed näidis keskmine. Ülemine α/2-kvantiil standard normaaljaotus on alati suurem kui 0, mis on väga mugav.

Meie puhul, kui α = 0,05, ülemine α/2-kvantiil võrdub 1,960. Muude olulisuse tasemete puhul α (10%; 1%) ülemine α/2-kvantiil Zα/2 saab arvutada valemiga \u003d NORM.ST.OBR (1-α / 2) või kui see on teada usalduse tase, =NORM.ST.OBR((1+usaldustase)/2).

Tavaliselt ehitamisel usaldusvahemikud keskmise hindamiseks kasutada ainult ülemine α/2-kvantiil ja ära kasuta madalam α/2-kvantiil. See on võimalik, kuna standard normaaljaotus sümmeetriline x-telje suhtes ( selle leviku tihedus sümmeetriline umbes keskmine, s.t. 0). Seetõttu pole vaja arvutada madalam α/2-kvantiil(seda nimetatakse lihtsalt α-ks /2-kvantiil), sest see on võrdne ülemine α/2-kvantiil miinusmärgiga.

Tuletame meelde, et hoolimata x jaotuse kujust, vastav juhuslik suurus X vrd jagatud umbes hästi N(μ;σ 2 /n) (vt artiklit selle kohta). Seetõttu on ülaltoodud väljend üldiselt usaldusvahemik on ainult ligikaudne. Kui x on jaotatud tavaline seadus N(μ;σ 2 /n), siis avaldis for usaldusvahemik on täpne.

Usaldusvahemiku arvutamine MS EXCELis

Lahendame probleemi.
Elektroonilise komponendi reageerimisaeg sisendsignaalile on seadme oluline omadus. Insener soovib joonistada keskmise reaktsiooniaja usaldusvahemiku usaldusnivooga 95%. Varasemast kogemusest teab insener, et reaktsiooniaja standardhälve on 8 ms. Teadaolevalt tegi insener reageerimisaja hindamiseks 25 mõõtmist, keskmine väärtus oli 78 ms.

Otsus: Insener tahab teada elektroonikaseadme reaktsiooniaega, kuid ta saab aru, et reaktsiooniaeg ei ole fikseeritud, vaid juhuslik suurus, millel on oma jaotus. Nii et parim, mida ta võib loota, on määrata selle jaotuse parameetrid ja kuju.

Kahjuks ei tea me probleemi olukorrast reaktsiooniaja jaotuse vormi (see ei pea olema normaalne). , see jaotus pole samuti teada. Ainult teda teatakse standardhälveσ = 8. Seega, kuigi me ei saa arvutada tõenäosusi ja konstrueerida usaldusvahemik.

Siiski, kuigi me ei tea jaotust aega eraldi vastus, teame seda vastavalt CPT, valimi jaotus keskmine reageerimisaeg on ligikaudu normaalne(oletame, et tingimused CPT sooritatakse, sest suurus proovid piisavalt suur (n=25)) .

Lisaks keskmine see jaotus on võrdne keskmine väärtusühikute vastusejaotused, s.o. μ. AGA standardhälve selle jaotuse (σ/√n) saab arvutada valemiga =8/ROOT(25) .

Samuti on teada, et insener sai punkthinnang parameeter μ võrdub 78 ms (X cf). Seetõttu saame nüüd arvutada tõenäosused, sest me teame jaotusvormi ( normaalne) ja selle parameetrid (Х ср ja σ/√n).

Insener tahab teada oodatud väärtusμ reaktsiooniaja jaotusest. Nagu eespool öeldud, on see μ võrdne keskmise reaktsiooniaja valimijaotuse ootus. Kui kasutame normaaljaotus N(X cf; σ/√n), siis on soovitud μ ligikaudu 95% tõenäosusega vahemikus +/-2*σ/√n.

Olulisuse tase võrdub 1-0,95=0,05.

Lõpuks leidke vasak ja parem piir usaldusvahemik.
Vasak piir: \u003d 78-NORM.ST.INR (1-0,05 / 2) * 8 / JUUR (25) = 74,864
Parem piir: \u003d 78 + NORM. ST. OBR (1-0,05 / 2) * 8 / JUUR (25) \u003d 81,136

Vasak piir: =NORM.INV(0,05/2, 78, 8/SQRT(25))
Parem piir: =NORM.INV(1-0,05/2, 78, 8/SQRT(25))

Vastus: usaldusvahemik juures 95% usaldusnivoo ja σ=8msek võrdub 78+/-3,136 ms

AT näidisfail lehel Sigma tuntud loonud vormi arvutamiseks ja ehitamiseks kahepoolsed usaldusvahemik meelevaldseks proovid antud σ ja olulisuse tase.

CONFIDENCE.NORM() funktsioon

Kui väärtused proovid on vahemikus B20:B79 , a olulisuse tase võrdne 0,05; siis MS EXCELi valem:
=KESKMINE(B20:B79)-KINDLUS(0,05,σ, LOEND(B20:B79))
tagastab vasakpoolse piiri usaldusvahemik.

Sama piiri saab arvutada järgmise valemi abil:
=KESKMINE(B20:B79)-NORM.ST.INV(1-0.05/2)*σ/SQRT(COUNT(B20:B79))

Märge: Funktsioon TRUST.NORM() ilmus MS EXCEL 2010-s. MS EXCELi varasemad versioonid kasutasid funktsiooni TRUST().

Usaldusintervallid ( Inglise Usaldusintervallid) üks statistikas kasutatavatest intervallhinnangute tüüpidest, mis arvutatakse antud olulisuse taseme jaoks. Need võimaldavad väita, et üldkogumi tundmatu statistilise parameetri tegelik väärtus on saadud väärtuste vahemikus tõenäosusega, mille annab valitud statistilise olulisuse tase.

Normaaljaotus

Kui andmete üldkogumi dispersioon (σ 2 ) on teada, saab usalduspiiride (usaldusvahemiku piiripunktide) arvutamiseks kasutada z-skoori. Võrreldes t-jaotuse kasutamisega ei anna z-skoor mitte ainult kitsamat usaldusvahemikku, vaid annab ka usaldusväärsemaid hinnanguid keskmisele ja standardhälbele (σ), kuna Z-skoor põhineb normaaljaotusel.

Valem

Usaldusvahemiku piiripunktide määramiseks, eeldusel, et andmete üldkogumi standardhälve on teada, kasutatakse järgmist valemit

L = X - Z a/2 σ
√n

Näide

Oletame, et valimi suurus on 25 vaatlust, valimi keskmine on 15 ja üldkogumi standardhälve on 8. Olulisuse taseme α=5% korral on Z-skoor Z α/2 =1,96. Sel juhul on usaldusvahemiku alumine ja ülemine piir

L = 15 - 1,96 8 = 11,864
√25
L = 15 + 1,96 8 = 18,136
√25

Seega võime väita, et 95% tõenäosusega langeb üldrahvastiku matemaatiline ootus vahemikku 11,864 kuni 18,136.

Meetodid usaldusvahemiku kitsendamiseks

Oletame, et vahemik on meie uuringu jaoks liiga lai. Usaldusvahemiku vahemiku vähendamiseks on kaks võimalust.

  1. Vähendage statistilise olulisuse taset α.
  2. Suurendage valimi suurust.

Vähendades statistilise olulisuse taseme α=10%, saame Z-skoori, mis on võrdne Z α/2 =1,64. Sel juhul on intervalli alumine ja ülemine piir

L = 15 - 1,64 8 = 12,376
√25
L = 15 + 1,64 8 = 17,624
√25

Ja usaldusvahemiku enda saab kirjutada kui

Sel juhul võime eeldada, et 90% tõenäosusega langeb üldkogumi matemaatiline ootus vahemikku.

Kui tahame säilitada statistilise olulisuse taset α, on ainus alternatiiv valimi suurust suurendada. Suurendades selle 144 vaatluseni, saame järgmised usalduspiiride väärtused

L = 15 - 1,96 8 = 13,693
√144
L = 15 + 1,96 8 = 16,307
√144

Usaldusvahemik ise näeb välja selline:

Seega on usaldusvahemiku kitsendamine ilma statistilise olulisuse taset vähendamata võimalik ainult valimi suurust suurendades. Kui valimi suurust ei ole võimalik suurendada, saab usaldusvahemiku kitsendamise saavutada üksnes statistilise olulisuse taseme vähendamisega.

Usaldusvahemiku loomine mittenormaalse jaotuse jaoks

Kui üldkogumi standardhälve pole teada või jaotus on ebanormaalne, kasutatakse usaldusvahemiku koostamiseks t-jaotust. See tehnika on Z-skooril põhineva tehnikaga võrreldes konservatiivsem, mis väljendub laiemates usaldusvahemikes.

Valem

Usaldusvahemiku alumise ja ülemise piiri arvutamiseks t-jaotuse põhjal kasutatakse järgmisi valemeid

L = X - tα σ
√n

Studenti jaotus või t-jaotus sõltub ainult ühest parameetrist - vabadusastmete arvust, mis võrdub üksikute tunnuste väärtuste arvuga (vaatluste arv valimis). Studenti t-testi väärtuse etteantud arvu vabadusastmete (n) ja statistilise olulisuse taseme α korral leiate otsingutabelitest.

Näide

Oletame, et valimi suurus on 25 üksikväärtust, valimi keskmine on 50 ja valimi standardhälve on 28. Statistilise olulisuse taseme α=5% jaoks peate konstrueerima usaldusvahemiku.

Meie puhul on vabadusastmete arv 24 (25-1), mistõttu Studenti t-testi vastav tabeliväärtus statistilise olulisuse taseme α=5% korral on 2,064. Seetõttu on usaldusvahemiku alumine ja ülemine piir

L = 50 - 2,064 28 = 38,442
√25
L = 50 + 2,064 28 = 61,558
√25

Ja intervalli enda saab kirjutada kui

Seega võime väita, et 95% tõenäosusega jääb üldrahvastiku matemaatiline ootus vahemikku.

T-jaotuse kasutamine võimaldab kitsendada usaldusvahemikku kas statistilist olulisust vähendades või valimi suurust suurendades.

Vähendades meie näite tingimustes statistilise olulisuse 95%-lt 90%-le, saame Studenti t-testi vastava tabeliväärtuse 1,711.

L = 50 - 1,711 28 = 40,418
√25
L = 50 + 1,711 28 = 59,582
√25

Sel juhul võime öelda, et 90% tõenäosusega jääb üldrahvastiku matemaatiline ootus vahemikku.

Kui me ei soovi statistilist olulisust vähendada, on ainsaks alternatiiviks valimi suurust suurendada. Oletame, et see on 64 üksikvaatlust, mitte 25, nagu näite algseisundis. Studenti t-testi tabeliväärtus 63 vabadusastme (64-1) ja statistilise olulisuse taseme α=5% korral on 1,998.

L = 50 - 1,998 28 = 43,007
√64
L = 50 + 1,998 28 = 56,993
√64

See annab meile võimaluse kinnitada, et 95% tõenäosusega jääb üldrahvastiku matemaatiline ootus vahemikku.

Suured proovid

Suured valimid on rohkem kui 100 üksikvaatlust sisaldavate andmete populatsiooni valimid Statistilised uuringud on näidanud, et suuremad valimid kipuvad olema normaalselt jaotunud, isegi kui üldkogumi jaotus ei ole normaalne. Lisaks annab selliste valimite puhul usaldusvahemike koostamisel z-skoori ja t-jaotuse kasutamine ligikaudu samad tulemused. Seega on suurte valimite puhul vastuvõetav t-jaotuse asemel normaaljaotuse jaoks kasutada z-skoori.

Summeerida

Usaldusvahemik(CI; inglise keeles usaldusvahemik - CI), mis saadi valimiga tehtud uuringus, annab mõõta uuringu tulemuste täpsust (või määramatust), et teha järeldusi kõigi selliste patsientide populatsiooni (üldpopulatsiooni) kohta. ). 95% CI õige määratluse saab sõnastada järgmiselt: 95% sellistest intervallidest sisaldab populatsiooni tegelikku väärtust. See tõlgendus on mõnevõrra vähem täpne: CI on väärtuste vahemik, mille piires võite olla 95% kindel, et see sisaldab tõelist väärtust. CI kasutamisel on rõhk kvantitatiivse efekti määramisel, mitte P väärtusel, mis saadakse statistilise olulisuse testimise tulemusena. P väärtus ei hinda ühtki summat, vaid pigem mõõdab tõendite tugevust nullhüpoteesi "mõju puudumise" suhtes. P väärtus iseenesest ei ütle meile midagi erinevuse suuruse ega isegi selle suuna kohta. Seetõttu on P sõltumatud väärtused artiklites või kokkuvõtetes absoluutselt vähe informatiivsed. Seevastu CI näitab nii vahetut huvipakkuvat mõju, nagu ravi kasulikkus, kui ka tõendite tugevust. Seetõttu on DI otseselt seotud DM-i praktikaga.

Statistilise analüüsi hinnangulise lähenemisviisi, mida illustreerib CI, eesmärk on mõõta huvipakkuva mõju suurust (diagnostilise testi tundlikkus, prognoositav esinemissagedus, suhtelise riski vähenemine raviga jne) ning samuti mõõta selles ebakindlust. mõju. Kõige sagedamini on CI väärtuste vahemik hinnangu mõlemal küljel, milles tõenäoline väärtus on, ja võite selles 95% kindel olla. 95% tõenäosuse kasutamise kokkulepe on meelevaldne, nagu ka P väärtus<0,05 для оценки статистической значимости, и авторы иногда используют 90% или 99% ДИ. Заметим, что слово «интервал» означает диапазон величин и поэтому стоит в единственном числе. Две величины, которые ограничивают интервал, называются «доверительными пределами».

CI põhineb ideel, et erinevate patsientide rühmadega läbi viidud sama uuring ei annaks identseid tulemusi, vaid nende tulemused jaguneksid tõelise, kuid tundmatu väärtuse ümber. Teisisõnu kirjeldab CI seda kui "valimist sõltuvat varieeruvust". CI ei kajasta muudest põhjustest tulenevat täiendavat ebakindlust; Eelkõige ei hõlma see patsientide valikulise kaotuse mõju jälgimisele, halba vastavust või ebatäpset tulemuste mõõtmist, pimestamise puudumist jne. Seega alahindab CI alati määramatuse kogusummat.

Usaldusintervalli arvutamine

Tabel A1.1. Mõne kliinilise mõõtmise standardvead ja usaldusvahemikud

Tavaliselt arvutatakse CI kvantitatiivse mõõdiku vaadeldud hinnangu põhjal, nagu kahe proportsiooni erinevus (d) ja selle erinevuse hinnangu standardvea (SE). Nii saadud ligikaudne 95% CI on d ± 1,96 SE. Valem muutub vastavalt tulemusnäitaja olemusele ja CI katvusele. Näiteks atsellulaarse läkaköha vaktsiini randomiseeritud platseebokontrollitud uuringus tekkis läkaköha 1670 vaktsiini saanud imikul 72-l (4,3%) ja kontrollrühmas 240-l 1665-st (14,4%). Protsentuaalne erinevus, mida nimetatakse absoluutse riski vähendamiseks, on 10,1%. Selle erinevuse SE on 0,99%. Vastavalt sellele on 95% CI 10,1% + 1,96 x 0,99%, st. 8,2 kuni 12,0.

Vaatamata erinevatele filosoofilistele lähenemisviisidele on CI-d ja statistilise olulisuse testid matemaatiliselt tihedalt seotud.

Seega on P väärtus “oluline”, st. R<0,05 соответствует 95% ДИ, который исключает величину эффекта, указывающую на отсутствие различия. Например, для различия между двумя средними пропорциями это ноль, а для относительного риска или отношения шансов - единица. При некоторых обстоятельствах эти два подхода могут быть не совсем эквивалентны. Преобладающая точка зрения: оценка с помощью ДИ - предпочтительный подход к суммированию результатов исследования, но ДИ и величина Р взаимодополняющи, и во многих статьях используются оба способа представления результатов.

Hinnangu määramatus (ebatäpsus), väljendatuna CI-s, on suuresti seotud valimi suuruse ruutjuurega. Väikesed valimid annavad vähem teavet kui suured valimid ja väiksemates valimites on CI-d vastavalt laiemad. Näiteks artiklis, milles võrreldakse Helicobacter pylori infektsiooni diagnoosimiseks kasutatud kolme testi toimivust, teatati uurea hingamistesti tundlikkusest 95,8% (95% CI 75–100). Kuigi 95,8% näib muljetavaldav, tähendab 24 täiskasvanud H. pylori patsiendi väike valimi suurus, et selles hinnangus on märkimisväärne ebakindlus, nagu näitab lai CI. Tõepoolest, alumine piir 75% on palju madalam kui 95,8% hinnang. Kui sama tundlikkust täheldataks 240 inimesest koosnevas valimis, oleks 95% CI 92,5–98,0, mis annab suurema kindlustunde, et test on väga tundlik.

Randomiseeritud kontrollitud uuringutes (RCT) on ebaolulised tulemused (st need, mille P > 0,05) on eriti vastuvõtlikud valesti tõlgendamisele. CI on siin eriti kasulik, kuna see näitab, kui ühilduvad tulemused kliiniliselt kasuliku tegeliku toimega. Näiteks RCT-s, milles võrreldi õmblust jämesoole klambri anastomoosiga, tekkis haavainfektsioon vastavalt 10,9% ja 13,5% patsientidest (P = 0,30). Selle erinevuse 95% usaldusvahemik on 2,6% (-2 kuni +8). Isegi selles uuringus, mis hõlmas 652 patsienti, on tõenäoline, et kahest protseduurist tulenevate infektsioonide esinemissagedus on tagasihoidlik. Mida väiksem on uuring, seda suurem on ebakindlus. Sung et al. viis läbi RCT, milles võrreldi oktreotiidi infusiooni erakorralise skleroteraapiaga ägeda veenilaiendite verejooksu korral 100 patsiendil. Oktreotiidi rühmas oli verejooksu peatamise määr 84%; skleroteraapia rühmas - 90%, mis annab P = 0,56. Pange tähele, et jätkuva verejooksu määrad on sarnased mainitud uuringus esinenud haavainfektsioonide omadega. Sel juhul on sekkumiste erinevuse 95% CI aga 6% (-7 kuni +19). See vahemik on üsna lai võrreldes 5% erinevusega, mis pakuks kliinilist huvi. On selge, et uuring ei välista olulist erinevust efektiivsuses. Seetõttu ei pea kindlasti paika autorite järeldus "oktreotiidi infusioon ja skleroteraapia on veenilaiendite verejooksu ravis võrdselt tõhusad". Sellistel juhtudel, kui absoluutse riski vähendamise (ARR) 95% CI sisaldab nulli, nagu siin, on NNT CI (ravimiseks vajalik arv) üsna raske tõlgendada. NLP ja selle CI saadakse ACP pöördväärtustest (korrutades need 100-ga, kui need väärtused on antud protsentides). Siin saame tuumaelektrijaama = 100: 6 = 16,6 95% CI-ga -14,3 kuni 5,3. Nagu näha tabeli joonealusest märkusest "d". A1.1, see CI sisaldab NTPP väärtusi vahemikus 5,3 kuni lõpmatuseni ja NTLP väärtusi vahemikus 14,3 kuni lõpmatuseni.

CI-sid saab koostada kõige sagedamini kasutatavate statistiliste hinnangute või võrdluste jaoks. RCT-de puhul sisaldab see erinevust keskmiste proportsioonide, suhteliste riskide, koefitsientide ja NRR-ide vahel. Samamoodi saab CI-d saada kõigi peamiste hinnangute kohta, mis on tehtud diagnostiliste testide täpsuse uuringutes – tundlikkus, spetsiifilisus, positiivne ennustusväärtus (mis kõik on lihtsad proportsioonid) ja tõenäosussuhted – hinnangud, mis on saadud metaanalüüsides ja võrdluses kontrolliga. uuringud. Personaalarvuti programm, mis katab paljusid selliseid DI kasutusviise, on saadaval ajakirja Statistics with Confidence teise väljaandega. Makrod proportsioonide CI arvutamiseks on Exceli ning statistikaprogrammide SPSS ja Minitab jaoks tasuta saadaval aadressil http://www.uwcm.ac.uk/study/medicine/epidemiology_statistics/research/statistics/proportions, htm.

Ravi mõju mitmekordne hindamine

Kuigi CI-de koostamine on uuringu esmaste tulemuste jaoks soovitav, ei ole need nõutavad kõigi tulemuste jaoks. CI puudutab kliiniliselt olulisi võrdlusi. Näiteks kahe rühma võrdlemisel on õige CI see, mis on loodud rühmadevahelise erinevuse jaoks, nagu on näidatud ülaltoodud näidetes, mitte CI, mille saab koostada iga rühma hinnangu jaoks. Vähe sellest, et iga rühma hinnete jaoks eraldi CI-de andmine pole kasutu, võib see esitlus olla eksitav. Samamoodi on õige lähenemisviis ravi efektiivsuse võrdlemisel erinevates alarühmades kahe (või enama) alarühma otsene võrdlemine. On vale eeldada, et ravi on efektiivne ainult ühes alarühmas, kui selle CI välistab väärtuse, mis vastab mõju puudumisele, samas kui teised seda ei tee. CI-d on kasulikud ka mitme alarühma tulemuste võrdlemisel. Joonisel fig. A1.1 näitab eklampsia suhtelist riski preeklampsiaga naistel naiste alarühmades, kes said platseebokontrolliga magneesiumsulfaadi RCT-d.

Riis. A1.2. Forest Graph näitab veiste rotaviiruse vaktsiini 11 randomiseeritud kliinilise uuringu tulemusi kõhulahtisuse ennetamiseks võrreldes platseeboga. Kõhulahtisuse suhtelise riski hindamiseks kasutati 95% usaldusvahemikku. Musta ruudu suurus on võrdeline teabe hulgaga. Lisaks on näidatud ravi efektiivsuse kokkuvõtlik hinnang ja 95% usaldusvahemik (tähistatud rombiga). Metaanalüüsis kasutati juhuslike mõjude mudelit, mis ületab mõned eelnevalt kehtestatud mudelid; näiteks võib see olla valimi suuruse arvutamisel kasutatud suurus. Rangema kriteeriumi kohaselt peab kogu CI-de vahemik näitama kasu, mis ületab eelnevalt kindlaksmääratud miinimumi.

Oleme juba arutanud ekslikkust, et statistilise olulisuse puudumine näitab, et kaks ravi on võrdselt tõhusad. Sama oluline on mitte samastada statistilist olulisust kliinilise tähtsusega. Kliinilist tähtsust võib eeldada, kui tulemus on statistiliselt oluline ja ravivastuse ulatus

Uuringud võivad näidata, kas tulemused on statistiliselt olulised ja millised on kliiniliselt olulised ja millised mitte. Joonisel fig. A1.2 näitab nelja katse tulemusi, mille puhul kogu CI<1, т.е. их результаты статистически значимы при Р <0,05 , . После высказанного предположения о том, что клинически важным различием было бы сокращение риска диареи на 20% (ОР = 0,8), все эти испытания показали клинически значимую оценку сокращения риска, и лишь в исследовании Treanor весь 95% ДИ меньше этой величины. Два других РКИ показали клинически важные результаты, которые не были статистически значимыми. Обратите внимание, что в трёх испытаниях точечные оценки эффективности лечения были почти идентичны, но ширина ДИ различалась (отражает размер выборки). Таким образом, по отдельности доказательная сила этих РКИ различна.

Ja teised.Kõik need on hinnangud nende teoreetiliste vastete kohta, mida saaks saada, kui poleks valimit, vaid üldkogumit. Kuid kahjuks on üldine elanikkond väga kallis ja sageli kättesaamatu.

Intervallhinnangu mõiste

Igal valimihinnangul on hajumine, sest on juhuslik muutuja, mis sõltub konkreetse valimi väärtustest. Seetõttu peaks usaldusväärsemate statistiliste järelduste tegemiseks teadma mitte ainult punkthinnangut, vaid ka intervalli, mis suure tõenäosusega γ (gamma) katab hinnangulise näitaja θ (teeta).

Formaalselt on need kaks sellist väärtust (statistika) T1(X) ja T2(X), mida T1< T 2 , mille puhul etteantud tõenäosuse tasemel γ tingimus on täidetud:

Lühidalt, see on tõenäoline γ või rohkem on tegelik väärtus punktide vahel T1(X) ja T2(X), mida nimetatakse alumiseks ja ülemiseks piiriks usaldusvahemik.

Usaldusvahemike konstrueerimise üheks tingimuseks on selle maksimaalne kitsus, s.o. see peaks olema võimalikult lühike. Soov on üsna loomulik, sest. uurija püüab soovitud parameetri leidu täpsemalt lokaliseerida.

Sellest järeldub, et usaldusvahemik peaks katma jaotuse maksimaalsed tõenäosused. ja skoor ise on kesksel kohal.

See tähendab, et (tõelise näitaja hinnangust) ülespoole kõrvalekaldumise tõenäosus on võrdne allapoole kõrvalekaldumise tõenäosusega. Samuti tuleb märkida, et kallutatud jaotuste korral ei ole parempoolne intervall võrdne vasakpoolse intervalliga.

Ülaltoodud joonis näitab selgelt, et mida suurem on usaldustase, seda laiem on intervall – otsene seos.

See oli väike sissejuhatus tundmatute parameetrite intervallide hindamise teooriasse. Liigume edasi matemaatilise ootuse usalduspiiride leidmise juurde.

Matemaatilise ootuse usaldusvahemik

Kui algandmed on jaotatud , on keskmine normaalväärtus. See tuleneb reeglist, et normaalväärtuste lineaarsel kombinatsioonil on ka normaaljaotus. Seetõttu võiksime tõenäosuste arvutamiseks kasutada normaaljaotuse seaduse matemaatilist aparaati.

See eeldab aga kahe parameetri – eeldatava väärtuse ja dispersiooni – tundmist, mida tavaliselt ei teata. Parameetrite (aritmeetiline keskmine ja ) asemel võib muidugi kasutada hinnanguid, kuid siis ei ole keskmise jaotus päris normaalne, see on veidi tasandatud. Iirimaa kodanik William Gosset märkis seda fakti osavalt, kui avaldas oma avastuse 1908. aasta märtsikuu ajakirjas Biometrica. Saladuslikel eesmärkidel allkirjastas Gosset Studentiga. Nii tekkis Studenti t-jaotus.

Andmete normaaljaotus, mida K. Gauss kasutab astronoomiliste vaatluste vigade analüüsimisel, on aga maapealses elus äärmiselt haruldane ja seda on üsna raske kindlaks teha (suure täpsuse jaoks on vaja umbes 2 tuhat vaatlust). Seetõttu on kõige parem loobuda normaalsuse eeldusest ja kasutada meetodeid, mis ei sõltu algandmete jaotusest.

Tekib küsimus: milline on aritmeetilise keskmise jaotus, kui see arvutatakse tundmatu jaotuse andmetest? Vastuse annab tõenäosusteoorias tuntud Keskpiiri teoreem(CPT). Matemaatikas on sellest mitu versiooni (koostised on aastate jooksul viimistletud), kuid kõik need taanduvad jämedalt öeldes väitele, et suure hulga sõltumatute juhuslike suuruste summa järgib normaaljaotuse seadust.

Aritmeetilise keskmise arvutamisel kasutatakse juhuslike suuruste summat. Sellest selgub, et aritmeetiline keskmine on normaaljaotusega, milles eeldatav väärtus on algandmete eeldatav väärtus ja dispersioon on .

Targad inimesed teavad, kuidas CLT-d tõestada, kuid meie kontrollime seda Excelis tehtud katse abil. Simuleerime 50 ühtlaselt jaotatud juhusliku muutuja valimit (Exceli funktsiooni RANDOMBETWEEN abil). Seejärel teeme 1000 sellist valimit ja arvutame igaühe aritmeetilise keskmise. Vaatame nende levikut.

On näha, et keskmise jaotus on normaalseadusele lähedane. Kui proovide maht ja nende arv veelgi suuremaks teha, on sarnasus veelgi parem.

Nüüd, kui oleme ise veendunud CLT kehtivuses, saame, kasutades , arvutada aritmeetilise keskmise usaldusvahemikud, mis katavad tegeliku keskmise või matemaatilise ootuse antud tõenäosusega.

Ülemise ja alumise piiri määramiseks on vaja teada normaaljaotuse parameetreid. Seetõttu ei kasutata neid reeglina hinnanguid: aritmeetiline keskmine ja valimi dispersioon. Jällegi annab see meetod hea ligikaudse hinnangu ainult suurte proovide puhul. Kui valimid on väikesed, on sageli soovitatav kasutada Studenti jaotust. Ära usu! Studenti jaotus keskmise jaoks esineb ainult siis, kui algandmetel on normaaljaotus, st peaaegu mitte kunagi. Seetõttu on parem kohe seada nõutavate andmete hulga miinimumriba ja kasutada asümptootiliselt õigeid meetodeid. Nad ütlevad, et 30 vaatlusest piisab. Võtke 50 – te ei saa eksida.

T 1.2 on usaldusvahemiku alumine ja ülemine piir

– valimi aritmeetiline keskmine

s0– valimi standardhälve (erapooletu)

n - näidissuurus

γ – usaldustase (tavaliselt 0,9, 0,95 või 0,99)

c γ = Φ -1 ((1+γ)/2) on standardse normaaljaotuse funktsiooni pöördväärtus. Lihtsamalt öeldes on see standardvigade arv aritmeetilisest keskmisest alumise või ülemise piirini (näidatud kolm tõenäosust vastavad väärtustele 1,64, 1,96 ja 2,58).

Valemi olemus seisneb selles, et võetakse aritmeetiline keskmine ja siis jäetakse sellest teatud summa kõrvale ( γ-ga) standardvead ( s 0 /√n). Kõik on teada, võta ja loe.

Enne personaalarvutite massilist kasutamist kasutasid nad normaaljaotusfunktsiooni ja selle pöördfunktsiooni väärtuste saamiseks . Neid kasutatakse endiselt, kuid tõhusam on pöörduda valmis Exceli valemite poole. Kõiki ülaltoodud valemi elemente ( , ja ) saab Excelis hõlpsasti arvutada. Kuid usaldusvahemiku arvutamiseks on ka valmis valem - KONFIDENTSIOON NORM. Selle süntaks on järgmine.

CONFIDENCE NORM(alfa, standard_dev, suurus)

alfa– olulisuse tase ehk usaldusnivoo, mis ülaltoodud tähistuses võrdub 1-γ, s.o. tõenäosus, et matemaatilineootus jääb väljaspool usaldusvahemikku. Usaldustasemega 0,95 on alfa 0,05 ja nii edasi.

standard_off on näidisandmete standardhälve. Standardviga pole vaja arvutada, Excel jagab n-i juurega.

suurus– valimi suurus (n).

Funktsiooni CONFIDENCE.NORM tulemus on teine ​​liige usaldusvahemiku arvutamise valemist, s.o. poolintervall. Vastavalt sellele on alumine ja ülemine punkt keskmine ± saadud väärtus.

Seega on võimalik aritmeetilise keskmise usaldusvahemike arvutamiseks ehitada universaalne algoritm, mis ei sõltu algandmete jaotusest. Universaalsuse hind on selle asümptootilisus, s.t. vajadus kasutada suhteliselt suuri proove. Moodsa tehnoloogia ajastul pole aga õige andmehulga kogumine enamasti keeruline.

Statistiliste hüpoteeside testimine usaldusvahemiku abil

(moodul 111)

Üks peamisi statistikas lahendatavaid probleeme on. Lühidalt, selle olemus on see. Eeldatakse näiteks, et üldrahvastiku ootus võrdub mingi väärtusega. Seejärel konstrueeritakse valimi keskmiste jaotus, mida saab vaadelda antud ootusega. Järgmisena vaatame, kus selles tingimuslikus jaotuses asub reaalne keskmine. Kui see ületab lubatud piire, on sellise keskmise ilmumine väga ebatõenäoline ja ühe katse kordusega peaaegu võimatu, mis on vastuolus püstitatud hüpoteesiga, mis lükatakse edukalt tagasi. Kui keskmine ei ületa kriitilist piiri, siis hüpoteesi ei lükata (aga ka ei tõestata!).

Nii et usaldusvahemike abil, meie puhul ootuse jaoks, saate ka mõnda hüpoteese testida. Seda on väga lihtne teha. Oletame, et mõne valimi aritmeetiline keskmine on 100. Kontrollitakse hüpoteesi, et eeldatav väärtus on näiteks 90. See tähendab, et kui me esitame küsimuse primitiivselt, siis kõlab see järgmiselt: kas see võib olla nii, et see on tõelise väärtusega keskmine võrdne 90, vaadeldud keskmine oli 100?

Sellele küsimusele vastamiseks on vaja täiendavat teavet standardhälbe ja valimi suuruse kohta. Oletame, et standardhälve on 30 ja vaatluste arv on 64 (juure hõlpsaks eraldamiseks). Siis on keskmise standardviga 30/8 ehk 3,75. 95% usaldusvahemiku arvutamiseks peate kõrvale jätma kaks standardviga mõlemal pool keskmist (täpsemalt 1,96). Usaldusvahemik on ligikaudu 100 ± 7,5 või 92,5 kuni 107,5.

Edasine põhjendus on järgmine. Kui testitav väärtus jääb usaldusvahemikku, siis ei ole see hüpoteesiga vastuolus, kuna mahub juhuslike kõikumiste piiridesse (tõenäosusega 95%). Kui testitav punkt on väljaspool usaldusvahemikku, siis on sellise sündmuse tõenäosus väga väike, igal juhul alla vastuvõetava taseme. Seetõttu lükatakse hüpotees tagasi, kuna see on vaadeldud andmetega vastuolus. Meie puhul on ootushüpotees väljaspool usaldusvahemikku (testitud väärtus 90 ei sisaldu intervallis 100±7,5), mistõttu tuleks see tagasi lükata. Ülaltoodud primitiivsele küsimusele vastates tuleks öelda: ei, see ei saa, igal juhul juhtub seda äärmiselt harva. Tihti viitab see hüpoteesi eksliku tagasilükkamise konkreetsele tõenäosusele (p-tase), mitte aga antud tasemele, mille järgi usaldusvahemik üles ehitati, vaid sellest mõni teine ​​kord.

Nagu näete, pole keskmise (või matemaatilise ootuse) usaldusvahemiku koostamine keeruline. Peaasi on olemus tabada ja siis asjad lähevad. Praktikas kasutavad enamik 95% usaldusvahemikku, mis on umbes kahe standardvea laius mõlemal pool keskmist.

Praeguseks kõik. Kõike paremat!

SAGEDUSTE JA OSADE KINNITUSVÄLJAD

© 2008

Riiklik Rahvatervise Instituut, Oslo, Norra

Artiklis kirjeldatakse ja käsitletakse sageduste ja proportsioonide usaldusvahemike arvutamist Waldi, Wilsoni, Klopper-Pearsoni meetoditega, kasutades nurkteisendust ja Waldi meetodit Agresti-Cowlli korrektsiooniga. Esitatud materjal annab üldist teavet sageduste ja proportsioonide usaldusvahemike arvutamise meetodite kohta ning on mõeldud äratama ajakirja lugejates huvi mitte ainult usaldusvahemike kasutamise vastu oma uurimistöö tulemuste esitlemisel, vaid ka erialakirjanduse lugemiseks enne. alustades tööd tulevaste väljaannetega.

Märksõnad: usaldusvahemik, sagedus, proportsioon

Ühes varasemas publikatsioonis mainiti lühidalt kvalitatiivsete andmete kirjeldust ja teatati, et nende intervallide hindamine on eelistatavam punkthinnangule, kirjeldamaks uuritava tunnuse esinemissagedust üldpopulatsioonis. Tõepoolest, kuna uuringud viiakse läbi valimiandmete abil, peab tulemuste projektsioon üldkogumile sisaldama valimi hinnangus ebatäpsust. Usaldusvahemik on hinnangulise parameetri täpsuse mõõt. Huvitav on see, et mõnes arstidele mõeldud statistika põhitõdesid käsitlevas raamatus jäetakse sageduste usaldusvahemike teema täielikult tähelepanuta. Käesolevas artiklis vaatleme mitmeid viise sageduste usaldusvahemike arvutamiseks, eeldades valimi omadusi, nagu mittekordumine ja representatiivsus, samuti vaatluste sõltumatust üksteisest. Käesolevas artiklis ei mõisteta sagedust absoluutarvuna, mis näitab, mitu korda see või teine ​​väärtus kokkuvõttes esineb, vaid suhtelist väärtust, mis määrab uuringus osalejate osakaalu, kellel on uuritav tunnus.

Biomeditsiinilistes uuringutes kasutatakse kõige sagedamini 95% usaldusvahemikke. See usaldusvahemik on piirkond, millesse tegelik osakaal langeb 95% ajast. Teisisõnu võib 95% kindlusega väita, et tunnuse esinemissageduse tegelik väärtus üldpopulatsioonis jääb 95% usaldusvahemikku.

Enamik meditsiiniteadlastele mõeldud statistikaõpikuid teatab, et sagedusviga arvutatakse valemi abil

kus p on tunnuse esinemise sagedus valimis (väärtus 0 kuni 1). Enamikus kodumaistes teadusartiklites on märgitud tunnuse esinemissageduse väärtus valimis (p) ja selle viga (s) kujul p ± s. Siiski on otstarbekam esitada tunnuse esinemissageduse üldpopulatsioonis 95% usaldusvahemik, mis hõlmab väärtusi alates

enne.

Mõnedes õpikutes soovitatakse väikeste valimite puhul N - 1 vabadusastme puhul väärtus 1,96 asendada t väärtusega, kus N on vaatluste arv valimis. T väärtuse leiate t-jaotuse tabelitest, mis on saadaval peaaegu kõigis statistikaõpikutes. t jaotuse kasutamine Waldi meetodi jaoks ei anna nähtavaid eeliseid teiste allpool käsitletud meetodite ees ja seetõttu ei tervita seda mõned autorid.

Ülaltoodud meetod sageduste või murdude usaldusvahemike arvutamiseks on oma nime saanud Abraham Waldi järgi (Abraham Wald, 1902–1950), kuna seda hakati laialdaselt kasutama pärast Waldi ja Wolfowitzi avaldamist 1939. aastal. Meetodi enda pakkus aga välja Pierre Simon Laplace (1749–1827) juba 1812. aastal.

Waldi meetod on väga populaarne, kuid selle rakendamine on seotud märkimisväärsete probleemidega. Meetodit ei soovitata kasutada väikeste valimite puhul, samuti juhtudel, kui tunnuse esinemissagedus kipub olema 0 või 1 (0% või 100%) ning sageduste 0 ja 1 puhul pole see lihtsalt võimalik. normaaljaotuse lähendus, mida kasutatakse vea arvutamisel, "ei tööta" juhtudel, kui n p< 5 или n · (1 – p) < 5 . Более консервативные статистики считают, что n · p и n · (1 – p) должны быть не менее 10 . Более детальное рассмотрение метода Вальда показало, что полученные с его помощью доверительные интервалы в большинстве случаев слишком узки, то есть их применение ошибочно создает слишком оптимистичную картину, особенно при удалении частоты встречаемости признака от 0,5, или 50 % . К тому же при приближении частоты к 0 или 1 доверительный интревал может принимать отрицательные значения или превышать 1, что выглядит абсурдно для частот. Многие авторы совершенно справедливо не рекомендуют применять данный метод не только в уже упомянутых случаях, но и тогда, когда частота встречаемости признака менее 25 % или более 75 % . Таким образом, несмотря на простоту расчетов, метод Вальда может применяться лишь в очень ограниченном числе случаев. Зарубежные исследователи более категоричны в своих выводах и однозначно рекомендуют не применять этот метод для небольших выборок , а ведь именно с такими выборками часто приходится иметь дело исследователям-медикам.

Kuna uus muutuja on normaalse jaotusega, on muutuja φ 95% usaldusvahemiku alumine ja ülemine piir φ-1,96 ja φ+1,96 vasakult">

Väikeste valimite 1,96 asemel on N - 1 vabadusastmega soovitatav asendada väärtus t. See meetod ei anna negatiivseid väärtusi ja võimaldab teil sageduste usaldusvahemikke täpsemalt hinnata kui Waldi meetod. Lisaks on seda kirjeldatud paljudes kodumaistes meditsiinistatistika teatmeteostes, mis aga ei toonud kaasa selle laialdast kasutamist meditsiiniuuringutes. Usaldusvahemike arvutamine nurgateisendusega ei ole soovitatav 0-le või 1-le lähenevate sageduste korral.

Siinkohal tavaliselt lõpeb usaldusvahemike hindamise meetodite kirjeldus enamikus arstiteadlastele mõeldud statistika aluste raamatutes ja see probleem on omane mitte ainult kodumaisele, vaid ka välismaisele kirjandusele. Mõlemad meetodid põhinevad keskpiiri teoreemil, mis eeldab suurt valimit.

Võttes arvesse puudusi usaldusvahemike hindamisel ülaltoodud meetodite abil, pakkusid Clopper (Clopper) ja Pearson (Pearson) 1934. aastal välja meetodi nn täpse usaldusvahemiku arvutamiseks, võttes arvesse uuritava tunnuse binoomjaotust. See meetod on saadaval paljudes veebikalkulaatorites, kuid sel viisil saadud usaldusvahemikud on enamasti liiga laiad. Samal ajal on seda meetodit soovitatav kasutada juhtudel, kui on vaja konservatiivset hinnangut. Meetodi konservatiivsus suureneb valimi suuruse vähenedes, eriti N puhul< 15 . описывает применение функции биномиального распределения для анализа качественных данных с использованием MS Excel, в том числе и для определения доверительных интервалов, однако расчет последних для частот в электронных таблицах не «затабулирован» в удобном для пользователя виде, а потому, вероятно, и не используется большинством исследователей.

Paljude statistikute sõnul tehakse sageduste usaldusvahemike optimaalseim hinnang Wilsoni meetodi abil, mis pakuti välja juba 1927. aastal, kuid mida kodumaistes biomeditsiinilistes uuringutes praktiliselt ei kasutatud. See meetod mitte ainult ei võimalda hinnata usaldusvahemikke nii väga väikeste kui ka väga kõrgete sageduste jaoks, vaid on rakendatav ka väikese arvu vaatluste jaoks. Üldiselt on usaldusvahemik Wilsoni valemi järgi kujul alates



kus see võtab 95% usaldusvahemiku arvutamisel väärtuse 1,96, N on vaatluste arv ja p on tunnuse sagedus valimis. See meetod on saadaval veebikalkulaatorites, seega pole selle rakendamine problemaatiline. ja ei soovita seda meetodit kasutada n p< 4 или n · (1 – p) < 4 по причине слишком грубого приближения распределения р к нормальному в такой ситуации, однако зарубежные статистики считают метод Уилсона применимым и для малых выборок .

Lisaks Wilsoni meetodile usutakse, et Agresti-Caulli korrigeeritud Waldi meetod annab sageduste usaldusvahemiku optimaalse hinnangu. Agresti-Coulle'i parandus on Waldi valemis valimi tunnuse esinemissageduse (p) asendamine p`-ga, mille arvutamisel lisatakse lugejale 2 ja nimetajale 4, st. , p` = (X + 2) / (N + 4), kus X on uuringus osalejate arv, kellel on uuritav tunnus, ja N on valimi suurus. See modifikatsioon annab Wilsoni valemi tulemustele väga sarnased tulemused, välja arvatud juhul, kui sündmuste määr läheneb 0% või 100% ja valim on väike. Lisaks ülaltoodud sageduste usaldusvahemike arvutamise meetoditele on väikeste valimite puhul välja pakutud pidevuse parandusi nii Waldi kui ka Wilsoni meetodi puhul, kuid uuringud on näidanud, et nende kasutamine ei ole asjakohane.

Kaaluge ülaltoodud meetodite rakendamist usaldusvahemike arvutamiseks kahe näite abil. Esimesel juhul uurime suurt valimit 1000 juhuslikult valitud uuringus osalejast, kellest 450-l on uuritav tunnus (see võib olla riskitegur, tulemus või mõni muu tunnus), mille esinemissagedus on 0,45 või 45%. Teisel juhul viiakse uuring läbi väikese valimiga, näiteks ainult 20 inimesega, ja ainult 1 uuringus osalejal (5%) on uuritav tunnus. Usaldusvahemikud Waldi meetodi jaoks, Waldi meetodi jaoks Agresti-Colli korrektsiooniga ja Wilsoni meetodi jaoks arvutati Jeff Sauro välja töötatud veebikalkulaatori abil (http://www./wald.htm). Järjepidevuse järgi korrigeeritud Wilsoni usaldusvahemikud arvutati, kasutades kalkulaatorit, mille pakub Wassar Stats: Web Site for Statistical Computation (http://faculty.vassar.edu/lowry/prop1.html). Fisheri nurkteisendust kasutavad arvutused viidi läbi "käsitsi", kasutades kriitilist väärtust t vastavalt 19 ja 999 vabadusastme jaoks. Mõlema näite arvutustulemused on toodud tabelis.

Usaldusvahemikud on arvutatud kahe tekstis kirjeldatud näite jaoks kuuel erineval viisil

Usaldusintervalli arvutamise meetod

P=0,0500 ehk 5%

95% CI, kui X = 450, N = 1000, P = 0,4500 või 45%

–0,0455–0,2541

Walda Agresti-Colli korrektsiooniga

<,0001–0,2541

Wilson koos järjepidevuse korrektsiooniga

Klopper-Pearsoni "täpne meetod"

Nurga teisendus

<0,0001–0,1967

Nagu tabelist näha, läheb esimese näite puhul "üldtunnustatud" Waldi meetodil arvutatud usaldusvahemik negatiivsesse piirkonda, mis ei saa sageduste puhul nii olla. Kahjuks pole sellised juhtumid vene kirjanduses haruldased. Traditsiooniline viis andmete esitamiseks sagedusena ja selle viga varjab seda probleemi osaliselt. Näiteks kui tunnuse esinemissagedus (protsentides) on esitatud kui 2,1 ± 1,4, siis see ei ole nii "ärritav" kui 2,1% (95% CI: –0,7; 4,9), kuigi ja tähendab sama. Waldi meetod Agresti-Coulle'i parandusega ja nurkteisendust kasutav arvutus annavad alampiiri, mis kaldub nullile. Wilsoni meetod koos pidevuse korrektsiooniga ja "täpne meetod" annavad laiemad usaldusvahemikud kui Wilsoni meetod. Teise näite puhul annavad kõik meetodid ligikaudu ühesugused usaldusvahemikud (erinevused ilmnevad vaid tuhandikes), mis pole üllatav, kuna sündmuse sagedus selles näites ei erine palju 50% -st ja valimi suurus on üsna suur .

Lugejatele, keda see probleem huvitab, võib soovitada R. G. Newcombe’i ja Browni, Cai ja Dasgupta töid, mis annavad plussid ja miinused vastavalt 7 ja 10 erineva usaldusintervalli arvutamise meetodi kasutamisele. Kodumaistest käsiraamatutest on soovitatav raamat ja, milles lisaks teooria üksikasjalikule kirjeldusele on välja toodud Waldi ja Wilsoni meetodid ning meetod usaldusvahemike arvutamiseks, arvestades binoomsagedusjaotust. Lisaks tasuta veebikalkulaatoritele (http://www./wald.htm ja http://faculty.vassar.edu/lowry/prop1.html) saab sageduste (ja mitte ainult!) usaldusvahemikke arvutada, kasutades CIA programm ( Confidence Intervals Analysis), mille saab alla laadida aadressilt http://www. meditsiinikool. soton. ac. uk/cia/ .

Järgmises artiklis käsitletakse kvalitatiivsete andmete võrdlemise ühemõõtmelisi viise.

Bibliograafia

Banerjee A. Lihtkeeles meditsiinistatistika: sissejuhatav kursus / A. Banerzhi. - M. : Praktiline meditsiin, 2007. - 287 lk. Meditsiinistatistika / . - M. : Meditsiiniinfo Agentuur, 2007. - 475 lk. Glanz S. Medikobioloogiline statistika / S. Glants. - M. : Praktika, 1998. Andmetüübid, leviku kontrollimine ja kirjeldav statistika / // Inimökoloogia - 2008. - Nr 1. - Lk 52–58. Zhizhin K.S.. Meditsiinistatistika: õpik / . - Rostov n / D: Phoenix, 2007. - 160 lk. Rakendusmeditsiiniline statistika / ,. - Peterburi. : Folio, 2003. - 428 lk. Lakin G.F. Biomeetria / . - M. : Kõrgkool, 1990. - 350 lk. Arst V. A. Matemaatiline statistika meditsiinis / , . - M. : Rahandus ja statistika, 2007. - 798 lk. Matemaatiline statistika kliinilistes uuringutes / , . - M. : GEOTAR-MED, 2001. - 256 lk. Junkerov V. Ja. Meditsiiniuuringute andmete meditsiinilis-statistiline töötlemine /,. - Peterburi. : VmedA, 2002. - 266 lk. Agresti A. Ligikaudne on parem kui täpne binoomproportsioonide intervallide hindamiseks / A. Agresti, B. Coull // Ameerika statistik. - 1998. - N 52. - S. 119-126. Altman D. Usaldusväärne statistika // D. Altman, D. Machin, T. Bryant, M. J. Gardner. - London: BMJ Books, 2000. - 240 lk. Pruun L.D. Intervall estimation for a binomial ratio / L. D. Brown, T. T. Cai, A. Dasgupta // Statistikateadus. - 2001. - N 2. - Lk 101-133. Clopper C.J. Usaldusväärsuse või usalduspiiride kasutamine, mis on illustreeritud binoomarvu puhul / C. J. Clopper, E. S. Pearson // Biometrika. - 1934. - N 26. - Lk 404-413. Garcia-Perez M. A. Binoomparameetri usaldusvahemikust / M. A. Garcia-Perez // Kvaliteet ja kvantiteet. - 2005. - N 39. - Lk 467-481. Motulsky H. Intuitiivne biostatistika // H. Motulsky. - Oxford: Oxford University Press, 1995. - 386 lk. Newcombe R.G. Kahepoolsed usaldusintervallid ühe proportsiooni jaoks: seitsme meetodi võrdlus / R. G. Newcombe // Meditsiini statistika. - 1998. - N. 17. - Lk 857–872. Sauro J. Valmimismäärade hindamine väikestest valimitest binoomsete usaldusvahemike abil: võrdlused ja soovitused / J. Sauro, J. R. Lewis // Proceedings of the human factor and ergonomics Society aastakoosolek. – Orlando, Florida, 2005. Wald A. Pidevate jaotusfunktsioonide usalduspiirid // A. Wald, J. Wolfovitz // Annals of Mathematical Statistics. - 1939. - N 10. - Lk 105–118. Wilson E.B. Tõenäoline järeldus, pärimisseadus ja statistiline järeldus / E. B. Wilson // Journal of American Statistical Association. - 1927. - N 22. - Lk 209-212.

PROPORTSIOONIDE KONFIDENTSIAALID

A. M. Grjibovski

Riiklik Rahvatervise Instituut, Oslo, Norra

Artiklis esitatakse mitmed meetodid binoomproportsioonide usaldusvahemike arvutamiseks, nimelt Waldi, Wilsoni, arcsiini, Agresti-Coulli ja täpsed Clopper-Pearsoni meetodid. Töö annab ainult üldise sissejuhatuse binoomproportsiooni usaldusintervallide hindamise probleemisse ning selle eesmärk ei ole mitte ainult ärgitada lugejaid kasutama usaldusvahemikke enda empiiriliste uuringute tulemuste esitamisel, vaid ka julgustada neid enne statistikaraamatuid uurima. enda andmete analüüsimine ja käsikirjade koostamine.

võtmesõnad: usaldusvahemik, proportsioon

Kontaktinfo:

Oslo, Norra riikliku rahvatervise instituudi vanemnõunik