Luottamusväli. Lääketieteellisten tilastojen ABC

Rakennetaan MS EXCEL:iin luottamusväli jakauman keskiarvon arvioimiseksi, jos varianssin arvo on tunnettu.

Tietysti valinta luottamuksen taso riippuu täysin käsillä olevasta tehtävästä. Siten lentomatkustajan luottamuksen asteen lentokoneen luotettavuuteen tulee tietysti olla korkeampi kuin ostajan luottamus hehkulampun luotettavuuteen.

Tehtävän muotoilu

Oletetaan, että alkaen väestö otettuaan näyte koko n. Oletetaan, että keskihajonta tämä jakauma tunnetaan. Tämän perusteella tarpeellista näytteet arvioi tuntematonta jakelun keskiarvo(μ, ) ja muodosta vastaava kahdenvälinen luottamusväli.

Piste-arvio

Kuten tiedetään tilastot(kutsutaanko sitä X vrt) on puolueeton arvio keskiarvosta Tämä väestö ja sen jakauma on N(μ;σ 2/n).

Huomautus: Mitä jos pitää rakentaa luottamusväli jakelun tapauksessa mikä ei ole normaalia? Tässä tapauksessa tulee apuun, joka sanoo, että riittävän suurella koolla näytteet n jakelusta ei- normaali, tilastojen otantajakauma Х av tahtoa suunnilleen vastaa normaalijakauma parametreillä N(μ;σ 2/n).

Niin, pistearvio keskellä jakeluarvot meillä on näytteen keskiarvo, eli X vrt. Nyt ollaan kiireisiä luottamusväli.

Luottamusvälin rakentaminen

Yleensä jakauman ja sen parametrien tuntemalla voimme laskea todennäköisyyden, että satunnaismuuttuja saa arvon määrittämältämme väliltä. Tehdään nyt päinvastoin: etsitään väli, johon satunnaismuuttuja osuu annetulla todennäköisyydellä. Esimerkiksi kiinteistöistä normaalijakauma tiedetään, että 95 %:n todennäköisyydellä satunnaismuuttuja jakautuu normaali laki, putoaa noin +/- 2 väliin keskiarvo(katso artikkeli aiheesta). Tämä aikaväli toimii prototyyppinä luottamusväli.

Katsotaan nyt tiedämmekö jakelun , laskea tämä intervalli? Vastataksemme kysymykseen meidän on määritettävä jakelumuoto ja sen parametrit.

Tiedämme jakelumuodon normaalijakauma(muista, että puhumme näytteiden jakelu tilastot X vrt).

Parametri μ on meille tuntematon (se täytyy vain arvioida käyttämällä luottamusväli), mutta meillä on sen arvio X vrt., perusteella laskettu näyte, jota voidaan käyttää.

Toinen parametri on näytteen keskimääräinen standardipoikkeama tullaan tiedoksi, se on yhtä suuri kuin σ/√n.

Koska emme tiedä μ, niin rakennamme välin +/- 2 standardipoikkeamat ei alkaen keskiarvo, mutta sen tunnetun arvion perusteella X vrt. Nuo. laskettaessa luottamusväli emme oleta sitä X vrt putoaa väliin +/- 2 standardipoikkeamatμ:stä 95 %:n todennäköisyydellä ja oletetaan, että väli on +/- 2 standardipoikkeamat alkaen X vrt 95 %:n todennäköisyydellä kattaa μ - väestön keskiarvo, josta näyte. Nämä kaksi lausetta ovat samanarvoisia, mutta toinen lause antaa meille mahdollisuuden rakentaa luottamusväli.

Lisäksi tarkennamme väliä: satunnaismuuttuja, joka on jakautunut normaali laki, osuu 95 %:n todennäköisyydellä väliin +/- 1,960 standardipoikkeamat, ei +/- 2 standardipoikkeamat. Tämä voidaan laskea kaavalla \u003d NORM.ST.OBR ((1 + 0,95) / 2), cm. esimerkkitiedosto Sheet Spacing.

Nyt voimme muotoilla todennäköisyyslaskennan, joka auttaa meitä muodostamaan luottamusväli:
"Todennäköisyys, että väestön keskiarvo sijaitsee alkaen näytteen keskiarvo 1,960" sisällä näytteen keskiarvon keskihajonnat", on yhtä suuri kuin 95 %.

Lausunnossa mainitulla todennäköisyysarvolla on erityinen nimi , joka liittyy merkitsevyystaso α (alfa) yksinkertaisella lausekkeella luottamustaso =1 . Meidän tapauksessamme merkitsevyystaso α =1-0,95=0,05 .

Nyt tämän todennäköisyyslausekkeen perusteella kirjoitamme lausekkeen laskemista varten luottamusväli:

missä Zα/2 standardi normaalijakauma(sellainen satunnaismuuttujan arvo z, mitä P(z>=Zα/2 )=α/2).

Huomautus: Ylempi α/2-kvantiili määrittää leveyden luottamusväli sisään standardipoikkeamat näytteen keskiarvo. Ylempi α/2-kvantiili standardi normaalijakauma on aina suurempi kuin 0, mikä on erittäin kätevää.

Meidän tapauksessamme, kun α = 0,05, ylempi α/2-kvantiili on 1,960. Muille merkitsevyystasoille α (10 %; 1 %) ylempi α/2-kvantiili Zα/2 voidaan laskea kaavalla \u003d NORM.ST.OBR (1-α / 2) tai, jos tiedossa luottamustaso, =NORM.ST.OBR((1+luottamustaso)/2).

Yleensä rakentamisen yhteydessä luottamusvälit keskiarvon arvioimiseksi vain käyttöön ylempi α/2-kvantiili ja älä käytä pienempi α/2-kvantiili. Tämä on mahdollista, koska standardi normaalijakauma symmetrinen x-akselin suhteen ( sen jakautumisen tiheys symmetrinen noin keskimääräinen, ts. 0). Siksi laskelmia ei tarvitse tehdä alempi α/2-kvantiili(Sitä kutsutaan yksinkertaisesti α:ksi /2-kvantiili), koska se on tasa-arvoinen ylempi α/2-kvantiili miinusmerkillä.

Muista, että x:n jakauman muodosta riippumatta vastaava satunnaismuuttuja X vrt hajautettu suunnilleen hieno N(μ;σ 2 /n) (katso artikkeli aiheesta). Siksi yleensä yllä oleva lauseke for luottamusväli on vain likimääräinen. Jos x on jaettu normaali laki N(μ;σ 2 /n), sitten lauseke for luottamusväli on tarkka.

Luottamusvälin laskenta MS EXCELissä

Ratkaistaan ​​ongelma.
Elektronisen komponentin vasteaika tulosignaaliin on tärkeä laitteen ominaisuus. Insinööri haluaa piirtää keskimääräisen vasteajan luottamusvälin 95 %:n luottamustasolla. Aikaisemmasta kokemuksesta insinööri tietää, että vasteajan keskihajonna on 8 ms. Tiedetään, että insinööri teki 25 mittausta arvioidakseen vasteaikaa, keskiarvo oli 78 ms.

Päätös: Insinööri haluaa tietää elektronisen laitteen vasteajan, mutta hän ymmärtää, että vasteaika ei ole kiinteä, vaan satunnaismuuttuja, jolla on oma jakaumansa. Joten parasta, mitä hän voi toivoa, on määrittää tämän jakauman parametrit ja muoto.

Valitettavasti ongelman tilasta emme tiedä vastausajan jakautumisen muotoa (sen ei tarvitse olla normaali). , tämä jakauma on myös tuntematon. Vain hänet tunnetaan keskihajontaσ = 8. Siksi, vaikka emme voi laskea todennäköisyyksiä ja rakentaa luottamusväli.

Emme kuitenkaan tiedä jakelua aika erillinen vastaus, tiedämme sen mukaan CPT, näytteiden jakelu keskimääräinen vasteaika on suunnilleen normaali(oletamme, että ehdot CPT suoritetaan, koska koko näytteet tarpeeksi suuri (n=25)) .

Lisäksi, keskimääräinen tämä jakauma on yhtä suuri kuin keskiarvo yksikkövastejakaumat, ts. μ. MUTTA keskihajonta tämän jakauman (σ/√n) voidaan laskea käyttämällä kaavaa =8/ROOT(25) .

Tiedetään myös, että insinööri sai pistearvio parametri μ on 78 ms (X cf). Siksi voimme nyt laskea todennäköisyydet, koska tiedämme jakelumuodon ( normaali) ja sen parametrit (Х ср ja σ/√n).

Insinööri haluaa tietää odotettu arvoμ vasteaikajakaumasta. Kuten edellä mainittiin, tämä μ on yhtä suuri kuin keskimääräisen vasteajan otosjakauman odotus. Jos käytämme normaalijakauma N(X cf; σ/√n), silloin haluttu μ on alueella +/-2*σ/√n noin 95 %:n todennäköisyydellä.

Merkitsevyystaso on 1-0,95 = 0,05.

Etsi lopuksi vasen ja oikea reuna luottamusväli.
Vasen reuna: \u003d 78-NORM.ST.INR (1-0,05 / 2) * 8 / JUURI (25) = 74,864
Oikea reuna: \u003d 78 + NORM. ST. OBR (1-0,05 / 2) * 8 / JUURI (25) \u003d 81,136

Vasen reuna: =NORM.INV(0,05/2, 78, 8/SQRT(25))
Oikea reuna: =NORM.INV(1-0,05/2, 78, 8/SQRT(25))

Vastaus: luottamusväli klo 95 % luottamustaso ja σ=8ms on yhtä suuri 78+/-3,136 ms

AT esimerkkitiedosto arkilla Sigma tunnettu loi lomakkeen laskentaa ja rakentamista varten kahdenvälinen luottamusväli mielivaltaiselle näytteet tietyllä σ ja merkitsevyystaso.

CONFIDENCE.NORM()-funktio

Jos arvot näytteet ovat alueella B20:B79 , a merkitsevyystaso yhtä suuri kuin 0,05; sitten MS EXCEL -kaava:
=KESKIARVO(B20:B79)-LUOTTAMINEN(0,05,σ, LASKE(B20:B79))
palauttaa vasemman reunan luottamusväli.

Sama raja voidaan laskea kaavalla:
=KESKIARVO(B20:B79)-NORM..ST.INV(1-0.05/2)*σ/SQRT(LASKE(B20:B79))

Huomautus: Funktio TRUST.NORM() ilmestyi MS EXCEL 2010:een. MS EXCELIN aiemmissa versioissa käytettiin TRUST()-funktiota.

Luottamusvälit ( Englanti Luottamusvälit) yksi tilastoissa käytetyistä intervalliestimaateista, jotka lasketaan tietylle merkitsevyystasolle. Niiden avulla voimme todeta, että yleisen populaation tuntemattoman tilastollisen parametrin todellinen arvo on saadulla arvoalueella valitun tilastollisen merkitsevyyden tason antamalla todennäköisyydellä.

Normaalijakauma

Kun tietojoukon varianssi (σ 2 ) tunnetaan, voidaan z-pisteellä laskea luottamusrajoja (luottamusvälin rajapisteitä). Verrattuna t-jakauman käyttöön, z-pistemäärän käyttäminen ei anna vain kapeampaa luottamusväliä, vaan antaa myös luotettavampia arvioita keskiarvosta ja keskihajonnasta (σ), koska Z-pistemäärä perustuu normaalijakaumaan.

Kaava

Luottamusvälin rajapisteiden määrittämiseen käytetään seuraavaa kaavaa edellyttäen, että tietojoukon keskihajonta tunnetaan

L = X - Z a/2 σ
√n

Esimerkki

Oletetaan, että otoskoko on 25 havaintoa, otoksen keskiarvo on 15 ja populaation keskihajonna 8. Merkitsevyystasolle α=5 % Z-pistemäärä on Z α/2 =1,96. Tässä tapauksessa luottamusvälin ala- ja ylärajat ovat

L = 15 - 1,96 8 = 11,864
√25
L = 15 + 1,96 8 = 18,136
√25

Siten voidaan todeta, että 95 %:n todennäköisyydellä väestön matemaattiset odotukset putoavat välillä 11.864 - 18.136.

Menetelmät luottamusvälin kaventamiseksi

Oletetaan, että vaihteluväli on liian laaja tutkimuksemme tarkoituksiin. On kaksi tapaa pienentää luottamusväliä.

  1. Pienennä tilastollisen merkitsevyyden tasoa α.
  2. Suurenna näytteen kokoa.

Pienentämällä tilastollisen merkitsevyyden tason arvoon α=10 %, saadaan Z-pisteet, jotka ovat yhtä suuria kuin Z α/2 =1,64. Tässä tapauksessa välin ala- ja ylärajat ovat

L = 15 - 1,64 8 = 12,376
√25
L = 15 + 1,64 8 = 17,624
√25

Ja itse luottamusväli voidaan kirjoittaa muodossa

Tässä tapauksessa voimme olettaa, että 90 %:n todennäköisyydellä väestön matemaattinen odotus putoaa alueelle.

Jos haluamme säilyttää tilastollisen merkitsevyyden tason α, niin ainoa vaihtoehto on kasvattaa otoskokoa. Nostamalla sen 144 havaintoon, saadaan seuraavat luottamusrajojen arvot

L = 15 - 1,96 8 = 13,693
√144
L = 15 + 1,96 8 = 16,307
√144

Itse luottamusväli näyttää tältä:

Näin ollen luottamusvälin kaventaminen ilman tilastollisen merkitsevyyden tasoa on mahdollista vain suurentamalla otoskokoa. Jos otoskokoa ei ole mahdollista kasvattaa, luottamusvälin kaventuminen voidaan saavuttaa pelkästään tilastollisen merkitsevyyden tasoa pienentämällä.

Luottamusvälin luominen epänormaalille jakaumille

Jos perusjoukon keskihajontaa ei tunneta tai jakauma on epänormaali, t-jakaumaa käytetään luottamusvälin muodostamiseen. Tämä tekniikka on konservatiivisempi, mikä ilmaistaan ​​laajemmilla luottamusvälillä verrattuna Z-pisteeseen perustuvaan tekniikkaan.

Kaava

Seuraavia kaavoja käytetään luottamusvälin ala- ja ylärajan laskemiseen t-jakauman perusteella

L = X - tα σ
√n

Studentin jakauma tai t-jakauma riippuu vain yhdestä parametrista - vapausasteiden lukumäärästä, joka on yhtä suuri kuin yksittäisten piirrearvojen lukumäärä (havaintojen määrä otoksessa). Studentin t-testin arvo tietylle määrälle vapausasteita (n) ja tilastollisen merkitsevyyden taso α löytyvät hakutaulukoista.

Esimerkki

Oletetaan, että otoskoko on 25 yksittäistä arvoa, otoksen keskiarvo on 50 ja otoksen keskihajonta on 28. Sinun on muodostettava luottamusväli tilastollisen merkitsevyyden tasolle α=5 %.

Meidän tapauksessamme vapausasteiden lukumäärä on 24 (25-1), joten Studentin t-testin vastaava taulukkoarvo tilastollisen merkitsevyyden tasolle α=5 % on 2,064. Siksi luottamusvälin ala- ja ylärajat ovat

L = 50 - 2,064 28 = 38,442
√25
L = 50 + 2,064 28 = 61,558
√25

Ja itse intervalli voidaan kirjoittaa muodossa

Näin ollen voidaan todeta, että 95 %:n todennäköisyydellä väestön matemaattiset odotukset ovat alueella.

T-jakauman avulla voit kaventaa luottamusväliä joko vähentämällä tilastollista merkitsevyyttä tai suurentamalla otoskokoa.

Pienentämällä tilastollinen merkitsevyys 95 %:sta 90 %:iin esimerkkimme olosuhteissa, saadaan Studentin t-testin 1,711 vastaava taulukkoarvo.

L = 50 - 1,711 28 = 40,418
√25
L = 50 + 1,711 28 = 59,582
√25

Tässä tapauksessa voidaan sanoa, että 90 %:n todennäköisyydellä väestön matemaattinen odotus on alueella.

Jos emme halua pienentää tilastollista merkitsevyyttä, ainoa vaihtoehto on kasvattaa otoskokoa. Oletetaan, että kyseessä on 64 yksittäistä havaintoa, ei 25, kuten esimerkin alkutilassa. Studentin t-testin taulukkoarvo 63 vapausasteelle (64-1) ja tilastollisen merkitsevyyden tasolle α=5 % on 1,998.

L = 50 - 1,998 28 = 43,007
√64
L = 50 + 1,998 28 = 56,993
√64

Tämä antaa meille mahdollisuuden väittää, että 95 %:n todennäköisyydellä väestön matemaattiset odotukset ovat alueella.

Suuret näytteet

Suuret otokset ovat otoksia tietojoukosta, jossa on yli 100 yksittäistä havaintoa. Tilastotutkimukset ovat osoittaneet, että suuremmat otokset ovat yleensä jakautuneet normaalisti, vaikka populaation jakautuminen ei olisi normaali. Lisäksi tällaisille näytteille z-pisteen ja t-jakauman käyttö antaa suunnilleen samat tulokset luotettavuusvälejä muodostettaessa. Siten suurille näytteille on hyväksyttävää käyttää z-pistettä normaalijakaumaan t-jakauman sijaan.

Yhteenvetona

Luottamusväli(CI; englanniksi luottamusväli - CI), joka saatiin tutkimuksessa otoksella, antaa mittauksen tutkimuksen tulosten tarkkuudesta (tai epävarmuudesta), jotta voidaan tehdä johtopäätöksiä kaikkien tällaisten potilaiden populaatiosta (yleinen populaatio). ). 95 % CI:n oikea määritelmä voidaan muotoilla seuraavasti: 95 % tällaisista intervalleista sisältää perusjoukon todellisen arvon. Tämä tulkinta on hieman epätarkempi: CI on arvoalue, jonka sisällä voit olla 95% varma, että se sisältää todellisen arvon. CI:tä käytettäessä painopiste on kvantitatiivisen vaikutuksen määrittämisessä, toisin kuin P-arvossa, joka saadaan tilastollisen merkitsevyyden testaamisen tuloksena. P-arvo ei arvioi mitään määrää, vaan se toimii pikemminkin todisteen vahvuuden mittana nollahypoteesia "ei vaikutusta" vastaan. P:n arvo sinänsä ei kerro meille mitään eron suuruudesta tai edes sen suunnasta. Siksi P:n riippumattomat arvot ovat ehdottoman informatiivisia artikkeleissa tai tiivistelmissä. Sitä vastoin CI osoittaa sekä välittömän kiinnostavan vaikutuksen määrän, kuten hoidon hyödyllisyyden, että todisteiden vahvuuden. Siksi DI liittyy suoraan DM:n käytäntöön.

Pisteytyslähestymistapa tilastolliseen analyysiin, jota havainnollistaa CI, pyrkii mittaamaan kiinnostavan vaikutuksen suuruutta (diagnostisen testin herkkyys, ennustettu ilmaantuvuus, suhteellinen riskin väheneminen hoidolla jne.) ja mittaamaan tämän vaikutuksen epävarmuutta. Useimmiten CI on arvoalue arvion kummallakin puolella, jossa todellinen arvo todennäköisesti sijaitsee, ja voit olla 95% varma siitä. Sopimus käyttää 95 %:n todennäköisyyttä on mielivaltainen, samoin kuin P:n arvo<0,05 для оценки статистической значимости, и авторы иногда используют 90% или 99% ДИ. Заметим, что слово «интервал» означает диапазон величин и поэтому стоит в единственном числе. Две величины, которые ограничивают интервал, называются «доверительными пределами».

CI perustuu ajatukseen, että sama tutkimus eri potilasryhmille ei tuottaisi identtisiä tuloksia, vaan että niiden tulokset jakautuisivat todellisen mutta tuntemattoman arvon ympärille. Toisin sanoen CI kuvaa tätä "näytteestä riippuvaiseksi vaihteluksi". CI ei heijasta muista syistä johtuvaa lisäepävarmuutta; se ei etenkään sisällä potilaiden valikoivan menetyksen vaikutuksia seurantaan, huonoa hoitomyöntyvyyttä tai epätarkkoja tulosmittauksia, sokeuttamisen puutetta jne. Näin ollen CI aliarvioi aina epävarmuuden kokonaismäärän.

Luottamusvälin laskenta

Taulukko A1.1. Joidenkin kliinisten mittausten standardivirheet ja luottamusvälit

Tyypillisesti CI lasketaan kvantitatiivisen mittarin havaitusta estimaatista, kuten kahden osuuden välisestä erosta (d), ja tämän eron estimaatin keskivirheestä (SE). Näin saatu likimääräinen 95 % CI on d ± 1,96 SE. Kaava muuttuu tulosmitan luonteen ja CI:n kattavuuden mukaan. Esimerkiksi satunnaistetussa, lumekontrolloidussa soluttoman hinkuyskärokotteen tutkimuksessa hinkuyskä kehittyi 72:lle 1670:stä (4,3 %) rokotteen saaneesta lapsesta ja 240:lle 1665:stä (14,4 %) kontrolliryhmästä. Prosentuaalinen ero, joka tunnetaan nimellä absoluuttinen riskin vähennys, on 10,1 %. Tämän eron SE on 0,99 %. Vastaavasti 95 % CI on 10,1 % + 1,96 x 0,99 %, so. 8.2 - 12.0.

Erilaisista filosofisista lähestymistavoista huolimatta CI:t ja tilastollisen merkitsevyyden testit liittyvät matemaattisesti läheisesti toisiinsa.

Siten P:n arvo on ”merkittävä”, ts. R<0,05 соответствует 95% ДИ, который исключает величину эффекта, указывающую на отсутствие различия. Например, для различия между двумя средними пропорциями это ноль, а для относительного риска или отношения шансов - единица. При некоторых обстоятельствах эти два подхода могут быть не совсем эквивалентны. Преобладающая точка зрения: оценка с помощью ДИ - предпочтительный подход к суммированию результатов исследования, но ДИ и величина Р взаимодополняющи, и во многих статьях используются оба способа представления результатов.

Arvioinnin epävarmuus (epätarkkuus) CI:nä ilmaistuna liittyy suurelta osin otoskoon neliöjuureen. Pienet näytteet tarjoavat vähemmän tietoa kuin suuret näytteet, ja CI:t ovat vastaavasti leveämpiä pienemmissä näytteissä. Esimerkiksi artikkelissa, jossa verrattiin kolmen Helicobacter pylori -infektion diagnosointiin käytetyn testin suorituskykyä, ureahengitystestin herkkyys oli 95,8 % (95 % CI 75-100). Vaikka luku 95,8 % näyttää vaikuttavalta, 24 aikuisen H. pylori -potilaan pieni otoskoko tarkoittaa, että tässä arviossa on merkittävää epävarmuutta, kuten laaja CI osoittaa. Itse asiassa 75 prosentin alaraja on paljon alhaisempi kuin 95,8 prosentin arvio. Jos sama herkkyys havaittaisiin 240 ihmisen otoksessa, 95 %:n luottamusväli olisi 92,5-98,0, mikä antaisi paremman varmuuden siitä, että testi on erittäin herkkä.

Satunnaistetuissa kontrolloiduissa tutkimuksissa (RCT) ei-merkittävät tulokset (eli tulokset, joiden P > 0,05) ovat erityisen alttiita väärintulkinnoille. CI on erityisen hyödyllinen tässä, koska se osoittaa, kuinka yhteensopivia tulokset ovat kliinisesti käyttökelpoisen todellisen vaikutuksen kanssa. Esimerkiksi RCT-tutkimuksessa, jossa verrattiin ompeleita paksusuolen anastomoosiin, haavainfektio kehittyi 10,9 %:lle ja 13,5 %:lle potilaista (P = 0,30). Tämän eron 95 % luottamusväli on 2,6 % (-2 - +8). Jopa tässä tutkimuksessa, johon osallistui 652 potilasta, on edelleen todennäköistä, että näiden kahden toimenpiteen aiheuttamien infektioiden ilmaantuvuus vaihtelee. Mitä pienempi tutkimus, sitä suurempi epävarmuus. Sung et ai. suoritti RCT-tutkimuksen, jossa verrattiin oktreotidi-infuusiota hätäskleroterapiaan akuutin suonikohjuvuotojen vuoksi 100 potilaalla. Oktreotidiryhmässä verenvuodon pysäytysprosentti oli 84 %; skleroterapiaryhmässä - 90%, mikä antaa P = 0,56. Huomaa, että jatkuvan verenvuodon määrä on samanlainen kuin haavainfektion yhteydessä mainitussa tutkimuksessa. Tässä tapauksessa interventioiden eron 95 % CI on kuitenkin 6 % (-7 - +19). Tämä vaihteluväli on melko laaja verrattuna 5 %:n eroon, joka olisi kliinisesti kiinnostava. On selvää, että tutkimus ei sulje pois merkittävää eroa tehokkuudessa. Siksi tekijöiden johtopäätös "oktreotidin infuusio ja skleroterapia ovat yhtä tehokkaita suonikohjujen aiheuttaman verenvuodon hoidossa" ei todellakaan pidä paikkaansa. Tällaisissa tapauksissa, joissa absoluuttisen riskin vähentämisen (ARR) 95 % CI sisältää nollan, kuten tässä, NNT:n CI:tä (hoitoon tarvittava luku) on melko vaikea tulkita. NLP ja sen CI saadaan ACP:n käänteisluvuista (kerrotaan ne 100:lla, jos nämä arvot annetaan prosentteina). Tässä saadaan NPP = 100: 6 = 16,6 95 %:n luottamusvälillä -14,3 - 5,3. Kuten taulukon alaviitteestä "d" voidaan nähdä. A1.1, tämä CI sisältää arvot NTPP:lle 5,3:sta äärettömään ja NTLP:lle arvot 14,3:sta äärettömään.

CI:t voidaan muodostaa yleisimmin käytettyjä tilastollisia arvioita tai vertailuja varten. RCT:n osalta se sisältää eron keskimääräisten suhteiden, suhteellisten riskien, todennäköisyyssuhteiden ja NRR:n välillä. Vastaavasti CI:t voidaan saada kaikille tärkeimmille arvioille, jotka on tehty diagnostisten testien tarkkuutta koskevissa tutkimuksissa - herkkyys, spesifisyys, positiivinen ennustearvo (jotka kaikki ovat yksinkertaisia ​​​​suhteita) ja todennäköisyyssuhteet - arvioita, jotka on saatu meta-analyyseissä ja vertailussa kontrolliin. opinnot. Henkilökohtainen tietokoneohjelma, joka kattaa monet näistä DI:n käyttötavoista, on saatavilla Statistics with Confidence -julkaisun toisen painoksen mukana. Makrot CI:n mittasuhteiden laskemiseen ovat saatavilla maksutta Excelissä sekä tilasto-ohjelmissa SPSS ja Minitab osoitteessa http://www.uwcm.ac.uk/study/medicine/epidemiology_statistics/research/statistics/proportions, htm.

Useita arvioita hoidon vaikutuksesta

Vaikka CI:iden rakentaminen on toivottavaa tutkimuksen ensisijaisten tulosten kannalta, niitä ei vaadita kaikille tuloksille. CI koskee kliinisesti tärkeitä vertailuja. Esimerkiksi kahta ryhmää verrattaessa oikea CI on se, joka rakennetaan ryhmien väliselle erolle, kuten yllä olevissa esimerkeissä näkyy, eikä se CI, joka voidaan rakentaa kunkin ryhmän estimaatia varten. Sen lisäksi, että ei ole hyödytöntä antaa erillisiä CI-pisteitä kunkin ryhmän pisteille, tämä esitys voi olla harhaanjohtava. Vastaavasti oikea lähestymistapa verrattaessa hoidon tehokkuutta eri alaryhmissä on verrata kahta (tai useampaa) alaryhmää suoraan. On väärin olettaa, että hoito on tehokas vain yhdessä alaryhmässä, jos sen CI sulkee pois arvon, joka vastaa ei vaikutusta, kun taas toiset eivät. CI:t ovat hyödyllisiä myös verrattaessa tuloksia useiden alaryhmien välillä. Kuvassa A1.1 osoittaa eklampsian suhteellisen riskin naisilla, joilla on preeklampsia naisten alaryhmissä lumekontrolloidun magnesiumsulfaatin RCT:n perusteella.

Riisi. A1.2. Forest Graph näyttää tulokset 11 satunnaistetusta kliinisestä tutkimuksesta naudan rotavirusrokotteesta ripulin ehkäisyssä verrattuna lumelääkkeeseen. 95 %:n luottamusväliä käytettiin arvioimaan suhteellinen ripulin riski. Mustan neliön koko on verrannollinen tiedon määrään. Lisäksi näytetään yhteenvetoarvio hoidon tehokkuudesta ja 95 %:n luottamusväli (merkitty timantilla). Meta-analyysissä käytettiin satunnaisten vaikutusten mallia, joka ylittää jotkin ennalta laaditut mallit; se voi esimerkiksi olla otoskoon laskennassa käytetty koko. Tiukemman kriteerin mukaan koko CI-alueen on osoitettava etu, joka ylittää ennalta määrätyn vähimmäismäärän.

Olemme jo keskustelleet virheestä, jonka mukaan tilastollisen merkitsevyyden puuttuminen osoitti, että kaksi hoitoa ovat yhtä tehokkaita. Yhtä tärkeää on olla rinnastamatta tilastollista merkitsevyyttä kliiniseen merkitykseen. Kliininen merkitys voidaan olettaa, kun tulos on tilastollisesti merkitsevä ja hoitovasteen suuruus

Tutkimukset voivat osoittaa, ovatko tulokset tilastollisesti merkittäviä ja mitkä ovat kliinisesti tärkeitä ja mitkä eivät. Kuvassa A1.2 näyttää tulokset neljästä kokeesta, joiden koko CI<1, т.е. их результаты статистически значимы при Р <0,05 , . После высказанного предположения о том, что клинически важным различием было бы сокращение риска диареи на 20% (ОР = 0,8), все эти испытания показали клинически значимую оценку сокращения риска, и лишь в исследовании Treanor весь 95% ДИ меньше этой величины. Два других РКИ показали клинически важные результаты, которые не были статистически значимыми. Обратите внимание, что в трёх испытаниях точечные оценки эффективности лечения были почти идентичны, но ширина ДИ различалась (отражает размер выборки). Таким образом, по отдельности доказательная сила этих РКИ различна.

Ja muut. Ne kaikki ovat arvioita teoreettisista vastineistaan, jotka voitaisiin saada, jos ei olisi otosta, vaan yleinen populaatio. Mutta valitettavasti yleinen väestö on erittäin kallista ja usein poissa.

Intervalliarvioinnin käsite

Kaikissa näytearvioissa on hajontaa, koska on satunnaismuuttuja, joka riippuu tietyn näytteen arvoista. Siksi luotettavampia tilastollisia päätelmiä varten ei pitäisi tietää vain pisteestimaatti, vaan myös intervalli, mikä suurella todennäköisyydellä γ (gamma) kattaa arvioidun indikaattorin θ (theta).

Muodollisesti nämä ovat kaksi tällaista arvoa (tilastot) T1(X) ja T2(X), mitä T1< T 2 , joille tietyllä todennäköisyystasolla γ ehto täyttyy:

Lyhyesti sanottuna se on todennäköistä γ tai enemmän todellinen arvo on pisteiden välissä T1(X) ja T2(X), joita kutsutaan ala- ja ylärajoiksi luottamusväli.

Yksi luottamusvälien muodostamisen edellytyksistä on sen maksimikapea, ts. sen tulee olla mahdollisimman lyhyt. Halu on melko luonnollista, koska. tutkija yrittää paikantaa halutun parametrin löydön tarkemmin.

Tästä seuraa, että luottamusvälin tulee kattaa jakauman enimmäistodennäköisyydet. ja itse pisteet ovat keskellä.

Toisin sanoen todennäköisyys poikkeaa (todellisen indikaattorin estimaatista) ylöspäin on yhtä suuri kuin poikkeaman todennäköisyys alaspäin. On myös huomattava, että vinossa jakaumassa oikeanpuoleinen intervalli ei ole sama kuin vasemmanpuoleinen intervalli.

Yllä oleva kuva osoittaa selvästi, että mitä suurempi luottamustaso, sitä laajempi väli - suora suhde.

Tämä oli pieni johdatus tuntemattomien parametrien intervalliarvioinnin teoriaan. Jatketaan matemaattisten odotusten luottamusrajojen löytämistä.

Matemaattisen odotuksen luottamusväli

Jos alkuperäiset tiedot jaetaan, keskiarvo on normaaliarvo. Tämä seuraa säännöstä, että normaaliarvojen lineaarisella yhdistelmällä on myös normaalijakauma. Siksi todennäköisyyksien laskemiseen voisimme käyttää normaalijakauman lain matemaattista laitteistoa.

Tämä edellyttää kuitenkin kahden parametrin - odotusarvon ja varianssin - tuntemista, joita ei yleensä tunneta. Voit tietysti käyttää arvioita parametrien sijasta (aritmeettinen keskiarvo ja ), mutta silloin keskiarvon jakauma ei ole aivan normaali, vaan se litistyy hieman. Irlannin kansalainen William Gosset pani taitavasti merkille tämän tosiasian, kun hän julkaisi löytönsä Biometrica-lehden maaliskuussa 1908. Salassapitosyistä Gosset allekirjoitti Studentin kanssa. Näin syntyi Studentin t-jakauma.

Normaali datajakauma, jota K. Gauss käytti tähtitieteellisten havaintojen virheiden analysoinnissa, on kuitenkin erittäin harvinainen maanpäällisessä elämässä, ja sen toteaminen on melko vaikeaa (suureen tarkkuuteen tarvitaan noin 2 tuhatta havaintoa). Siksi on parasta luopua normaalisuusoletuksesta ja käyttää menetelmiä, jotka eivät riipu alkuperäisen datan jakautumisesta.

Herää kysymys: mikä on aritmeettisen keskiarvon jakauma, jos se lasketaan tuntemattoman jakauman tiedoista? Vastauksen antaa todennäköisyysteoriassa hyvin tunnettu Keskirajalause(CPT). Matematiikassa siitä on useita versioita (formulaatioita on jalostettu vuosien varrella), mutta ne kaikki karkeasti sanottuna päätyvät väitteeseen, että suuren määrän riippumattomien satunnaismuuttujien summa noudattaa normaalijakauman lakia.

Aritmeettista keskiarvoa laskettaessa käytetään satunnaismuuttujien summaa. Tästä käy ilmi, että aritmeettisella keskiarvolla on normaalijakauma, jossa odotusarvo on alkuperäisen datan odotusarvo ja varianssi on .

Älykkäät ihmiset osaavat todistaa CLT:n, mutta me varmistamme tämän Excelissä tehdyn kokeen avulla. Simuloitetaan 50 tasaisesti jakautuneen satunnaismuuttujan otos (Excelin RANDOMBETWEEN-funktiolla). Sitten tehdään 1000 tällaista näytettä ja lasketaan jokaiselle aritmeettinen keskiarvo. Katsotaanpa niiden jakautumista.

Voidaan nähdä, että keskiarvon jakauma on lähellä normaalilakia. Jos näytteiden tilavuudesta ja niiden määrästä tehdään vielä suurempi, samankaltaisuus on vielä parempi.

Nyt kun olemme itse todenneet CLT:n validiteetin, voimme :n avulla laskea aritmeettisen keskiarvon luottamusvälit, jotka kattavat todellisen keskiarvon tai matemaattisen odotuksen tietyllä todennäköisyydellä.

Ylä- ja alarajan määrittäminen edellyttää normaalijakauman parametrien tuntemista. Yleensä niitä ei käytetä, joten arvioita käytetään: aritmeettinen keskiarvo ja näytteen varianssi. Tämä menetelmä antaa jälleen hyvän likiarvon vain suurille näytteille. Kun näytteet ovat pieniä, on usein suositeltavaa käyttää Studentin jakaumaa. Älä usko! Studentin jakauma keskiarvolle tapahtuu vain silloin, kun alkuperäisellä tiedolla on normaalijakauma, eli melkein ei koskaan. Siksi on parempi asettaa välittömästi vähimmäispalkki vaaditun tiedon määrälle ja käyttää asymptoottisesti oikeita menetelmiä. He sanovat, että 30 havaintoa riittää. Ota 50 - et voi mennä pieleen.

T 1.2 ovat luottamusvälin ala- ja ylärajat

– näyte aritmeettinen keskiarvo

s0– näytteen keskihajonta (harhaanjohtava)

n - otoskoko

γ – luottamustaso (yleensä 0,9, 0,95 tai 0,99)

c γ = Φ -1 ((1+γ)/2) on normaalin normaalijakaumafunktion käänteisluku. Yksinkertaisesti sanottuna tämä on standardivirheiden lukumäärä aritmeettisesta keskiarvosta ala- tai ylärajaan (ilmoitetut kolme todennäköisyyttä vastaavat arvoja 1,64, 1,96 ja 2,58).

Kaavan ydin on, että aritmeettinen keskiarvo otetaan ja siitä jätetään tietty määrä ( γ:n kanssa) vakiovirheet ( s 0 /√n). Kaikki tiedetään, ota ja laske.

Ennen PC-tietokoneiden massakäyttöä normaalijakaumafunktion ja sen käänteisfunktion arvojen saamiseksi he käyttivät . Niitä käytetään edelleen, mutta tehokkaampaa on kääntyä valmiiden Excel-kaavojen puoleen. Kaikki yllä olevan kaavan elementit ( , ja ) voidaan laskea helposti Excelissä. Mutta on myös valmis kaava luottamusvälin laskemiseen - LUOTTAMINEN NORMI. Sen syntaksi on seuraava.

CONFIDENCE NORM(alfa, standardi_dev, koko)

alfa– merkitsevyystaso tai luottamustaso, joka yllä olevassa merkinnässä on 1-γ, ts. todennäköisyys, että matemaattinenodotus on luottamusvälin ulkopuolella. Kun luottamustaso on 0,95, alfa on 0,05 ja niin edelleen.

standardi_pois on näytetietojen keskihajonta. Sinun ei tarvitse laskea keskivirhettä, Excel jakaa n:n juurella.

koko– näytteen koko (n).

CONFIDENCE.NORM-funktion tulos on toinen termi luottamusvälin laskentakaavasta, ts. puoliväli. Vastaavasti alempi ja ylempi piste ovat keskiarvo ± saatu arvo.

Näin ollen on mahdollista rakentaa universaali algoritmi aritmeettisen keskiarvon luottamusvälien laskemiseen, joka ei riipu lähtötietojen jakaumasta. Universaalisuuden hinta on sen asymptoottisuus, ts. tarve käyttää suhteellisen suuria näytteitä. Nykytekniikan aikakaudella oikean datamäärän kerääminen ei kuitenkaan yleensä ole vaikeaa.

Tilastollisten hypoteesien testaus luottamusvälillä

(moduuli 111)

Yksi tärkeimmistä tilastoissa ratkaistavista ongelmista on. Lyhyesti sanottuna sen olemus on tämä. Oletetaan esimerkiksi, että yleisen väestön odotus on yhtä suuri kuin jokin arvo. Sitten muodostetaan näytekeskiarvojakauma, jota voidaan tarkkailla tietyllä odotuksella. Seuraavaksi tarkastellaan missä tässä ehdollisessa jakaumassa todellinen keskiarvo sijaitsee. Jos se ylittää sallitut rajat, tällaisen keskiarvon ilmestyminen on erittäin epätodennäköistä, ja yhdellä kokeen toistolla se on melkein mahdotonta, mikä on ristiriidassa esitetyn hypoteesin kanssa, joka hylätään onnistuneesti. Jos keskiarvo ei ylitä kriittistä tasoa, hypoteesia ei hylätä (mutta sitä ei myöskään todisteta!).

Joten luottamusvälien avulla, meidän tapauksessamme odotukselle, voit myös testata joitain hypoteeseja. Se on erittäin helppo tehdä. Oletetaan, että jonkin otoksen aritmeettinen keskiarvo on 100. Testataan hypoteesia, jonka mukaan odotusarvo on esimerkiksi 90. Eli jos esitämme kysymyksen primitiivisesti, se kuulostaa tältä: voiko olla niin, että otoksen todellisella arvolla. keskiarvo on 90, havaittu keskiarvo oli 100?

Tähän kysymykseen vastaamiseksi tarvitaan lisätietoja keskihajonnasta ja otoksen koosta. Oletetaan, että keskihajonta on 30 ja havaintojen määrä on 64 (juuren erottamiseksi helposti). Tällöin keskiarvon standardivirhe on 30/8 tai 3,75. 95 %:n luottamusvälin laskemiseksi sinun on jätettävä syrjään kaksi keskivirhettä molemmin puolin keskiarvoa (tarkemmin sanottuna 1,96). Luottamusväli on noin 100 ± 7,5 tai 92,5 - 107,5.

Lisäperustelut ovat seuraavat. Jos testattu arvo osuu luottamusväliin, se ei ole ristiriidassa hypoteesin kanssa, koska mahtuu satunnaisten vaihteluiden rajoihin (todennäköisyydellä 95 %). Jos testattava piste on luottamusvälin ulkopuolella, niin tällaisen tapahtuman todennäköisyys on hyvin pieni, joka tapauksessa alle hyväksyttävän tason. Tästä syystä hypoteesi hylätään, koska se on ristiriidassa havaitun tiedon kanssa. Meidän tapauksessamme odotushypoteesi on luottamusvälin ulkopuolella (testattu arvo 90 ei sisälly väliin 100±7,5), joten se tulee hylätä. Vastaamalla yllä olevaan primitiiviseen kysymykseen, pitäisi sanoa: ei, se ei voi, joka tapauksessa, tämä tapahtuu erittäin harvoin. Usein tämä viittaa tiettyyn hypoteesin virheellisen hylkäämisen todennäköisyyteen (p-taso), eikä tiettyä tasoa, jonka mukaan luottamusväli rakennettiin, vaan siitä lisää toisella kerralla.

Kuten näet, keskiarvon (tai matemaattisen odotuksen) luottamusvälin rakentaminen ei ole vaikeaa. Tärkeintä on saada kiinni olemuksesta, ja sitten asiat etenevät. Käytännössä useimmat käyttävät 95 %:n luottamusväliä, joka on noin kahden standardivirheen levyinen keskiarvon molemmin puolin.

Tässä kaikki tältä erää. Kaikki parhaat!

TAAJUUSTEN JA OSIEN LUOTTOVÄLISET

© 2008

Kansallinen kansanterveyslaitos, Oslo, Norja

Artikkelissa kuvataan ja käsitellään taajuuksien ja suhteiden luottamusvälien laskemista Wald-, Wilson-, Klopper-Pearson-menetelmillä, käyttäen kulmamuunnosta ja Wald-menetelmää Agresti-Cowll-korjauksella. Esitetty aineisto antaa yleistä tietoa frekvenssien ja suhteiden luottamusvälien laskentamenetelmistä ja on tarkoitettu herättämään lehden lukijoissa kiinnostus paitsi luottamusvälien käyttöön esitellessään oman tutkimuksensa tuloksia, myös lukea erikoiskirjallisuutta ennen tulevien julkaisujen työskentelyn aloittaminen.

Avainsanat: luottamusväli, taajuus, osuus

Yhdessä aikaisemmissa julkaisuissa mainittiin lyhyesti kvalitatiivisten tietojen kuvaus ja kerrottiin, että niiden intervallestimaatti on parempi kuin pisteestimaatti kuvaamaan tutkitun ominaisuuden esiintymistiheyttä yleisväestössä. Itse asiassa, koska tutkimukset tehdään otosdatalla, tulosten ennusteen yleisen populaation on sisällettävä otosestimaatin epätarkkuutta. Luottamusväli on estimoidun parametrin tarkkuuden mitta. Mielenkiintoista on, että joissakin perustilastoja koskevissa lääketieteellisissä oppikirjoissa taajuuksien luottamusvälien aihe jätetään täysin huomiotta. Tässä artikkelissa tarkastellaan useita tapoja laskea taajuuksien luottamusvälit olettaen, että otosominaisuudet, kuten toistumattomuus ja edustavuus, sekä havaintojen riippumattomuus toisistaan. Tämän artikkelin esiintymistiheyttä ei ymmärretä absoluuttisena lukuna, joka osoittaa, kuinka monta kertaa tämä tai tuo arvo esiintyy aggregaatissa, vaan suhteellinen arvo, joka määrittää niiden tutkimukseen osallistuneiden osuuden, joilla on tutkittava piirre.

Biolääketieteellisessä tutkimuksessa käytetään yleisimmin 95 %:n luottamusväliä. Tämä luottamusväli on alue, jonka sisällä todellinen osuus osuu 95 % ajasta. Toisin sanoen 95 %:n varmuudella voidaan sanoa, että piirteen esiintymistiheyden todellinen arvo yleisessä populaatiossa on 95 %:n luottamusvälillä.

Useimmat lääketieteen tutkijoiden tilastolliset oppikirjat raportoivat, että taajuusvirhe lasketaan kaavalla

jossa p on piirteen esiintymistiheys otoksessa (arvo 0 - 1). Useimmissa kotimaisissa tieteellisissä artikkeleissa on osoitettu ominaisuuden esiintymistiheyden arvo otoksessa (p) sekä sen virhe (s) muodossa p ± s. On kuitenkin tarkoituksenmukaisempaa esittää 95 %:n luottamusväli piirteen esiintymistiheydelle yleisessä populaatiossa, joka sisältää arvot alkaen

ennen.

Joissakin oppikirjoissa suositellaan pienille näytteille arvon 1,96 korvaamista t:n arvolla N - 1 vapausasteessa, missä N on havaintojen lukumäärä otoksessa. T:n arvo löytyy t-jakauman taulukoista, jotka löytyvät lähes kaikista tilastoalan oppikirjoista. t:n jakauman käyttö Wald-menetelmässä ei tarjoa näkyviä etuja muihin alla käsiteltyihin menetelmiin verrattuna, ja siksi jotkut kirjoittajat eivät pidä sitä tervetulleena.

Yllä oleva menetelmä taajuuksien tai murto-osien luottamusvälien laskemiseksi on nimetty Abraham Waldin mukaan (Abraham Wald, 1902–1950), koska sitä alettiin käyttää laajalti Waldin ja Wolfowitzin vuonna 1939 julkaisemisen jälkeen. Itse menetelmää ehdotti kuitenkin Pierre Simon Laplace (1749–1827) jo vuonna 1812.

Wald-menetelmä on erittäin suosittu, mutta sen soveltamiseen liittyy merkittäviä ongelmia. Menetelmää ei suositella pienille otoskokoille, eikä tilanteissa, joissa ominaisuuden esiintymistiheys on yleensä 0 tai 1 (0 % tai 100 %), eikä se yksinkertaisesti ole mahdollista 0 ja 1 taajuuksilla. normaalijakauman approksimaatio, jota käytetään laskettaessa virhettä, "ei toimi" tapauksissa, joissa n p< 5 или n · (1 – p) < 5 . Более консервативные статистики считают, что n · p и n · (1 – p) должны быть не менее 10 . Более детальное рассмотрение метода Вальда показало, что полученные с его помощью доверительные интервалы в большинстве случаев слишком узки, то есть их применение ошибочно создает слишком оптимистичную картину, особенно при удалении частоты встречаемости признака от 0,5, или 50 % . К тому же при приближении частоты к 0 или 1 доверительный интревал может принимать отрицательные значения или превышать 1, что выглядит абсурдно для частот. Многие авторы совершенно справедливо не рекомендуют применять данный метод не только в уже упомянутых случаях, но и тогда, когда частота встречаемости признака менее 25 % или более 75 % . Таким образом, несмотря на простоту расчетов, метод Вальда может применяться лишь в очень ограниченном числе случаев. Зарубежные исследователи более категоричны в своих выводах и однозначно рекомендуют не применять этот метод для небольших выборок , а ведь именно с такими выборками часто приходится иметь дело исследователям-медикам.

Koska uusi muuttuja jakautuu normaalisti, muuttujan φ 95 %:n luottamusvälin ala- ja ylärajat ovat φ-1,96 ja φ+1,96 vasen">

Pienten näytteiden arvon 1,96 sijaan on suositeltavaa korvata N - 1 vapausaste t:llä. Tämä menetelmä ei anna negatiivisia arvoja ja antaa sinun arvioida taajuuksien luottamusvälit tarkemmin kuin Wald-menetelmä. Lisäksi se on kuvattu monissa kotimaisissa lääketieteellisten tilastojen hakuteoksissa, mikä ei kuitenkaan johtanut sen laajaan käyttöön lääketieteellisessä tutkimuksessa. Luottamusvälien laskemista kulmamuunnoksen avulla ei suositella taajuuksille, jotka lähestyvät 0:ta tai 1:tä.

Tähän päättyy useimmissa lääketieteen tutkijoiden tilaston perusteita käsittelevissä kirjoissa luotettavuusvälien estimointimenetelmien kuvaus, ja tämä ongelma on tyypillinen paitsi kotimaiselle myös ulkomaiselle kirjallisuudelle. Molemmat menetelmät perustuvat keskirajalauseeseen, mikä merkitsee suurta otosta.

Ottaen huomioon epäkohdat luottamusvälien arvioinnissa yllä olevilla menetelmillä, Clopper (Clopper) ja Pearson (Pearson) ehdottivat vuonna 1934 menetelmää niin sanotun tarkan luottamusvälin laskemiseksi ottaen huomioon tutkitun piirteen binomiaalijakauma. Tämä menetelmä on saatavilla monissa online-laskimissa, mutta tällä tavalla saadut luottamusvälit ovat useimmiten liian leveitä. Samanaikaisesti tätä menetelmää suositellaan käytettäväksi tapauksissa, joissa tarvitaan konservatiivinen arvio. Menetelmän konservatiivisuusaste kasvaa otoskoon pienentyessä, erityisesti N:lle< 15 . описывает применение функции биномиального распределения для анализа качественных данных с использованием MS Excel, в том числе и для определения доверительных интервалов, однако расчет последних для частот в электронных таблицах не «затабулирован» в удобном для пользователя виде, а потому, вероятно, и не используется большинством исследователей.

Monien tilastotieteilijöiden mukaan optimaalisin estimaatti frekvenssien luottamusvälistä tehdään Wilsonin menetelmällä, jota ehdotettiin jo vuonna 1927, mutta jota ei käytännössä käytetty kotimaisessa biolääketieteellisessä tutkimuksessa. Tällä menetelmällä ei vain voida arvioida luottamusväliä sekä erittäin pienille että erittäin korkeille taajuuksille, vaan sitä voidaan soveltaa myös pieneen määrään havaintoja. Yleensä Wilsonin kaavan mukainen luottamusväli on muotoa alkaen



jossa se saa arvon 1,96 laskettaessa 95 %:n luottamusväliä, N on havaintojen määrä ja p on ominaisuuden taajuus otoksessa. Tämä menetelmä on saatavilla online-laskimissa, joten sen soveltaminen ei ole ongelmallista. äläkä suosittele tämän menetelmän käyttöä n p< 4 или n · (1 – p) < 4 по причине слишком грубого приближения распределения р к нормальному в такой ситуации, однако зарубежные статистики считают метод Уилсона применимым и для малых выборок .

Wilsonin menetelmän lisäksi Agresti–Caull-korjatun Wald-menetelmän uskotaan antavan optimaalisen arvion frekvenssien luottamusvälistä. Agresti-Coullen korjaus korvaa Wald-kaavan piirteen esiintymistiheyden otoksessa (p) p`:llä, kun lasketaan mikä 2 lisätään osoittajaan ja 4 lisätään nimittäjään, eli , p` = (X + 2) / (N + 4), missä X on niiden tutkimukseen osallistuneiden lukumäärä, joilla on tutkittava ominaisuus, ja N on otoksen koko. Tämä muutos tuottaa hyvin samankaltaisia ​​tuloksia kuin Wilsonin kaavalla, paitsi jos tapahtumatiheys lähestyy 0 % tai 100 % ja näyte on pieni. Yllä olevien taajuuksien luottamusvälien laskentamenetelmien lisäksi on ehdotettu jatkuvuuden korjauksia sekä Wald-menetelmälle että Wilsonin menetelmälle pienille näytteille, mutta tutkimukset ovat osoittaneet, että niiden käyttö ei ole tarkoituksenmukaista.

Harkitse yllä olevien menetelmien soveltamista luottamusvälien laskemiseen kahden esimerkin avulla. Ensimmäisessä tapauksessa tutkimme suuren 1 000 satunnaisesti valitun tutkimukseen osallistujan otoksen, joista 450:llä on tutkittava ominaisuus (se voi olla riskitekijä, tulos tai mikä tahansa muu ominaisuus), jonka esiintymistiheys on 0,45, tai 45 %. Toisessa tapauksessa tutkimus tehdään pienellä otoksella, esimerkiksi vain 20 henkilöä, ja vain yhdellä tutkimukseen osallistuneella (5 %) on tutkittava piirre. Luottamusvälit Wald-menetelmälle, Wald-menetelmälle Agresti-Coll-korjauksella, Wilson-menetelmälle laskettiin käyttämällä Jeff Sauron kehittämää online-laskinta (http://www./wald.htm). Jatkuvuuskorjatut Wilsonin luottamusvälit laskettiin käyttämällä laskinta, jonka tarjoaa Wassar Stats: Web Site for Statistical Computation (http://faculty.vassar.edu/lowry/prop1.html). Fisherin kulmamuunnoksia käyttävät laskelmat suoritettiin "manuaalisesti" käyttämällä kriittistä t:n arvoa 19 ja 999 vapausasteelle, vastaavasti. Laskentatulokset on esitetty taulukossa molemmille esimerkeille.

Luottamusvälit laskettu kuudella eri tavalla kahdelle tekstissä kuvatulle esimerkille

Luottamusvälin laskentamenetelmä

P = 0,0500 eli 5 %

95 % CI X = 450, N = 1000, P = 0,4500 tai 45 %

–0,0455–0,2541

Walda Agresti-Coll-korjauksella

<,0001–0,2541

Wilson jatkuvuuskorjauksella

Klopper-Pearsonin "tarkka menetelmä"

Kulman muunnos

<0,0001–0,1967

Kuten taulukosta voidaan nähdä, ensimmäisessä esimerkissä "yleisesti hyväksytyllä" Wald-menetelmällä laskettu luottamusväli menee negatiiviselle alueelle, mikä ei voi olla taajuuksien tapauksessa. Valitettavasti tällaiset tapaukset eivät ole harvinaisia ​​venäläisessä kirjallisuudessa. Perinteinen tapa esittää dataa taajuudella ja sen virheellä peittää osittain tämän ongelman. Jos esimerkiksi piirteen esiintymistiheys (prosentteina) esitetään arvona 2,1 ± 1,4, tämä ei ole niin "ärsyttävää" kuin 2,1 % (95 % CI: –0,7; 4,9), vaikka ja tarkoittaa samaa. Wald-menetelmä Agresti-Coullen korjauksella ja kulmamuunnoksen laskenta antavat nollaan pyrkivän alarajan. Wilsonin menetelmä jatkuvuuskorjauksella ja "tarkka menetelmä" antavat laajemmat luottamusvälit kuin Wilsonin menetelmä. Toisessa esimerkissä kaikki menetelmät antavat suunnilleen samat luottamusvälit (erot näkyvät vain tuhannesosissa), mikä ei ole yllättävää, koska tapahtuman esiintymistiheys tässä esimerkissä ei poikkea paljon 50 prosentista ja otoskoko on melko suuri .

Tästä ongelmasta kiinnostuneille lukijoille voimme suositella R. G. Newcomben ja Brownin, Cain ja Dasguptan teoksia, jotka antavat edut ja haitat 7 ja 10 erilaisen menetelmän käyttämisestä luottamusvälien laskemiseen. Kotimaisista käsikirjoista suositellaan kirjaa ja, jossa on yksityiskohtaisen teoriakuvauksen lisäksi esitelty Waldin ja Wilsonin menetelmät sekä menetelmä luottamusvälien laskentaan binomiaalinen taajuusjakauma huomioon ottaen. Ilmaisten online-laskimien (http://www./wald.htm ja http://faculty.vassar.edu/lowry/prop1.html) lisäksi taajuuksien (eikä vain!) luottamusvälit voidaan laskea käyttämällä CIA-ohjelma (Confidence Intervals Analysis), jonka voi ladata osoitteesta http://www. lääketieteellinen koulu. soton. ac. uk/cia/ .

Seuraavassa artikkelissa tarkastellaan yksimuuttujaisia ​​tapoja vertailla laadullisia tietoja.

Bibliografia

Banerjee A. Lääketieteellinen tilasto selkeällä kielellä: johdantokurssi / A. Banerzhi. - M. : Käytännön lääketiede, 2007. - 287 s. Lääketieteellinen tilasto / . - M. : Medical Information Agency, 2007. - 475 s. Glanz S. Lääketieteellis-biologiset tilastot / S. Glants. - M.: Harjoittelu, 1998. Tietotyypit, levinneisyyden todentaminen ja kuvaavat tilastot / // Human Ecology - 2008. - Nro 1. - S. 52–58. Zhizhin K.S.. Lääketieteellinen tilasto: oppikirja / . - Rostov n/D: Phoenix, 2007. - 160 s. Sovellettavat lääketieteelliset tilastot / , . - Pietari. : Folio, 2003. - 428 s. Lakin G.F. Biometriset tiedot / . - M. : Korkeakoulu, 1990. - 350 s. Lääkäri V. A. Lääketieteen matemaattiset tilastot / , . - M. : Talous ja tilastot, 2007. - 798 s. Kliinisen tutkimuksen matemaattiset tilastot / , . - M.: GEOTAR-MED, 2001. - 256 s. Junkerov V. Ja. Lääketieteellisten tutkimustietojen lääketieteellis-tilastollinen käsittely /,. - Pietari. : VmedA, 2002. - 266 s. Agresti A. Likimääräinen on parempi kuin tarkka binomiaalisten suhteiden intervalliestimointiin / A. Agresti, B. Coull // Amerikkalainen tilastotieteilijä. - 1998. - N 52. - S. 119-126. Altman D. Tilastot luottavaisin mielin // D. Altman, D. Machin, T. Bryant, M. J. Gardner. - Lontoo: BMJ Books, 2000. - 240 s. Ruskea L.D. Interval estimation for a binomial ratio / L. D. Brown, T. T. Cai, A. Dasgupta // Tilastotiede. - 2001. - N 2. - P. 101-133. Clopper C.J. Luottamus- tai vertailurajojen käyttö binomiaalin tapauksessa / C. J. Clopper, E. S. Pearson // Biometrika. - 1934. - N 26. - P. 404-413. Garcia-Perez M. A. Binomiaalisen parametrin luottamusvälistä / M. A. Garcia-Perez // Laatu ja määrä. - 2005. - N 39. - P. 467-481. Motulsky H. Intuitiivinen biostatistiikka // H. Motulsky. - Oxford: Oxford University Press, 1995. - 386 s. Newcombe R.G. Kaksipuoliset luottamusvälit yhdelle osuudelle: Seitsemän menetelmän vertailu / R. G. Newcombe // Statistics in Medicine. - 1998. - N. 17. - P. 857–872. Sauro J. Valmistumisasteiden arvioiminen pienistä otoksista binomiaalisten luottamusvälien avulla: vertailuja ja suosituksia / J. Sauro, J. R. Lewis // Proceedings of the Human factor and ergonomics Society vuosittainen kokous. – Orlando, Florida, 2005. Wald A. Jatkuvien jakelufunktioiden luottamusrajat // A. Wald, J. Wolfovitz // Annals of Mathematical Statistics. - 1939. - N 10. - P. 105–118. Wilson E.B. Todennäköinen päättely, perintölaki ja tilastollinen päättely / E. B. Wilson // Journal of American Statistical Association. - 1927. - N 22. - P. 209-212.

SUHTEIDEN LUOTTOVÄLISET

A. M. Grjibovski

Kansallinen kansanterveyslaitos, Oslo, Norja

Artikkelissa esitetään useita menetelmiä binomiaalisten suhteiden luottamusvälien laskemiseen, nimittäin Wald-, Wilson-, arcsin-, Agresti-Coull- ja tarkka Clopper-Pearson -menetelmät. Artikkeli esittelee vain yleisluontoisesti binomiosuuden luottamusväliestimoinnin ongelmaa, ja sen tavoitteena ei ole pelkästään kannustaa lukijoita käyttämään luottamusväliä esitellessään oman empiirisen tutkimuksen tuloksia, vaan myös rohkaista heitä tutustumaan tilastokirjoihin ennen oman tiedon analysointi ja käsikirjoitusten valmistelu.

avainsanoja: luottamusväli, osuus

Yhteystiedot:

Senior Advisor, National Institute of Public Health, Oslo, Norja