Luottamusväli MS EXCELin keskiarvon (dispersio tunnetaan) arvioimiseksi. Kvantitatiiviset analyysimenetelmät: Luottamusvälien arviointi

"Katren-Style" jatkaa Konstantin Kravchikin syklin julkaisemista lääketieteellisistä tilastoista. Kahdessa aiemmassa artikkelissa kirjoittaja käsitteli selostuksia sellaisista käsitteistä kuin ja.

Konstantin Kravchik

Matemaatikko-analyytikko. Lääketieteen ja humanististen tieteiden tilastollisen tutkimuksen asiantuntija

Moskovan kaupunki

Hyvin usein kliinisiä tutkimuksia koskevista artikkeleista löydät mystisen lauseen: "luottamusväli" (95% CI tai 95% CI - luottamusväli). Artikkelissa saatetaan esimerkiksi sanoa: "Opiskelijan t-testiä käytettiin arvioimaan erojen merkittävyyttä, jolloin laskettiin 95 %:n luottamusväli."

Mikä on "95 %:n luottamusvälin" arvo ja miksi se lasketaan?

Mikä on luottamusväli? - Tämä on alue, jolle väestön todelliset keskiarvot putoavat. Ja mitä, onko olemassa "epätosia" keskiarvoja? Tietyssä mielessä kyllä. Selitimme, että kiinnostavaa parametria on mahdotonta mitata koko populaatiossa, joten tutkijat ovat tyytyväisiä rajoitettuun otokseen. Tässä otoksessa (esimerkiksi ruumiinpainon mukaan) on yksi keskiarvo (tiety paino), jonka perusteella arvioimme keskiarvon koko väestössä. On kuitenkin epätodennäköistä, että otoksen keskimääräinen paino (etenkin pieni) osuisi yhteen yleisen väestön keskimääräisen painon kanssa. Siksi on oikeampaa laskea ja käyttää yleisen väestön keskiarvojen vaihteluväliä.

Oletetaan esimerkiksi, että hemoglobiinin 95 %:n luottamusväli (95 % CI) on 110-122 g/l. Tämä tarkoittaa, että 95 % todennäköisyydellä hemoglobiinin todellinen keskiarvo yleisväestössä on välillä 110-122 g/l. Toisin sanoen emme tiedä keskimääräistä hemoglobiinia väestössä, mutta voimme osoittaa tämän ominaisuuden arvoalueen 95 %:n todennäköisyydellä.

Luottamusvälit ovat erityisen tärkeitä ryhmien välisten keskiarvojen erojen tai niin sanotun vaikutuskoon kannalta.

Oletetaan, että vertailimme kahden rautavalmisteen tehokkuutta: toisen, joka on ollut markkinoilla pitkään, ja toisen, joka on juuri rekisteröity. Hoidon jälkeen hemoglobiinipitoisuus tutkituissa potilasryhmissä arvioitiin ja tilastoohjelma laski meille, että ero näiden kahden ryhmän keskiarvojen välillä on todennäköisyydellä 95 %. 1,72 - 14,36 g/l (taulukko 1).

Tab. 1. Riippumattomien näytteiden kriteeri
(ryhmiä verrataan hemoglobiinitason mukaan)

Tämä tulee tulkita seuraavasti: osassa uutta lääkettä käyttävistä potilaista hemoglobiini on keskimäärin 1,72–14,36 g/l korkeampi kuin niillä, jotka ottivat jo tunnettua lääkettä.

Toisin sanoen yleisessä väestössä ero hemoglobiinin keskiarvoissa ryhmissä 95 %:n todennäköisyydellä on näissä rajoissa. Tutkijan tehtävänä on arvioida, onko tämä paljon vai vähän. Kaiken tämän pointti on, että emme työskentele yhdellä keskiarvolla, vaan arvoalueella, joten arvioimme luotettavammin parametrin eron ryhmien välillä.

Tilastopaketeissa voidaan tutkijan harkinnan mukaan itsenäisesti kaventaa tai laajentaa luottamusvälin rajoja. Pienentämällä luottamusvälin todennäköisyyksiä kavennetaan keskiarvoja. Esimerkiksi 90 % CI:llä keskiarvoalue (tai keskiarvoerot) on kapeampi kuin 95 % CI:llä.

Päinvastoin, todennäköisyyden lisääminen 99 prosenttiin laajentaa arvoaluetta. Ryhmiä verrattaessa CI:n alaraja voi ylittää nollamerkin. Jos esimerkiksi laajensimme luottamusvälin rajoja arvoon 99 %, niin intervallin rajat vaihtelivat välillä –1 - 16 g/L. Tämä tarkoittaa, että yleispopulaatiossa on ryhmiä, joiden keskiarvojen ero tutkittavan ominaisuuden osalta on 0 (M=0).

Luottamusvälejä voidaan käyttää tilastollisten hypoteesien testaamiseen. Jos luottamusväli ylittää nolla-arvon, niin nollahypoteesi, joka olettaa, että ryhmät eivät eroa tutkitussa parametrissa, on totta. Esimerkki on kuvattu yllä, kun laajensimme rajoja 99 prosenttiin. Jossain yleisestä väestöstä löysimme ryhmiä, jotka eivät eronneet millään tavalla.

95 %:n luottamusväli hemoglobiinin erosta, (g/l)


Kuvassa näkyy kahden ryhmän keskimääräisen hemoglobiinieron 95 %:n luottamusväli viivana. Viiva ohittaa nollamerkin, joten keskiarvojen välillä on ero, joka on yhtä suuri kuin nolla, mikä vahvistaa nollahypoteesin, että ryhmät eivät eroa toisistaan. Ryhmien välinen ero on -2 - 5 g/l, mikä tarkoittaa, että hemoglobiini voi joko laskea 2 g/l tai nousta 5 g/l.

Luottamusväli on erittäin tärkeä indikaattori. Sen ansiosta näet, johtuivatko erot ryhmissä todella keskiarvoeroista vai suuresta otoksesta, sillä suurella otoksella erojen löytäminen on suurempi kuin pienellä.

Käytännössä se voi näyttää tältä. Otimme 1000 ihmisen näytteen, mittasimme hemoglobiinitason ja totesimme, että keskiarvojen eron luottamusväli on 1,2-1,5 g/l. Tilastollisen merkitsevyyden taso tässä tapauksessa s

Näemme, että hemoglobiinipitoisuus nousi, mutta lähes huomaamattomasti, joten tilastollinen merkitsevyys ilmestyi juuri näytteen koosta johtuen.

Luottamusvälit voidaan laskea paitsi keskiarvoille, myös suhteille (ja riskisuhteille). Meitä kiinnostaa esimerkiksi niiden potilaiden osien luottamusväli, jotka saavuttivat remissio kehitetyn lääkkeen käytön aikana. Oletetaan, että osuuksien eli tällaisten potilaiden osuuden 95 % luottamusväli on välillä 0,60–0,80. Näin ollen voimme sanoa, että lääkkeellämme on terapeuttinen vaikutus 60-80 prosentissa tapauksista.

Luottamusväli

Luottamusväli- termi, jota käytetään matemaattisissa tilastoissa tilastollisten parametrien intervalliarviointiin (eikä pisteen), mikä on edullista pienellä otoskoolla. Luottamusväli on aikaväli, joka kattaa tuntemattoman parametrin tietyllä luotettavuudella.

Luottamusvälien menetelmän on kehittänyt amerikkalainen tilastotieteilijä Jerzy Neumann englantilaisen tilastotieteilijän Ronald Fischerin ideoiden pohjalta.

Määritelmä

Luottamusväliparametri θ satunnaismuuttujajakauma X luottamustasolla 100 p%, näytteen luoma ( x 1 ,…,x n), kutsutaan intervalliksi, jolla on rajat ( x 1 ,…,x n) ja ( x 1 ,…,x n) jotka ovat satunnaismuuttujien realisaatioita L(X 1 ,…,X n) ja U(X 1 ,…,X n) sellainen

.

Luottamusvälin rajapisteitä kutsutaan luottamusrajoja.

Luottamusvälin intuitioon perustuva tulkinta olisi: jos s on suuri (esim. 0,95 tai 0,99), silloin luottamusväli sisältää lähes varmasti todellisen arvon θ .

Toinen tulkinta luottamusvälin käsitteestä: sitä voidaan pitää parametriarvojen intervallina θ yhteensopivia kokeellisten tietojen kanssa eivätkä ole ristiriidassa niiden kanssa.

Esimerkkejä

  • Normaalin otoksen matemaattisen odotuksen luottamusväli ;
  • Normaalin otosvarianssin luottamusväli .

Bayesin luottamusväli

Bayesilaisessa tilastossa on määritelmä luottamusvälille, joka on samanlainen, mutta eroaa joidenkin tärkeiden yksityiskohtien osalta. Tässä itse estimoitua parametria pidetään satunnaismuuttujana, jolle on annettu a priori jakauma (yhtenäinen yksinkertaisimmassa tapauksessa), ja otos on kiinteä (klassisessa tilastossa kaikki on täsmälleen päinvastoin). Bayesin luottamusväli on intervalli, joka kattaa parametrin arvon posteriorisella todennäköisyydellä:

.

Yleensä klassiset ja Bayesin luottamusvälit ovat erilaisia. Englanninkielisessä kirjallisuudessa Bayesin luottamusväliä kutsutaan yleensä termiksi uskottava intervalli, ja klassikko luottamusväli.

Huomautuksia

Lähteet

Wikimedia Foundation. 2010 .

  • Vauva (elokuva)
  • Siirtolainen

Katso, mitä "luottamusväli" on muissa sanakirjoissa:

    Luottamusväli- näytetiedoista laskettu aikaväli, joka kattaa annetulla todennäköisyydellä (luottamuksella) arvioidun jakaumaparametrin tuntemattoman todellisen arvon. Lähde: GOST 20522 96: Maaperä. Tulosten tilastollisen käsittelyn menetelmät ... Normatiivisen ja teknisen dokumentaation termien sanakirja-viitekirja

    luottamusväli- yleisen perusjoukon skalaariparametrille tämä on segmentti, joka todennäköisimmin sisältää tämän parametrin. Tämä lause on merkityksetön ilman lisäselvitystä. Koska luottamusvälin rajat arvioidaan otoksesta, on luonnollista ... ... Sosiologisen tilastotieteen sanakirja

    LUOTTAMISVÄLI on parametrien estimointimenetelmä, joka eroaa pisteestimaatiosta. Olkoon näyte x1, . . ., xn jakaumasta, jonka todennäköisyystiheys on f(x, α), ja a*=a*(x1, . . ., xn) on estimaatti α, g(a*, α) on todennäköisyystiheys arvio. Etsivät… … Geologinen tietosanakirja

    LUOTTAMISVÄLI- (luottamusväli) Väli, jossa otantatutkimuksesta johdetun perusjoukon parametriarvon luotettavuudella on tietty todennäköisyysaste, kuten 95 %, johtuen itse otoksesta. Leveys…… Taloussanakirja

    luottamusväli- on väli, jossa määritetyn suuren todellinen arvo sijaitsee tietyllä luottamustodennäköisyydellä. Yleinen kemia: oppikirja / A. V. Zholnin ... Kemialliset termit

    Luottamusväli CI- Luottamusväli, CI * davyaralny interval, CI * merkkiarvon luottamusväli, laskettu c.l. jakaumaparametri (esim. ominaisuuden keskiarvo) otoksen yli ja tietyllä todennäköisyydellä (esim. 95 % 95 %:lle ... Genetiikka. tietosanakirja

    LUOTTAMISVÄLI- käsite, joka syntyy arvioitaessa parametritilastoa. jakauma arvovälin mukaan. D. i. parametrille q, joka vastaa annettua kerrointa. luottamus P, on yhtä suuri kuin sellainen väli (q1, q2), että millä tahansa epäyhtälön todennäköisyyden jakaumalla ... ... Fyysinen tietosanakirja

    luottamusväli- - Tietoliikenneaiheet, peruskäsitteet FI luottamusväli ... Teknisen kääntäjän käsikirja

    luottamusväli- pasikliovimo intervalas statusas T-ala Standartizacija ir metrologija definis Dydžio verčių intervalas, kuriame su pasirinktąja tikimybe yra matavimo rezultato vertė. atitikmenys: engl. luottamusväli vok. Vertrauensbereich, m rus.… … Penkiakalbis aiskinamasis metrologijos terminų žodynas

    luottamusväli- pasikliovimo intervalas statusas T ala kemian definis Dydžio verčių intervalas, kuriame su pasirinktąja tikimybe yra matavimo rezultatų vertė. atitikmenys: engl. luottamusväli rus. luottamus alue; luottamusväli... Chemijos terminų aiskinamasis žodynas

Oletetaan, että meillä on suuri määrä nimikkeitä joidenkin ominaisuuksien normaalijakaumassa (esimerkiksi täysi varasto samantyyppisiä vihanneksia, joiden koko ja paino vaihtelee). Haluat tietää koko tavaraerän keskimääräiset ominaisuudet, mutta sinulla ei ole aikaa eikä halua mitata ja punnita jokaista vihannesta. Ymmärrät, että tämä ei ole välttämätöntä. Mutta kuinka monta kappaletta pitäisi ottaa satunnaiseen tarkastukseen?

Ennen kuin annamme joitain tähän tilanteeseen hyödyllisiä kaavoja, muistamme joitakin merkintöjä.

Ensinnäkin, jos mittaamme koko vihannesvaraston (tätä elementtijoukkoa kutsutaan yleiseksi populaatioksi), tietäisimme kaikella käytettävissä olevalla tarkkuudella koko erän painon keskiarvon. Kutsutaan tätä keskiarvoksi X vrt .g fi . - yleinen keskiarvo. Tiedämme jo, mikä on täysin määritetty, jos sen keskiarvo ja poikkeama s tunnetaan . Totta, toistaiseksi emme ole X keskim. emmekä s emme tunne yleistä väestöä. Voimme vain ottaa näytteen, mitata tarvitsemamme arvot ja laskea tälle näytteelle sekä näytteen keskiarvon X sr. että keskihajonnan S sb.

Tiedetään, että jos mukautettu tarkistusmme sisältää suuren määrän elementtejä (yleensä n on suurempi kuin 30), ja ne otetaan todella satunnainen, sitten s yleinen väestö ei juuri eroa S ..

Lisäksi normaalijakauman tapauksessa voimme käyttää seuraavia kaavoja:

95 % todennäköisyydellä


99% todennäköisyydellä



Yleensä todennäköisyydellä Р (t)


Suhde t:n arvon ja todennäköisyyden P (t) arvon välillä, jolla haluamme tietää luottamusvälin, voidaan ottaa seuraavasta taulukosta:


Näin ollen olemme määrittäneet, millä alueella yleisen populaation keskiarvo on (tietyllä todennäköisyydellä).

Ellei meillä ole riittävän suurta otosta, emme voi väittää, että populaatiolla on s = S sel. Lisäksi tässä tapauksessa näytteen läheisyys normaalijakaumaan on ongelmallista. Käytä tässä tapauksessa myös S sb:tä s kaavassa:




mutta t:n arvo kiinteälle todennäköisyydelle P(t) riippuu alkioiden lukumäärästä näytteessä n. Mitä suurempi n, sitä lähempänä tuloksena oleva luottamusväli on kaavan (1) antamaa arvoa. Tässä tapauksessa t-arvot on otettu toisesta taulukosta (opiskelijan t-testi), jonka tarjoamme alla:

Studentin t-testin arvot todennäköisyyksille 0,95 ja 0,99


Esimerkki 3 Yrityksen työntekijöiden joukosta valittiin satunnaisesti 30 henkilöä. Otoksen mukaan kävi ilmi, että keskipalkka (kuukaudessa) on 30 tuhatta ruplaa ja keskimääräinen neliöpoikkeama 5 tuhatta ruplaa. Määritä yrityksen keskipalkka todennäköisyydellä 0,99.

Ratkaisu: Ehdolla meillä on n = 30, X vrt. = 30 000, S = 5 000, P = 0,99. Luottamusvälin löytämiseksi käytämme Studentin kriteeriä vastaavaa kaavaa. Taulukon mukaan n \u003d 30 ja P \u003d 0,99 löydämme t \u003d 2,756, joten


nuo. haluttu luottamus väli 27484< Х ср.ген < 32516.

Joten todennäköisyydellä 0,99 voidaan väittää, että väli (27484; 32516) sisältää yrityksen keskipalkan.

Toivomme, että käytät tätä menetelmää ilman, että sinulla on aina laskentataulukko mukanasi. Laskut voidaan suorittaa automaattisesti Excelissä. Kun olet Excel-tiedostossa, napsauta ylävalikon fx-painiketta. Valitse sitten toiminnoista tyyppi "tilastollinen" ja ruudussa olevasta ehdotetusta luettelosta - STEUDRASP. Aseta sitten kohdistin "todennäköisyys"-kenttään kehotteeseen ja kirjoita vastavuoroisen todennäköisyyden arvo (eli meidän tapauksessamme todennäköisyyden 0,95 sijaan sinun on kirjoitettava todennäköisyys 0,05). Ilmeisesti laskentataulukko on suunniteltu niin, että tulos vastaa kysymykseen, kuinka todennäköisesti voimme olla väärässä. Syötä vastaavasti "vapausaste"-kenttään näytteesi arvo (n-1).

Luottamusväli tuli meille tilastoalalta. Tämä on määritetty alue, jonka avulla voidaan arvioida tuntematon parametri suurella luotettavuudella. Helpoin tapa selittää tämä on esimerkin avulla.

Oletetaan, että sinun on tutkittava jokin satunnaismuuttuja, esimerkiksi palvelimen vastausnopeus asiakkaan pyyntöön. Aina kun käyttäjä kirjoittaa tietyn sivuston osoitteen, palvelin vastaa eri nopeudella. Siten tutkitulla vasteajalla on satunnainen luonne. Joten luottamusvälin avulla voit määrittää tämän parametrin rajat, ja sitten on mahdollista väittää, että 95% todennäköisyydellä palvelin on laskemallamme alueella.

Tai sinun on selvitettävä, kuinka moni tietää yrityksen brändistä. Luottamusväliä laskettaessa voidaan esimerkiksi sanoa, että 95 %:n todennäköisyydellä kuluttajien osuus asiasta tietävän on 27-34 %.

Tähän termiin liittyy läheisesti sellainen arvo kuin luottamustaso. Se edustaa todennäköisyyttä, että haluttu parametri sisältyy luottamusväliin. Tämä arvo määrittää, kuinka suuri haluttu alue on. Mitä suurempi arvo se ottaa, sitä kapeampi luottamusväli tulee ja päinvastoin. Yleensä se on asetettu arvoon 90%, 95% tai 99%. Arvo 95 % on suosituin.

Tähän indikaattoriin vaikuttaa myös havaintojen varianssi ja sen määritelmä perustuu oletukseen, että tutkittava piirre tottelee tätä väitettä tunnetaan myös Gaussin laina. Hänen mukaansa tällaista jatkuvan satunnaismuuttujan kaikkien todennäköisyyksien jakaumaa kutsutaan normaaliksi, jota voidaan kuvata todennäköisyystiheydellä. Jos normaalijakauman oletus osoittautui vääräksi, arvio voi osoittautua vääräksi.

Selvitetään ensin, kuinka lasketaan luottamusväli Tässä kaksi tapausta on mahdollista. Dispersio (satunnaismuuttujan levinneisyysaste) voi olla tiedossa tai ei. Jos se tiedetään, luottamusvälimme lasketaan seuraavalla kaavalla:

xsr - t*σ / (sqrt(n))<= α <= хср + t*σ / (sqrt(n)), где

α - merkki,

t on Laplace-jakaumataulukon parametri,

σ on dispersion neliöjuuri.

Jos varianssia ei tunneta, se voidaan laskea, jos tiedämme kaikki halutun ominaisuuden arvot. Tätä varten käytetään seuraavaa kaavaa:

σ2 = х2ср - (хр)2, missä

х2ср - tutkittavan ominaisuuden neliöiden keskiarvo,

(xsr)2 on tämän ominaisuuden neliö.

Kaava, jolla luottamusväli lasketaan tässä tapauksessa, muuttuu hieman:

xsr - t*s / (sqrt(n))<= α <= хср + t*s / (sqrt(n)), где

xsr - näytekeskiarvo,

α - merkki,

t on parametri, joka löytyy Studentin jakaumataulukosta t \u003d t (ɣ; n-1),

sqrt(n) on näytteen kokonaiskoon neliöjuuri,

s on varianssin neliöjuuri.

Harkitse tätä esimerkkiä. Oletetaan, että 7 mittauksen tulosten perusteella tutkittavaksi piirteeksi määritettiin 30 ja otosvarianssiksi 36. On tarpeen löytää 99 %:n todennäköisyydellä luottamusväli, joka sisältää todellisen arvon mitattu parametri.

Määritetään ensin, mikä t on yhtä suuri kuin: t \u003d t (0,99; 7-1) \u003d 3,71. Yllä olevaa kaavaa käyttämällä saamme:

xsr - t*s / (sqrt(n))<= α <= хср + t*s / (sqrt(n))

30 - 3,71*36 / (sqrt(7))<= α <= 30 + 3.71*36 / (sqrt(7))

21.587 <= α <= 38.413

Varianssin luottamusväli lasketaan sekä tunnetun keskiarvon tapauksessa että silloin, kun matemaattisesta odotuksesta ei ole tietoa ja vain varianssin puolueettoman pisteestimaatin arvo tiedetään. Emme anna tässä kaavoja sen laskemiseen, koska ne ovat melko monimutkaisia ​​ja haluttaessa ne löytyvät aina verkosta.

Huomaamme vain, että luottamusväli on kätevä määrittää Excel-ohjelmalla tai verkkopalvelulla, jota kutsutaan niin.