Matemaattisen odotuksen luottamusväli. Otokset ja luottamusvälit

Matemaattisen odotuksen luottamusväli - tämä on sellainen tiedoista laskettu intervalli, joka tunnetulla todennäköisyydellä sisältää yleisen populaation matemaattisen odotuksen. Matemaattisen odotuksen luonnollinen estimaatti on sen havaittujen arvojen aritmeettinen keskiarvo. Siksi jatkossa oppitunnin aikana käytämme termejä "keskiarvo", "keskiarvo". Luottamusvälin laskentatehtävissä vaaditaan useimmiten vastaus "Keskimääräisen luvun [arvo tietyssä tehtävässä] luottamusväli on [pienempi arvo] - [suurempi arvo]". Luottamusvälin avulla on mahdollista arvioida paitsi keskiarvoja myös jonkin ominaisuuden osuutta yleisestä väestöstä. Oppitunnilla analysoidaan keskiarvoja, varianssia, keskihajontaa ja virhettä, joiden kautta päästään uusiin määritelmiin ja kaavoihin Näytteen ja populaation ominaisuudet .

Keskiarvon piste- ja intervalliestimaatit

Jos yleisen perusjoukon keskiarvo arvioidaan luvulla (pisteellä), niin havaintojen otoksesta laskettu spesifinen keskiarvo otetaan estimaatiksi yleisen perusjoukon tuntemattomasta keskiarvosta. Tässä tapauksessa otoskeskiarvon - satunnaismuuttujan - arvo ei ole sama kuin yleisen perusjoukon keskiarvo. Siksi näytteen keskiarvoa ilmoitettaessa on samalla ilmoitettava myös näytevirhe. Otantavirheen mittana käytetään keskivirhettä, joka ilmaistaan ​​samoissa yksiköissä kuin keskiarvo. Siksi seuraavaa merkintää käytetään usein: .

Jos keskiarvon estimaatti vaaditaan liitettäväksi tiettyyn todennäköisyyteen, niin yleisen kiinnostuksen kohteena olevan populaation parametri ei tule estimoida yhdellä luvulla, vaan välillä. Luottamusväli on aikaväli, jossa tietyllä todennäköisyydellä P väestön estimoidun indikaattorin arvo löytyy. Luottamusväli, jossa todennäköisyydellä P = 1 - α on satunnaismuuttuja , lasketaan seuraavasti:

,

α = 1 - P, joka löytyy melkein minkä tahansa tilastokirjan liitteestä.

Käytännössä perusjoukon keskiarvoa ja varianssia ei tunneta, joten populaation varianssi korvataan otosvarianssilla ja perusjoukon keskiarvo otoksen keskiarvolla. Näin ollen luottamusväli lasketaan useimmissa tapauksissa seuraavasti:

.

Luottamusvälikaavaa voidaan käyttää populaation keskiarvon arvioimiseen jos

  • yleisen perusjoukon keskihajonta tunnetaan;
  • tai perusjoukon keskihajontaa ei tiedetä, mutta otoskoko on suurempi kuin 30.

Otoskeskiarvo on puolueeton arvio perusjoukon keskiarvosta. Otosvarianssi puolestaan ei ole puolueeton arvio populaatiovarianssista. Jotta saadaan puolueeton arvio populaatiovarianssista otosvarianssikaavassa, otoskoko on n pitäisi korvata n-1.

Esimerkki 1 Tietyn kaupungin sadasta satunnaisesti valitusta kahvilasta kerätään tiedot, että niissä on keskimäärin 10,5 työntekijää keskihajonnan ollessa 4,6. Määritä 95 %:n luottamusväli kahvilan työntekijöiden lukumäärästä.

missä on standardin normaalijakauman kriittinen arvo merkitsevyystasolle α = 0,05 .

Näin ollen 95 %:n luottamusväli kahvilatyöntekijöiden keskimääräiselle lukumäärälle oli välillä 9,6-11,4.

Esimerkki 2 Satunnaisotokselle 64 havainnon yleisestä populaatiosta laskettiin seuraavat kokonaisarvot:

havaintojen arvojen summa,

arvojen keskiarvosta poikkeamien neliösumma .

Laske odotusarvon 95 %:n luottamusväli.

laske standardipoikkeama:

,

laske keskiarvo:

.

Korvaa lausekkeen arvot luottamusvälille:

missä on standardin normaalijakauman kriittinen arvo merkitsevyystasolle α = 0,05 .

Saamme:

Näin ollen tämän otoksen matemaattisen odotuksen 95 %:n luottamusväli vaihteli välillä 7,484-11,266.

Esimerkki 3 Satunnaisotokselle 100 havainnon yleisestä populaatiosta laskettiin keskiarvo 15,2 ja keskihajonta 3,2. Laske odotusarvon 95 % luottamusväli ja sitten 99 % luottamusväli. Jos otosteho ja sen vaihtelu pysyvät samoina, mutta luottamuskerroin kasvaa, kapeneeko vai leveneekö luottamusväli?

Korvaamme nämä arvot luottamusvälin lausekkeeseen:

missä on standardin normaalijakauman kriittinen arvo merkitsevyystasolle α = 0,05 .

Saamme:

.

Siten tämän otoksen keskiarvon 95 %:n luottamusväli oli 14,57 - 15,82.

Korvaamme jälleen nämä arvot luottamusvälin lausekkeeseen:

missä on standardin normaalijakauman kriittinen arvo merkitsevyystasolle α = 0,01 .

Saamme:

.

Siten tämän otoksen keskiarvon 99 %:n luottamusväli oli 14,37 - 16,02.

Kuten näette, luottamustekijän kasvaessa myös normaalin normaalijakauman kriittinen arvo kasvaa, ja siksi intervallin alku- ja loppupisteet sijaitsevat kauempana keskiarvosta ja siten matemaattisen odotuksen luottamusvälistä. lisääntyy.

Ominaispainon piste- ja intervalliarviot

Otoksen jonkin ominaisuuden osuus voidaan tulkita osuuden pisteestimaattina s sama ominaisuus koko väestössä. Jos tämä arvo on liitettävä todennäköisyyteen, on ominaispainon luottamusväli laskettava s ominaisuus yleisessä populaatiossa todennäköisyydellä P = 1 - α :

.

Esimerkki 4 Tietyssä kaupungissa on kaksi ehdokasta A Ja B ehdolle pormestariksi. Satunnaiskyselyyn osallistui 200 kaupungin asukasta, joista 46 % vastasi äänestävänsä ehdokasta A, 26 % - ehdokkaalle B ja 28 % ei tiedä ketä äänestää. Määritä 95 %:n luottamusväli ehdokasta kannattavien kaupunkilaisten osuudelle A.

Ohje

Huomatkaa että intervalli(l1 tai l2), jonka keskialue on estimaatti l* ja jossa myös parametrin todellinen arvo todennäköisesti sisältyy, on vain luottamus intervalli ohm tai vastaava luottamustason alfa. Tässä tapauksessa l* itse viittaa pisteestimaateihin. Esimerkiksi satunnaisarvon X (x1, x2,..., xn) näytearvojen tulosten perusteella on tarpeen laskea tuntematon indikaattoriparametri l, josta jakautuminen riippuu. Tässä tapauksessa annetun parametrin l* arvion saaminen tarkoittaa, että jokaiselle näytteelle on tarpeen asettaa jokin parametrin arvo vastaavuuteen, eli luoda funktio indikaattorin Q havainnoinnin tuloksista, arvo joka on yhtä suuri kuin parametrin l* arvioitu arvo kaavan muodossa: l*=Q*(x1, x2,..., xn).

Huomaa, että mitä tahansa havainnon tulosten funktiota kutsutaan tilastoksi. Lisäksi, jos se kuvaa täysin tarkasteltavana olevan parametrin (ilmiön), sitä kutsutaan riittäväksi tilastoksi. Ja koska havaintojen tulokset ovat satunnaisia, niin l * on myös satunnaismuuttuja. Tilastojen laskentatehtävä tulisi suorittaa ottaen huomioon sen laatukriteerit. Tässä on huomioitava, että estimaatin jakautumislaki on varsin selvä, todennäköisyystiheyden W(x, l) jakauma.

Voit laskea luottamusta intervalli tarpeeksi helppoa, jos tunnet lain arvostuksen jakautumisesta. Esimerkiksi luottamus intervalli estimaatit suhteessa matemaattiseen odotukseen (satunnaisarvon keskiarvo) mx* =(1/n)*(x1+x2+ …+xn) . Tämä arvio on puolueeton, eli indikaattorin matemaattinen odotus tai keskiarvo on yhtä suuri kuin parametrin todellinen arvo (M(mx*) = mx).

Voit määrittää, että estimaatin varianssi matemaattisen odotuksen mukaan on: bx*^2=Dx/n. Rajakeskilauseen perusteella voidaan tehdä sopiva johtopäätös, että tämän estimaatin jakautumislaki on Gaussin (normaali). Siksi laskelmissa voit käyttää indikaattoria Ф (z) - todennäköisyyksien integraalia. Valitse tässä tapauksessa luottamuksen pituus intervalli ja 2ld, joten saat: alfa \u003d P (mx-ld (käyttäen todennäköisyysintegraalin ominaisuutta kaavan mukaan: Ф (-z) \u003d 1- Ф (z)).

Rakenna luottamusta intervalli matemaattisen odotuksen estimaatit: - etsi kaavan arvo (alfa + 1) / 2; - valitse arvo, joka on yhtä suuri kuin ld / sqrt (Dx / n) todennäköisyysintegraalitaulukosta; - ota arvio todellisesta varianssista: Dx * = (1/n) * ((x1 - mx*)^2+(x2 - mx*)^2+…+(xn - mx*)^2); intervalli kaavan mukaan: (mx*-ld, mx*+ld).

Luottamusväli(CI; englanniksi luottamusväli - CI), joka saatiin tutkimuksessa otoksella, antaa mittauksen tutkimuksen tulosten tarkkuudesta (tai epävarmuudesta), jotta voidaan tehdä johtopäätöksiä kaikkien tällaisten potilaiden populaatiosta (yleinen populaatio). ). 95 % CI:n oikea määritelmä voidaan muotoilla seuraavasti: 95 % tällaisista intervalleista sisältää perusjoukon todellisen arvon. Tämä tulkinta on hieman epätarkempi: CI on arvoalue, jonka sisällä voit olla 95% varma, että se sisältää todellisen arvon. CI:tä käytettäessä painopiste on kvantitatiivisen vaikutuksen määrittämisessä, toisin kuin P-arvossa, joka saadaan tilastollisen merkitsevyyden testauksen tuloksena. P-arvo ei arvioi mitään määrää, vaan toimii pikemminkin todisteen vahvuuden mittana nollahypoteesia "ei vaikutusta" vastaan. P:n arvo ei sinänsä kerro meille mitään eron suuruudesta tai edes sen suunnasta. Siksi P:n itsenäiset arvot ovat ehdottoman informatiivisia artikkeleissa tai tiivistelmissä. Sitä vastoin CI osoittaa sekä välittömän kiinnostavan vaikutuksen määrän, kuten hoidon hyödyllisyyden, että todisteiden vahvuuden. Siksi DI liittyy suoraan DM:n käytäntöön.

CI:n havainnollistaman tilastollisen analyysin pisteytysmenetelmän tarkoituksena on mitata kiinnostavan vaikutuksen suuruutta (diagnostisen testin herkkyys, ennustettu ilmaantuvuus, suhteellinen riskin väheneminen hoidolla jne.) ja mitata tämän vaikutuksen epävarmuutta. Useimmiten CI on arvion kummallakin puolella olevien arvojen alue, jossa todellinen arvo todennäköisesti sijaitsee, ja voit olla 95% varma siitä. Sopimus käyttää 95 %:n todennäköisyyttä on mielivaltainen, samoin kuin P:n arvo<0,05 для оценки статистической значимости, и авторы иногда используют 90% или 99% ДИ. Заметим, что слово «интервал» означает диапазон величин и поэтому стоит в единственном числе. Две величины, которые ограничивают интервал, называются «доверительными пределами».

CI perustuu ajatukseen, että sama tutkimus eri potilasryhmille ei tuottaisi identtisiä tuloksia, vaan että niiden tulokset jakautuisivat todellisen mutta tuntemattoman arvon ympärille. Toisin sanoen CI kuvaa tätä "näytteestä riippuvaiseksi vaihteluksi". CI ei heijasta muista syistä johtuvaa lisäepävarmuutta; etenkään se ei sisällä potilaiden valikoivan menetyksen vaikutusta seurantaan, huonoa hoitomyöntyvyyttä tai epätarkkoja tulosmittauksia, sokeuttamisen puutetta jne. Näin ollen CI aliarvioi aina epävarmuuden kokonaismäärän.

Luottamusvälin laskenta

Taulukko A1.1. Joidenkin kliinisten mittausten standardivirheet ja luottamusvälit

Tyypillisesti CI lasketaan kvantitatiivisen mittarin havaitusta estimaatista, kuten kahden osuuden välisestä erosta (d) ja tämän eron estimaatin keskivirheestä (SE). Näin saatu likimääräinen 95 % CI on d ± 1,96 SE. Kaava muuttuu tulosmitan luonteen ja CI:n kattavuuden mukaan. Esimerkiksi satunnaistetussa, lumekontrolloidussa soluttoman hinkuyskärokotteen tutkimuksessa hinkuyskä kehittyi 72:lle 1670:stä (4,3 %) rokotteen saaneesta lapsesta ja 240:lle 1665:stä (14,4 %) kontrolliryhmästä. Prosentuaalinen ero, joka tunnetaan nimellä absoluuttinen riskin vähennys, on 10,1 %. Tämän eron SE on 0,99 %. Vastaavasti 95 % CI on 10,1 % + 1,96 x 0,99 %, so. 8.2 - 12.0.

Erilaisista filosofisista lähestymistavoista huolimatta CI:t ja tilastollisen merkitsevyyden testit liittyvät matemaattisesti läheisesti toisiinsa.

Siten P:n arvo on ”merkittävä”, ts. R<0,05 соответствует 95% ДИ, который исключает величину эффекта, указывающую на отсутствие различия. Например, для различия между двумя средними пропорциями это ноль, а для относительного риска или отношения шансов - единица. При некоторых обстоятельствах эти два подхода могут быть не совсем эквивалентны. Преобладающая точка зрения: оценка с помощью ДИ - предпочтительный подход к суммированию результатов исследования, но ДИ и величина Р взаимодополняющи, и во многих статьях используются оба способа представления результатов.

Arvioinnin epävarmuus (epätarkkuus) CI:nä ilmaistuna liittyy suurelta osin otoskoon neliöjuureen. Pienet näytteet tarjoavat vähemmän tietoa kuin suuret näytteet, ja CI:t ovat vastaavasti leveämpiä pienemmissä näytteissä. Esimerkiksi artikkelissa, jossa verrattiin kolmen Helicobacter pylori -infektion diagnosointiin käytetyn testin suorituskykyä, ureahengitystestin herkkyys oli 95,8 % (95 % CI 75-100). Vaikka luku 95,8 % näyttää vaikuttavalta, 24 aikuisen H. pylori -potilaan pieni otoskoko tarkoittaa, että tässä arviossa on merkittävää epävarmuutta, kuten laaja CI osoittaa. Itse asiassa 75 prosentin alaraja on paljon alhaisempi kuin 95,8 prosentin arvio. Jos sama herkkyys havaittaisiin 240 ihmisen otoksessa, 95 %:n luottamusväli olisi 92,5–98,0, mikä antaisi paremman varmuuden siitä, että testi on erittäin herkkä.

Satunnaistetuissa kontrolloiduissa tutkimuksissa (RCT:t) ei-merkittävät tulokset (eli tulokset, joiden P > 0,05) ovat erityisen alttiita väärintulkinnoille. CI on erityisen hyödyllinen tässä, koska se osoittaa, kuinka yhteensopivia tulokset ovat kliinisesti käyttökelpoisen todellisen vaikutuksen kanssa. Esimerkiksi RCT-tutkimuksessa, jossa verrattiin ompeleita paksusuolen anastomoosiin, haavainfektio kehittyi 10,9 %:lle ja 13,5 %:lle potilaista (P = 0,30). Tämän eron 95 % luottamusväli on 2,6 % (-2 - +8). Jopa tässä tutkimuksessa, johon osallistui 652 potilasta, on edelleen todennäköistä, että näiden kahden toimenpiteen aiheuttamien infektioiden ilmaantuvuus vaihtelee. Mitä pienempi tutkimus, sitä suurempi epävarmuus. Sung et ai. suoritti RCT-tutkimuksen, jossa verrattiin oktreotidi-infuusiota hätäskleroterapiaan akuutin suonikohjuverenvuodon vuoksi 100 potilaalla. Oktreotidiryhmässä verenvuodon pysäytysprosentti oli 84 %; skleroterapiaryhmässä - 90%, mikä antaa P = 0,56. Huomaa, että jatkuvan verenvuodon määrä on samanlainen kuin haavainfektion yhteydessä mainitussa tutkimuksessa. Tässä tapauksessa interventioiden eron 95 % CI on kuitenkin 6 % (-7 - +19). Tämä vaihteluväli on melko laaja verrattuna 5 %:n eroon, joka olisi kliinisesti kiinnostava. On selvää, että tutkimus ei sulje pois merkittävää eroa tehokkuudessa. Siksi tekijöiden johtopäätös "oktreotidin infuusio ja skleroterapia ovat yhtä tehokkaita suonikohjujen aiheuttaman verenvuodon hoidossa" ei todellakaan pidä paikkaansa. Tällaisissa tapauksissa, joissa absoluuttisen riskin vähentämisen (ARR) 95 % CI sisältää nollan, kuten tässä, NNT:n CI:tä (hoitoon tarvittava luku) on melko vaikea tulkita. NLP ja sen CI saadaan ACP:n käänteisluvuista (kerrotaan ne 100:lla, jos nämä arvot annetaan prosentteina). Tässä saadaan NPP = 100: 6 = 16,6 95 %:n luottamusvälillä -14,3 - 5,3. Kuten taulukon alaviitteestä "d" voidaan nähdä. A1.1, tämä CI sisältää arvot NTPP:lle 5,3:sta äärettömään ja NTLP:lle arvot 14,3:sta äärettömään.

CI:t voidaan muodostaa yleisimmin käytettyjä tilastollisia arvioita tai vertailuja varten. RCT:n osalta se sisältää eron keskimääräisten suhteiden, suhteellisten riskien, todennäköisyyssuhteiden ja NRR:n välillä. Vastaavasti CI:t voidaan saada kaikille tärkeimmille arvioille, jotka on tehty diagnostisten testien tarkkuutta koskevissa tutkimuksissa - herkkyys, spesifisyys, positiivinen ennustearvo (jotka kaikki ovat yksinkertaisia ​​​​suhteita) ja todennäköisyyssuhteet - arvioita, jotka on saatu meta-analyyseissä ja vertailussa kontrolliin. opinnot. Henkilökohtainen tietokoneohjelma, joka kattaa monet näistä DI:n käyttötavoista, on saatavilla Statistics with Confidence -julkaisun toisen painoksen mukana. Makrot suhteiden CI:n laskemiseen ovat vapaasti saatavilla Excelissä sekä tilasto-ohjelmissa SPSS ja Minitab osoitteessa http://www.uwcm.ac.uk/study/medicine/epidemiology_statistics/research/statistics/proportions, htm.

Useita arvioita hoidon vaikutuksesta

Vaikka CI:n rakentaminen on toivottavaa tutkimuksen ensisijaisten tulosten kannalta, niitä ei vaadita kaikille tuloksille. CI koskee kliinisesti tärkeitä vertailuja. Esimerkiksi kahta ryhmää verrattaessa oikea CI on se, joka rakennetaan ryhmien väliselle erolle, kuten yllä olevissa esimerkeissä näkyy, eikä se CI, joka voidaan rakentaa kunkin ryhmän estimaatia varten. Sen lisäksi, että ei ole hyödytöntä antaa erillisiä CI-pisteitä kunkin ryhmän pisteille, tämä esitys voi olla harhaanjohtava. Vastaavasti oikea lähestymistapa verrattaessa hoidon tehokkuutta eri alaryhmissä on verrata kahta (tai useampaa) alaryhmää suoraan. On väärin olettaa, että hoito on tehokas vain yhdessä alaryhmässä, jos sen CI sulkee pois arvon, joka vastaa ei vaikutusta, kun taas toiset eivät. CI:t ovat hyödyllisiä myös verrattaessa tuloksia useiden alaryhmien välillä. Kuvassa A1.1 osoittaa eklampsian suhteellisen riskin naisilla, joilla on preeklampsia naisten alaryhmissä lumekontrolloidusta magnesiumsulfaatin RCT:stä.

Riisi. A1.2. Forest Graph näyttää tulokset 11 satunnaistetusta kliinisestä tutkimuksesta naudan rotavirusrokotteesta ripulin ehkäisyssä verrattuna lumelääkkeeseen. Ripulin suhteellisen riskin arvioimiseen käytettiin 95 %:n luottamusväliä. Mustan neliön koko on verrannollinen tiedon määrään. Lisäksi näytetään yhteenvetoarvio hoidon tehokkuudesta ja 95 %:n luottamusväli (merkitty vinoneliöllä). Meta-analyysissä käytettiin satunnaisten vaikutusten mallia, joka ylittää jotkin ennalta laaditut mallit; se voi esimerkiksi olla otoskoon laskennassa käytetty koko. Tiukemmat kriteerit edellyttäisivät, että kaikki luottolaitokset osoittaisivat etua, joka ylittää ennalta määrätyn vähimmäistason.

Olemme jo keskustelleet virheestä, jonka mukaan tilastollisen merkitsevyyden puuttuminen osoitti, että kaksi hoitoa ovat yhtä tehokkaita. Yhtä tärkeää on olla rinnastamatta tilastollista merkitsevyyttä kliiniseen merkitykseen. Kliininen merkitys voidaan olettaa, kun tulos on tilastollisesti merkitsevä ja hoitovasteen suuruus

Tutkimukset voivat osoittaa, ovatko tulokset tilastollisesti merkittäviä ja mitkä ovat kliinisesti tärkeitä ja mitkä eivät. Kuvassa A1.2 näyttää tulokset neljästä kokeesta, joiden koko CI<1, т.е. их результаты статистически значимы при Р <0,05 , . После высказанного предположения о том, что клинически важным различием было бы сокращение риска диареи на 20% (ОР = 0,8), все эти испытания показали клинически значимую оценку сокращения риска, и лишь в исследовании Treanor весь 95% ДИ меньше этой величины. Два других РКИ показали клинически важные результаты, которые не были статистически значимыми. Обратите внимание, что в трёх испытаниях точечные оценки эффективности лечения были почти идентичны, но ширина ДИ различалась (отражает размер выборки). Таким образом, по отдельности доказательная сила этих РКИ различна.

Oletetaan, että meillä on suuri määrä tavaroita joidenkin ominaisuuksien normaalijakaumassa (esimerkiksi täysi varasto samantyyppisiä vihanneksia, joiden koko ja paino vaihtelee). Haluat tietää koko tavaraerän keskimääräiset ominaisuudet, mutta sinulla ei ole aikaa eikä halua mitata ja punnita jokaista vihannesta. Ymmärrät, että tämä ei ole välttämätöntä. Mutta kuinka monta kappaletta sinun pitäisi ottaa satunnaiseen tarkastukseen?

Ennen kuin annamme joitain tähän tilanteeseen hyödyllisiä kaavoja, muistamme joitakin merkintöjä.

Ensinnäkin, jos mittaamme koko vihannesvaraston (tätä elementtijoukkoa kutsutaan yleiseksi populaatioksi), tietäisimme kaikella käytettävissä olevalla tarkkuudella koko erän painon keskiarvon. Kutsutaan tätä keskiarvoksi X vrt .g fi . - yleinen keskiarvo. Tiedämme jo, mikä on täysin määritetty, jos sen keskiarvo ja poikkeama s tunnetaan . Totta, toistaiseksi emme ole X keskim. emmekä s emme tunne yleistä väestöä. Voimme vain ottaa näytteen, mitata tarvitsemamme arvot ja laskea tälle näytteelle sekä näytteen keskiarvon X sr. että keskihajonnan S sb.

Tiedetään, että jos mukautettu tarkistusmme sisältää suuren määrän elementtejä (yleensä n on suurempi kuin 30), ja ne otetaan todella satunnainen, sitten s yleinen väestö ei juuri eroa S ..

Lisäksi normaalijakauman tapauksessa voimme käyttää seuraavia kaavoja:

95 % todennäköisyydellä


99% todennäköisyydellä



Yleensä todennäköisyydellä Р (t)


Suhde t:n arvon ja todennäköisyyden P (t) arvon välillä, jolla haluamme tietää luottamusvälin, voidaan ottaa seuraavasta taulukosta:


Näin ollen olemme määrittäneet, millä alueella yleisen populaation keskiarvo on (tietyllä todennäköisyydellä).

Ellei meillä ole riittävän suurta otosta, emme voi väittää, että populaatiolla on s = S sel. Lisäksi tässä tapauksessa näytteen läheisyys normaalijakaumaan on ongelmallista. Käytä tässä tapauksessa myös S sb:tä s kaavassa:




mutta t:n arvo kiinteälle todennäköisyydelle P(t) riippuu alkioiden lukumäärästä näytteessä n. Mitä suurempi n, sitä lähempänä tuloksena oleva luottamusväli on kaavan (1) antamaa arvoa. Tässä tapauksessa t-arvot on otettu toisesta taulukosta (opiskelijan t-testi), jonka tarjoamme alla:

Studentin t-testin arvot todennäköisyyksille 0,95 ja 0,99


Esimerkki 3 Yrityksen työntekijöiden joukosta valittiin satunnaisesti 30 henkilöä. Otoksen mukaan kävi ilmi, että keskipalkka (kuukaudessa) on 30 tuhatta ruplaa ja keskimääräinen neliöpoikkeama 5 tuhatta ruplaa. Määritä yrityksen keskipalkka todennäköisyydellä 0,99.

Ratkaisu: Ehdolla meillä on n = 30, X vrt. = 30 000, S = 5 000, P = 0,99. Luottamusvälin löytämiseksi käytämme Studentin kriteeriä vastaavaa kaavaa. Taulukon mukaan n \u003d 30 ja P \u003d 0,99 löydämme t \u003d 2,756, joten


nuo. haluttu luottamus väli 27484< Х ср.ген < 32516.

Joten todennäköisyydellä 0,99 voidaan väittää, että väli (27484; 32516) sisältää yrityksen keskipalkan.

Toivomme, että käytät tätä menetelmää ilman, että sinulla on aina laskentataulukko mukanasi. Laskut voidaan suorittaa automaattisesti Excelissä. Kun olet Excel-tiedostossa, napsauta ylävalikon fx-painiketta. Valitse sitten toiminnoista tyyppi "tilastollinen" ja ruudussa olevasta ehdotetusta luettelosta - STEUDRASP. Aseta sitten kohdistin "todennäköisyys"-kenttään kehotteeseen ja kirjoita vastavuoroisen todennäköisyyden arvo (eli meidän tapauksessamme todennäköisyyden 0,95 sijaan sinun on kirjoitettava todennäköisyys 0,05). Ilmeisesti laskentataulukko on suunniteltu niin, että tulos vastaa kysymykseen, kuinka todennäköisesti voimme olla väärässä. Syötä vastaavasti "vapausaste"-kenttään näytteesi arvo (n-1).

Mieli ei ole vain tiedossa, vaan myös kyvyssä soveltaa tietoa käytännössä. (Aristoteles)

Luottamusvälit

yleinen arvostelu

Ottamalla otoksen perusjoukosta saamme pisteestimaatin meitä kiinnostavasta parametrista ja laskemme keskivirheen estimaatin tarkkuuden osoittamiseksi.

Useimmissa tapauksissa standardivirhe sinänsä ei kuitenkaan ole hyväksyttävää. On paljon hyödyllisempää yhdistää tämä tarkkuusmitta populaatioparametrin intervalliarvioon.

Tämä voidaan tehdä käyttämällä tietoa otostilaston (parametrin) teoreettisesta todennäköisyysjakaumasta, jotta parametrille voidaan laskea luottamusväli (CI - luottamusväli, CI - luottamusväli).

Yleensä luottamusväli laajentaa arvioita molempiin suuntiin jollain (tietyn parametrin) standardivirheen kerrannaisuudella; kaksi arvoa (luottamusrajat), jotka määrittävät intervallin, erotetaan yleensä pilkulla ja suluissa.

Keskiarvon luottamusväli

Normaalijakaumaa käyttämällä

Otoskeskiarvolla on normaalijakauma, jos otoskoko on suuri, joten tietoa normaalijakaumasta voidaan soveltaa otoskeskiarvoa tarkasteltaessa.

Erityisesti 95 % otoskeskiarvojen jakautumisesta on 1,96 keskihajonnan (SD) sisällä populaation keskiarvosta.

Kun meillä on vain yksi näyte, kutsumme tätä keskiarvon standardivirheeksi (SEM) ja laskemme keskiarvon 95 %:n luottamusvälin seuraavasti:

Jos tämä koe toistetaan useita kertoja, väli sisältää todellisen populaation keskiarvon 95 % ajasta.

Tämä on yleensä luottamusväli, kuten arvoalue, jonka sisällä todellinen väestökeskiarvo (yleinen keskiarvo) on 95 %:n luottamustasolla.

Vaikka ei ole aivan tiukkaa (populaatiokeskiarvo on kiinteä arvo, eikä sillä siksi voi olla siihen liittyvää todennäköisyyttä) tulkita luottamusväliä tällä tavalla, on se käsitteellisesti helpompi ymmärtää.

Käyttö t- jakelu

Voit käyttää normaalijakaumaa, jos tiedät populaation varianssin arvon. Myös, kun otoskoko on pieni, otoksen keskiarvo noudattaa normaalijakaumaa, jos populaation taustalla olevat tiedot ovat normaalijakaumia.

Jos populaation taustalla olevat tiedot eivät ole normaalijakautuneita ja/tai yleisvarianssia (populaatiovarianssia) ei tunneta, otoksen keskiarvo noudattaa Opiskelijan t-jakauma.

Laske populaation keskiarvon 95 %:n luottamusväli seuraavasti:

Missä - prosenttiyksikkö (prosenttipiste) t- Opiskelijajakauma (n-1) vapausasteilla, mikä antaa kaksisuuntaiseksi todennäköisyydeksi 0,05.

Yleensä se tarjoaa laajemman intervallin kuin normaalijakaumaa käytettäessä, koska se ottaa huomioon populaation keskihajonnan estimoimisen ja/tai pienestä otoskoon aiheuttaman lisäepävarmuuden.

Kun otoskoko on suuri (luokkaa 100 tai enemmän), näiden kahden jakauman välinen ero ( t-opiskelija ja normaali) on mitätön. Käytä kuitenkin aina t- jakauma luottamusväliä laskettaessa, vaikka otoskoko olisi suuri.

Yleensä ilmoitetaan 95 % CI. Muita luottamusväliä voidaan laskea, kuten 99 % CI keskiarvolle.

Vakiovirheen ja taulukon arvon tulon sijaan t- jakauma, joka vastaa kaksisuuntaista todennäköisyyttä 0,05, kerro se (keskivirhe) arvolla, joka vastaa kaksisuuntaista todennäköisyyttä 0,01. Tämä on laajempi luottamusväli kuin 95 %:n tapaus, koska se heijastaa lisääntynyttä luottamusta siihen, että väli todellakin sisältää perusjoukon keskiarvon.

Suhteen luottamusväli

Suhteiden otantajakaumalla on binomijakauma. Kuitenkin, jos otoskoko n kohtuullisen suuri, silloin otosjakauma on suunnilleen normaali keskiarvon kanssa.

Arvio otossuhteella p=r/n(Missä r- otokseen kuuluvien henkilöiden lukumäärä, joilla on meitä kiinnostavat ominaisuudet), ja keskivirhe on arvioitu:

Osuuden 95 %:n luottamusväli on arvioitu:

Jos otoskoko on pieni (yleensä kun np tai n(1-p) Vähemmän 5 ), silloin on käytettävä binomijakaumaa tarkan luottamusvälin laskemiseksi.

Huomaa, että jos s prosentteina ilmaistuna (1-p) korvattu (100p).

Luottamusvälien tulkinta

Luottamusväliä tulkittaessa olemme kiinnostuneita seuraavista kysymyksistä:

Kuinka leveä luottamusväli on?

Leveä luottamusväli osoittaa, että arvio on epätarkka; kapea osoittaa hienoa arviota.

Luottamusvälin leveys riippuu keskivirheen koosta, joka puolestaan ​​riippuu otoskoosta ja, kun otetaan huomioon numeerinen muuttuja tietojen vaihtelusta, antaa laajemmat luottamusvälit kuin suuren tietojoukon tutkimukset. muutamasta muuttujasta.

Sisältääkö CI mitään erityisen kiinnostavia arvoja?

Voit tarkistaa, onko populaatioparametrin todennäköinen arvo luottamusvälin sisällä. Jos kyllä, tulokset ovat tämän todennäköisen arvon mukaisia. Jos ei, niin on epätodennäköistä (95 %:n luottamusvälillä todennäköisyys on lähes 5 %), että parametrilla on tämä arvo.