Interval spoľahlivosti pre odhad priemeru (rozptyl je známy) v MS EXCEL. Metódy kvantitatívnej analýzy: Odhad intervalov spoľahlivosti

"Katren-Style" pokračuje vo vydávaní série Konstantina Kravchika o lekárskej štatistike. V dvoch predchádzajúcich článkoch sa autor zaoberal vysvetlením pojmov ako a.

Konštantín Kravčík

Matematik-analytik. Špecialista na štatistický výskum v medicíne a humanitných vedách

Mesto Moskva

Veľmi často v článkoch o klinických štúdiách nájdete záhadnú frázu: „interval spoľahlivosti“ (95 % CI alebo 95 % CI - interval spoľahlivosti). V článku môže byť napríklad napísané: „Na posúdenie významnosti rozdielov sa na výpočet 95 % intervalu spoľahlivosti použil Studentov t-test.“

Aká je hodnota „95 % intervalu spoľahlivosti“ a prečo ho počítať?

Čo je interval spoľahlivosti? - Toto je rozsah, v ktorom ležia skutočné prostriedky populácie. Existujú „nepravdivé“ priemery? V istom zmysle áno, robia. Vysvetlili sme, že nie je možné merať parameter záujmu v celej populácii, takže výskumníci sa uspokoja s obmedzenou vzorkou. V tejto vzorke (napríklad na základe telesnej hmotnosti) existuje jedna priemerná hodnota (určitá hmotnosť), podľa ktorej posudzujeme priemernú hodnotu v celej populácii. Je však nepravdepodobné, že by sa priemerná hmotnosť vo vzorke (najmä malej) zhodovala s priemernou hmotnosťou vo všeobecnej populácii. Preto je správnejšie vypočítať a použiť rozsah priemerných hodnôt populácie.

Predstavte si napríklad, že 95 % interval spoľahlivosti (95 % CI) pre hemoglobín je 110 až 122 g/l. To znamená, že existuje 95% šanca, že skutočná stredná hodnota hemoglobínu v populácii bude medzi 110 a 122 g/l. Inými slovami, nepoznáme priemernú hodnotu hemoglobínu v populácii, ale môžeme s 95 % pravdepodobnosťou uviesť rozsah hodnôt pre túto vlastnosť.

Intervaly spoľahlivosti sú obzvlášť dôležité pre rozdiely v priemeroch medzi skupinami alebo veľkosti účinku, ako sa nazývajú.

Povedzme, že sme porovnali účinnosť dvoch prípravkov železa: jedného, ktorý je na trhu už dlho, a jedného, ktorý je práve zaregistrovaný. Po ukončení terapie sme hodnotili koncentráciu hemoglobínu v skúmaných skupinách pacientov a štatistický program vypočítal, že rozdiel medzi priemernými hodnotami oboch skupín bol s 95 % pravdepodobnosťou v rozmedzí od 1,72 do 14,36 g/l (tabuľka 1).

Tabuľka 1. Test na nezávislé vzorky
(skupiny sa porovnávajú podľa hladiny hemoglobínu)

Treba to interpretovať nasledovne: u niektorých pacientov v bežnej populácii, ktorí užívajú nový liek, bude hemoglobín vyšší v priemere o 1,72–14,36 g/l ako u tých, ktorí užili už známy liek.

Inými slovami, vo všeobecnej populácii je rozdiel v priemerných hodnotách hemoglobínu medzi skupinami v rámci týchto limitov s pravdepodobnosťou 95 %. Či je to veľa alebo málo, posúdi výskumník. Pointou toho všetkého je, že nepracujeme s jednou priemernou hodnotou, ale s rozsahom hodnôt, preto spoľahlivejšie odhadneme rozdiel v parametri medzi skupinami.

V štatistických balíkoch môžete podľa uváženia výskumníka nezávisle zúžiť alebo rozšíriť hranice intervalu spoľahlivosti. Znížením pravdepodobností intervalu spoľahlivosti zužujeme rozsah priemerov. Napríklad pri 90 % CI bude rozsah priemerov (alebo rozdiel v priemeroch) užší ako pri 95°%.

Naopak, zvýšenie pravdepodobnosti na 99 % rozširuje rozsah hodnôt. Pri porovnávaní skupín môže spodná hranica CI prekročiť nulovú značku. Ak sme napríklad rozšírili hranice intervalu spoľahlivosti na 99 %, potom sa hranice intervalu pohybovali od –1 do 16 g/l. To znamená, že vo všeobecnej populácii existujú skupiny, medzi ktorými je rozdiel v priemeroch pre skúmanú charakteristiku rovný 0 (M = 0).

Pomocou intervalu spoľahlivosti môžete testovať štatistické hypotézy. Ak interval spoľahlivosti prekročí nulovú hodnotu, potom je pravdivá nulová hypotéza, ktorá predpokladá, že skupiny sa nelíšia v skúmanom parametri. Príklad je opísaný vyššie, kde sme rozšírili hranice na 99 %. Niekde v bežnej populácii sme našli skupiny, ktoré sa nijako nelíšili.

95 % interval spoľahlivosti rozdielu hemoglobínu, (g/l)

Obrázok ukazuje 95% interval spoľahlivosti pre rozdiel v stredných hodnotách hemoglobínu medzi týmito dvoma skupinami. Čiara prechádza cez nulovú značku, preto je medzi priemermi nuly rozdiel, čo potvrdzuje nulovú hypotézu, že skupiny sa nelíšia. Rozdiel medzi skupinami je od –2 do 5 g/l, čo znamená, že hemoglobín sa môže znížiť o 2 g/l alebo zvýšiť o 5 g/l.

Interval spoľahlivosti je veľmi dôležitým ukazovateľom. Vďaka nej môžete vidieť, či rozdiely v skupinách boli skutočne spôsobené rozdielom v priemeroch alebo veľkou vzorkou, keďže pri veľkej vzorke je šanca nájsť rozdiely väčšia ako pri malej.

V praxi to môže vyzerať takto. Odobrali sme vzorku 1000 ľudí, zmerali sme hladiny hemoglobínu a zistili sme, že interval spoľahlivosti pre rozdiel v priemeroch sa pohyboval od 1,2 do 1,5 g/l. Hladina štatistickej významnosti v tomto prípade p

Vidíme, že koncentrácia hemoglobínu sa zvýšila, ale takmer nebadateľne, preto sa štatistická významnosť objavila práve kvôli veľkosti vzorky.

Intervaly spoľahlivosti možno vypočítať nielen pre priemer, ale aj pre proporcie (a pomery rizika). Zaujíma nás napríklad interval spoľahlivosti podielov pacientov, ktorí dosiahli remisiu pri užívaní vyvinutého lieku. Predpokladajme, že 95 % CI pre proporcie, t.j. pre podiel takýchto pacientov, leží v rozmedzí 0,60–0,80. Dá sa teda povedať, že náš liek má terapeutický účinok v 60 až 80 % prípadov.

Interval spoľahlivosti

Interval spoľahlivosti- termín používaný v matematickej štatistike pre intervalový (na rozdiel od bodového) odhad štatistických parametrov, ktorý sa uprednostňuje, keď je veľkosť vzorky malá. Interval spoľahlivosti je interval, ktorý pokrýva neznámy parameter s danou spoľahlivosťou.

Metódu intervalov spoľahlivosti vyvinul americký štatistik Jerzy Neumann na základe myšlienok anglického štatistika Ronalda Fishera.

Definícia

Interval spoľahlivosti parametra θ rozdelenie náhodných premenných X s úrovňou spoľahlivosti 100 p%, generované vzorkou ( X 1 ,…,X n), sa nazýva interval s hranicami ( X 1 ,…,X n) a ( X 1 ,…,X n), čo sú realizácie náhodných premenných L(X 1 ,…,X n) a U(X 1 ,…,X n), také, že

Hraničné body intervalu spoľahlivosti sa nazývajú hranice spoľahlivosti.

Interpretácia intervalu spoľahlivosti založená na intuícii by bola: ak p je veľký (povedzme 0,95 alebo 0,99), potom interval spoľahlivosti takmer určite obsahuje skutočnú hodnotu θ .

Ďalší výklad pojmu interval spoľahlivosti: možno ho považovať za interval hodnôt parametrov θ kompatibilné s experimentálnymi údajmi a nie sú v rozpore s nimi.

Príklady

Interval spoľahlivosti pre matematické očakávanie normálnej vzorky;
Interval spoľahlivosti pre normálny rozptyl vzorky.

Bayesovský interval spoľahlivosti

V Bayesovskej štatistike existuje podobná, ale odlišná definícia intervalu spoľahlivosti v niektorých kľúčových detailoch. Tu sa samotný odhadovaný parameter považuje za náhodnú premennú s určitým daným predchádzajúcim rozdelením (v najjednoduchšom prípade rovnomerným) a vzorka je pevná (v klasickej štatistike je všetko presne naopak). Bayesovský interval spoľahlivosti je interval pokrývajúci hodnotu parametra so zadnou pravdepodobnosťou:

Vo všeobecnosti sú klasické a Bayesovské intervaly spoľahlivosti odlišné. V anglickojazyčnej literatúre sa Bayesovský interval spoľahlivosti zvyčajne nazýva termínom dôveryhodný interval a ten klasický - interval spoľahlivosti.

Poznámky

Zdroje

Nadácia Wikimedia. 2010.

deti (film)
Kolonista

Pozrite si, čo je „Interval spoľahlivosti“ v iných slovníkoch:

Interval spoľahlivosti- interval vypočítaný z údajov vzorky, ktorý s danou pravdepodobnosťou (spoľahlivosťou) pokrýva neznámu skutočnú hodnotu odhadovaného distribučného parametra. Zdroj: GOST 20522 96: Pôdy. Metódy štatistického spracovania výsledkov... Slovník-príručka termínov normatívnej a technickej dokumentácie

interval spoľahlivosti- pre skalárny parameter populácie je to segment, ktorý s najväčšou pravdepodobnosťou obsahuje tento parameter. Táto fráza je bez ďalšieho upresnenia bezvýznamná. Keďže hranice intervalu spoľahlivosti sú odhadované zo vzorky, je prirodzené... ... Slovník sociologickej štatistiky

INTERVAL SPOĽAHLIVOSTI- metóda odhadu parametrov, ktorá sa líši od bodového odhadu. Nechajte vzorku x1, . . ., xn z distribúcie s hustotou pravdepodobnosti f(x, α) a a*=a*(x1, . . ., xn) odhadujú α, g(a*, α) odhad hustoty pravdepodobnosti. Hľadáte…… Geologická encyklopédia

INTERVAL SPOĽAHLIVOSTI- (interval spoľahlivosti) Interval, v ktorom má spoľahlivosť hodnoty parametra pre populáciu získanú na základe výberového zisťovania určitú mieru pravdepodobnosti, napríklad 95 %, čo je spôsobené samotnou vzorkou. Šírka…… Ekonomický slovník

interval spoľahlivosti- je interval, v ktorom sa nachádza skutočná hodnota určovanej veličiny s danou pravdepodobnosťou spoľahlivosti. Všeobecná chémia: učebnica / A. V. Žolnin ... Chemické termíny

Interval spoľahlivosti CI- Interval spoľahlivosti, CI * interval údajov, CI * interval intervalu spoľahlivosti charakteristickej hodnoty, vypočítaný pre k.l. distribučný parameter (napríklad priemerná hodnota charakteristiky) vo vzorke as určitou pravdepodobnosťou (napríklad 95% pre 95% ... genetika. encyklopedický slovník

INTERVAL SPOĽAHLIVOSTI- pojem, ktorý vzniká pri odhade štatistického parametra. rozdelenie podľa intervalu hodnôt. D. a. pre parameter q, zodpovedajúci tomuto koeficientu. dôvera P sa rovná takému intervalu (q1, q2), že pre akékoľvek rozdelenie pravdepodobnosti nerovnosti... ... Fyzická encyklopédia

interval spoľahlivosti- - Telekomunikačné témy, základné pojmy EN interval spoľahlivosti ... Technická príručka prekladateľa

interval spoľahlivosti- pasikliovimo intervalas statusas T sritis Standartizacija ir metrologija apibrėžtis Dydžio verčių intervalas, kuriame su pasirinktąja tikimybe yra matavimo rezultato vertė. atitikmenys: angl. interval spoľahlivosti vok. Vertrauensbereich, m rus.… … Penkiakalbis aiškinamasis metrologijos terminų žodynas

interval spoľahlivosti- pasikliovimo intervalas statusas T sritis chemija apibrėžtis Dydžio verčių intervalas, kuriame su pasirinktąja tikimybe yra matavimo rezultatų vertė. atitikmenys: angl. interval spoľahlivosti rus. oblasť dôvery; interval spoľahlivosti... Chemijos terminų aiškinamasis žodynas

Predpokladajme, že máme veľké množstvo položiek s normálnym rozložením niektorých charakteristík (napríklad plný sklad zeleniny rovnakého druhu, ktorej veľkosť a hmotnosť sa líšia). Chcete vedieť priemerné vlastnosti celej šarže tovaru, ale nemáte čas ani chuť každú zeleninu merať a vážiť. Chápete, že to nie je potrebné. Koľko kusov by však bolo potrebné vziať na náhodnú kontrolu?

Predtým, ako uvedieme niekoľko vzorcov užitočných pre túto situáciu, pripomeňme si niekoľko zápisov.

Po prvé, ak by sme zmerali celý sklad zeleniny (tento súbor prvkov sa nazýva všeobecná populácia), potom by sme so všetkou presnosťou, ktorú máme k dispozícii, poznali priemernú hmotnosť celej dávky. Nazvime to priemer X priem .g en . - všeobecný priemer. Už vieme, čo je úplne určené, ak je známa jeho stredná hodnota a odchýlka s . Pravda, zatiaľ nie sme ani X priemerný rod, ani s Nepoznáme bežnú populáciu. Môžeme odobrať iba určitú vzorku, zmerať hodnoty, ktoré potrebujeme, a vypočítať pre túto vzorku priemernú hodnotu X avg. aj smerodajnú odchýlku S select.

Je známe, že ak naša vzorová kontrola obsahuje veľký počet prvkov (zvyčajne n je väčšie ako 30), tak sa berú naozaj náhodné, potom s všeobecná populácia sa sotva bude líšiť od výberu S ..

Okrem toho v prípade normálneho rozdelenia môžeme použiť nasledujúce vzorce:

S pravdepodobnosťou 95%

S pravdepodobnosťou 99%

Vo všeobecnosti s pravdepodobnosťou P (t)

Vzťah medzi hodnotou t a hodnotou pravdepodobnosti P (t), s ktorou chceme poznať interval spoľahlivosti, môžeme získať z nasledujúcej tabuľky:

Takto sme určili, v akom rozsahu leží priemerná hodnota pre populáciu (s danou pravdepodobnosťou).

Pokiaľ nemáme dostatočne veľkú vzorku, nemôžeme povedať, že populácia má s = S vyberte Okrem toho je v tomto prípade problematická blízkosť vzorky k normálnemu rozdeleniu. V tomto prípade namiesto toho použijeme aj S select s vo vzorci:

ale hodnota t pre pevnú pravdepodobnosť P(t) bude závisieť od počtu prvkov vo vzorke n. Čím väčšie n, tým bližšie bude výsledný interval spoľahlivosti k hodnote danej vzorcom (1). Hodnoty t sú v tomto prípade prevzaté z inej tabuľky (Studentov t-test), ktorú uvádzame nižšie:

Hodnoty študentského t-testu pre pravdepodobnosť 0,95 a 0,99

Príklad 3 Zo zamestnancov spoločnosti bolo náhodne vybraných 30 ľudí. Podľa vzorky sa ukázalo, že priemerná mzda (za mesiac) je 30 000 rubľov so štandardnou odchýlkou 5 000 rubľov. Určte priemernú mzdu vo firme s pravdepodobnosťou 0,99.

Riešenie: Podľa podmienky máme n = 30, X priem. = 30 000, S = 5 000, P = 0,99. Na zistenie intervalu spoľahlivosti použijeme vzorec zodpovedajúci Studentovmu t testu. Z tabuľky pre n = 30 a P = 0,99 zistíme, že t = 2,756, teda

tie. vyhľadávaný správca interval 27484< Х ср.ген < 32516.

S pravdepodobnosťou 0,99 teda môžeme povedať, že interval (27484; 32516) obsahuje v sebe priemernú mzdu vo firme.

Dúfame, že túto metódu využijete a nie je nutné, aby ste mali stôl zakaždým pri sebe. Výpočty je možné vykonávať automaticky v Exceli. V súbore Excel kliknite na tlačidlo fx v hornom menu. Potom vyberte medzi funkciami typ „štatistický“ az navrhovaného zoznamu v okne – STUDAR DISCOVER. Potom na výzvu umiestnením kurzora do poľa „pravdepodobnosť“ zadajte hodnotu inverznej pravdepodobnosti (t. j. v našom prípade namiesto pravdepodobnosti 0,95 musíte zadať pravdepodobnosť 0,05). Tabuľka je zjavne navrhnutá tak, že výsledok odpovedá na otázku, aká je pravdepodobnosť, že sa mýlime. Podobne do poľa Stupeň voľnosti zadajte hodnotu (n-1) pre vašu vzorku.

Interval spoľahlivosti k nám prichádza z oblasti štatistiky. Ide o určitý rozsah, ktorý slúži na odhad neznámeho parametra s vysokou mierou spoľahlivosti. Najjednoduchšie sa to dá vysvetliť na príklade.

Predpokladajme, že potrebujete študovať nejakú náhodnú premennú, napríklad rýchlosť odozvy servera na požiadavku klienta. Zakaždým, keď používateľ zadá adresu konkrétneho webu, server odpovie rôznymi rýchlosťami. Skúmaný čas odozvy je teda náhodný. Interval spoľahlivosti nám teda umožňuje určiť hranice tohto parametra a potom môžeme povedať, že s 95% pravdepodobnosťou bude server v rozsahu, ktorý sme vypočítali.

Alebo potrebujete zistiť, koľko ľudí vie o ochrannej známke spoločnosti. Pri výpočte intervalu spoľahlivosti bude možné napríklad povedať, že s 95 % pravdepodobnosťou sa podiel spotrebiteľov, ktorí si to uvedomujú, pohybuje v rozmedzí od 27 % do 34 %.

S týmto pojmom úzko súvisí hodnota pravdepodobnosti spoľahlivosti. Predstavuje pravdepodobnosť, že požadovaný parameter je zahrnutý v intervale spoľahlivosti. Od tejto hodnoty závisí, aký veľký bude náš požadovaný rozsah. Čím je hodnota väčšia, tým je interval spoľahlivosti užší a naopak. Zvyčajne je nastavená na 90 %, 95 % alebo 99 %. Najpopulárnejšia je hodnota 95 %.

Tento ukazovateľ je ovplyvnený aj rozptylom pozorovaní a jeho definícia je založená na predpoklade, že sledovaná charakteristika sa riadi.Toto tvrdenie je známe aj ako Gaussov zákon. Normál je podľa neho rozdelenie všetkých pravdepodobností spojitej náhodnej premennej, ktoré možno opísať hustotou pravdepodobnosti. Ak je predpoklad normálneho rozdelenia nesprávny, odhad môže byť nesprávny.

Po prvé, poďme zistiť, ako vypočítať interval spoľahlivosti pre Existujú dva možné prípady. Disperzia (stupeň šírenia náhodnej premennej) môže, ale nemusí byť známa. Ak je známy, potom sa náš interval spoľahlivosti vypočíta pomocou nasledujúceho vzorca:

xsr - t*σ / (sqrt(n))<= α <= хср + t*σ / (sqrt(n)), где

α - znak,

t - parameter z Laplaceovej distribučnej tabuľky,

σ je druhá odmocnina z rozptylu.

Ak je rozptyl neznámy, možno ho vypočítať, ak poznáme všetky hodnoty požadovanej funkcie. Používa sa na to nasledujúci vzorec:

σ2 = х2ср - (хср)2, kde

х2ср - priemerná hodnota štvorcov študovanej charakteristiky,

(хср)2 je druhá mocnina tejto charakteristiky.

Vzorec, podľa ktorého sa počíta interval spoľahlivosti, sa v tomto prípade mierne mení:

xsr - t*s / (sqrt(n))<= α <= хср + t*s / (sqrt(n)), где

xsr - vzorový priemer,

α - znak,

t je parameter, ktorý sa nachádza pomocou študentskej distribučnej tabuľky t = t(ɣ;n-1),

sqrt(n) - druhá odmocnina z celkovej veľkosti vzorky,

s je druhá odmocnina z rozptylu.

Zvážte tento príklad. Predpokladajme, že na základe výsledkov 7 meraní bola študovaná charakteristika určená rovná 30 a výberový rozptyl rovný 36. Je potrebné nájsť s pravdepodobnosťou 99% interval spoľahlivosti, ktorý obsahuje skutočnú hodnotu hodnotu meraného parametra.

Najprv určme, čomu sa t rovná: t = t (0,99; 7-1) = 3,71. Pomocou vyššie uvedeného vzorca dostaneme:

xsr - t*s / (sqrt(n))<= α <= хср + t*s / (sqrt(n))

30 – 3,71*36 / (sqrt(7))<= α <= 30 + 3.71*36 / (sqrt(7))

21.587 <= α <= 38.413

Interval spoľahlivosti pre rozptyl sa počíta tak v prípade známeho priemeru, ako aj vtedy, keď neexistujú údaje o matematickom očakávaní a je známa len hodnota bodového neskresleného odhadu rozptylu. Nebudeme tu uvádzať vzorce na jeho výpočet, pretože sú dosť zložité a v prípade potreby sa dajú vždy nájsť na internete.

Poznamenajme len, že je vhodné určiť interval spoľahlivosti pomocou Excelu alebo sieťovej služby, ktorá sa tak nazýva.