Agwat ng kumpiyansa. ABC ng mga medikal na istatistika

Bumuo tayo ng agwat ng kumpiyansa sa MS EXCEL para sa pagtatantya ng ibig sabihin ng halaga ng distribusyon sa kaso ng isang kilalang halaga ng pagkakaiba.

Syempre ang pagpili antas ng pagtitiwala ganap na nakasalalay sa gawain sa kamay. Kaya, ang antas ng kumpiyansa ng pasahero ng hangin sa pagiging maaasahan ng sasakyang panghimpapawid, siyempre, ay dapat na mas mataas kaysa sa antas ng kumpiyansa ng mamimili sa pagiging maaasahan ng bombilya.

Pagbubuo ng Gawain

Ipagpalagay natin na mula sa populasyon pagkuha sample laki n. Ito ay ipinapalagay na karaniwang lihis kilala ang pamamahagi na ito. Kinakailangan sa batayan nito mga sample suriin ang hindi alam ibig sabihin ng pamamahagi(μ, ) at buuin ang katumbas bilateral agwat ng kumpiyansa.

Pagtataya ng Punto

Tulad ng nalalaman mula sa mga istatistika(tawagan natin X cf) ay walang pinapanigan na pagtatantya ng mean ito populasyon at may distribusyon na N(μ;σ 2 /n).

Tandaan: Paano kung kailangan mong magtayo agwat ng kumpiyansa sa kaso ng pamamahagi, na ay hindi normal? Sa kasong ito, dumating upang iligtas, na nagsasabi na may sapat na malaking sukat mga sample n mula sa pamamahagi hindi- normal, sampling distribution ng statistics Х av kalooban humigit-kumulang tumutugma normal na pamamahagi may mga parameter na N(μ;σ 2 /n).

Kaya, pagtatantya ng punto gitna mga halaga ng pamamahagi mayroon kami ay sample ibig sabihin, ibig sabihin. X cf. Ngayon, maging abala tayo agwat ng kumpiyansa.

Pagbuo ng agwat ng kumpiyansa

Karaniwan, alam ang pamamahagi at mga parameter nito, maaari nating kalkulahin ang posibilidad na ang isang random na variable ay kukuha ng isang halaga mula sa isang naibigay na agwat. Ngayon gawin natin ang kabaligtaran: hanapin ang agwat kung saan ang random na variable ay nahuhulog na may ibinigay na posibilidad. Halimbawa, mula sa mga ari-arian normal na pamamahagi ito ay kilala na sa isang probabilidad ng 95%, isang random variable na ipinamamahagi sa ibabaw normal na batas, ay mahuhulog sa pagitan ng humigit-kumulang +/- 2 mula sa ibig sabihin ng halaga(tingnan ang artikulo tungkol sa). Ang agwat na ito ay magsisilbing aming prototype para sa agwat ng kumpiyansa.

Ngayon tingnan natin kung alam natin ang pamamahagi , upang kalkulahin ang agwat na ito? Upang masagot ang tanong, dapat nating tukuyin ang anyo ng pamamahagi at mga parameter nito.

Alam natin ang anyo ng pamamahagi normal na pamamahagi(tandaan na pinag-uusapan natin sampling distribution mga istatistika X cf).

Ang parameter na μ ay hindi alam sa amin (kailangan lamang itong tantyahin gamit ang agwat ng kumpiyansa), ngunit mayroon kaming pagtatantya nito X cf, kinakalkula batay sa sample, na maaaring gamitin.

Ang pangalawang parameter ay sample mean na standard deviation malalaman, ito ay katumbas ng σ/√n.

kasi hindi namin alam μ, pagkatapos ay bubuo kami ng interval +/- 2 standard deviations hindi galing ibig sabihin ng halaga, ngunit mula sa kilalang pagtatantya nito X cf. Yung. kapag nagkalkula agwat ng kumpiyansa HINDI namin ipagpalagay na X cf babagsak sa pagitan ng +/- 2 standard deviations mula sa μ na may posibilidad na 95%, at ipagpalagay namin na ang pagitan ay +/- 2 standard deviations mula sa X cf na may posibilidad na 95% ay sumasakop sa μ - ang average ng pangkalahatang populasyon, mula saan sample. Ang dalawang pahayag na ito ay katumbas, ngunit ang pangalawang pahayag ay nagpapahintulot sa amin na bumuo agwat ng kumpiyansa.

Bilang karagdagan, pinipino namin ang agwat: isang random na variable na ibinahagi sa ibabaw normal na batas, na may 95% na posibilidad ay nasa pagitan ng +/- 1.960 standard deviations, hindi +/- 2 standard deviations. Ito ay maaaring kalkulahin gamit ang formula \u003d NORM.ST.OBR ((1 + 0.95) / 2), cm. sample na file Sheet Spacing.

Ngayon ay maaari na tayong bumuo ng isang probabilistikong pahayag na magsisilbi sa atin upang mabuo agwat ng kumpiyansa:
"Ang posibilidad na ibig sabihin ng populasyon matatagpuan mula sa sample average sa loob ng 1.960" standard deviations ng sample mean", ay katumbas ng 95%.

Ang halaga ng posibilidad na binanggit sa pahayag ay may espesyal na pangalan , na nauugnay sa antas ng kabuluhan α (alpha) sa pamamagitan ng isang simpleng expression antas ng tiwala =1 . Sa kaso natin lebel ng kahalagahan α =1-0,95=0,05 .

Ngayon, batay sa probabilistikong pahayag na ito, sumusulat kami ng isang expression para sa pagkalkula agwat ng kumpiyansa:

kung saan ang Zα/2 pamantayan normal na pamamahagi(tulad ng isang halaga ng isang random na variable z, Ano P(z>=Zα/2 )=α/2).

Tandaan: Itaas na α/2-quantile tumutukoy sa lapad agwat ng kumpiyansa V standard deviations sample ibig sabihin. Itaas na α/2-quantile pamantayan normal na pamamahagi ay palaging mas malaki kaysa sa 0, na kung saan ay napaka-maginhawa.

Sa aming kaso, sa α=0.05, itaas na α/2-quantile katumbas ng 1.960. Para sa iba pang antas ng kahalagahan α (10%; 1%) itaas na α/2-quantile Zα/2 maaaring kalkulahin gamit ang formula \u003d NORM.ST.OBR (1-α / 2) o, kung kilala antas ng tiwala, =NORM.ST.OBR((1+antas ng kumpiyansa)/2).

Kadalasan kapag nagtatayo mga agwat ng kumpiyansa para sa pagtatantya ng mean gamitin lamang itaas na α/2-dami at huwag gamitin ibaba ang α/2-dami. Posible ito dahil pamantayan normal na pamamahagi simetriko tungkol sa x-axis ( density ng pamamahagi nito simetriko tungkol sa average, i.e. 0). Samakatuwid, hindi na kailangang kalkulahin mas mababang α/2-quantile(tinatawag lang itong α /2-quantile), dahil ito ay katumbas itaas na α/2-dami na may minus sign.

Alalahanin na, sa kabila ng hugis ng distribusyon ng x, ang kaukulang random variable X cf ipinamahagi humigit-kumulang ayos lang N(μ;σ 2 /n) (tingnan ang artikulo tungkol sa). Samakatuwid, sa pangkalahatan, ang expression sa itaas para sa agwat ng kumpiyansa ay tinatayang lamang. Kung ang x ay ibinahagi sa ibabaw normal na batas N(μ;σ 2 /n), pagkatapos ay ang expression para sa agwat ng kumpiyansa ay tumpak.

Pagkalkula ng agwat ng kumpiyansa sa MS EXCEL

Solusyonan natin ang problema.
Ang oras ng pagtugon ng isang electronic component sa isang input signal ay isang mahalagang katangian ng isang device. Nais ng isang inhinyero na magplano ng agwat ng kumpiyansa para sa average na oras ng pagtugon sa antas ng kumpiyansa na 95%. Mula sa nakaraang karanasan, alam ng inhinyero na ang karaniwang paglihis ng oras ng pagtugon ay 8 ms. Ito ay kilala na ang inhinyero ay gumawa ng 25 mga sukat upang matantya ang oras ng pagtugon, ang average na halaga ay 78 ms.

Solusyon: Nais malaman ng isang inhinyero ang oras ng pagtugon ng isang elektronikong aparato, ngunit nauunawaan niya na ang oras ng pagtugon ay hindi naayos, ngunit isang random na variable na may sariling pamamahagi. Kaya ang pinakamahusay na maaari niyang asahan ay upang matukoy ang mga parameter at hugis ng pamamahagi na ito.

Sa kasamaang palad, mula sa kondisyon ng problema, hindi namin alam ang anyo ng pamamahagi ng oras ng pagtugon (hindi kailangang maging normal). , hindi rin alam ang pamamahaging ito. Siya lang ang kilala karaniwang lihisσ=8. Samakatuwid, habang hindi namin makalkula ang mga probabilidad at bumuo agwat ng kumpiyansa.

Gayunpaman, bagaman hindi namin alam ang pamamahagi oras hiwalay na tugon, alam namin na ayon sa CPT, sampling distribution average na oras ng pagtugon ay humigit-kumulang normal(Ipapalagay namin na ang mga kondisyon CPT ay ginanap, dahil laki mga sample sapat na malaki (n=25)) .

Bukod dito, karaniwan ang pamamahagi na ito ay katumbas ng ibig sabihin ng halaga mga pamamahagi ng tugon ng yunit, ibig sabihin. μ. A karaniwang lihis ng distribusyon na ito (σ/√n) ay maaaring kalkulahin gamit ang formula =8/ROOT(25) .

Nabatid din na nakatanggap ang engineer pagtatantya ng punto parameter μ katumbas ng 78 ms (X cf). Samakatuwid, ngayon maaari naming kalkulahin ang mga probabilidad, dahil alam namin ang form ng pamamahagi ( normal) at mga parameter nito (Х ср at σ/√n).

Gustong malaman ng engineer inaasahang halagaμ ng distribusyon ng oras ng pagtugon. Gaya ng nakasaad sa itaas, ang μ na ito ay katumbas ng inaasahan ng sample distribution ng average na oras ng pagtugon. Kung gagamitin natin normal na pamamahagi N(X cf; σ/√n), kung gayon ang nais na μ ay nasa hanay na +/-2*σ/√n na may posibilidad na humigit-kumulang 95%.

Lebel ng kahalagahan katumbas ng 1-0.95=0.05.

Panghuli, hanapin ang kaliwa at kanang hangganan agwat ng kumpiyansa.
Kaliwang hangganan: \u003d 78-NORM.ST.INR (1-0.05 / 2) * 8 / ROOT (25) = 74,864
kanang hangganan: \u003d 78 + NORM. ST. OBR (1-0.05 / 2) * 8 / ROOT (25) \u003d 81.136

Kaliwang hangganan: =NORM.INV(0.05/2, 78, 8/SQRT(25))
kanang hangganan: =NORM.INV(1-0.05/2, 78, 8/SQRT(25))

Sagot: agwat ng kumpiyansa sa 95% na antas ng kumpiyansa at σ=8msec katumbas 78+/-3.136ms

SA halimbawa ng file sa sheet na Sigma kilala na lumikha ng isang form para sa pagkalkula at pagbuo bilateral agwat ng kumpiyansa para sa arbitraryo mga sample na may ibinigay na σ at lebel ng kahalagahan.

CONFIDENCE.NORM() function

Kung ang mga halaga mga sample ay nasa hanay B20:B79 , A lebel ng kahalagahan katumbas ng 0.05; pagkatapos MS EXCEL formula:
=AVERAGE(B20:B79)-CONFIDENCE(0.05,σ, COUNT(B20:B79))
ibabalik ang kaliwang hangganan agwat ng kumpiyansa.

Ang parehong hangganan ay maaaring kalkulahin gamit ang formula:
=AVERAGE(B20:B79)-NORM.ST.INV(1-0.05/2)*σ/SQRT(COUNT(B20:B79))

Tandaan: Ang TRUST.NORM() function ay lumabas sa MS EXCEL 2010. Ang mga naunang bersyon ng MS EXCEL ay gumamit ng TRUST() function.

Mga pagitan ng kumpiyansa ( Ingles Mga Pagitan ng Kumpiyansa) isa sa mga uri ng mga pagtatantya ng pagitan na ginagamit sa mga istatistika, na kinakalkula para sa isang partikular na antas ng kahalagahan. Pinapayagan nila kaming gumawa ng isang pahayag na ang tunay na halaga ng isang hindi kilalang istatistikal na parameter ng pangkalahatang populasyon ay nasa nakuha na hanay ng mga halaga na may posibilidad na ibinibigay ng napiling antas ng istatistikal na kahalagahan.

Normal na pamamahagi

Kapag ang pagkakaiba (σ 2 ) ng populasyon ng data ay kilala, ang isang z-score ay maaaring gamitin upang kalkulahin ang mga limitasyon ng kumpiyansa (mga boundary point ng confidence interval). Kung ikukumpara sa paggamit ng t-distribution, ang paggamit ng z-score ay hindi lamang magbibigay ng mas makitid na confidence interval, ngunit magbibigay din ng mas maaasahang mga pagtatantya ng mean at standard deviation (σ), dahil ang Z-score ay nakabatay sa isang normal na distribution.

Formula

Upang matukoy ang mga boundary point ng confidence interval, sa kondisyon na ang standard deviation ng populasyon ng data ay kilala, ang sumusunod na formula ay ginagamit

L = X - Z α/2 σ
√n

Halimbawa

Ipagpalagay na ang sample size ay 25 observation, ang sample mean ay 15, at ang population standard deviation ay 8. Para sa significance level na α=5%, ang Z-score ay Z α/2 =1.96. Sa kasong ito, magiging mas mababa at itaas na limitasyon ng agwat ng kumpiyansa

L = 15 - 1.96 8 = 11,864
√25
L = 15 + 1.96 8 = 18,136
√25

Kaya, maaari nating sabihin na may posibilidad na 95% ang mathematical na inaasahan ng pangkalahatang populasyon ay mahuhulog sa saklaw mula 11.864 hanggang 18.136.

Mga pamamaraan para sa pagpapaliit ng agwat ng kumpiyansa

Sabihin nating masyadong malawak ang saklaw para sa mga layunin ng ating pag-aaral. Mayroong dalawang paraan upang bawasan ang hanay ng agwat ng kumpiyansa.

  1. Bawasan ang antas ng istatistikal na kahalagahan α.
  2. Dagdagan ang laki ng sample.

Ang pagbabawas ng antas ng istatistikal na kahalagahan sa α=10%, makakakuha tayo ng Z-score na katumbas ng Z α/2 =1.64. Sa kasong ito, ang mas mababa at itaas na mga limitasyon ng pagitan ay magiging

L = 15 - 1.64 8 = 12,376
√25
L = 15 + 1.64 8 = 17,624
√25

At ang agwat ng kumpiyansa mismo ay maaaring isulat bilang

Sa kasong ito, maaari tayong gumawa ng isang pagpapalagay na may posibilidad na 90%, ang mathematical na inaasahan ng pangkalahatang populasyon ay mahuhulog sa hanay.

Kung gusto nating panatilihin ang antas ng statistical significance na α, ang tanging alternatibo ay dagdagan ang laki ng sample. Ang pagtaas nito sa 144 na mga obserbasyon, nakuha namin ang mga sumusunod na halaga ng mga limitasyon ng kumpiyansa

L = 15 - 1.96 8 = 13,693
√144
L = 15 + 1.96 8 = 16,307
√144

Ang agwat ng kumpiyansa mismo ay magiging ganito:

Kaya, ang pagpapaliit ng agwat ng kumpiyansa nang hindi binabawasan ang antas ng istatistikal na kahalagahan ay posible lamang sa pamamagitan ng pagtaas ng laki ng sample. Kung hindi posible na dagdagan ang laki ng sample, kung gayon ang pagpapaliit ng agwat ng kumpiyansa ay maaaring makamit lamang sa pamamagitan ng pagbabawas ng antas ng istatistikal na kahalagahan.

Bumuo ng agwat ng kumpiyansa para sa isang hindi normal na pamamahagi

Kung hindi alam ang standard deviation ng populasyon o hindi normal ang distribution, ang t-distribution ay ginagamit upang bumuo ng confidence interval. Ang diskarteng ito ay mas konserbatibo, na ipinahayag sa mas malawak na agwat ng kumpiyansa, kumpara sa pamamaraan batay sa Z-score.

Formula

Ang mga sumusunod na formula ay ginagamit upang kalkulahin ang mas mababa at itaas na mga limitasyon ng agwat ng kumpiyansa batay sa t-distribution

L = X - tα σ
√n

Ang pamamahagi o t-distribusyon ng Mag-aaral ay nakasalalay lamang sa isang parameter - ang bilang ng mga antas ng kalayaan, na katumbas ng bilang ng mga indibidwal na halaga ng tampok (ang bilang ng mga obserbasyon sa sample). Ang halaga ng t-test ng Mag-aaral para sa isang naibigay na bilang ng mga antas ng kalayaan (n) at ang antas ng istatistikal na kahalagahan α ay makikita sa mga talahanayan ng paghahanap.

Halimbawa

Ipagpalagay na ang sample size ay 25 individual values, ang mean value ng sample ay 50, at ang standard deviation ng sample ay 28. Kailangan mong bumuo ng confidence interval para sa antas ng statistical significance α=5%.

Sa aming kaso, ang bilang ng mga antas ng kalayaan ay 24 (25-1), samakatuwid, ang katumbas na halaga ng tabular ng t-test ng Mag-aaral para sa antas ng istatistikal na kahalagahan α=5% ay 2.064. Samakatuwid, ang mas mababa at itaas na mga hangganan ng pagitan ng kumpiyansa ay magiging

L = 50 - 2.064 28 = 38,442
√25
L = 50 + 2.064 28 = 61,558
√25

At ang agwat mismo ay maaaring isulat bilang

Kaya, maaari nating sabihin na may posibilidad na 95% ang inaasahan sa matematika ng pangkalahatang populasyon ay nasa saklaw.

Ang paggamit ng t-distribution ay nagbibigay-daan sa iyo na paliitin ang agwat ng kumpiyansa, alinman sa pamamagitan ng pagbabawas ng istatistikal na kahalagahan o sa pamamagitan ng pagtaas ng laki ng sample.

Ang pagbabawas ng istatistikal na kahalagahan mula 95% hanggang 90% sa mga kundisyon ng aming halimbawa, nakukuha namin ang katumbas na halaga ng tabular ng t-test ng Mag-aaral na 1.711.

L = 50 - 1.711 28 = 40,418
√25
L = 50 + 1.711 28 = 59,582
√25

Sa kasong ito, maaari nating sabihin na may posibilidad na 90% ang inaasahan sa matematika ng pangkalahatang populasyon ay nasa saklaw.

Kung ayaw nating bawasan ang istatistikal na kahalagahan, ang tanging alternatibo ay ang dagdagan ang laki ng sample. Sabihin natin na ito ay 64 indibidwal na mga obserbasyon, at hindi 25 tulad ng sa unang kondisyon ng halimbawa. Ang tabular value ng Student's t-test para sa 63 degrees of freedom (64-1) at ang antas ng statistical significance α=5% ay 1.998.

L = 50 - 1.998 28 = 43,007
√64
L = 50 + 1.998 28 = 56,993
√64

Nagbibigay ito sa amin ng pagkakataong igiit na may posibilidad na 95% ang mathematical na inaasahan ng pangkalahatang populasyon ay nasa hanay.

Malaking Sample

Ang mga malalaking sample ay mga sample mula sa isang populasyon ng data na may higit sa 100 indibidwal na mga obserbasyon. Ipinakita ng mga pag-aaral sa istatistika na ang mas malalaking sample ay karaniwang ipinamamahagi, kahit na ang distribusyon ng populasyon ay hindi normal. Bilang karagdagan, para sa mga naturang sample, ang paggamit ng z-score at t-distribution ay nagbibigay ng humigit-kumulang sa parehong mga resulta kapag gumagawa ng mga agwat ng kumpiyansa. Kaya, para sa malalaking sample, katanggap-tanggap na gumamit ng z-score para sa isang normal na distribusyon sa halip na isang t-distribution.

Summing up

Agwat ng kumpiyansa(CI; sa English, confidence interval - CI) na nakuha sa pag-aaral sa sample ay nagbibigay ng sukatan ng katumpakan (o kawalan ng katiyakan) ng mga resulta ng pag-aaral, upang makagawa ng mga konklusyon tungkol sa populasyon ng lahat ng naturang mga pasyente (pangkalahatang populasyon ). Ang tamang kahulugan ng 95% CI ay maaaring buuin tulad ng sumusunod: 95% ng naturang mga pagitan ay maglalaman ng tunay na halaga sa populasyon. Ang interpretasyong ito ay medyo hindi gaanong tumpak: Ang CI ay ang hanay ng mga halaga kung saan maaari kang maging 95% sigurado na naglalaman ito ng tunay na halaga. Kapag gumagamit ng CI, ang diin ay sa pagtukoy sa dami ng epekto, kumpara sa P value, na nakuha bilang resulta ng pagsubok para sa istatistikal na kahalagahan. Ang halaga ng P ay hindi sinusuri ang anumang halaga, ngunit sa halip ay nagsisilbing sukatan ng lakas ng ebidensya laban sa null hypothesis ng "walang epekto". Ang halaga ng P mismo ay hindi nagsasabi sa amin ng anuman tungkol sa laki ng pagkakaiba, o kahit tungkol sa direksyon nito. Samakatuwid, ang mga independiyenteng halaga ng P ay ganap na hindi nagbibigay-kaalaman sa mga artikulo o abstract. Sa kabaligtaran, ang CI ay nagpapahiwatig ng parehong halaga ng epekto ng agarang interes, tulad ng pagiging kapaki-pakinabang ng isang paggamot, at ang lakas ng ebidensya. Samakatuwid, ang DI ay direktang nauugnay sa pagsasanay ng DM.

Ang diskarte sa pagmamarka sa pagsusuri sa istatistika, na inilalarawan ng CI, ay naglalayong sukatin ang laki ng epekto ng interes (sensitivity ng diagnostic test, hinulaang saklaw, relatibong pagbabawas ng panganib sa paggamot, atbp.) at sukatin ang kawalan ng katiyakan sa epektong iyon. Kadalasan, ang CI ay ang hanay ng mga halaga sa magkabilang panig ng pagtatantya kung saan ang totoong halaga ay malamang na nasa, at maaari kang maging 95% sigurado dito. Ang kumbensyon na gamitin ang 95% na posibilidad ay arbitrary, gayundin ang halaga ng P<0,05 для оценки статистической значимости, и авторы иногда используют 90% или 99% ДИ. Заметим, что слово «интервал» означает диапазон величин и поэтому стоит в единственном числе. Две величины, которые ограничивают интервал, называются «доверительными пределами».

Ang CI ay batay sa ideya na ang parehong pag-aaral na isinagawa sa iba't ibang hanay ng mga pasyente ay hindi magbubunga ng magkatulad na resulta, ngunit ang kanilang mga resulta ay ibabahagi sa paligid ng totoo ngunit hindi kilalang halaga. Sa madaling salita, inilalarawan ito ng CI bilang "sample-dependent variability". Ang CI ay hindi nagpapakita ng karagdagang kawalan ng katiyakan dahil sa iba pang mga dahilan; sa partikular, hindi kasama dito ang epekto ng mapiling pagkawala ng mga pasyente sa pagsubaybay, mahinang pagsunod o hindi tumpak na pagsukat ng resulta, kawalan ng pagbulag, atbp. Kaya palaging minamaliit ng CI ang kabuuang halaga ng kawalan ng katiyakan.

Pagkalkula ng Interval ng Kumpiyansa

Talahanayan A1.1. Mga karaniwang error at agwat ng kumpiyansa para sa ilang klinikal na pagsukat

Karaniwan, ang CI ay kinakalkula mula sa isang naobserbahang pagtatantya ng isang quantitative measure, gaya ng pagkakaiba (d) sa pagitan ng dalawang proporsyon, at ang karaniwang error (SE) sa pagtatantya ng pagkakaibang iyon. Ang tinatayang 95% CI kaya nakuha ay d ± 1.96 SE. Ang formula ay nagbabago ayon sa likas na katangian ng sukatan ng kinalabasan at ang saklaw ng CI. Halimbawa, sa isang randomized, placebo-controlled na pagsubok ng acellular pertussis vaccine, ang whooping cough ay nabuo sa 72 sa 1670 (4.3%) na mga sanggol na nakatanggap ng bakuna at 240 sa 1665 (14.4%) sa control group. Ang pagkakaiba sa porsyento, na kilala bilang ganap na pagbabawas ng panganib, ay 10.1%. Ang SE ng pagkakaibang ito ay 0.99%. Alinsunod dito, ang 95% CI ay 10.1% + 1.96 x 0.99%, ibig sabihin. mula 8.2 hanggang 12.0.

Sa kabila ng iba't ibang mga pamamaraang pilosopikal, ang mga CI at pagsusulit para sa kahalagahan ng istatistika ay malapit na nauugnay sa matematika.

Kaya, ang halaga ng P ay "makabuluhan", i.e. R<0,05 соответствует 95% ДИ, который исключает величину эффекта, указывающую на отсутствие различия. Например, для различия между двумя средними пропорциями это ноль, а для относительного риска или отношения шансов - единица. При некоторых обстоятельствах эти два подхода могут быть не совсем эквивалентны. Преобладающая точка зрения: оценка с помощью ДИ - предпочтительный подход к суммированию результатов исследования, но ДИ и величина Р взаимодополняющи, и во многих статьях используются оба способа представления результатов.

Ang kawalan ng katiyakan (pagkakamali) ng pagtatantya, na ipinahayag sa CI, ay higit na nauugnay sa square root ng sample size. Ang maliliit na sample ay nagbibigay ng mas kaunting impormasyon kaysa sa malalaking sample, at ang mga CI ay katumbas na mas malawak sa mas maliliit na sample. Halimbawa, ang isang artikulong naghahambing sa pagganap ng tatlong pagsubok na ginamit upang masuri ang impeksyon sa Helicobacter pylori ay nag-ulat ng isang urea breath test sensitivity na 95.8% (95% CI 75-100). Habang ang bilang ng 95.8% ay mukhang kahanga-hanga, ang maliit na sukat ng sample ng 24 na may sapat na gulang na H. pylori na mga pasyente ay nangangahulugan na mayroong malaking kawalan ng katiyakan sa pagtatantya na ito, tulad ng ipinapakita ng malawak na CI. Sa katunayan, ang mas mababang limitasyon ng 75% ay mas mababa kaysa sa 95.8% na pagtatantya. Kung ang parehong sensitivity ay naobserbahan sa isang sample ng 240 tao, ang 95% CI ay magiging 92.5-98.0, na nagbibigay ng higit na katiyakan na ang pagsubok ay lubos na sensitibo.

Sa mga randomized na kinokontrol na pagsubok (RCT), ang mga hindi makabuluhang resulta (ibig sabihin, ang mga may P > 0.05) ay partikular na madaling kapitan ng maling interpretasyon. Ang CI ay partikular na kapaki-pakinabang dito dahil ito ay nagpapahiwatig kung gaano katugma ang mga resulta sa klinikal na kapaki-pakinabang na totoong epekto. Halimbawa, sa isang RCT na naghahambing ng tahi laban sa staple anastomosis sa colon, ang impeksyon sa sugat ay nabuo sa 10.9% at 13.5% ng mga pasyente, ayon sa pagkakabanggit (P = 0.30). Ang 95% CI para sa pagkakaibang ito ay 2.6% (-2 hanggang +8). Kahit na sa pag-aaral na ito, na kinabibilangan ng 652 mga pasyente, nananatiling malamang na mayroong katamtamang pagkakaiba sa saklaw ng mga impeksyon na nagreresulta mula sa dalawang pamamaraan. Kung mas maliit ang pag-aaral, mas malaki ang kawalan ng katiyakan. Sung et al. nagsagawa ng RCT na naghahambing ng octreotide infusion na may emergency sclerotherapy para sa talamak na variceal bleeding sa 100 pasyente. Sa pangkat ng octreotide, ang rate ng pag-aresto sa pagdurugo ay 84%; sa sclerotherapy group - 90%, na nagbibigay ng P = 0.56. Tandaan na ang mga rate ng patuloy na pagdurugo ay katulad ng sa impeksyon sa sugat sa pag-aaral na nabanggit. Sa kasong ito, gayunpaman, ang 95% CI para sa pagkakaiba sa pagitan ng mga interbensyon ay 6% (-7 hanggang +19). Ang hanay na ito ay medyo malawak kumpara sa isang 5% na pagkakaiba na magiging interesado sa klinikal. Malinaw na ang pag-aaral ay hindi nagbubukod ng isang makabuluhang pagkakaiba sa pagiging epektibo. Samakatuwid, ang konklusyon ng mga may-akda na "octreotide infusion at sclerotherapy ay pantay na epektibo sa paggamot ng pagdurugo mula sa varices" ay tiyak na hindi wasto. Sa mga kasong tulad nito kung saan ang 95% CI para sa absolute risk reduction (ARR) ay may kasamang zero, dahil dito, ang CI para sa NNT (numero na kailangan upang gamutin) ay medyo mahirap bigyang-kahulugan. . Ang NLP at ang CI nito ay nakuha mula sa mga kapalit ng ACP (multiply ang mga ito ng 100 kung ang mga halagang ito ay ibinibigay bilang mga porsyento). Dito nakukuha natin ang NPP = 100: 6 = 16.6 na may 95% CI na -14.3 hanggang 5.3. Tulad ng makikita mula sa footnote na "d" sa Talahanayan. A1.1, ang CI na ito ay may kasamang mga halaga para sa NTPP mula 5.3 hanggang infinity at NTLP mula 14.3 hanggang infinity.

Maaaring buuin ang mga CI para sa pinakakaraniwang ginagamit na istatistikal na pagtatantya o paghahambing. Para sa mga RCT, kabilang dito ang pagkakaiba sa pagitan ng mga mean na proporsyon, mga kamag-anak na panganib, mga ratio ng odds, at mga NRR. Katulad nito, ang mga CI ay maaaring makuha para sa lahat ng mga pangunahing pagtatantya na ginawa sa mga pag-aaral ng diagnostic test accuracy—sensitivity, specificity, positive predictive value (lahat ng mga ito ay simpleng proporsyon), at likelihood ratios—mga pagtatantya na nakuha sa meta-analyses at paghahambing-to-kontrol. pag-aaral. Ang isang personal na programa sa computer na sumasaklaw sa marami sa mga paggamit na ito ng DI ay magagamit sa ikalawang edisyon ng Statistics with Confidence. Ang mga macro para sa pagkalkula ng mga CI para sa mga proporsyon ay malayang magagamit para sa Excel at ang mga programang istatistikal na SPSS at Minitab sa http://www.uwcm.ac.uk/study/medicine/epidemiology_statistics/research/statistics/proportions, htm.

Maramihang mga pagsusuri ng epekto ng paggamot

Habang ang pagtatayo ng mga CI ay kanais-nais para sa mga pangunahing kinalabasan ng isang pag-aaral, ang mga ito ay hindi kinakailangan para sa lahat ng mga resulta. Ang CI ay may kinalaman sa klinikal na mahahalagang paghahambing. Halimbawa, kapag naghahambing ng dalawang grupo, ang tamang CI ay ang ginawa para sa pagkakaiba sa pagitan ng mga pangkat, tulad ng ipinapakita sa mga halimbawa sa itaas, at hindi ang CI na maaaring itayo para sa pagtatantya sa bawat pangkat. Hindi lamang walang silbi ang pagbibigay ng hiwalay na CI para sa mga marka sa bawat grupo, ang pagtatanghal na ito ay maaaring nakaliligaw. Katulad nito, ang tamang diskarte kapag inihambing ang pagiging epektibo ng paggamot sa iba't ibang mga subgroup ay direktang ihambing ang dalawa (o higit pang) subgroup. Hindi tama na ipagpalagay na ang paggamot ay epektibo lamang sa isang subgroup kung ang CI nito ay nagbubukod ng halaga na walang epekto, habang ang iba ay hindi. Kapaki-pakinabang din ang mga CI kapag naghahambing ng mga resulta sa maraming subgroup. Sa fig. Ipinapakita ng A1.1 ang relatibong panganib ng eclampsia sa mga babaeng may preeclampsia sa mga subgroup ng kababaihan mula sa isang placebo-controlled na RCT ng magnesium sulfate.

kanin. A1.2. Ipinapakita ng Forest Graph ang mga resulta ng 11 randomized na klinikal na pagsubok ng bovine rotavirus vaccine para sa pag-iwas sa pagtatae kumpara sa placebo. Ang 95% na agwat ng kumpiyansa ay ginamit upang tantiyahin ang kamag-anak na panganib ng pagtatae. Ang laki ng itim na parisukat ay proporsyonal sa dami ng impormasyon. Bilang karagdagan, ang isang buod na pagtatantya ng pagiging epektibo ng paggamot at isang 95% na agwat ng kumpiyansa (ipinahiwatig ng isang brilyante) ay ipinapakita. Gumamit ang meta-analysis ng random-effects na modelo na lumampas sa ilang mga nauna nang naitatag; halimbawa, maaaring ito ang sukat na ginamit sa pagkalkula ng laki ng sample. Sa ilalim ng mas mahigpit na pamantayan, ang buong hanay ng mga CI ay dapat magpakita ng benepisyong lumampas sa paunang natukoy na minimum.

Napag-usapan na natin ang kamalian ng pagkuha ng kawalan ng istatistikal na kahalagahan bilang isang indikasyon na ang dalawang paggamot ay pantay na epektibo. Parehong mahalaga na huwag ipantay ang istatistikal na kahalagahan sa klinikal na kahalagahan. Maaaring ipalagay ang klinikal na kahalagahan kapag ang resulta ay makabuluhan ayon sa istatistika at ang laki ng tugon sa paggamot

Maaaring ipakita ng mga pag-aaral kung ang mga resulta ay makabuluhan ayon sa istatistika at kung alin ang mahalaga sa klinika at alin ang hindi. Sa fig. Ipinapakita ng A1.2 ang mga resulta ng apat na pagsubok kung saan ang buong CI<1, т.е. их результаты статистически значимы при Р <0,05 , . После высказанного предположения о том, что клинически важным различием было бы сокращение риска диареи на 20% (ОР = 0,8), все эти испытания показали клинически значимую оценку сокращения риска, и лишь в исследовании Treanor весь 95% ДИ меньше этой величины. Два других РКИ показали клинически важные результаты, которые не были статистически значимыми. Обратите внимание, что в трёх испытаниях точечные оценки эффективности лечения были почти идентичны, но ширина ДИ различалась (отражает размер выборки). Таким образом, по отдельности доказательная сила этих РКИ различна.

At iba pa. Lahat ng mga ito ay mga pagtatantya ng kanilang mga teoretikal na katapat, na maaaring makuha kung walang sample, ngunit ang pangkalahatang populasyon. Ngunit sayang, ang pangkalahatang populasyon ay napakamahal at kadalasan ay hindi magagamit.

Ang konsepto ng pagtatantya ng pagitan

Ang anumang sample na pagtatantya ay may ilang scatter, dahil ay isang random na variable depende sa mga halaga sa isang partikular na sample. Samakatuwid, para sa mas maaasahang istatistikal na inferences, dapat malaman hindi lamang ang point estimate, kundi pati na rin ang interval, na may mataas na posibilidad. γ Sinasaklaw ng (gamma) ang tinantyang tagapagpahiwatig θ (theta).

Pormal, ito ay dalawang ganoong halaga (mga istatistika) T1(X) At T2(X), Ano T1< T 2 , kung saan sa isang naibigay na antas ng posibilidad γ natugunan ang kondisyon:

Sa madaling salita, malamang γ o higit pa ang tunay na halaga ay nasa pagitan ng mga puntos T1(X) At T2(X), na tinatawag na lower at upper bounds agwat ng kumpiyansa.

Ang isa sa mga kondisyon para sa pagbuo ng mga agwat ng kumpiyansa ay ang pinakamataas na makitid nito, i.e. ito ay dapat na maikli hangga't maaari. Ang pagnanais ay medyo natural, dahil. sinusubukan ng mananaliksik na mas tumpak na i-localize ang paghahanap ng nais na parameter.

Ito ay sumusunod na ang agwat ng kumpiyansa ay dapat sumaklaw sa pinakamataas na posibilidad ng pamamahagi. at ang score mismo ay nasa gitna.

Iyon ay, ang posibilidad ng paglihis (ng tunay na tagapagpahiwatig mula sa pagtatantya) pataas ay katumbas ng posibilidad ng paglihis pababa. Dapat ding tandaan na para sa mga skewed distribution, ang interval sa kanan ay hindi katumbas ng interval sa kaliwa.

Ang figure sa itaas ay malinaw na nagpapakita na mas malaki ang antas ng kumpiyansa, mas malawak ang pagitan - isang direktang relasyon.

Ito ay isang maliit na panimula sa teorya ng pagtatantya ng pagitan ng hindi kilalang mga parameter. Lumipat tayo sa paghahanap ng mga limitasyon ng kumpiyansa para sa inaasahan sa matematika.

Agwat ng kumpiyansa para sa inaasahan sa matematika

Kung ang orihinal na data ay ibinahagi sa , ang average ay magiging isang normal na halaga. Ito ay sumusunod mula sa panuntunan na ang isang linear na kumbinasyon ng mga normal na halaga ay mayroon ding isang normal na distribusyon. Samakatuwid, upang kalkulahin ang mga probabilidad, maaari naming gamitin ang mathematical apparatus ng normal na batas sa pamamahagi.

Gayunpaman, mangangailangan ito ng kaalaman sa dalawang parameter - ang inaasahang halaga at ang pagkakaiba, na karaniwang hindi alam. Maaari mong, siyempre, gumamit ng mga pagtatantya sa halip na mga parameter (arithmetic mean at ), ngunit pagkatapos ay ang pamamahagi ng ibig sabihin ay hindi magiging normal, ito ay bahagyang pipi. Ang mamamayang si William Gosset ng Ireland ay matalinong nabanggit ang katotohanang ito nang ilathala niya ang kanyang natuklasan sa Marso 1908 na isyu ng Biometrica. Para sa mga layuning lihim, lumagda si Gosset kasama ang Mag-aaral. Ganito lumabas ang t-distribution ng Student.

Gayunpaman, ang normal na pamamahagi ng data, na ginamit ni K. Gauss sa pagsusuri ng mga pagkakamali sa mga obserbasyon sa astronomiya, ay napakabihirang sa buhay sa lupa at medyo mahirap itatag ito (mga 2 libong obserbasyon ang kailangan para sa mataas na katumpakan). Samakatuwid, pinakamahusay na i-drop ang normality assumption at gumamit ng mga pamamaraan na hindi nakadepende sa pamamahagi ng orihinal na data.

Ang tanong ay lumitaw: ano ang pamamahagi ng arithmetic mean kung ito ay kinakalkula mula sa data ng isang hindi kilalang pamamahagi? Ang sagot ay ibinigay ng kilalang in probability theory Central limit theorem(CPT). Sa matematika, mayroong ilang mga bersyon nito (ang mga pormulasyon ay pino sa paglipas ng mga taon), ngunit lahat ng mga ito, sa halos pagsasalita, ay bumaba sa pahayag na ang kabuuan ng isang malaking bilang ng mga independiyenteng random na mga variable ay sumusunod sa normal na batas sa pamamahagi.

Kapag kinakalkula ang arithmetic mean, ang kabuuan ng mga random na variable ay ginagamit. Mula dito lumalabas na ang arithmetic mean ay may normal na distribusyon, kung saan ang inaasahang halaga ay ang inaasahang halaga ng paunang data, at ang pagkakaiba ay .

Alam ng mga matalinong tao kung paano patunayan ang CLT, ngunit ibe-verify namin ito sa tulong ng isang eksperimento na isinagawa sa Excel. Gayahin natin ang isang sample ng 50 pare-parehong ipinamahagi na random variable (gamit ang Excel function na RANDOMBETWEEN). Pagkatapos ay gagawa kami ng 1000 tulad ng mga sample at kalkulahin ang arithmetic mean para sa bawat isa. Tingnan natin ang kanilang pamamahagi.

Makikita na ang distribusyon ng average ay malapit sa normal na batas. Kung ang dami ng mga sample at ang kanilang bilang ay gagawing mas malaki, kung gayon ang pagkakatulad ay magiging mas mahusay.

Ngayon na nakita natin sa ating sarili ang bisa ng CLT, maaari nating, gamit ang , kalkulahin ang mga pagitan ng kumpiyansa para sa arithmetic mean, na sumasaklaw sa tunay na mean o mathematical na inaasahan na may ibinigay na posibilidad.

Upang maitatag ang itaas at mas mababang mga hangganan, kinakailangan na malaman ang mga parameter ng normal na pamamahagi. Bilang isang patakaran, hindi sila, samakatuwid, ang mga pagtatantya ay ginagamit: ibig sabihin ng aritmetika At sample na pagkakaiba-iba. Muli, ang pamamaraang ito ay nagbibigay ng isang mahusay na approximation para lamang sa malalaking sample. Kapag ang mga sample ay maliit, madalas na inirerekomenda na gamitin ang pamamahagi ng Mag-aaral. Huwag maniwala! Ang distribusyon ng mag-aaral para sa mean ay nangyayari lamang kapag ang orihinal na data ay may normal na distribusyon, iyon ay, halos hindi kailanman. Samakatuwid, mas mahusay na agad na itakda ang minimum na bar para sa dami ng kinakailangang data at gumamit ng mga asymptotically correct na pamamaraan. Sabi nila, sapat na ang 30 obserbasyon. Kumuha ng 50 - hindi ka maaaring magkamali.

T 1.2 ay ang lower at upper bounds ng confidence interval

– sample na arithmetic mean

s0– sample na standard deviation (walang pinapanigan)

n – laki ng sample

γ – antas ng kumpiyansa (karaniwang katumbas ng 0.9, 0.95 o 0.99)

c γ =Φ -1 ((1+γ)/2) ay ang kapalit ng karaniwang normal na distribution function. Sa simpleng mga termino, ito ang bilang ng mga karaniwang error mula sa arithmetic mean hanggang sa lower o upper bound (ang ipinahiwatig na tatlong probabilidad ay tumutugma sa mga halaga ng 1.64, 1.96 at 2.58).

Ang kakanyahan ng formula ay ang arithmetic mean ay kinuha at pagkatapos ay isang tiyak na halaga ay itabi mula dito ( kasama ang γ) mga karaniwang error ( s 0 /√n). Lahat ay alam, kunin at bilangin.

Bago ang malawakang paggamit ng mga PC, upang makuha ang mga halaga ng normal na function ng pamamahagi at ang kabaligtaran nito, ginamit nila . Ginagamit pa rin ang mga ito, ngunit mas mahusay na bumaling sa mga yari na formula ng Excel. Ang lahat ng elemento mula sa formula sa itaas ( , at ) ay madaling kalkulahin sa Excel. Ngunit mayroon ding isang handa na formula para sa pagkalkula ng agwat ng kumpiyansa - NORM NG tiwala sa sarili. Ang syntax nito ay ang mga sumusunod.

CONFIDENCE NORM(alpha, standard_dev, size)

alpha– antas ng kabuluhan o antas ng kumpiyansa, na sa notasyon sa itaas ay katumbas ng 1-γ, i.e. ang posibilidad na ang mathematicalang inaasahan ay nasa labas ng confidence interval. Sa antas ng kumpiyansa na 0.95, ang alpha ay 0.05, at iba pa.

standard_off ay ang standard deviation ng sample data. Hindi mo kailangang kalkulahin ang karaniwang error, hahatiin ng Excel sa ugat ng n.

laki– laki ng sample (n).

Ang resulta ng function na CONFIDENCE.NORM ay ang pangalawang termino mula sa formula para sa pagkalkula ng agwat ng kumpiyansa, i.e. kalahating pagitan. Alinsunod dito, ang mas mababa at itaas na mga puntos ay ang average ± ang nakuhang halaga.

Kaya, posible na bumuo ng isang unibersal na algorithm para sa pagkalkula ng mga agwat ng kumpiyansa para sa arithmetic mean, na hindi nakasalalay sa pamamahagi ng paunang data. Ang presyo para sa pagiging pangkalahatan ay ang asymptotic na kalikasan nito, i.e. ang pangangailangang gumamit ng medyo malalaking sample. Gayunpaman, sa panahon ng modernong teknolohiya, ang pagkolekta ng tamang dami ng data ay karaniwang hindi mahirap.

Pagsubok sa Statistical Hypotheses Gamit ang Confidence Interval

(module 111)

Ang isa sa mga pangunahing problema na nalutas sa istatistika ay. Sa maikling salita, ang kakanyahan nito ay ito. Ang isang pagpapalagay ay ginawa, halimbawa, na ang inaasahan ng pangkalahatang populasyon ay katumbas ng ilang halaga. Pagkatapos ay itinayo ang pamamahagi ng mga sample na paraan, na maaaring maobserbahan sa isang naibigay na inaasahan. Susunod, titingnan natin kung saan sa kondisyonal na pamamahagi na ito ang tunay na average ay matatagpuan. Kung ito ay lumampas sa pinahihintulutang mga limitasyon, kung gayon ang hitsura ng naturang average ay napaka-malamang, at sa isang solong pag-uulit ng eksperimento ito ay halos imposible, na sumasalungat sa hypothesis na iniharap, na matagumpay na tinanggihan. Kung ang average ay hindi lalampas sa kritikal na antas, kung gayon ang hypothesis ay hindi tinatanggihan (ngunit hindi rin ito napatunayan!).

Kaya, sa tulong ng mga agwat ng kumpiyansa, sa aming kaso para sa inaasahan, maaari mo ring subukan ang ilang mga hypotheses. Napakadaling gawin. Ipagpalagay na ang arithmetic mean para sa ilang sample ay 100. Ang hypothesis ay sinusubok na ang inaasahan ay, sabihin nating, 90. Ibig sabihin, kung ilalagay natin ang tanong sa primitively, ito ay ganito ang tunog: maaari ba na sa totoong halaga ng average katumbas ng 90, ang naobserbahang average ay 100?

Upang masagot ang tanong na ito, kakailanganin ang karagdagang impormasyon sa karaniwang paglihis at laki ng sample. Sabihin nating ang karaniwang paglihis ay 30, at ang bilang ng mga obserbasyon ay 64 (upang madaling makuha ang ugat). Kung gayon ang karaniwang error ng mean ay 30/8 o 3.75. Upang kalkulahin ang 95% na agwat ng kumpiyansa, kakailanganin mong magtabi ng dalawang karaniwang error sa magkabilang panig ng mean (mas tiyak, 1.96). Ang confidence interval ay magiging humigit-kumulang 100 ± 7.5, o mula 92.5 hanggang 107.5.

Ang karagdagang pangangatwiran ay ang mga sumusunod. Kung ang nasubok na halaga ay nasa loob ng agwat ng kumpiyansa, kung gayon hindi ito sumasalungat sa hypothesis, dahil umaangkop sa loob ng mga limitasyon ng mga random na pagbabagu-bago (na may posibilidad na 95%). Kung ang nasubok na punto ay nasa labas ng agwat ng kumpiyansa, kung gayon ang posibilidad ng naturang kaganapan ay napakaliit, sa anumang kaso sa ibaba ng katanggap-tanggap na antas. Samakatuwid, ang hypothesis ay tinanggihan bilang sumasalungat sa naobserbahang data. Sa aming kaso, ang expectation hypothesis ay nasa labas ng confidence interval (ang nasubok na value na 90 ay hindi kasama sa interval na 100±7.5), kaya dapat itong tanggihan. Ang pagsagot sa primitive na tanong sa itaas, dapat sabihin ng isa: hindi, hindi ito maaaring, sa anumang kaso, ito ay napakabihirang mangyari. Kadalasan, ito ay nagpapahiwatig ng isang tiyak na posibilidad ng maling pagtanggi sa hypothesis (p-level), at hindi isang naibigay na antas, ayon sa kung saan ang agwat ng kumpiyansa ay binuo, ngunit higit pa sa ibang pagkakataon.

Tulad ng nakikita mo, hindi mahirap bumuo ng isang agwat ng kumpiyansa para sa mean (o inaasahan sa matematika). Ang pangunahing bagay ay upang mahuli ang kakanyahan, at pagkatapos ay pupunta ang mga bagay. Sa pagsasagawa, karamihan ay gumagamit ng 95% na agwat ng kumpiyansa, na humigit-kumulang sa dalawang karaniwang error sa magkabilang panig ng mean.

Yun lang muna. Lahat ng pinakamahusay!

MGA INTERVAL NG PAGTITIWALA PARA SA MGA DALAS AT MGA BAHAGI

© 2008

National Institute of Public Health, Oslo, Norway

Inilalarawan at tinatalakay ng artikulo ang pagkalkula ng mga agwat ng kumpiyansa para sa mga frequency at proporsyon gamit ang mga pamamaraang Wald, Wilson, Klopper-Pearson, gamit ang angular transformation at ang Wald method na may Agresti-Cowll correction. Ang ipinakita na materyal ay nagbibigay ng pangkalahatang impormasyon tungkol sa mga pamamaraan para sa pagkalkula ng mga agwat ng kumpiyansa para sa mga frequency at proporsyon at nilayon upang pukawin ang interes ng mga mambabasa ng journal hindi lamang sa paggamit ng mga agwat ng kumpiyansa kapag ipinakita ang mga resulta ng kanilang sariling pananaliksik, kundi pati na rin sa pagbabasa ng mga dalubhasang literatura bago magsimula. magtrabaho sa hinaharap na mga publikasyon.

Mga keyword: agwat ng kumpiyansa, dalas, proporsyon

Sa isa sa mga naunang publikasyon, ang paglalarawan ng data ng husay ay maikling binanggit at iniulat na ang kanilang pagtatantya ng pagitan ay mas kanais-nais kaysa sa pagtatantya ng punto para sa paglalarawan ng dalas ng paglitaw ng pinag-aralan na katangian sa pangkalahatang populasyon. Sa katunayan, dahil ang mga pag-aaral ay isinasagawa gamit ang sample na data, ang projection ng mga resulta sa pangkalahatang populasyon ay dapat maglaman ng isang elemento ng hindi tumpak sa sample na pagtatantya. Ang confidence interval ay isang sukatan ng katumpakan ng tinantyang parameter. Ito ay kagiliw-giliw na sa ilang mga libro sa mga pangunahing kaalaman ng mga istatistika para sa mga manggagamot, ang paksa ng mga agwat ng kumpiyansa para sa mga frequency ay ganap na binabalewala. Sa artikulong ito, isasaalang-alang namin ang ilang paraan upang kalkulahin ang mga agwat ng kumpiyansa para sa mga frequency, sa pag-aakala ng mga sample na katangian tulad ng hindi pag-ulit at pagiging kinatawan, pati na rin ang kalayaan ng mga obserbasyon mula sa isa't isa. Ang dalas sa artikulong ito ay hindi nauunawaan bilang isang ganap na bilang na nagpapakita kung gaano karaming beses nangyayari ito o ang halagang iyon sa pinagsama-samang halaga, ngunit isang kamag-anak na halaga na tumutukoy sa proporsyon ng mga kalahok sa pag-aaral na mayroong katangiang pinag-aaralan.

Sa biomedical na pananaliksik, 95% na mga agwat ng kumpiyansa ang pinakakaraniwang ginagamit. Ang agwat ng kumpiyansa na ito ay ang rehiyon kung saan bumabagsak ang tunay na proporsyon sa 95% ng oras. Sa madaling salita, masasabing may 95% na katiyakan na ang tunay na halaga ng dalas ng paglitaw ng isang tampok sa pangkalahatang populasyon ay nasa loob ng 95% na agwat ng kumpiyansa.

Karamihan sa mga statistical textbook para sa mga medikal na mananaliksik ay nag-uulat na ang frequency error ay kinakalkula gamit ang formula

kung saan ang p ay ang dalas ng paglitaw ng tampok sa sample (halaga mula 0 hanggang 1). Sa karamihan ng mga domestic na artikulong pang-agham, ang halaga ng dalas ng paglitaw ng isang tampok sa sample (p) ay ipinahiwatig, pati na rin ang (mga) error nito sa anyo ng p ± s. Gayunpaman, mas kapaki-pakinabang na magpakita ng 95% na agwat ng kumpiyansa para sa dalas ng paglitaw ng isang katangian sa pangkalahatang populasyon, na magsasama ng mga halaga mula sa

dati.

Sa ilang mga aklat-aralin, para sa maliliit na sample, inirerekumenda na palitan ang halaga ng 1.96 sa halaga ng t para sa N - 1 degrees ng kalayaan, kung saan ang N ay ang bilang ng mga obserbasyon sa sample. Ang halaga ng t ay matatagpuan sa mga talahanayan para sa t-distribution, na magagamit sa halos lahat ng mga aklat-aralin sa mga istatistika. Ang paggamit ng pamamahagi ng t para sa pamamaraang Wald ay hindi nagbibigay ng nakikitang mga pakinabang sa iba pang mga pamamaraan na tinalakay sa ibaba, at samakatuwid ay hindi tinatanggap ng ilang mga may-akda.

Ang paraan sa itaas para sa pagkalkula ng mga agwat ng kumpiyansa para sa mga frequency o fraction ay pinangalanan kay Abraham Wald (Abraham Wald, 1902–1950), dahil nagsimula itong malawakang gamitin pagkatapos ng publikasyon ng Wald at Wolfowitz noong 1939. Gayunpaman, ang pamamaraan mismo ay iminungkahi ni Pierre Simon Laplace (1749–1827) noong 1812.

Ang pamamaraang Wald ay napakapopular, ngunit ang aplikasyon nito ay nauugnay sa mga makabuluhang problema. Ang pamamaraan ay hindi inirerekomenda para sa maliliit na laki ng sample, gayundin sa mga kaso kung saan ang dalas ng paglitaw ng isang tampok ay may posibilidad na 0 o 1 (0% o 100%) at hindi posible para sa mga frequency na 0 at 1. Bilang karagdagan, ang normal na pagtatantya ng pamamahagi, na ginagamit kapag kinakalkula ang error , "ay hindi gumagana" sa mga kaso kung saan n p< 5 или n · (1 – p) < 5 . Более консервативные статистики считают, что n · p и n · (1 – p) должны быть не менее 10 . Более детальное рассмотрение метода Вальда показало, что полученные с его помощью доверительные интервалы в большинстве случаев слишком узки, то есть их применение ошибочно создает слишком оптимистичную картину, особенно при удалении частоты встречаемости признака от 0,5, или 50 % . К тому же при приближении частоты к 0 или 1 доверительный интревал может принимать отрицательные значения или превышать 1, что выглядит абсурдно для частот. Многие авторы совершенно справедливо не рекомендуют применять данный метод не только в уже упомянутых случаях, но и тогда, когда частота встречаемости признака менее 25 % или более 75 % . Таким образом, несмотря на простоту расчетов, метод Вальда может применяться лишь в очень ограниченном числе случаев. Зарубежные исследователи более категоричны в своих выводах и однозначно рекомендуют не применять этот метод для небольших выборок , а ведь именно с такими выборками часто приходится иметь дело исследователям-медикам.

Dahil ang bagong variable ay may normal na distribution, ang lower at upper bounds ng 95% confidence interval para sa variable na φ ay magiging φ-1.96 at φ+1.96left">

Sa halip na 1.96 para sa maliliit na sample, inirerekumenda na palitan ang halaga ng t para sa N - 1 degrees ng kalayaan. Ang pamamaraang ito ay hindi nagbibigay ng mga negatibong halaga at nagbibigay-daan sa iyo na mas tumpak na tantyahin ang mga agwat ng kumpiyansa para sa mga frequency kaysa sa pamamaraang Wald. Bilang karagdagan, ito ay inilarawan sa maraming mga domestic reference na libro sa mga medikal na istatistika, na, gayunpaman, ay hindi humantong sa malawakang paggamit nito sa medikal na pananaliksik. Ang pagkalkula ng mga agwat ng kumpiyansa gamit ang isang pagbabago ng anggulo ay hindi inirerekomenda para sa mga frequency na lumalapit sa 0 o 1.

Dito karaniwang nagtatapos ang paglalarawan ng mga pamamaraan para sa pagtatantya ng mga agwat ng kumpiyansa sa karamihan ng mga aklat sa mga pangunahing kaalaman ng istatistika para sa mga medikal na mananaliksik, at ang problemang ito ay tipikal hindi lamang para sa domestic, kundi pati na rin para sa mga banyagang literatura. Ang parehong mga pamamaraan ay batay sa gitnang teorama ng limitasyon, na nagpapahiwatig ng isang malaking sample.

Dahil sa mga pagkukulang sa pagtatantya ng mga pagitan ng kumpiyansa gamit ang mga pamamaraan sa itaas, iminungkahi ni Clopper (Clopper) at Pearson (Pearson) noong 1934 ang isang paraan para sa pagkalkula ng tinatawag na eksaktong agwat ng kumpiyansa, na isinasaalang-alang ang binomial na pamamahagi ng pinag-aralan na katangian. Ang pamamaraang ito ay magagamit sa maraming mga online na calculator, gayunpaman, ang mga pagitan ng kumpiyansa na nakuha sa ganitong paraan ay sa karamihan ng mga kaso ay masyadong malawak. Kasabay nito, ang pamamaraang ito ay inirerekomenda para sa paggamit sa mga kaso kung saan ang isang konserbatibong pagtatantya ay kinakailangan. Ang antas ng konserbatismo ng pamamaraan ay tumataas habang bumababa ang laki ng sample, lalo na para sa N< 15 . описывает применение функции биномиального распределения для анализа качественных данных с использованием MS Excel, в том числе и для определения доверительных интервалов, однако расчет последних для частот в электронных таблицах не «затабулирован» в удобном для пользователя виде, а потому, вероятно, и не используется большинством исследователей.

Ayon sa maraming mga istatistika, ang pinakamainam na pagtatantya ng mga agwat ng kumpiyansa para sa mga frequency ay isinasagawa ng pamamaraang Wilson, na iminungkahi noong 1927, ngunit halos hindi ginagamit sa domestic biomedical na pananaliksik. Ang pamamaraang ito ay hindi lamang ginagawang posible upang tantyahin ang mga agwat ng kumpiyansa para sa parehong napakaliit at napakataas na mga frequency, ngunit naaangkop din sa isang maliit na bilang ng mga obserbasyon. Sa pangkalahatan, ang agwat ng kumpiyansa ayon sa pormula ng Wilson ay may anyo mula sa



kung saan kinakailangan ang halaga na 1.96 kapag kinakalkula ang 95% na agwat ng kumpiyansa, ang N ay ang bilang ng mga obserbasyon, at ang p ay ang dalas ng tampok sa sample. Ang pamamaraang ito ay magagamit sa mga online na calculator, kaya ang aplikasyon nito ay hindi problema. at hindi inirerekomenda ang paggamit ng paraang ito para sa n p< 4 или n · (1 – p) < 4 по причине слишком грубого приближения распределения р к нормальному в такой ситуации, однако зарубежные статистики считают метод Уилсона применимым и для малых выборок .

Bilang karagdagan sa pamamaraang Wilson, ang pamamaraang Wald na itinama ng Agresti–Caull ay pinaniniwalaan ding nagbibigay ng pinakamainam na pagtatantya ng agwat ng kumpiyansa para sa mga frequency. Ang Agresti-Coulle correction ay isang kapalit sa Wald formula para sa dalas ng paglitaw ng isang katangian sa sample (p) ng p`, kapag kinakalkula kung aling 2 ang idinaragdag sa numerator, at 4 ang idinaragdag sa denominator, iyon ay. , p` = (X + 2) / (N + 4), kung saan ang X ay ang bilang ng mga kalahok sa pag-aaral na may katangiang pinag-aaralan, at ang N ay ang laki ng sample. Ang pagbabagong ito ay gumagawa ng mga resulta na halos kapareho ng sa Wilson formula, maliban kung ang rate ng kaganapan ay lumalapit sa 0% o 100% at ang sample ay maliit. Bilang karagdagan sa mga pamamaraan sa itaas para sa pagkalkula ng mga agwat ng kumpiyansa para sa mga frequency, ang mga pagwawasto ng pagpapatuloy ay iminungkahi para sa parehong paraan ng Wald at para sa Wilson para sa maliliit na sample, ngunit ipinakita ng mga pag-aaral na ang kanilang paggamit ay hindi naaangkop.

Isaalang-alang ang aplikasyon ng mga pamamaraan sa itaas para sa pagkalkula ng mga pagitan ng kumpiyansa gamit ang dalawang halimbawa. Sa unang kaso, pinag-aaralan namin ang isang malaking sample ng 1,000 random na napiling mga kalahok sa pag-aaral, kung saan 450 ang may katangiang pinag-aaralan (kung ito man ay isang risk factor, isang resulta, o anumang iba pang katangian), na isang dalas ng 0.45, o 45%. Sa pangalawang kaso, ang pag-aaral ay isinasagawa gamit ang isang maliit na sample, sabihin, 20 tao lamang, at 1 kalahok lamang sa pag-aaral (5%) ang may katangiang pinag-aaralan. Ang mga pagitan ng kumpiyansa para sa pamamaraang Wald, para sa pamamaraang Wald na may pagwawasto ng Agresti-Coll, para sa pamamaraang Wilson ay kinakalkula gamit ang isang online na calculator na binuo ni Jeff Sauro (http://www./wald.htm). Ang continuity-corrected Wilson confidence interval ay kinakalkula gamit ang calculator na ibinigay ng Wassar Stats: Web Site for Statistical Computation (http://faculty.vassar.edu/lowry/prop1.html). Ang mga kalkulasyon gamit ang Fisher angular transformation ay isinagawa "manual" gamit ang kritikal na halaga ng t para sa 19 at 999 degrees ng kalayaan, ayon sa pagkakabanggit. Ang mga resulta ng pagkalkula ay ipinakita sa talahanayan para sa parehong mga halimbawa.

Ang mga pagitan ng kumpiyansa ay kinakalkula sa anim na magkakaibang paraan para sa dalawang halimbawang inilarawan sa teksto

Paraan ng Pagkalkula ng Agwat ng Kumpiyansa

P=0.0500, o 5%

95% CI para sa X=450, N=1000, P=0.4500, o 45%

–0,0455–0,2541

Walda na may Agresti-Coll correction

<,0001–0,2541

Wilson na may continuity correction

Ang "eksaktong pamamaraan" ni Klopper-Pearson

Angular na pagbabago

<0,0001–0,1967

Tulad ng makikita mula sa talahanayan, para sa unang halimbawa, ang agwat ng kumpiyansa na kinakalkula ng "pangkalahatang tinatanggap" na paraan ng Wald ay napupunta sa negatibong rehiyon, na hindi maaaring mangyari para sa mga frequency. Sa kasamaang palad, ang mga ganitong insidente ay hindi karaniwan sa panitikang Ruso. Ang tradisyunal na paraan ng pagkatawan ng data bilang isang dalas at ang error nito ay bahagyang tinatakpan ang problemang ito. Halimbawa, kung ang dalas ng paglitaw ng isang katangian (sa porsyento) ay ipinakita bilang 2.1 ± 1.4, kung gayon hindi ito "nakakairita" bilang 2.1% (95% CI: –0.7; 4.9), bagaman at pareho ang ibig sabihin. Ang Wald method na may Agresti-Coulle correction at ang pagkalkula gamit ang angular transformation ay nagbibigay ng lower bound tending to zero. Ang Wilson method na may continuity correction at ang "eksaktong paraan" ay nagbibigay ng mas malawak na confidence interval kaysa sa Wilson method. Para sa pangalawang halimbawa, ang lahat ng mga pamamaraan ay nagbibigay ng humigit-kumulang sa parehong mga agwat ng kumpiyansa (ang mga pagkakaiba ay lilitaw lamang sa ika-libo), na hindi nakakagulat, dahil ang dalas ng kaganapan sa halimbawang ito ay hindi gaanong naiiba sa 50%, at ang laki ng sample ay medyo malaki. .

Para sa mga mambabasa na interesado sa problemang ito, maaari naming irekomenda ang mga gawa ni R. G. Newcombe at Brown, Cai at Dasgupta, na nagbibigay ng mga kalamangan at kahinaan ng paggamit ng 7 at 10 iba't ibang paraan para sa pagkalkula ng mga agwat ng kumpiyansa, ayon sa pagkakabanggit. Mula sa mga domestic manual, ang libro at inirerekomenda, kung saan, bilang karagdagan sa isang detalyadong paglalarawan ng teorya, ang mga pamamaraan ni Wald, Wilson, pati na rin ang isang paraan para sa pagkalkula ng mga agwat ng kumpiyansa, na isinasaalang-alang ang pamamahagi ng binomial frequency, ay ipinakita. . Bilang karagdagan sa mga libreng online na calculator (http://www./wald.htm at http://faculty.vassar.edu/lowry/prop1.html), ang mga agwat ng kumpiyansa para sa mga frequency (at hindi lamang!) ay maaaring kalkulahin gamit ang CIA program ( Confidence Intervals Analysis), na maaaring i-download mula sa http://www. medschool. soton. ac. uk/cia/ .

Ang susunod na artikulo ay titingnan ang mga univariate na paraan upang ihambing ang qualitative data.

Bibliograpiya

Banerjee A. Mga istatistika ng medikal sa simpleng wika: isang panimulang kurso / A. Banerzhi. - M. : Praktikal na gamot, 2007. - 287 p. Medikal na istatistika / . - M. : Ahensya ng Impormasyong Medikal, 2007. - 475 p. Glanz S. Medico-biological statistics / S. Glants. - M. : Pagsasanay, 1998. Mga uri ng data, pag-verify ng pamamahagi at mga deskriptibong istatistika / // Human Ecology - 2008. - No. 1. - P. 52–58. Zhizhin K.S.. Medikal na istatistika: aklat-aralin / . - Rostov n / D: Phoenix, 2007. - 160 p. Inilapat na Medikal na Istatistika / , . - St. Petersburg. : Folio, 2003. - 428 p. Lakin G. F. Biometrics / . - M. : Mas mataas na paaralan, 1990. - 350 p. Medikal V. A. Mga istatistika ng matematika sa medisina / , . - M. : Pananalapi at istatistika, 2007. - 798 p. Mga istatistika ng matematika sa klinikal na pananaliksik / , . - M. : GEOTAR-MED, 2001. - 256 p. Junkerov V. AT. Medico-statistical na pagproseso ng data ng medikal na pananaliksik /,. - St. Petersburg. : VmedA, 2002. - 266 p. Agresti A. Ang tinatayang ay mas mahusay kaysa sa eksaktong para sa pagitan ng pagtatantya ng mga binomial na sukat / A. Agresti, B. Coull // American statistician. - 1998. - N 52. - S. 119-126. Altman D. Mga istatistikang may kumpiyansa // D. Altman, D. Machin, T. Bryant, M. J. Gardner. - London: BMJ Books, 2000. - 240 p. Kayumanggi L.D. Pagtatantya ng pagitan para sa isang binomial na proporsyon / L. D. Brown, T. T. Cai, A. Dasgupta // Statistical science. - 2001. - N 2. - P. 101-133. Clopper C.J. Ang paggamit ng kumpiyansa o fiducial na mga limitasyon na inilalarawan sa kaso ng binomial / C. J. Clopper, E. S. Pearson // Biometrika. - 1934. - N 26. - P. 404-413. Garcia-Perez M. A. Sa pagitan ng kumpiyansa para sa binomial na parameter / M. A. Garcia-Perez // Kalidad at dami. - 2005. - N 39. - P. 467-481. Motulsky H. Intuitive biostatistics // H. Motulsky. - Oxford: Oxford University Press, 1995. - 386 p. Newcombe R.G. Two-Sided Confidence Intervals for the Single Proportion: Comparison of Seven Methods / R. G. Newcombe // Statistics in Medicine. - 1998. - N. 17. - P. 857–872. Sauro J. Pagtatantya ng mga rate ng pagkumpleto mula sa maliliit na sample gamit ang binomial confidence interval: paghahambing at rekomendasyon / J. Sauro, J. R. Lewis // Proceedings of the human factors and ergonomics society annual meeting. – Orlando, FL, 2005. Wald A. Mga limitasyon ng kumpiyansa para sa tuluy-tuloy na pamamahagi ng mga function // A. Wald, J. Wolfovitz // Mga Annals ng Mathematical Statistics. - 1939. - N 10. - P. 105–118. Wilson E. B. Probable inference, the law of succession, and statistical inference / E. B. Wilson // Journal of American Statistical Association. - 1927. - N 22. - P. 209-212.

MGA INTERVAL NG PAGTITIWALA PARA SA MGA PROPORTYON

A. M. Grjibovski

National Institute of Public Health, Oslo, Norway

Ang artikulo ay nagpapakita ng ilang mga pamamaraan para sa mga kalkulasyon ng mga agwat ng kumpiyansa para sa mga binomial na sukat, ibig sabihin, Wald, Wilson, arcsine, Agresti-Coull at eksaktong mga pamamaraan ng Clopper-Pearson. Ang papel ay nagbibigay lamang ng pangkalahatang pagpapakilala sa problema ng pagtatantya ng agwat ng kumpiyansa ng isang binomial na proporsyon at ang layunin nito ay hindi lamang upang pasiglahin ang mga mambabasa na gumamit ng mga agwat ng kumpiyansa kapag naglalahad ng mga resulta ng sariling empirical na mga agwat ng pananaliksik, ngunit upang hikayatin din silang kumonsulta sa mga aklat ng istatistika bago. sa pagsusuri ng sariling datos at paghahanda ng mga manuskrito.

susing salita: agwat ng kumpiyansa, proporsyon

Impormasyon sa Pakikipag-ugnayan:

Senior Advisor, National Institute of Public Health, Oslo, Norway