Ang pagitan ng kumpiyansa para sa pagtatantya ng mean (kilala ang pagkakaiba) sa MS EXCEL.

Agwat ng kumpiyansa– ang paglilimita ng mga halaga ng isang istatistikal na dami na, na may ibinigay na probabilidad ng kumpiyansa γ, ay nasa pagitan na ito kapag nagsa-sample ng mas malaking volume. Tinutukoy bilang P(θ - ε. Sa pagsasagawa, ang probabilidad ng kumpiyansa na γ ay pinili mula sa mga halagang medyo malapit sa pagkakaisa: γ = 0.9, γ = 0.95, γ = 0.99.

Layunin ng serbisyo. Gamit ang serbisyong ito, matutukoy mo:

agwat ng kumpiyansa para sa pangkalahatang mean, agwat ng kumpiyansa para sa pagkakaiba;
confidence interval para sa standard deviation, confidence interval para sa general share;

Ang resultang solusyon ay nai-save sa isang Word file (tingnan ang halimbawa). Nasa ibaba ang isang video na pagtuturo kung paano punan ang paunang data.

Halimbawa Blg. 1. Sa isang kolektibong bukid, sa kabuuang kawan ng 1000 tupa, 100 tupa ang sumailalim sa selective control shearing. Bilang isang resulta, ang isang average na gupit ng lana na 4.2 kg bawat tupa ay itinatag. Tukuyin na may probabilidad na 0.99 ang mean square error ng sample kapag tinutukoy ang average na paggugupit ng lana bawat tupa at ang mga limitasyon kung saan nakapaloob ang halaga ng paggugupit kung ang pagkakaiba ay 2.5. Ang sample ay hindi paulit-ulit.
Halimbawa Blg. 2. Mula sa isang batch ng mga imported na produkto sa post ng Moscow Northern Customs, 20 sample ng produkto "A" ang kinuha sa pamamagitan ng random na paulit-ulit na sampling. Bilang resulta ng pagsubok, ang average na nilalaman ng kahalumigmigan ng produkto na "A" sa sample ay itinatag, na naging katumbas ng 6% na may karaniwang paglihis ng 1%.
Tukuyin nang may posibilidad na 0.683 ang mga limitasyon ng average na nilalaman ng kahalumigmigan ng produkto sa buong batch ng mga imported na produkto.
Halimbawa Blg. 3. Sa isang survey sa 36 na mag-aaral ay nagpakita na ang average na bilang ng mga textbook na binabasa nila noong academic year ay katumbas ng 6. Ipagpalagay na ang bilang ng mga textbook na binabasa ng isang mag-aaral bawat semestre ay may normal na batas sa pamamahagi na may standard deviation na katumbas ng 6, hanapin : A) na may reliability na 0 .99 interval estimate para sa mathematical expectation ng random variable na ito; B) sa anong posibilidad na masasabi natin na ang average na bilang ng mga aklat-aralin na binabasa ng isang mag-aaral bawat semestre, na kinakalkula mula sa sample na ito, ay lilihis mula sa inaasahan sa matematika sa ganap na halaga ng hindi hihigit sa 2.

Pag-uuri ng mga agwat ng kumpiyansa

Sa pamamagitan ng uri ng parameter na sinusuri:

Ayon sa uri ng sample:

Agwat ng kumpiyansa para sa isang walang katapusang sample;
Agwat ng kumpiyansa para sa huling sample;

Ang sample ay tinatawag na resampling, kung ang napiling bagay ay ibinalik sa populasyon bago piliin ang susunod. Ang sample ay tinatawag na non-repeat, kung ang napiling bagay ay hindi ibinalik sa populasyon. Sa pagsasagawa, kadalasan ay nakikitungo kami sa mga hindi paulit-ulit na sample.

Pagkalkula ng average sampling error para sa random sampling

Ang pagkakaiba sa pagitan ng mga halaga ng mga tagapagpahiwatig na nakuha mula sa sample at ang kaukulang mga parameter ng pangkalahatang populasyon ay tinatawag pagkakamali sa pagiging kinatawan.
Mga pagtatalaga ng mga pangunahing parameter ng pangkalahatan at sample na populasyon.

Average na mga formula ng error sa pag-sample
muling pagpili		ulitin ang pagpili
para sa karaniwan	para ibahagi	para sa karaniwan	para ibahagi

Ang ugnayan sa pagitan ng limitasyon ng error sa pag-sample (Δ) ay ginagarantiyahan na may ilang posibilidad Р(t), at ang karaniwang error sa sampling ay may anyo: o Δ = t·μ, kung saan t– koepisyent ng kumpiyansa, tinutukoy depende sa antas ng posibilidad na P(t) ayon sa talahanayan ng Laplace integral function.

Mga formula para sa pagkalkula ng laki ng sample gamit ang isang random na paraan ng sampling

Pagtataya ng Mga Pagitan ng Kumpiyansa

Mga Layunin sa pag-aaral

Isinasaalang-alang ng mga istatistika ang mga sumusunod dalawang pangunahing gawain:

Mayroon kaming ilang pagtatantya batay sa sample na data, at gusto naming gumawa ng ilang probabilistikong pahayag tungkol sa kung saan matatagpuan ang totoong halaga ng tinantyang parameter.

Mayroon kaming partikular na hypothesis na kailangang masuri gamit ang sample na data.

Sa paksang ito isasaalang-alang natin ang unang gawain. Ipakilala din natin ang kahulugan ng agwat ng kumpiyansa.

Ang agwat ng kumpiyansa ay isang agwat na binuo sa paligid ng tinantyang halaga ng isang parameter at nagpapakita kung saan matatagpuan ang tunay na halaga ng tinantyang parameter na may isang priori na tinukoy na posibilidad.

Pagkatapos pag-aralan ang materyal sa paksang ito, ikaw ay:

alamin kung ano ang agwat ng kumpiyansa para sa isang pagtatantya;

matutong pag-uri-uriin ang mga problema sa istatistika;

makabisado ang pamamaraan ng pagbuo ng mga agwat ng kumpiyansa, kapwa gamit ang mga istatistikal na formula at paggamit ng mga tool sa software;

matutong tukuyin ang mga kinakailangang laki ng sample para makamit ang ilang partikular na parameter ng katumpakan ng mga istatistikal na pagtatantya.

Pamamahagi ng mga katangian ng sample

T-pamamahagi

Gaya ng tinalakay sa itaas, ang distribusyon ng random variable ay malapit sa standardized normal distribution na may mga parameter na 0 at 1. Dahil hindi natin alam ang halaga ng σ, pinapalitan natin ito ng ilang pagtatantya ng s. Ang dami ay mayroon nang ibang distribusyon, ibig sabihin, o Pamamahagi ng mag-aaral, na tinutukoy ng parameter n -1 (ang bilang ng mga antas ng kalayaan). Ang distribusyon na ito ay malapit sa normal na distribusyon (mas malaki n, mas malapit ang mga distribusyon).

Sa Fig. 95
ipinakita ang pamamahagi ng Mag-aaral na may 30 digri ng kalayaan. Tulad ng nakikita mo, ito ay napakalapit sa normal na pamamahagi.

Katulad ng mga function para sa pagtatrabaho sa normal na distribution NORMIDIST at NORMINV, may mga function para sa pagtatrabaho sa t-distribution - STUDIST (TDIST) at STUDRASOBR (TINV). Ang isang halimbawa ng paggamit ng mga function na ito ay makikita sa file na STUDRASP.XLS (template at solusyon) at sa Fig. 96
.

Pamamahagi ng iba pang mga katangian

Tulad ng alam na natin, upang matukoy ang katumpakan ng pagtantya ng inaasahan sa matematika, kailangan natin ng t-distribution. Upang matantya ang iba pang mga parameter, tulad ng pagkakaiba-iba, kinakailangan ang iba't ibang mga distribusyon. Dalawa sa kanila ay ang F-distribution at x 2 -pamamahagi.

Ang pagitan ng kumpiyansa para sa mean

Agwat ng kumpiyansa- ito ay isang agwat na binuo sa paligid ng tinantyang halaga ng parameter at nagpapakita kung saan matatagpuan ang tunay na halaga ng tinantyang parameter na may isang priori na tinukoy na posibilidad.

Ang pagbuo ng isang agwat ng kumpiyansa para sa average na halaga ay nangyayari sa sumusunod na paraan:

Halimbawa

Plano ng fast food restaurant na palawakin ang assortment nito gamit ang bagong uri ng sandwich. Upang matantya ang pangangailangan para dito, plano ng manager na random na pumili ng 40 bisita mula sa mga nakasubok na nito at hilingin sa kanila na i-rate ang kanilang saloobin sa bagong produkto sa isang sukat mula 1 hanggang 10. Gusto ng manager na tantiyahin ang inaasahang bilang ng mga puntos na matatanggap ng bagong produkto at bubuo ng 95% confidence interval para sa pagtatantyang ito. Paano ito gawin? (tingnan ang file na SANDWICH1.XLS (template at solusyon).

Solusyon

Upang malutas ang problemang ito maaari mong gamitin ang . Ang mga resulta ay ipinakita sa Fig. 97
.

Agwat ng kumpiyansa para sa kabuuang halaga

Minsan, gamit ang sample na data, kinakailangan na tantyahin hindi ang inaasahan sa matematika, ngunit ang kabuuang kabuuan ng mga halaga. Halimbawa, sa isang sitwasyon sa isang auditor, ang interes ay maaaring hindi sa pagtatantya ng average na laki ng account, ngunit ang kabuuan ng lahat ng mga account.

Hayaan ang N ang kabuuang bilang ng mga elemento, n ang laki ng sample, ang T 3 ang kabuuan ng mga halaga sa sample, ang T" ay ang pagtatantya para sa kabuuan ng buong populasyon, pagkatapos , at ang pagitan ng kumpiyansa ay kinakalkula ng formula , kung saan ang s ay ang pagtatantya ng karaniwang paglihis para sa sample, at ang pagtatantya ng mean para sa sample.

Halimbawa

Sabihin nating gustong tantyahin ng isang ahensya ng buwis ang kabuuang mga refund ng buwis para sa 10,000 nagbabayad ng buwis. Ang nagbabayad ng buwis ay maaaring makatanggap ng refund o magbabayad ng mga karagdagang buwis. Hanapin ang 95% na agwat ng kumpiyansa para sa halaga ng refund, kung ipagpalagay na ang laki ng sample na 500 tao (tingnan ang file na HALAGA NG REFUND.XLS (template at solusyon).

Solusyon

Ang StatPro ay walang espesyal na pamamaraan para sa kasong ito, gayunpaman, mapapansin na ang mga hangganan ay maaaring makuha mula sa mga hangganan para sa average batay sa mga formula sa itaas (Fig. 98
).

Agwat ng kumpiyansa para sa proporsyon

Hayaan ang p ay ang matematikal na inaasahan ng bahagi ng mga kliyente, at hayaang p b ang pagtatantya ng bahaging ito na nakuha mula sa isang sample ng laki n. Maaari itong ipakita na para sa sapat na malaki ang distribusyon ng pagtatasa ay magiging malapit sa normal na may mathematical expectation p at standard deviation . Ang karaniwang error ng pagtatantya sa kasong ito ay ipinahayag bilang , at ang agwat ng kumpiyansa ay bilang .

Halimbawa

Plano ng fast food restaurant na palawakin ang assortment nito gamit ang bagong uri ng sandwich. Upang masuri ang pangangailangan para dito, random na pumili ang manager ng 40 bisita mula sa mga nakasubok na nito at hiniling sa kanila na i-rate ang kanilang saloobin sa bagong produkto sa isang sukat mula 1 hanggang 10. Nais tantiyahin ng manager ang inaasahang proporsyon ng mga customer na nagre-rate ng bagong produkto ng hindi bababa sa 6 na puntos (inaasahan niya na ang mga customer na ito ay ang mga mamimili ng bagong produkto).

Solusyon

Sa una, gumawa kami ng bagong column batay sa attribute 1 kung ang rating ng kliyente ay higit sa 6 na puntos at 0 kung hindi man (tingnan ang file na SANDWICH2.XLS (template at solusyon).

Paraan 1

Sa pamamagitan ng pagbilang ng bilang ng 1, tinatantya namin ang bahagi, at pagkatapos ay ginagamit ang mga formula.

Ang zcr value ay kinuha mula sa mga espesyal na normal na distribution table (halimbawa, 1.96 para sa isang 95% confidence interval).

Gamit ang diskarteng ito at tiyak na data upang makabuo ng 95% na pagitan, nakuha namin ang mga sumusunod na resulta (Larawan 99
). Ang kritikal na halaga ng parameter na zcr ay 1.96. Ang karaniwang error ng pagtatantya ay 0.077. Ang mas mababang limitasyon ng agwat ng kumpiyansa ay 0.475. Ang pinakamataas na limitasyon ng agwat ng kumpiyansa ay 0.775. Kaya, ang manager ay may karapatang maniwala nang may 95% kumpiyansa na ang porsyento ng mga customer na nagre-rate ng bagong produkto ng 6 na puntos o mas mataas ay nasa pagitan ng 47.5 at 77.5.

Paraan 2

Ang problemang ito ay maaaring malutas gamit ang mga karaniwang tool ng StatPro. Upang gawin ito, sapat na tandaan na ang bahagi sa kasong ito ay tumutugma sa average na halaga ng hanay ng Uri. Susunod na mag-apply kami StatPro/Statistical Inference/One-Sample na Pagsusuri para bumuo ng confidence interval ng mean (estimate ng mathematical expectation) para sa Type column. Ang mga resulta na nakuha sa kasong ito ay magiging napakalapit sa mga resulta ng 1st method (Fig. 99).

Agwat ng kumpiyansa para sa karaniwang paglihis

s ay ginagamit bilang isang pagtatantya ng karaniwang paglihis (ang formula ay ibinigay sa Seksyon 1). Ang function ng density ng pagtatantya s ay ang chi-square function, na, tulad ng t-distribution, ay may n-1 degrees ng kalayaan. May mga espesyal na function para sa pagtatrabaho sa pamamahaging ito ng CHIDIST at CHIINV.

Ang agwat ng kumpiyansa sa kasong ito ay hindi na magiging simetriko. Ang isang maginoo na diagram ng hangganan ay ipinapakita sa Fig. 100 .

Halimbawa

Ang makina ay dapat gumawa ng mga bahagi na may diameter na 10 cm. Gayunpaman, dahil sa iba't ibang mga pangyayari, ang mga pagkakamali ay nangyayari. Ang controller ng kalidad ay nag-aalala tungkol sa dalawang pangyayari: una, ang average na halaga ay dapat na 10 cm; pangalawa, kahit na sa kasong ito, kung ang mga paglihis ay malaki, kung gayon maraming bahagi ang tatanggihan. Araw-araw ay gumagawa siya ng sample ng 50 parts (tingnan ang file QUALITY CONTROL.XLS (template and solution). Anong mga konklusyon ang maibibigay ng naturang sample?

Solusyon

Bumuo tayo ng 95% confidence interval para sa mean at standard deviation gamit StatPro/Statistical Inference/One-Sample na Pagsusuri(Larawan 101
).

Susunod, gamit ang pagpapalagay ng isang normal na pamamahagi ng mga diameters, kinakalkula namin ang proporsyon ng mga may sira na produkto, na nagtatakda ng maximum na paglihis ng 0.065. Gamit ang mga kakayahan ng talahanayan ng pagpapalit (ang kaso ng dalawang mga parameter), inilalagay namin ang pagtitiwala sa proporsyon ng mga depekto sa average na halaga at karaniwang paglihis (Larawan 102).
).

Agwat ng kumpiyansa para sa pagkakaiba sa pagitan ng dalawang paraan

Ito ay isa sa pinakamahalagang aplikasyon ng mga pamamaraang istatistika. Mga halimbawa ng mga sitwasyon.

Gustong malaman ng isang manager ng tindahan ng damit kung magkano o mas kaunti ang ginagastos ng karaniwang babaeng customer sa tindahan kaysa sa karaniwang lalaking customer.

Ang dalawang airline ay lumilipad ng magkatulad na ruta. Gusto ng isang organisasyon ng consumer na ihambing ang pagkakaiba sa pagitan ng average na inaasahang oras ng pagkaantala ng flight para sa parehong airline.

Ang kumpanya ay nagpapadala ng mga kupon para sa ilang uri ng mga kalakal sa isang lungsod at hindi sa isa pa. Gusto ng mga manager na ihambing ang average na dami ng pagbili ng mga produktong ito sa susunod na dalawang buwan.

Ang isang dealer ng kotse ay madalas na nakikipag-ugnayan sa mga mag-asawa sa mga presentasyon. Upang maunawaan ang kanilang mga personal na reaksyon sa pagtatanghal, ang mga mag-asawa ay madalas na hiwalay na kapanayamin. Gusto ng manager na suriin ang pagkakaiba sa mga rating na ibinigay ng mga lalaki at babae.

Kaso ng mga independiyenteng sample

Ang pagkakaiba sa pagitan ng mga paraan ay magkakaroon ng t-distribution na may n 1 + n 2 - 2 degrees ng kalayaan. Ang agwat ng kumpiyansa para sa μ 1 - μ 2 ay ipinahayag ng kaugnayan:

Ang problemang ito ay maaaring malutas hindi lamang gamit ang mga formula sa itaas, kundi pati na rin ang paggamit ng mga karaniwang tool ng StatPro. Upang gawin ito, ito ay sapat na upang gamitin

Agwat ng kumpiyansa para sa pagkakaiba sa pagitan ng mga sukat

Hayaan ang mathematical na inaasahan ng mga pagbabahagi. Hayaan ang kanilang mga sample na pagtatantya, na binuo mula sa mga sample ng laki n 1 at n 2, ayon sa pagkakabanggit. Pagkatapos ay isang pagtatantya para sa pagkakaiba. Samakatuwid, ang agwat ng kumpiyansa ng pagkakaibang ito ay ipinahayag bilang:

Dito, ang z cr ay isang value na nakuha mula sa isang normal na distribution gamit ang mga espesyal na talahanayan (halimbawa, 1.96 para sa isang 95% confidence interval).

Ang karaniwang error ng pagtatantya ay ipinahayag sa kasong ito ng kaugnayan:

Halimbawa

Ang tindahan, naghahanda para sa isang malaking sale, ay nagsagawa ng sumusunod na pananaliksik sa marketing. Ang nangungunang 300 na mamimili ay pinili at random na hinati sa dalawang grupo ng 150 miyembro bawat isa. Ang lahat ng napiling customer ay pinadalhan ng mga imbitasyon upang lumahok sa sale, ngunit ang mga miyembro lamang ng unang pangkat ang nakatanggap ng kupon na nagbibigay sa kanila ng 5% na diskwento. Sa panahon ng pagbebenta, ang mga pagbili ng lahat ng 300 napiling mamimili ay naitala. Paano mabibigyang-kahulugan ng isang tagapamahala ang mga resulta at gumawa ng paghatol tungkol sa pagiging epektibo ng mga kupon? (tingnan ang file COUPONS.XLS (template at solusyon)).

Solusyon

Para sa aming partikular na kaso, sa 150 na customer na nakatanggap ng discount coupon, 55 ang bumili sa pagbebenta, at sa 150 na hindi nakatanggap ng coupon, 35 lang ang bumili (Fig. 103
). Pagkatapos ang mga halaga ng mga proporsyon ng sample ay 0.3667 at 0.2333, ayon sa pagkakabanggit. At ang sample na pagkakaiba sa pagitan ng mga ito ay katumbas ng 0.1333, ayon sa pagkakabanggit. Sa pag-aakalang 95% ang pagitan ng kumpiyansa, makikita natin mula sa normal na talahanayan ng pamamahagi z cr = 1.96. Ang pagkalkula ng karaniwang error ng sample na pagkakaiba ay 0.0524. Sa wakas ay nalaman namin na ang mas mababang limitasyon ng 95% na agwat ng kumpiyansa ay 0.0307, at ang pinakamataas na limitasyon ay 0.2359, ayon sa pagkakabanggit. Ang mga resultang nakuha ay maaaring bigyang-kahulugan sa paraang para sa bawat 100 customer na nakatanggap ng discount coupon, maaari naming asahan mula 3 hanggang 23 bagong customer. Gayunpaman, dapat nating tandaan na ang konklusyon na ito mismo ay hindi nangangahulugan ng pagiging epektibo ng paggamit ng mga kupon (dahil sa pagbibigay ng diskwento, nawawalan tayo ng kita!). Ipakita natin ito gamit ang partikular na data. Ipagpalagay natin na ang average na laki ng pagbili ay 400 rubles, kung saan 50 rubles. may tubo para sa tindahan. Kung gayon ang inaasahang kita sa 100 customer na hindi nakatanggap ng kupon ay:

50 0.2333 100 = 1166.50 kuskusin.

Mga katulad na kalkulasyon para sa 100 customer na nakatanggap ng coupon give:

30 0.3667 100 = 1100.10 kuskusin.

Ang pagbaba sa average na kita sa 30 ay ipinaliwanag sa pamamagitan ng ang katunayan na, gamit ang diskwento, ang mga customer na nakatanggap ng isang kupon ay sa average na gagawa ng isang pagbili para sa 380 rubles.

Kaya, ang pangwakas na konklusyon ay nagpapahiwatig ng hindi pagiging epektibo ng paggamit ng naturang mga kupon sa partikular na sitwasyong ito.

Magkomento. Ang problemang ito ay maaaring malutas gamit ang mga karaniwang tool ng StatPro. Upang gawin ito, sapat na upang bawasan ang problemang ito sa problema ng pagtantya ng pagkakaiba sa pagitan ng dalawang average gamit ang pamamaraan, at pagkatapos ay ilapat StatPro/Statistical Inference/Two-Sample Analysis upang bumuo ng agwat ng kumpiyansa para sa pagkakaiba sa pagitan ng dalawang average na halaga.

Pagkontrol sa Haba ng Pagitan ng Kumpiyansa

Ang haba ng agwat ng kumpiyansa ay nakasalalay sa sumusunod na mga kondisyon:

direktang data (standard deviation);

antas ng kahalagahan;

laki ng sample.

Laki ng sample para sa pagtatantya ng mean

Una, isaalang-alang natin ang problema sa pangkalahatang kaso. Tukuyin natin ang halaga ng kalahati ng haba ng agwat ng kumpiyansa na ibinigay sa atin bilang B (Larawan 104
). Alam namin na ang agwat ng kumpiyansa para sa mean na halaga ng ilang random variable X ay ipinahayag bilang , Saan . Naniniwala:

at pagpapahayag n, nakukuha natin .

Sa kasamaang palad, hindi namin alam ang eksaktong halaga ng pagkakaiba ng random variable X. Bilang karagdagan, hindi natin alam ang halaga ng tcr, dahil ito ay nakasalalay sa n sa pamamagitan ng bilang ng mga antas ng kalayaan. Sa sitwasyong ito, magagawa natin ang mga sumusunod. Sa halip na variance s, gumagamit kami ng ilang pagtatantya ng variance batay sa anumang magagamit na pagpapatupad ng random variable na pinag-aaralan. Sa halip na ang halaga ng t cr, ginagamit namin ang halaga ng z cr para sa normal na distribusyon. Ito ay lubos na katanggap-tanggap, dahil ang mga function ng density ng pamamahagi para sa normal at t-distribusyon ay napakalapit (maliban sa kaso ng maliit na n). Kaya, ang kinakailangang pormula ay tumatagal ng anyo:

Dahil ang formula ay nagbibigay, sa pangkalahatan, hindi-integer na mga resulta, ang pag-round na may labis sa resulta ay kinukuha bilang ang nais na laki ng sample.

Halimbawa

Plano ng fast food restaurant na palawakin ang assortment nito gamit ang bagong uri ng sandwich. Upang masuri ang pangangailangan para dito, pinaplano ng manager na random na pumili ng bilang ng mga bisita mula sa mga nakasubok na nito at hilingin sa kanila na i-rate ang kanilang saloobin sa bagong produkto sa sukat mula 1 hanggang 10. Nais tantyahin ng manager ang inaasahang bilang ng mga puntos na matatanggap ng bagong produkto ng produkto at bumuo ng 95% confidence interval para sa pagtatantyang ito. Kasabay nito, nais niyang ang kalahating lapad ng pagitan ng kumpiyansa ay hindi lalampas sa 0.3. Ilang bisita ang kailangan niyang makapanayam?

tulad ng sumusunod:

Dito r ots ay isang pagtatantya ng proporsyon p, at ang B ay isang ibinigay na kalahati ng haba ng agwat ng kumpiyansa. Ang isang labis na pagtatantya para sa n ay maaaring makuha gamit ang halaga r ots= 0.5. Sa kasong ito, ang haba ng agwat ng kumpiyansa ay hindi lalampas sa tinukoy na halaga B para sa anumang tunay na halaga ng p.

Halimbawa

Hayaang magplano ang manager mula sa nakaraang halimbawa na tantyahin ang bahagi ng mga customer na mas gusto ang isang bagong uri ng produkto. Gusto niyang bumuo ng 90% confidence interval na ang kalahating haba ay hindi lalampas sa 0.05. Ilang kliyente ang dapat isama sa random na sample?

Solusyon

Sa aming kaso, ang halaga ng z cr = 1.645. Samakatuwid, ang kinakailangang dami ay kinakalkula bilang .

Kung ang tagapamahala ay may dahilan upang maniwala na ang nais na p-value ay, halimbawa, humigit-kumulang 0.3, pagkatapos ay sa pamamagitan ng pagpapalit ng halagang ito sa formula sa itaas, makakakuha tayo ng isang mas maliit na random na sample na halaga, katulad ng 228.

Formula para sa pagtukoy random na laki ng sample sa kaso ng pagkakaiba sa pagitan ng dalawang paraan nakasulat bilang:

Halimbawa

May customer service center ang ilang kumpanya ng kompyuter. Kamakailan, tumaas ang bilang ng mga reklamo ng customer tungkol sa mahinang kalidad ng serbisyo. Ang sentro ng serbisyo ay pangunahing gumagamit ng dalawang uri ng mga empleyado: ang mga walang gaanong karanasan, ngunit nakatapos ng mga espesyal na kurso sa paghahanda, at ang mga may malawak na praktikal na karanasan, ngunit hindi nakatapos ng mga espesyal na kurso. Nais ng kumpanya na suriin ang mga reklamo ng customer sa nakalipas na anim na buwan at ihambing ang average na bilang ng mga reklamo para sa bawat isa sa dalawang grupo ng mga empleyado. Ipinapalagay na ang mga numero sa mga sample para sa parehong grupo ay magiging pareho. Ilang empleyado ang dapat isama sa sample upang makakuha ng 95% interval na may kalahating haba na hindi hihigit sa 2?

Solusyon

Narito ang σ ots ay isang pagtatantya ng karaniwang paglihis ng parehong mga random na variable sa ilalim ng pagpapalagay na sila ay malapit. Kaya, sa aming problema kailangan naming makuha ang pagtatantya na ito. Ito ay maaaring gawin, halimbawa, tulad ng sumusunod. Ang pagkakaroon ng pagtingin sa data sa mga reklamo ng customer sa nakalipas na anim na buwan, maaaring mapansin ng isang manager na ang bawat empleyado ay karaniwang tumatanggap ng mula 6 hanggang 36 na reklamo. Alam na para sa isang normal na pamamahagi halos lahat ng mga halaga ay hindi hihigit sa tatlong karaniwang paglihis ang layo mula sa mean, makatwirang maniniwala siya na:

, mula sa kung saan σ ots = 5.

Ang pagpapalit ng halagang ito sa formula, nakukuha namin .

Formula para sa pagtukoy random na laki ng sample kung sakaling matantya ang pagkakaiba sa pagitan ng mga proporsyon ay may anyo:

Halimbawa

Ang ilang kumpanya ay may dalawang pabrika na gumagawa ng mga katulad na produkto. Nais ng isang manager ng kumpanya na ihambing ang porsyento ng mga may sira na produkto sa parehong mga pabrika. Ayon sa magagamit na impormasyon, ang rate ng depekto sa parehong mga pabrika ay mula 3 hanggang 5%. Ito ay nilayon na bumuo ng 99% confidence interval na may kalahating haba na hindi hihigit sa 0.005 (o 0.5%). Ilang produkto ang dapat piliin mula sa bawat pabrika?

Solusyon

Narito ang p 1ots at p 2ots ay mga pagtatantya ng dalawang hindi kilalang bahagi ng mga depekto sa 1st at 2nd factory. Kung maglalagay tayo ng p 1ots = p 2ots = 0.5, pagkatapos ay makakakuha tayo ng overestimated na halaga para sa n. Ngunit dahil sa aming kaso mayroon kaming ilang priori na impormasyon tungkol sa mga pagbabahaging ito, kinukuha namin ang itaas na pagtatantya ng mga pagbabahagi na ito, katulad ng 0.05. Nakukuha namin

Kapag tinatantya ang ilang parameter ng populasyon mula sa sample na data, kapaki-pakinabang na magbigay hindi lamang ng point estimate ng parameter, ngunit magbigay din ng confidence interval na nagpapakita kung saan ang eksaktong halaga ng parameter na tinatantya ay maaaring nasa.

Sa kabanatang ito, nakilala rin namin ang mga quantitative na relasyon na nagpapahintulot sa amin na bumuo ng mga ganoong agwat para sa iba't ibang mga parameter; natutunan ang mga paraan upang makontrol ang haba ng agwat ng kumpiyansa.

Tandaan din na ang problema sa pagtatantya ng mga laki ng sample (ang problema sa pagpaplano ng isang eksperimento) ay maaaring malutas gamit ang mga karaniwang tool ng StatPro, katulad StatPro/Statistical Inference/Sample Size Selection.

Ang agwat ng kumpiyansa ay dumating sa amin mula sa larangan ng mga istatistika. Ito ay isang tiyak na hanay na nagsisilbing tantyahin ang isang hindi kilalang parameter na may mataas na antas ng pagiging maaasahan. Ang pinakamadaling paraan upang ipaliwanag ito ay sa pamamagitan ng isang halimbawa.

Ipagpalagay na kailangan mong pag-aralan ang ilang random na variable, halimbawa, ang bilis ng pagtugon ng server sa isang kahilingan ng kliyente. Sa tuwing ita-type ng user ang address ng isang partikular na site, tumutugon ang server sa iba't ibang bilis. Kaya, ang oras ng pagtugon sa ilalim ng pag-aaral ay random. Kaya, ang agwat ng kumpiyansa ay nagpapahintulot sa amin na matukoy ang mga hangganan ng parameter na ito, at pagkatapos ay maaari naming sabihin na may 95% na posibilidad na ang server ay nasa saklaw na aming kinakalkula.

O kailangan mong malaman kung gaano karaming tao ang nakakaalam tungkol sa trademark ng kumpanya. Kapag kinakalkula ang agwat ng kumpiyansa, posibleng sabihin, halimbawa, na may 95% na posibilidad ang bahagi ng mga mamimili na nakakaalam nito ay nasa saklaw mula 27% hanggang 34%.

Ang malapit na nauugnay sa terminong ito ay ang halaga ng posibilidad ng kumpiyansa. Kinakatawan nito ang posibilidad na ang nais na parameter ay kasama sa pagitan ng kumpiyansa. Kung gaano kalaki ang ating gustong hanay ay depende sa halagang ito. Kung mas malaki ang halaga na kailangan, mas makitid ang pagitan ng kumpiyansa, at kabaliktaran. Kadalasan ito ay nakatakda sa 90%, 95% o 99%. Ang halagang 95% ang pinakasikat.

Ang indicator na ito ay naiimpluwensyahan din ng dispersion ng mga obserbasyon at ang depinisyon nito ay batay sa pag-aakalang sumusunod ang katangiang pinag-aaralan.Ang pahayag na ito ay kilala rin bilang Gauss’s Law. Ayon sa kanya, ang normal ay isang distribusyon ng lahat ng probabilities ng isang tuluy-tuloy na random variable na maaaring ilarawan ng probability density. Kung ang pagpapalagay ng isang normal na distribusyon ay hindi tama, kung gayon ang pagtatantya ay maaaring mali.

Una, alamin natin kung paano kalkulahin ang agwat ng kumpiyansa para sa Mayroong dalawang posibleng mga kaso dito. Ang dispersion (ang antas ng pagkalat ng isang random na variable) ay maaaring malaman o hindi. Kung ito ay kilala, kung gayon ang aming agwat ng kumpiyansa ay kinakalkula gamit ang sumusunod na formula:

xsr - t*σ / (sqrt(n))<= α <= хср + t*σ / (sqrt(n)), где

α - tanda,

t - parameter mula sa talahanayan ng pamamahagi ng Laplace,

σ ay ang square root ng variance.

Kung hindi alam ang pagkakaiba, maaari itong kalkulahin kung alam natin ang lahat ng mga halaga ng nais na tampok. Ang sumusunod na formula ay ginagamit para dito:

σ2 = х2ср - (хср)2, kung saan

х2ср - average na halaga ng mga parisukat ng pinag-aralan na katangian,

(хср)2 ang parisukat ng katangiang ito.

Ang formula kung saan kinakalkula ang agwat ng kumpiyansa sa kasong ito ay bahagyang nagbabago:

xsr - t*s / (sqrt(n))<= α <= хср + t*s / (sqrt(n)), где

xsr - sample average,

α - tanda,

Ang t ay isang parameter na matatagpuan gamit ang talahanayan ng pamamahagi ng Mag-aaral t = t(ɣ;n-1),

sqrt(n) - square root ng kabuuang laki ng sample,

s ay ang square root ng variance.

Isaalang-alang ang halimbawang ito. Ipagpalagay na batay sa mga resulta ng 7 mga sukat, ang pinag-aralan na katangian ay natukoy na katumbas ng 30 at ang sample na pagkakaiba ay katumbas ng 36. Ito ay kinakailangan upang makahanap, na may posibilidad na 99%, isang agwat ng kumpiyansa na naglalaman ng totoo halaga ng sinusukat na parameter.

Una, tukuyin natin kung ano ang katumbas ng t: t = t (0.99; 7-1) = 3.71. Gamit ang formula sa itaas, nakukuha namin:

xsr - t*s / (sqrt(n))<= α <= хср + t*s / (sqrt(n))

30 - 3.71*36 / (sqrt(7))<= α <= 30 + 3.71*36 / (sqrt(7))

21.587 <= α <= 38.413

Ang agwat ng kumpiyansa para sa pagkakaiba ay kinakalkula kapwa sa kaso ng isang kilalang mean at kapag walang data sa inaasahan sa matematika, at tanging ang halaga ng puntong walang pinapanigan na pagtatantya ng pagkakaiba ang nalalaman. Hindi kami magbibigay ng mga formula para sa pagkalkula dito, dahil ang mga ito ay medyo kumplikado at, kung ninanais, ay palaging matatagpuan sa Internet.

Tandaan lamang natin na maginhawa upang matukoy ang agwat ng kumpiyansa gamit ang Excel o isang serbisyo sa network, na tinatawag na ganoong paraan.

Mga pagitan ng kumpiyansa.

Ang pagkalkula ng agwat ng kumpiyansa ay batay sa average na error ng kaukulang parameter. Agwat ng kumpiyansa nagpapakita sa loob ng kung anong mga limitasyon sa probabilidad (1-a) ang totoong halaga ng tinantyang parameter. Narito ang isang antas ng kabuluhan, (1-a) ay tinatawag ding posibilidad ng kumpiyansa.

Sa unang kabanata ipinakita namin na, halimbawa, para sa arithmetic mean, ang totoong populasyon na ibig sabihin sa humigit-kumulang 95% ng mga kaso ay nasa loob ng 2 karaniwang error ng mean. Kaya, ang mga hangganan ng 95% na agwat ng kumpiyansa para sa mean ay ihihiwalay mula sa sample mean ng dalawang beses sa mean error ng mean, i.e. pinaparami natin ang average na error ng mean sa isang tiyak na koepisyent depende sa antas ng kumpiyansa. Para sa average at pagkakaiba ng mga average, kukunin ang Student coefficient (kritikal na halaga ng pagsusulit ng Estudyante), para sa bahagi at pagkakaiba ng mga share, ang kritikal na halaga ng z criterion. Ang produkto ng koepisyent at ang average na error ay maaaring tawaging maximum na error ng isang ibinigay na parameter, i.e. ang maximum na maaari naming makuha kapag tinatasa ito.

Agwat ng kumpiyansa para sa ibig sabihin ng aritmetika : .

Narito ang sample mean;

Average na error ng arithmetic mean;

s – sample standard deviation;

f = n-1 (Koepisyent ng mag-aaral).

Agwat ng kumpiyansa para sa pagkakaiba ng arithmetic means :

Narito ang pagkakaiba sa pagitan ng sample na paraan;

- average na error ng pagkakaiba sa pagitan ng arithmetic means;

s 1 , s 2 – sample standard deviations;

n1,n2

Ang kritikal na halaga ng pagsusulit ng Mag-aaral para sa isang naibigay na antas ng kahalagahan a at ang bilang ng mga antas ng kalayaan f=n 1 +n 2-2 (Koepisyent ng mag-aaral).

Agwat ng kumpiyansa para sa pagbabahagi :

Narito ang d ay ang sample fraction;

– average na fraction error;

n– laki ng sample (laki ng pangkat);

Agwat ng kumpiyansa para sa pagkakaiba ng shares :

Narito ang pagkakaiba sa mga sample share;

– average na error ng pagkakaiba sa pagitan ng arithmetic means;

n1,n2– dami ng sample (bilang ng mga grupo);

Ang kritikal na halaga ng z criterion sa isang naibigay na antas ng kahalagahan a ( , , ).

Sa pamamagitan ng pagkalkula ng mga agwat ng kumpiyansa para sa pagkakaiba sa pagitan ng mga tagapagpahiwatig, kami, una, ay direktang nakikita ang mga posibleng halaga ng epekto, at hindi lamang ang pagtatantya ng punto nito. Pangalawa, maaari tayong gumawa ng konklusyon tungkol sa pagtanggap o pagtanggi sa null hypothesis at, pangatlo, maaari tayong gumawa ng konklusyon tungkol sa kapangyarihan ng pagsubok.

Kapag sinusubukan ang mga hypotheses gamit ang mga agwat ng kumpiyansa, dapat mong sundin ang sumusunod na panuntunan:

Kung ang 100(1-a) porsyento na agwat ng kumpiyansa ng pagkakaiba sa paraan ay hindi naglalaman ng zero, kung gayon ang mga pagkakaiba ay makabuluhan ayon sa istatistika sa antas ng kahalagahan a; sa kabaligtaran, kung ang pagitan na ito ay naglalaman ng zero, kung gayon ang mga pagkakaiba ay hindi makabuluhan ayon sa istatistika.

Sa katunayan, kung ang agwat na ito ay naglalaman ng zero, nangangahulugan ito na ang tagapagpahiwatig na inihambing ay maaaring mas malaki o mas kaunti sa isa sa mga pangkat kumpara sa isa pa, i.e. ang naobserbahang pagkakaiba ay dahil sa pagkakataon.

Ang kapangyarihan ng pagsubok ay maaaring hatulan sa pamamagitan ng lokasyon ng zero sa loob ng agwat ng kumpiyansa. Kung ang zero ay malapit sa ibaba o itaas na limitasyon ng agwat, kung gayon posible na sa mas malaking bilang ng mga pangkat na inihahambing, ang mga pagkakaiba ay umabot sa istatistikal na kahalagahan. Kung ang zero ay malapit sa gitna ng agwat, nangangahulugan ito na ang parehong pagtaas at pagbaba sa tagapagpahiwatig sa pang-eksperimentong pangkat ay pantay na malamang, at, marahil, talagang walang mga pagkakaiba.

Mga halimbawa:

Upang ihambing ang surgical mortality kapag gumagamit ng dalawang magkaibang uri ng anesthesia: 61 tao ang inoperahan gamit ang unang uri ng anesthesia, 8 ang namatay, kasama ang pangalawang uri – 67 tao, 10 ang namatay.

d 1 = 8/61 = 0.131; d2 = 10/67 = 0.149; d1-d2 = - 0.018.

Ang pagkakaiba sa lethality ng mga inihambing na pamamaraan ay nasa hanay (-0.018 - 0.122; -0.018 + 0.122) o (-0.14; 0.104) na may posibilidad na 100(1-a) = 95%. Ang pagitan ay naglalaman ng zero, i.e. hindi maaaring tanggihan ang hypothesis ng pantay na dami ng namamatay na may dalawang magkaibang uri ng anesthesia.

Kaya, ang dami ng namamatay ay maaari at bababa sa 14% at tataas sa 10.4% na may posibilidad na 95%, i.e. ang zero ay humigit-kumulang sa gitna ng agwat, kaya maaari itong maitalo na, malamang, ang dalawang pamamaraan na ito ay talagang hindi naiiba sa kabagsikan.

Sa halimbawang tinalakay kanina, ang average na oras ng pagpindot sa panahon ng tapping test ay inihambing sa apat na grupo ng mga mag-aaral na naiiba sa mga marka ng pagsusulit. Kalkulahin natin ang mga pagitan ng kumpiyansa para sa average na oras ng pagpindot para sa mga mag-aaral na nakapasa sa pagsusulit na may mga grado 2 at 5 at ang pagitan ng kumpiyansa para sa pagkakaiba sa pagitan ng mga average na ito.

Ang mga koepisyent ng mag-aaral ay matatagpuan gamit ang mga talahanayan ng pamamahagi ng Mag-aaral (tingnan ang apendiks): para sa unang pangkat: = t(0.05;48) = 2.011; para sa pangalawang pangkat: = t(0.05;61) = 2.000. Kaya, ang mga agwat ng kumpiyansa para sa unang grupo: = (162.19-2.011*2.18; 162.19+2.011*2.18) = (157.8; 166.6), para sa pangalawang grupo (156.55- 2,000*1.88; 156.05 =*1.88; 156.55+1.88) ; 160.3). Kaya, para sa mga nakapasa sa pagsusulit na may 2, ang average na oras ng pagpindot ay mula 157.8 ms hanggang 166.6 ms na may posibilidad na 95%, para sa mga nakapasa sa pagsusulit na may 5 - mula 152.8 ms hanggang 160.3 ms na may posibilidad na 95% .

Maaari mo ring subukan ang null hypothesis gamit ang mga agwat ng kumpiyansa para sa mga paraan, at hindi lamang para sa pagkakaiba sa mga paraan. Halimbawa, tulad ng sa aming kaso, kung ang mga agwat ng kumpiyansa para sa mga paraan ay magkakapatong, kung gayon ang null hypothesis ay hindi maaaring tanggihan. Upang tanggihan ang isang hypothesis sa isang napiling antas ng kahalagahan, ang mga kaukulang agwat ng kumpiyansa ay hindi dapat mag-overlap.

Hanapin natin ang confidence interval para sa pagkakaiba sa average na oras ng pagpindot sa mga pangkat na nakapasa sa pagsusulit na may grade 2 at 5. Pagkakaiba ng mga average: 162.19 – 156.55 = 5.64. Koepisyent ng mag-aaral: = t(0.05;49+62-2) = t(0.05;109) = 1.982. Ang mga karaniwang paglihis ng pangkat ay magiging katumbas ng: ; . Kinakalkula namin ang average na error ng pagkakaiba sa pagitan ng mga paraan: . Agwat ng kumpiyansa: =(5.64-1.982*2.87; 5.64+1.982*2.87) = (-0.044; 11.33).

Kaya, ang pagkakaiba sa average na oras ng pagpindot sa mga pangkat na nakapasa sa pagsusulit na may 2 at 5 ay nasa hanay mula -0.044 ms hanggang 11.33 ms. Kasama sa agwat na ito ang zero, i.e. Ang average na oras ng pagpindot para sa mga nakapasa ng mabuti sa pagsusulit ay maaaring tumaas o bumaba kumpara sa mga nakapasa sa pagsusulit nang hindi kasiya-siya, i.e. hindi maaaring tanggihan ang null hypothesis. Ngunit ang zero ay napakalapit sa mas mababang limitasyon, at ang oras ng pagpindot ay mas malamang na bumaba para sa mga nakapasa nang maayos. Kaya, maaari nating tapusin na may mga pagkakaiba pa rin sa average na oras ng pagpindot sa pagitan ng mga nakapasa sa 2 at 5, hindi lang natin sila matukoy dahil sa pagbabago sa average na oras, ang pagkalat ng average na oras at ang mga laki ng sample.

Ang kapangyarihan ng isang pagsubok ay ang posibilidad na tanggihan ang isang maling null hypothesis, i.e. maghanap ng mga pagkakaiba kung saan sila aktwal na umiiral.

Ang kapangyarihan ng pagsubok ay tinutukoy batay sa antas ng kahalagahan, ang laki ng mga pagkakaiba sa pagitan ng mga grupo, ang pagkalat ng mga halaga sa mga grupo at ang laki ng mga sample.

Para sa t test ng Mag-aaral at pagsusuri ng pagkakaiba, maaaring gamitin ang mga sensitivity diagram.

Ang kapangyarihan ng criterion ay maaaring gamitin upang paunang matukoy ang kinakailangang bilang ng mga grupo.

Ipinapakita ng agwat ng kumpiyansa kung aling mga limitasyon ang tunay na halaga ng tinantyang parameter ay nakasalalay sa isang ibinigay na posibilidad.

Gamit ang mga pagitan ng kumpiyansa, maaari mong subukan ang mga istatistikal na hypotheses at gumawa ng mga konklusyon tungkol sa pagiging sensitibo ng pamantayan.

PANITIKAN.

Glanz S. – Kabanata 6,7.

Rebrova O.Yu. – p.112-114, p.171-173, p.234-238.

Sidorenko E.V. – p.32-33.

Mga tanong para sa self-testing ng mga mag-aaral.

1. Ano ang kapangyarihan ng pamantayan?

2. Sa anong mga kaso kinakailangan na suriin ang kapangyarihan ng pamantayan?

3. Mga paraan para sa pagkalkula ng kapangyarihan.

6. Paano subukan ang isang statistical hypothesis gamit ang isang confidence interval?

7. Ano ang masasabi tungkol sa kapangyarihan ng criterion kapag kinakalkula ang agwat ng kumpiyansa?

Mga gawain.

Ang "Katren-Style" ay nagpapatuloy sa paglalathala ng serye ni Konstantin Kravchik sa mga medikal na istatistika. Sa dalawang nakaraang artikulo, tinalakay ng may-akda ang pagpapaliwanag ng mga konsepto tulad ng at.

Konstantin Kravchik

Mathematician-analyst. Espesyalista sa istatistikal na pananaliksik sa medisina at humanities

lungsod ng Moscow

Kadalasan sa mga artikulo tungkol sa mga klinikal na pag-aaral ay makakahanap ka ng mahiwagang parirala: “confidence interval” (95 % CI o 95 % CI - confidence interval). Halimbawa, maaaring sumulat ang isang artikulo ng: "Upang masuri ang kahalagahan ng mga pagkakaiba, ginamit ang t-test ng Estudyante upang kalkulahin ang 95 % na agwat ng kumpiyansa."

Ano ang halaga ng "95 % confidence interval" at bakit ito kinakalkula?

Ano ang confidence interval? - Ito ang saklaw kung saan ang tunay na populasyon ay nangangahulugan ng kasinungalingan. Mayroon bang "hindi totoo" na mga average? Sa isang kahulugan, oo, ginagawa nila. Sa aming ipinaliwanag na imposibleng sukatin ang parameter ng interes sa buong populasyon, kaya ang mga mananaliksik ay kontento sa isang limitadong sample. Sa sample na ito (halimbawa, batay sa timbang ng katawan) mayroong isang average na halaga (isang tiyak na timbang), kung saan hinuhusgahan namin ang average na halaga sa buong populasyon. Gayunpaman, hindi malamang na ang average na timbang sa isang sample (lalo na ang isang maliit) ay magkakasabay sa average na timbang sa pangkalahatang populasyon. Samakatuwid, mas tama na kalkulahin at gamitin ang hanay ng mga average na halaga ng populasyon.

Halimbawa, isipin na ang 95% confidence interval (95% CI) para sa hemoglobin ay 110 hanggang 122 g/L. Nangangahulugan ito na mayroong 95% na pagkakataon na ang tunay na average na halaga ng hemoglobin sa populasyon ay nasa pagitan ng 110 at 122 g/L. Sa madaling salita, hindi natin alam ang average na halaga ng hemoglobin sa populasyon, ngunit maaari nating, na may 95 % na posibilidad, ipahiwatig ang isang hanay ng mga halaga para sa katangiang ito.

Partikular na nauugnay ang mga agwat ng kumpiyansa para sa mga pagkakaiba sa paraan sa pagitan ng mga grupo, o laki ng epekto kung tawagin ang mga ito.

Sabihin nating ikinumpara natin ang bisa ng dalawang paghahanda ng bakal: ang isa na matagal nang nasa merkado at ang isa na kakarehistro pa lang. Pagkatapos ng kurso ng therapy, sinuri namin ang konsentrasyon ng hemoglobin sa mga pinag-aralan na grupo ng mga pasyente, at kinakalkula ng statistical program na ang pagkakaiba sa pagitan ng mga average na halaga ng dalawang grupo ay, na may 95 % na posibilidad, sa saklaw mula 1.72 hanggang 14.36 g/l (Talahanayan 1).

mesa 1. Subukan para sa mga independiyenteng sample
(ang mga pangkat ay inihambing sa antas ng hemoglobin)

Dapat itong bigyang-kahulugan bilang mga sumusunod: sa ilang mga pasyente sa pangkalahatang populasyon na umiinom ng bagong gamot, ang hemoglobin ay magiging mas mataas sa average ng 1.72–14.36 g/l kaysa sa mga umiinom na ng kilalang gamot.

Sa madaling salita, sa pangkalahatang populasyon, ang pagkakaiba sa average na mga halaga ng hemoglobin sa pagitan ng mga grupo ay nasa loob ng mga limitasyong ito na may 95% na posibilidad. Bahala na ang mananaliksik kung ito ay marami o kaunti. Ang punto ng lahat ng ito ay hindi kami nagtatrabaho sa isang average na halaga, ngunit sa isang hanay ng mga halaga, samakatuwid, mas mapagkakatiwalaan naming tinatantya ang pagkakaiba sa isang parameter sa pagitan ng mga pangkat.

Sa mga pakete ng istatistika, sa pagpapasya ng mananaliksik, maaari mong independiyenteng paliitin o palawakin ang mga hangganan ng agwat ng kumpiyansa. Sa pamamagitan ng pagpapababa ng mga probabilidad ng agwat ng kumpiyansa, pinaliit namin ang hanay ng mga paraan. Halimbawa, sa 90 % CI ang hanay ng mga paraan (o pagkakaiba sa paraan) ay magiging mas makitid kaysa sa 95 %.

Sa kabaligtaran, ang pagtaas ng posibilidad sa 99 % ay nagpapalawak sa hanay ng mga halaga. Kapag naghahambing ng mga grupo, ang mas mababang limitasyon ng CI ay maaaring tumawid sa zero mark. Halimbawa, kung pinalawak namin ang mga hangganan ng agwat ng kumpiyansa sa 99 %, ang mga hangganan ng agwat ay mula -1 hanggang 16 g/l. Nangangahulugan ito na sa pangkalahatang populasyon ay may mga pangkat, ang pagkakaiba sa pagitan ng kung saan para sa katangiang pinag-aaralan ay katumbas ng 0 (M = 0).

Gamit ang isang agwat ng kumpiyansa, maaari mong subukan ang mga istatistikal na hypotheses. Kung ang pagitan ng kumpiyansa ay tumawid sa zero na halaga, kung gayon ang null hypothesis, na ipinapalagay na ang mga pangkat ay hindi naiiba sa parameter na pinag-aaralan, ay totoo. Ang halimbawa ay inilarawan sa itaas kung saan pinalawak namin ang mga hangganan sa 99 %. Sa isang lugar sa pangkalahatang populasyon nakakita kami ng mga grupo na hindi naiiba sa anumang paraan.

95% confidence interval ng pagkakaiba sa hemoglobin, (g/l)

Ipinapakita ng figure ang 95% na agwat ng kumpiyansa para sa pagkakaiba sa ibig sabihin ng mga halaga ng hemoglobin sa pagitan ng dalawang grupo. Ang linya ay dumadaan sa zero mark, samakatuwid mayroong isang pagkakaiba sa pagitan ng mga paraan ng zero, na nagpapatunay sa null hypothesis na ang mga grupo ay hindi naiiba. Ang saklaw ng pagkakaiba sa pagitan ng mga pangkat ay mula –2 hanggang 5 g/L. Nangangahulugan ito na ang hemoglobin ay maaaring bumaba ng 2 g/L o tumaas ng 5 g/L.

Ang agwat ng kumpiyansa ay isang napakahalagang tagapagpahiwatig. Salamat dito, makikita mo kung ang mga pagkakaiba sa mga grupo ay dahil sa pagkakaiba sa paraan o dahil sa isang malaking sample, dahil sa isang malaking sample ang mga pagkakataon na makahanap ng mga pagkakaiba ay mas malaki kaysa sa isang maliit na sample.

Sa pagsasagawa, maaaring ganito ang hitsura nito. Kumuha kami ng sample ng 1000 tao, sinukat ang mga antas ng hemoglobin at nalaman na ang agwat ng kumpiyansa para sa pagkakaiba sa ibig sabihin ay mula 1.2 hanggang 1.5 g/l. Ang antas ng istatistikal na kahalagahan sa kasong ito p

Nakikita namin na ang konsentrasyon ng hemoglobin ay tumaas, ngunit halos hindi mahahalata, samakatuwid, ang istatistikal na kahalagahan ay lumitaw nang tumpak dahil sa laki ng sample.

Ang mga pagitan ng kumpiyansa ay maaaring kalkulahin hindi lamang para sa mga paraan, kundi pati na rin para sa mga proporsyon (at mga ratio ng panganib). Halimbawa, interesado kami sa agwat ng kumpiyansa ng mga proporsyon ng mga pasyente na nakamit ang pagpapatawad habang umiinom ng binuong gamot. Ipagpalagay natin na ang 95 % CI para sa mga proporsyon, ibig sabihin, para sa proporsyon ng mga naturang pasyente, ay nasa hanay na 0.60–0.80. Kaya, maaari nating sabihin na ang ating gamot ay may therapeutic effect sa 60 hanggang 80 % ng mga kaso.