Selang keyakinan untuk menganggar min (serakan diketahui) dalam MS EXCEL. Kaedah Analisis Kuantitatif: Menganggar Selang Keyakinan

"Katren-Style" terus menerbitkan kitaran Konstantin Kravchik mengenai statistik perubatan. Dalam dua artikel sebelum ini, penulis menyentuh penjelasan tentang konsep seperti dan.

Konstantin Kravchik

Ahli matematik-penganalisis. Pakar dalam bidang penyelidikan statistik dalam perubatan dan kemanusiaan

bandar Moscow

Selalunya dalam artikel mengenai ujian klinikal anda boleh menemui frasa misteri: "selang keyakinan" (95% CI atau 95% CI - selang keyakinan). Sebagai contoh, artikel mungkin berkata: "Ujian-t pelajar digunakan untuk menilai kepentingan perbezaan, dengan selang keyakinan 95% dikira."

Apakah nilai "selang keyakinan 95%" dan mengapa mengiranya?

Apakah selang keyakinan? - Ini ialah julat di mana nilai min sebenar dalam populasi jatuh. Dan apakah, terdapat purata "tidak benar"? Dari satu segi, ya, mereka lakukan. Dalam kami menjelaskan bahawa adalah mustahil untuk mengukur parameter minat dalam keseluruhan populasi, jadi penyelidik berpuas hati dengan sampel yang terhad. Dalam sampel ini (contohnya, mengikut berat badan) terdapat satu nilai purata (berat tertentu), yang mana kami menilai nilai purata dalam keseluruhan populasi umum. Walau bagaimanapun, tidak mungkin purata berat dalam sampel (terutama yang kecil) akan bertepatan dengan purata berat dalam populasi umum. Oleh itu, adalah lebih tepat untuk mengira dan menggunakan julat nilai purata populasi umum.

Sebagai contoh, katakan selang keyakinan 95% (95% CI) untuk hemoglobin adalah antara 110 dan 122 g/L. Ini bermakna dengan kebarangkalian 95 %, nilai min sebenar hemoglobin dalam populasi umum adalah dalam julat dari 110 hingga 122 g/L. Dalam erti kata lain, kita tidak mengetahui purata hemoglobin dalam populasi umum, tetapi kita boleh menunjukkan julat nilai untuk ciri ini dengan kebarangkalian 95%.

Selang keyakinan amat relevan dengan perbezaan cara antara kumpulan, atau apa yang dipanggil saiz kesan.

Katakan kita membandingkan keberkesanan dua persediaan besi: satu yang telah lama di pasaran dan satu yang baru didaftarkan. Selepas kursus terapi, kepekatan hemoglobin dalam kumpulan pesakit yang dikaji telah dinilai, dan program statistik mengira untuk kita bahawa perbezaan antara nilai purata kedua-dua kumpulan dengan kebarangkalian 95% adalah dalam julat dari 1.72 hingga 14.36 g/l (Jadual 1).

Tab. 1. Kriteria untuk sampel bebas
(kumpulan dibandingkan dengan tahap hemoglobin)

Ini harus ditafsirkan seperti berikut: dalam sebahagian daripada pesakit dalam populasi umum yang mengambil ubat baru, hemoglobin akan lebih tinggi secara purata sebanyak 1.72-14.36 g/l berbanding mereka yang mengambil ubat yang telah diketahui.

Dalam erti kata lain, dalam populasi umum, perbezaan dalam nilai purata hemoglobin dalam kumpulan dengan kebarangkalian 95% adalah dalam had ini. Terpulang kepada pengkaji untuk menilai sama ada ini banyak atau sedikit. Inti dari semua ini ialah kami tidak bekerja dengan satu nilai purata, tetapi dengan julat nilai, oleh itu, kami lebih pasti menganggarkan perbezaan dalam parameter antara kumpulan.

Dalam pakej statistik, mengikut budi bicara penyelidik, seseorang boleh secara bebas menyempitkan atau mengembangkan sempadan selang keyakinan. Dengan menurunkan kebarangkalian selang keyakinan, kami menyempitkan julat cara. Contohnya, pada 90% CI, julat min (atau perbezaan min) akan lebih sempit daripada 95% CI.

Sebaliknya, meningkatkan kebarangkalian kepada 99% meluaskan julat nilai. Apabila membandingkan kumpulan, had bawah CI mungkin melepasi tanda sifar. Contohnya, jika kita memanjangkan sempadan selang keyakinan kepada 99 %, maka sempadan selang itu berjulat dari –1 hingga 16 g/L. Ini bermakna bahawa dalam populasi umum terdapat kumpulan, perbezaan antara purata yang mana untuk sifat yang dikaji ialah 0 (M=0).

Selang keyakinan boleh digunakan untuk menguji hipotesis statistik. Jika selang keyakinan melintasi sifar, maka hipotesis nol, yang menganggap bahawa kumpulan tidak berbeza dalam parameter yang dikaji, adalah benar. Satu contoh diterangkan di atas, apabila kami mengembangkan sempadan kepada 99%. Di suatu tempat dalam populasi umum, kami menemui kumpulan yang tidak berbeza dalam apa jua cara.

95% selang keyakinan perbezaan hemoglobin, (g/l)


Rajah menunjukkan selang keyakinan 95% perbezaan purata hemoglobin antara kedua-dua kumpulan sebagai garis. Garis melepasi tanda sifar, oleh itu, terdapat perbezaan antara min sama dengan sifar, yang mengesahkan hipotesis nol bahawa kumpulan tidak berbeza. Perbezaan antara kumpulan adalah dari -2 hingga 5 g/l, yang bermaksud hemoglobin boleh sama ada menurun sebanyak 2 g/l atau meningkat sebanyak 5 g/l.

Selang keyakinan adalah penunjuk yang sangat penting. Terima kasih kepadanya, anda boleh melihat sama ada perbezaan dalam kumpulan itu benar-benar disebabkan oleh perbezaan dalam cara atau disebabkan oleh sampel yang besar, kerana dengan sampel yang besar, peluang untuk mencari perbezaan adalah lebih besar daripada dengan sampel yang kecil.

Dalam amalan, ia mungkin kelihatan seperti ini. Kami mengambil sampel 1000 orang, mengukur tahap hemoglobin dan mendapati bahawa selang keyakinan untuk perbezaan min terletak dari 1.2 hingga 1.5 g/L. Tahap kepentingan statistik dalam kes ini p

Kami melihat bahawa kepekatan hemoglobin meningkat, tetapi hampir tidak dapat dilihat, oleh itu, kepentingan statistik muncul dengan tepat disebabkan oleh saiz sampel.

Selang keyakinan boleh dikira bukan sahaja untuk purata, tetapi juga untuk perkadaran (dan nisbah risiko). Sebagai contoh, kami berminat dengan selang keyakinan perkadaran pesakit yang mencapai remisi semasa mengambil ubat yang dibangunkan. Andaikan bahawa 95% CI untuk perkadaran, iaitu untuk perkadaran pesakit sedemikian, berada dalam julat 0.60-0.80. Oleh itu, kita boleh mengatakan bahawa ubat kita mempunyai kesan terapeutik dalam 60 hingga 80% kes.

Selang keyakinan

Selang keyakinan- istilah yang digunakan dalam statistik matematik untuk anggaran selang (berbanding titik) parameter statistik, yang lebih baik dengan saiz sampel yang kecil. Selang keyakinan ialah selang yang meliputi parameter yang tidak diketahui dengan kebolehpercayaan yang diberikan.

Kaedah selang keyakinan telah dibangunkan oleh ahli statistik Amerika Jerzy Neumann, berdasarkan idea ahli statistik Inggeris Ronald Fischer.

Definisi

Parameter selang keyakinan θ taburan pembolehubah rawak X dengan tahap kepercayaan 100 p%, dihasilkan oleh sampel ( x 1 ,…,x n), dipanggil selang dengan sempadan ( x 1 ,…,x n) dan ( x 1 ,…,x n) yang merupakan realisasi pembolehubah rawak L(X 1 ,…,X n) dan U(X 1 ,…,X n) sedemikian

.

Titik sempadan selang keyakinan dipanggil had keyakinan.

Tafsiran berasaskan intuisi bagi selang keyakinan ialah: jika hlm adalah besar (katakan 0.95 atau 0.99), maka selang keyakinan hampir pasti mengandungi nilai sebenar θ .

Satu lagi tafsiran konsep selang keyakinan: ia boleh dianggap sebagai selang nilai parameter θ serasi dengan data eksperimen dan tidak bercanggah dengannya.

Contoh

  • Selang keyakinan untuk jangkaan matematik bagi sampel biasa;
  • Selang keyakinan untuk varians sampel normal.

Selang Keyakinan Bayesian

Dalam statistik Bayesian, terdapat takrifan selang keyakinan yang serupa tetapi berbeza dalam beberapa butiran penting. Di sini, parameter anggaran itu sendiri dianggap pembolehubah rawak dengan beberapa diberikan taburan priori (seragam dalam kes paling mudah), dan sampel ditetapkan (dalam statistik klasik, semuanya betul-betul bertentangan). Selang keyakinan Bayesian ialah selang yang meliputi nilai parameter dengan kebarangkalian posterior:

.

Secara amnya, selang keyakinan klasik dan Bayesian adalah berbeza. Dalam kesusasteraan bahasa Inggeris, selang keyakinan Bayesian biasanya dipanggil istilah selang yang boleh dipercayai, dan klasik selang keyakinan.

Nota

Sumber

Yayasan Wikimedia. 2010 .

  • Bayi (filem)
  • Penjajah

Lihat apa "Selang Keyakinan" dalam kamus lain:

    Selang keyakinan- selang yang dikira daripada data sampel, yang dengan kebarangkalian tertentu (keyakinan) meliputi nilai sebenar yang tidak diketahui bagi parameter pengagihan anggaran. Sumber: GOST 20522 96: Tanah. Kaedah pemprosesan statistik keputusan ... Buku rujukan kamus istilah dokumentasi normatif dan teknikal

    selang keyakinan- untuk parameter skalar populasi umum, ini ialah segmen yang kemungkinan besar mengandungi parameter ini. Frasa ini tidak bermakna tanpa penjelasan lanjut. Oleh kerana sempadan selang keyakinan dianggarkan daripada sampel, adalah wajar untuk ... ... Kamus Statistik Sosiologi

    SELANG KEYAKINAN ialah kaedah anggaran parameter yang berbeza daripada anggaran titik. Biarkan sampel x1, . diberikan. . ., xn daripada taburan dengan ketumpatan kebarangkalian f(x, α), dan a*=a*(x1, . . ., xn) ialah anggaran α, g(a*, α) ialah ketumpatan kebarangkalian bagi anggaran. Sedang mencari… … Ensiklopedia Geologi

    SELANG KEYAKINAN- (selang keyakinan) Selang di mana keyakinan nilai parameter untuk populasi yang diperoleh daripada tinjauan sampel mempunyai tahap kebarangkalian tertentu, seperti 95%, disebabkan oleh sampel itu sendiri. Lebar… … Kamus ekonomi

    selang keyakinan- ialah selang di mana nilai sebenar kuantiti yang ditentukan terletak dengan kebarangkalian keyakinan yang diberikan. Kimia am: buku teks / A. V. Zholnin ... Istilah kimia

    Selang keyakinan CI- Selang keyakinan, CI * selang davyaralny, CI * selang selang keyakinan nilai tanda, dikira untuk c.l. parameter pengedaran (cth. nilai min sesuatu ciri) ke atas sampel dan dengan kebarangkalian tertentu (cth. 95% untuk 95% ... Genetik. Kamus ensiklopedia

    SELANG KEYAKINAN- konsep yang timbul apabila menganggarkan statistich parameter. pengagihan mengikut selang nilai. D. i. bagi parameter q yang sepadan dengan pekali yang diberikan. keyakinan P, adalah sama dengan selang sedemikian (q1, q2) bahawa untuk sebarang taburan kebarangkalian ketaksamaan ... ... Ensiklopedia Fizikal

    selang keyakinan- - Topik telekomunikasi, konsep asas EN selang keyakinan ... Buku Panduan Penterjemah Teknikal

    selang keyakinan- Paksikliovimo intervalas statusas T sritis Standartizacija ir metrologija apibrėžtis Dydžio verčių intervalas, kuriame su pasirinktąja tikimybe yra matavimo rezultato vertė. atitikmenys: engl. selang keyakinan vok. Vertrauensbereich, saya rus.… … Penkiakalbis aiskinamasis metrologijos terminų žodynas

    selang keyakinan- paksikliovimo intervalas statusas T sritis chemija apibrėžtis Dydžio verčių intervalas, kuriame su pasirinktąja tikimybe yra matavimo rezultatų vertė. atitikmenys: engl. selang keyakinan rus. kawasan amanah; selang keyakinan... Chemijos terminų aiskinamasis žodynas

Katakan kita mempunyai sejumlah besar item dengan taburan normal beberapa ciri (contohnya, gudang penuh sayur-sayuran dari jenis yang sama, saiz dan beratnya berbeza-beza). Anda ingin mengetahui ciri purata keseluruhan kumpulan barangan, tetapi anda tidak mempunyai masa atau kecenderungan untuk mengukur dan menimbang setiap sayuran. Anda faham bahawa ini tidak perlu. Tetapi berapa banyak keping yang perlu anda ambil untuk pemeriksaan rawak?

Sebelum memberikan beberapa formula yang berguna untuk situasi ini, kami ingat beberapa notasi.

Pertama, jika kita mengukur keseluruhan gudang sayur-sayuran (set elemen ini dipanggil populasi umum), maka kita akan mengetahui dengan semua ketepatan yang tersedia kepada kita nilai purata berat keseluruhan kumpulan. Mari kita panggil purata ini X rujuk .g en . - purata am. Kita sudah tahu apa yang ditentukan sepenuhnya jika nilai min dan sisihan s diketahui . Benar, setakat ini kami bukan purata X mahupun s kita tidak tahu populasi umum. Kita hanya boleh mengambil beberapa sampel, mengukur nilai yang kita perlukan dan mengira untuk sampel ini kedua-dua nilai min X sr. dalam sampel dan sisihan piawai S sb.

Adalah diketahui bahawa jika semakan tersuai kami mengandungi sejumlah besar elemen (biasanya n lebih besar daripada 30), dan ia diambil rambang sungguh, kemudian s populasi umum hampir tidak akan berbeza daripada S ..

Di samping itu, untuk kes taburan normal, kita boleh menggunakan formula berikut:

Dengan kebarangkalian 95%


Dengan kebarangkalian 99%



Secara umum, dengan kebarangkalian Р (t)


Hubungan antara nilai t dan nilai kebarangkalian P (t), yang mana kita ingin mengetahui selang keyakinan, boleh diambil daripada jadual berikut:


Oleh itu, kami telah menentukan dalam julat apakah nilai purata untuk populasi umum (dengan kebarangkalian tertentu).

Melainkan kita mempunyai sampel yang cukup besar, kita tidak boleh mendakwa bahawa populasi mempunyai s = S sel. Di samping itu, dalam kes ini, kedekatan sampel dengan taburan normal adalah bermasalah. Dalam kes ini, gunakan S sb juga s dalam formula:




tetapi nilai t untuk kebarangkalian tetap P(t) akan bergantung kepada bilangan unsur dalam sampel n. Semakin besar n, semakin hampir selang keyakinan yang terhasil dengan nilai yang diberikan oleh formula (1). Nilai t dalam kes ini diambil dari jadual lain (ujian-t Pelajar), yang kami sediakan di bawah:

Nilai ujian-t pelajar untuk kebarangkalian 0.95 dan 0.99


Contoh 3 30 orang telah dipilih secara rawak daripada pekerja syarikat tersebut. Menurut sampel, ternyata gaji purata (sebulan) adalah 30 ribu rubel dengan sisihan persegi purata 5 ribu rubel. Dengan kebarangkalian 0.99 tentukan purata gaji dalam firma.

Keputusan: Dengan syarat, kita mempunyai n = 30, X rujuk. =30000, S=5000, P=0.99. Untuk mencari selang keyakinan, kami menggunakan formula yang sepadan dengan kriteria Pelajar. Menurut jadual untuk n \u003d 30 dan P \u003d 0.99 kita dapati t \u003d 2.756, oleh itu,


mereka. amanah yang diingini selang 27484< Х ср.ген < 32516.

Jadi, dengan kebarangkalian 0.99, boleh dikatakan bahawa selang (27484; 32516) mengandungi purata gaji dalam syarikat.

Kami berharap anda akan menggunakan kaedah ini tanpa perlu mempunyai hamparan bersama anda setiap masa. Pengiraan boleh dilakukan secara automatik dalam Excel. Semasa dalam fail Excel, klik butang fx pada menu atas. Kemudian, pilih antara fungsi jenis "statistik", dan dari senarai yang dicadangkan dalam kotak - STEUDRASP. Kemudian, pada gesaan, meletakkan kursor dalam medan "kebarangkalian", taip nilai kebarangkalian timbal balik (iaitu, dalam kes kami, bukannya kebarangkalian 0.95, anda perlu menaip kebarangkalian 0.05). Nampaknya, hamparan direka bentuk supaya hasilnya menjawab persoalan tentang kemungkinan kita boleh salah. Begitu juga, dalam medan "darjah kebebasan", masukkan nilai (n-1) untuk sampel anda.

Selang keyakinan datang kepada kami dari bidang statistik. Ini ialah julat yang ditentukan yang berfungsi untuk menganggarkan parameter yang tidak diketahui dengan tahap kebolehpercayaan yang tinggi. Cara paling mudah untuk menerangkan ini adalah dengan contoh.

Katakan kita perlu menyiasat beberapa pembolehubah rawak, sebagai contoh, kelajuan tindak balas pelayan kepada permintaan pelanggan. Setiap kali pengguna menaip alamat tapak tertentu, pelayan bertindak balas pada kadar yang berbeza. Oleh itu, masa tindak balas yang disiasat mempunyai watak rawak. Oleh itu, selang keyakinan membolehkan anda menentukan sempadan parameter ini, dan kemudian mungkin untuk menegaskan bahawa dengan kebarangkalian 95% pelayan akan berada dalam julat yang kami kira.

Atau anda perlu mengetahui berapa ramai orang yang tahu tentang jenama syarikat itu. Apabila selang keyakinan dikira, adalah mungkin, sebagai contoh, untuk mengatakan bahawa dengan kebarangkalian 95% bahagian pengguna yang mengetahui tentang perkara ini berada dalam julat dari 27% hingga 34%.

Berkait rapat dengan istilah ini adalah nilai seperti tahap keyakinan. Ia mewakili kebarangkalian bahawa parameter yang dikehendaki dimasukkan dalam selang keyakinan. Nilai ini menentukan berapa besar julat yang kami kehendaki. Semakin besar nilai yang diambil, semakin sempit selang keyakinan, dan begitu juga sebaliknya. Biasanya ia ditetapkan kepada 90%, 95% atau 99%. Nilai 95% adalah yang paling popular.

Penunjuk ini juga dipengaruhi oleh varians pemerhatian dan definisinya adalah berdasarkan andaian bahawa ciri yang dikaji mematuhi.Pernyataan ini juga dikenali sebagai Hukum Gauss. Menurutnya, taburan semua kebarangkalian pembolehubah rawak berterusan sedemikian dipanggil normal, yang boleh diterangkan oleh ketumpatan kebarangkalian. Jika andaian taburan normal ternyata salah, maka anggaran mungkin ternyata salah.

Mula-mula, mari kita fikirkan cara mengira selang keyakinan untuk Di sini, dua kes adalah mungkin. Serakan (tahap penyebaran pembolehubah rawak) mungkin diketahui atau tidak. Jika ia diketahui, maka selang keyakinan kita dikira menggunakan formula berikut:

xsr - t*σ / (sqrt(n))<= α <= хср + t*σ / (sqrt(n)), где

α - tanda,

t ialah parameter daripada jadual pengedaran Laplace,

σ ialah punca kuasa dua serakan.

Jika varians tidak diketahui, maka ia boleh dikira jika kita mengetahui semua nilai ciri yang dikehendaki. Untuk ini, formula berikut digunakan:

σ2 = х2ср - (хр)2, di mana

х2ср - nilai purata kuasa dua sifat yang dikaji,

(xsr)2 ialah segi empat sama ciri ini.

Formula di mana selang keyakinan dikira dalam kes ini berubah sedikit:

xsr - t*s / (sqrt(n))<= α <= хср + t*s / (sqrt(n)), где

xsr - sampel min,

α - tanda,

t ialah parameter yang ditemui menggunakan jadual taburan Pelajar t \u003d t (ɣ; n-1),

sqrt(n) ialah punca kuasa dua bagi jumlah saiz sampel,

s ialah punca kuasa dua varians.

Pertimbangkan contoh ini. Andaikan bahawa, berdasarkan keputusan 7 pengukuran, sifat yang dikaji ditentukan sebagai 30 dan varians sampel bersamaan dengan 36. Adalah perlu untuk mencari, dengan kebarangkalian 99%, selang keyakinan yang mengandungi nilai sebenar bagi parameter yang diukur.

Mula-mula, mari tentukan apa yang sama dengan t: t \u003d t (0.99; 7-1) \u003d 3.71. Menggunakan formula di atas, kita dapat:

xsr - t*s / (sqrt(n))<= α <= хср + t*s / (sqrt(n))

30 - 3.71*36 / (persegi(7))<= α <= 30 + 3.71*36 / (sqrt(7))

21.587 <= α <= 38.413

Selang keyakinan untuk varians dikira kedua-duanya dalam kes min yang diketahui dan apabila tiada data mengenai jangkaan matematik, dan hanya nilai anggaran titik tidak berat sebelah bagi varians diketahui. Kami tidak akan memberikan di sini formula untuk pengiraannya, kerana ia agak rumit dan, jika dikehendaki, ia sentiasa boleh didapati di internet.

Kami hanya ambil perhatian bahawa adalah mudah untuk menentukan selang keyakinan menggunakan program Excel atau perkhidmatan rangkaian, yang dipanggil begitu.