Selang keyakinan untuk menganggar min (serakan diketahui) dalam MS EXCEL. Selang keyakinan

Mana-mana sampel hanya memberikan gambaran anggaran populasi umum, dan semua ciri statistik sampel (min, mod, varians ...) adalah beberapa anggaran atau katakan anggaran parameter umum, yang dalam kebanyakan kes tidak dapat dikira kerana ketidakupayaan penduduk umum (Rajah 20) .

Rajah 20. Ralat pensampelan

Tetapi anda boleh menentukan selang di mana, dengan tahap kebarangkalian tertentu, terletak nilai sebenar (umum) ciri statistik. Selang ini dipanggil d selang keyakinan (CI).

Jadi purata am dengan kebarangkalian 95% terletak di dalamnya

dari hingga, (20)

di mana t - nilai jadual kriteria Pelajar untuk α =0.05 dan f= n-1

Boleh didapati dan 99% CI, dalam kes ini t dipilih untuk α =0,01.

Apakah kepentingan praktikal selang keyakinan?

    Selang keyakinan yang luas menunjukkan bahawa min sampel tidak menggambarkan dengan tepat min populasi. Ini biasanya disebabkan oleh saiz sampel yang tidak mencukupi, atau kepelbagaiannya, i.e. penyebaran yang besar. Kedua-duanya memberikan ralat besar dalam min dan, dengan itu, CI yang lebih luas. Dan ini adalah sebab untuk kembali ke peringkat perancangan penyelidikan.

    Had CI atas dan bawah menilai sama ada keputusan akan menjadi signifikan secara klinikal

Marilah kita memikirkan dengan lebih terperinci mengenai persoalan kepentingan statistik dan klinikal hasil kajian sifat kumpulan. Ingat bahawa tugas statistik adalah untuk mengesan sekurang-kurangnya beberapa perbezaan dalam populasi umum, berdasarkan data sampel. Ia adalah tugas doktor untuk mencari (bukan sebarang) perbezaan yang akan membantu diagnosis atau rawatan. Dan tidak selalu kesimpulan statistik adalah asas untuk kesimpulan klinikal. Oleh itu, penurunan hemoglobin yang ketara secara statistik sebanyak 3 g/l tidaklah membimbangkan. Dan, sebaliknya, jika beberapa masalah dalam tubuh manusia tidak mempunyai watak jisim di peringkat keseluruhan populasi, ini bukanlah alasan untuk tidak menangani masalah ini.

Kami akan mempertimbangkan kedudukan ini dalam contoh.

Para penyelidik tertanya-tanya jika kanak-kanak lelaki yang mempunyai sejenis penyakit berjangkit ketinggalan di belakang rakan sebaya mereka dalam pertumbuhan. Untuk tujuan ini, kajian terpilih telah dijalankan, di mana 10 kanak-kanak lelaki yang mempunyai penyakit ini mengambil bahagian. Keputusan dibentangkan dalam jadual 23.

Jadual 23. Keputusan statistik

had bawah

had atas

Spesifikasi (cm)

tengah

Daripada pengiraan ini, ia menunjukkan bahawa purata ketinggian selektif kanak-kanak lelaki berumur 10 tahun yang mempunyai sejenis penyakit berjangkit adalah hampir normal (132.5 cm). Walau bagaimanapun, had bawah selang keyakinan (126.6 cm) menunjukkan bahawa terdapat 95% kebarangkalian bahawa purata ketinggian sebenar kanak-kanak ini sepadan dengan konsep "perawakan pendek", i.e. kanak-kanak ini terbantut.

Dalam contoh ini, keputusan pengiraan selang keyakinan adalah signifikan secara klinikal.

Dalam subseksyen sebelumnya, kami mempertimbangkan persoalan menganggarkan parameter yang tidak diketahui a satu nombor. Penilaian sedemikian dipanggil "titik". Dalam beberapa tugas, ia diperlukan bukan sahaja untuk mencari parameter a nilai berangka yang sesuai, tetapi juga menilai ketepatan dan kebolehpercayaannya. Ia diperlukan untuk mengetahui ralat apa yang boleh menyebabkan penggantian parameter a anggaran titiknya a dan dengan tahap keyakinan apakah yang boleh kita jangkakan bahawa kesilapan ini tidak akan melampaui had yang diketahui?

Masalah seperti ini amat relevan untuk sebilangan kecil pemerhatian, apabila anggaran titik dan dalam sebahagian besarnya rawak dan penggantian anggaran a dengan a boleh membawa kepada ralat yang serius.

Untuk memberi gambaran tentang ketepatan dan kebolehpercayaan anggaran a,

dalam statistik matematik, apa yang dipanggil selang keyakinan dan kebarangkalian keyakinan digunakan.

Biarkan untuk parameter a diperolehi daripada pengalaman anggaran yang tidak berat sebelah a. Kami ingin menganggarkan kemungkinan ralat dalam kes ini. Mari kita tetapkan beberapa kebarangkalian p yang cukup besar (contohnya, p = 0.9, 0.95, atau 0.99) supaya peristiwa dengan kebarangkalian p boleh dianggap secara praktikal pasti, dan mencari nilai s yang

Kemudian julat nilai ralat yang mungkin berlaku apabila menggantikan a pada a, akan menjadi ± s; ralat mutlak yang besar akan muncul hanya dengan kebarangkalian kecil a = 1 - p. Mari kita tulis semula (14.3.1) sebagai:

Kesamaan (14.3.2) bermakna dengan kebarangkalian p nilai parameter yang tidak diketahui a jatuh dalam selang waktu

Dalam kes ini, satu keadaan harus diperhatikan. Sebelum ini, kami berulang kali mempertimbangkan kebarangkalian pembolehubah rawak jatuh ke dalam selang bukan rawak yang diberikan. Di sini keadaannya berbeza: a bukan rawak, tetapi selang rawak / r. Secara rawak kedudukannya pada paksi-x, ditentukan oleh pusatnya a; secara umum, panjang selang 2s juga rawak, kerana nilai s dikira, sebagai peraturan, daripada data eksperimen. Oleh itu, dalam kes ini, adalah lebih baik untuk mentafsir nilai p bukan sebagai kebarangkalian "memukul" titik itu. a ke dalam selang / p, tetapi sebagai kebarangkalian bahawa selang rawak / p akan meliputi titik a(Gamb. 14.3.1).

nasi. 14.3.1

Kebarangkalian p dipanggil tahap keyakinan, dan selang / p - selang keyakinan. Sempadan selang jika. a x \u003d a- s dan a 2 = a + dan dipanggil sempadan amanah.

Mari kita berikan satu lagi tafsiran kepada konsep selang keyakinan: ia boleh dianggap sebagai selang nilai parameter a, serasi dengan data eksperimen dan tidak bercanggah dengannya. Sesungguhnya, jika kita bersetuju untuk menganggap peristiwa dengan kebarangkalian a = 1-p hampir mustahil, maka nilai-nilai parameter a yang a - a> s mesti diiktiraf sebagai bercanggah dengan data eksperimen, dan data yang |a - a a t na 2 .

Biarkan untuk parameter a terdapat anggaran yang tidak berat sebelah a. Jika kita tahu hukum taburan kuantiti a, masalah mencari selang keyakinan adalah agak mudah: sudah cukup untuk mencari nilai s yang

Kesukaran terletak pada fakta bahawa undang-undang pengagihan anggaran a bergantung kepada hukum taburan kuantiti X dan, akibatnya, pada parameter yang tidak diketahui (khususnya, pada parameter itu sendiri a).

Untuk mengatasi kesukaran ini, seseorang boleh menggunakan helah anggaran berikut: gantikan parameter yang tidak diketahui dalam ungkapan untuk s dengan anggaran mata mereka. Dengan bilangan eksperimen yang agak besar P(kira-kira 20 ... 30) teknik ini biasanya memberikan hasil yang memuaskan dari segi ketepatan.

Sebagai contoh, pertimbangkan masalah selang keyakinan untuk jangkaan matematik.

Biar dihasilkan P x, yang ciri-cirinya adalah jangkaan matematik t dan varians D- tidak diketahui. Untuk parameter ini, anggaran berikut diperoleh:

Ia diperlukan untuk membina selang keyakinan / р, sepadan dengan kebarangkalian keyakinan р, untuk jangkaan matematik t kuantiti x.

Dalam menyelesaikan masalah ini, kami menggunakan fakta bahawa kuantiti t ialah jumlahnya P pembolehubah rawak teragih sama bebas X h dan mengikut teorem had pusat untuk cukup besar P undang-undang pengedarannya hampir normal. Dalam amalan, walaupun dengan bilangan sebutan yang agak kecil (daripada susunan 10 ... 20), undang-undang pengagihan jumlah itu boleh dianggap normal. Kami akan menganggap bahawa nilai t diedarkan mengikut hukum biasa. Ciri-ciri undang-undang ini - jangkaan dan varians matematik - adalah sama, masing-masing t dan

(lihat bab 13 subseksyen 13.3). Mari kita anggap bahawa nilai D diketahui oleh kami dan kami akan mendapati Ep nilai sedemikian yang

Menggunakan formula (6.3.5) Bab 6, kami menyatakan kebarangkalian di sebelah kiri (14.3.5) dari segi fungsi taburan normal

di manakah sisihan piawai anggaran t.

Daripada persamaan

cari nilai Sp:

dengan arg Ф* (x) ialah fungsi songsang bagi Ф* (X), mereka. nilai hujah sedemikian yang mana fungsi taburan normal adalah sama dengan X.

Penyerakan D, melalui mana nilai dinyatakan a 1P, kita tidak tahu dengan tepat; sebagai nilai anggarannya, anda boleh menggunakan anggaran D(14.3.4) dan letakkan lebih kurang:

Oleh itu, masalah membina selang keyakinan hampir diselesaikan, yang sama dengan:

di mana gp ditakrifkan oleh formula (14.3.7).

Untuk mengelakkan interpolasi terbalik dalam jadual fungsi Ф * (l) apabila mengira s p, adalah mudah untuk menyusun jadual khas (Jadual 14.3.1), yang menyenaraikan nilai kuantiti

bergantung kepada r. Nilai (p menentukan untuk hukum biasa bilangan sisihan piawai yang mesti diketepikan di sebelah kanan dan kiri pusat penyebaran supaya kebarangkalian jatuh ke dalam kawasan yang terhasil adalah sama dengan p.

Melalui nilai 7 p, selang keyakinan dinyatakan sebagai:

Jadual 14.3.1

Contoh 1. 20 eksperimen telah dijalankan ke atas nilai x; keputusan ditunjukkan dalam jadual. 14.3.2.

Jadual 14.3.2

Ia dikehendaki mencari anggaran bagi jangkaan matematik kuantiti X dan bina selang keyakinan sepadan dengan tahap keyakinan p = 0.8.

Penyelesaian. Kami ada:

Memilih untuk asal n: = 10, mengikut formula ketiga (14.2.14) kita dapati anggaran tidak berat sebelah D :

Mengikut jadual 14.3.1 kita dapati

Had keyakinan:

Selang keyakinan:

Nilai parameter t, terletak dalam selang ini adalah serasi dengan data eksperimen yang diberikan dalam jadual. 14.3.2.

Dengan cara yang sama, selang keyakinan boleh dibina untuk varians.

Biar dihasilkan P eksperimen bebas ke atas pembolehubah rawak X dengan parameter yang tidak diketahui dari dan A, dan untuk varians D anggaran tidak berat sebelah diperolehi:

Ia diperlukan untuk membina selang keyakinan untuk varians.

Daripada formula (14.3.11) dapat dilihat bahawa nilai D mewakili

jumlah P pembolehubah rawak bentuk . Nilai-nilai ini tidak

bebas, kerana mana-mana daripadanya termasuk kuantiti t, bergantung pada orang lain. Walau bagaimanapun, ia boleh ditunjukkan bahawa sebagai P undang-undang pengagihan jumlah mereka juga hampir normal. Hampir di P= 20...30 dah boleh dianggap biasa.

Mari kita anggap bahawa ini benar, dan cari ciri-ciri undang-undang ini: jangkaan dan varians matematik. Sejak markah D- tidak berat sebelah, maka M[D] = D.

Pengiraan Varians D D dikaitkan dengan pengiraan yang agak kompleks, jadi kami memberikan ungkapannya tanpa terbitan:

di mana c 4 - momen pusat keempat kuantiti x.

Untuk menggunakan ungkapan ini, anda perlu menggantikan di dalamnya nilai 4 dan D(sekurang-kurangnya anggaran). Sebaliknya D anda boleh menggunakan penilaian D. Pada dasarnya, momen tengah keempat juga boleh digantikan dengan anggarannya, sebagai contoh, dengan nilai bentuk:

tetapi penggantian sedemikian akan memberikan ketepatan yang sangat rendah, kerana secara umum, dengan bilangan percubaan yang terhad, momen tertib tinggi ditentukan dengan ralat yang besar. Walau bagaimanapun, dalam amalan ia sering berlaku bahawa bentuk undang-undang taburan kuantiti X diketahui terlebih dahulu: hanya parameternya tidak diketahui. Kemudian kita boleh cuba untuk menyatakan u4 dari segi D.

Mari kita ambil kes yang paling biasa, apabila nilai X diedarkan mengikut hukum biasa. Kemudian momen pusat keempatnya dinyatakan dalam sebutan varians (lihat Bab 6 Subseksyen 6.2);

dan formula (14.3.12) memberi atau

Menggantikan dalam (14.3.14) yang tidak diketahui D penilaiannya D, kita dapat: dari mana

Detik u 4 boleh dinyatakan dalam sebutan D juga dalam beberapa kes lain, apabila pengagihan kuantiti X tidak normal, tetapi rupanya diketahui. Sebagai contoh, untuk undang-undang ketumpatan seragam (lihat Bab 5) kita ada:

di mana (a, P) ialah selang di mana undang-undang itu diberikan.

Akibatnya,

Mengikut formula (14.3.12) kita dapat: dari mana kita dapati lebih kurang

Dalam kes di mana bentuk hukum pengagihan nilai 26 tidak diketahui, apabila menganggar nilai a /) masih disyorkan untuk menggunakan formula (14.3.16), jika tidak ada alasan khusus untuk mempercayai bahawa ini undang-undang sangat berbeza daripada yang biasa (mempunyai kurtosis positif atau negatif yang ketara) .

Jika nilai anggaran a /) diperoleh dalam satu cara atau yang lain, maka adalah mungkin untuk membina selang keyakinan untuk varians dengan cara yang sama seperti kami membinanya untuk jangkaan matematik:

di mana nilai bergantung kepada kebarangkalian p yang diberikan terdapat dalam Jadual. 14.3.1.

Contoh 2. Cari Selang Keyakinan Kira-kira 80% untuk Varians Pembolehubah Rawak X di bawah syarat contoh 1, jika diketahui bahawa nilai X diedarkan mengikut undang-undang yang hampir normal.

Penyelesaian. Nilai tetap sama seperti dalam Jadual. 14.3.1:

Mengikut formula (14.3.16)

Mengikut formula (14.3.18) kita dapati selang keyakinan:

Julat nilai yang sepadan bagi sisihan piawai: (0.21; 0.29).

14.4. Kaedah tepat untuk membina selang keyakinan bagi parameter pembolehubah rawak yang diedarkan mengikut hukum biasa

Dalam subseksyen sebelumnya, kami mempertimbangkan kaedah anggaran secara kasar untuk membina selang keyakinan bagi min dan varians. Di sini kami memberikan idea tentang kaedah yang tepat untuk menyelesaikan masalah yang sama. Kami menekankan bahawa untuk mencari selang keyakinan dengan tepat, adalah perlu untuk mengetahui terlebih dahulu bentuk hukum taburan kuantiti x, sedangkan ini tidak diperlukan untuk penggunaan kaedah anggaran.

Idea kaedah tepat untuk membina selang keyakinan adalah seperti berikut. Sebarang selang keyakinan ditemui daripada keadaan yang menyatakan kebarangkalian pemenuhan beberapa ketaksamaan, yang termasuk anggaran faedah kepada kami a. Undang-undang pengagihan gred a dalam kes umum bergantung pada parameter kuantiti yang tidak diketahui x. Walau bagaimanapun, kadangkala adalah mungkin untuk lulus dalam ketaksamaan daripada pembolehubah rawak a kepada beberapa fungsi lain bagi nilai yang diperhatikan X p X 2, ..., X hlm. hukum taburan yang tidak bergantung pada parameter yang tidak diketahui, tetapi hanya bergantung pada bilangan eksperimen dan pada bentuk hukum taburan kuantiti x. Pembolehubah rawak jenis ini memainkan peranan yang besar dalam statistik matematik; mereka telah dikaji secara terperinci untuk kes taburan normal kuantiti x.

Sebagai contoh, telah dibuktikan bahawa di bawah taburan normal kuantiti X nilai rawak

tertakluk kepada apa yang dipanggil Undang-undang pengagihan pelajar Dengan P- 1 darjah kebebasan; ketumpatan undang-undang ini mempunyai bentuk

di mana G(x) ialah fungsi gamma yang diketahui:

Ia juga dibuktikan bahawa pembolehubah rawak

mempunyai "distribution % 2 " dengan P- 1 darjah kebebasan (lihat bab 7), yang ketumpatannya dinyatakan oleh formula

Tanpa memikirkan terbitan taburan (14.4.2) dan (14.4.4), kami akan menunjukkan bagaimana ia boleh digunakan semasa membina selang keyakinan untuk parameter Ty D .

Biar dihasilkan P eksperimen bebas ke atas pembolehubah rawak x, diedarkan mengikut hukum biasa dengan parameter yang tidak diketahui TIO. Untuk parameter ini, anggaran

Ia diperlukan untuk membina selang keyakinan untuk kedua-dua parameter yang sepadan dengan kebarangkalian keyakinan p.

Mari kita mula-mula membina selang keyakinan untuk jangkaan matematik. Adalah wajar untuk mengambil selang ini simetri berkenaan dengan t; nyatakan dengan s p separuh panjang selang itu. Nilai sp mesti dipilih supaya keadaan

Mari kita cuba lulus sebelah kiri kesamaan (14.4.5) daripada pembolehubah rawak t kepada pembolehubah rawak T, diedarkan mengikut undang-undang Pelajar. Untuk melakukan ini, kita darabkan kedua-dua bahagian ketaksamaan |m-w?|

kepada nilai positif: atau, menggunakan tatatanda (14.4.1),

Mari kita cari nombor / p supaya nilai / p boleh didapati daripada keadaan

Ia boleh dilihat daripada formula (14.4.2) bahawa (1) ialah fungsi genap, jadi (14.4.8) memberikan

Kesamaan (14.4.9) menentukan nilai / p bergantung pada p. Jika anda mempunyai jadual nilai kamiran yang anda boleh gunakan

maka nilai / p boleh didapati dengan interpolasi terbalik dalam jadual. Walau bagaimanapun, adalah lebih mudah untuk menyusun jadual nilai / p terlebih dahulu. Jadual sedemikian diberikan dalam Lampiran (Jadual 5). Jadual ini menunjukkan nilai bergantung pada kebarangkalian keyakinan p dan bilangan darjah kebebasan P- 1. Setelah ditentukan/p mengikut jadual. 5 dan andaikan

kita dapati separuh lebar selang keyakinan / p dan selang itu sendiri

Contoh 1. 5 eksperimen bebas telah dilakukan ke atas pembolehubah rawak x, diedarkan secara normal dengan parameter yang tidak diketahui t dan tentang. Keputusan eksperimen diberikan dalam jadual. 14.4.1.

Jadual 14.4.1

Cari anggaran t untuk jangkaan matematik dan bina selang keyakinan 90% / p untuknya (iaitu, selang yang sepadan dengan kebarangkalian keyakinan p \u003d 0.9).

Penyelesaian. Kami ada:

Mengikut jadual 5 permohonan untuk P - 1 = 4 dan p = 0.9 kita dapati di mana

Selang keyakinan akan menjadi

Contoh 2. Untuk syarat contoh 1 subseksyen 14.3, dengan andaian nilainya X taburan normal, cari selang keyakinan yang tepat.

Penyelesaian. Menurut jadual 5 permohonan itu, kami dapati di P - 1 = 19ir =

0.8 / p = 1.328; dari sini

Membandingkan dengan penyelesaian contoh 1 subseksyen 14.3 (e p = 0.072), kita melihat bahawa percanggahan adalah sangat kecil. Jika kita mengekalkan ketepatan ke tempat perpuluhan kedua, maka selang keyakinan yang ditemui oleh kaedah tepat dan anggaran adalah sama:

Mari kita teruskan untuk membina selang keyakinan untuk varians. Pertimbangkan anggaran varians tidak berat sebelah

dan nyatakan pembolehubah rawak D melalui nilai V(14.4.3) mempunyai pengedaran x 2 (14.4.4):

Mengetahui hukum taburan kuantiti V, adalah mungkin untuk mencari selang / (1 ) di mana ia jatuh dengan kebarangkalian p yang diberikan.

undang-undang pengedaran k n _ x (v) nilai I 7 mempunyai bentuk yang ditunjukkan dalam rajah. 14.4.1.

nasi. 14.4.1

Persoalannya timbul: bagaimana untuk memilih selang / p? Jika hukum taburan kuantiti V adalah simetri (seperti undang-undang biasa atau taburan Pelajar), adalah wajar untuk mengambil selang /p simetri berkenaan dengan jangkaan matematik. Dalam kes ini, undang-undang k n _ x (v) tidak simetri. Marilah kita bersetuju untuk memilih selang /p supaya kebarangkalian keluaran kuantiti V di luar selang ke kanan dan kiri (kawasan berlorek dalam Rajah 14.4.1) adalah sama dan sama

Untuk membina selang / p dengan sifat ini, kami menggunakan Jadual. 4 aplikasi: ia mengandungi nombor y) seperti itu

untuk kuantiti V, mempunyai x 2 -taburan dengan r darjah kebebasan. Dalam kes kita r = n- 1. Betulkan r = n- 1 dan cari dalam baris jadual yang sepadan. 4 dua nilai x 2 - satu sepadan dengan kebarangkalian yang lain - kebarangkalian Mari kita tentukan ini

nilai pukul 2 dan xl? Selang telah y 2 , dengan kirinya, dan y~ hujung kanan.

Sekarang kita dapati selang keyakinan yang diperlukan /| untuk varians dengan sempadan D, dan D2, yang meliputi perkara itu D dengan kebarangkalian p:

Mari kita bina selang seperti itu / (, = (?> b A), yang meliputi titik D jika dan hanya jika nilai V jatuh ke dalam selang / r. Mari kita tunjukkan bahawa selang

memenuhi syarat ini. Sesungguhnya, ketidaksamaan adalah setara dengan ketidaksamaan

dan ketaksamaan ini berlaku dengan kebarangkalian p. Oleh itu, selang keyakinan untuk serakan ditemui dan dinyatakan oleh formula (14.4.13).

Contoh 3. Cari selang keyakinan bagi varians di bawah syarat contoh 2 subseksyen 14.3, jika diketahui bahawa nilai X diedarkan secara normal.

Penyelesaian. Kami ada . Mengikut jadual 4 permohonan

kita dapati di r = n - 1 = 19

Mengikut formula (14.4.13) kita dapati selang keyakinan untuk serakan

Selang sepadan untuk sisihan piawai: (0.21; 0.32). Selang ini hanya sedikit melebihi selang (0.21; 0.29) yang diperoleh dalam Contoh 2 Subseksyen 14.3 dengan kaedah anggaran.

  • Rajah 14.3.1 menganggap selang keyakinan yang simetri tentang a. Secara umum, seperti yang akan kita lihat kemudian, ini tidak perlu.

Sasaran– untuk mengajar pelajar algoritma untuk mengira selang keyakinan parameter statistik.

Semasa pemprosesan data statistik, min aritmetik yang dikira, pekali variasi, pekali korelasi, kriteria perbezaan dan statistik titik lain harus menerima had keyakinan kuantitatif, yang menunjukkan kemungkinan turun naik penunjuk naik dan turun dalam selang keyakinan.

Contoh 3.1 . Pengagihan kalsium dalam serum darah monyet, seperti yang telah ditetapkan sebelum ini, dicirikan oleh penunjuk terpilih berikut: = 11.94 mg%; = 0.127 mg%; n= 100. Ia diperlukan untuk menentukan selang keyakinan bagi purata am ( ) dengan kebarangkalian keyakinan P = 0,95.

Purata am adalah dengan kebarangkalian tertentu dalam selang:

, di mana – sampel min aritmetik; t- Kriteria pelajar; ialah ralat bagi min aritmetik.

Menurut jadual "Nilai Kriteria Pelajar" kita dapati nilainya dengan tahap keyakinan 0.95 dan bilangan darjah kebebasan k\u003d 100-1 \u003d 99. Ia bersamaan dengan 1.982. Bersama-sama dengan nilai-nilai min aritmetik dan ralat statistik, kami menggantikannya ke dalam formula:

atau 11.69
12,19

Oleh itu, dengan kebarangkalian 95%, boleh dikatakan bahawa purata am bagi taburan normal ini adalah antara 11.69 dan 12.19 mg%.

Contoh 3.2 . Tentukan sempadan selang keyakinan 95% untuk varians am ( ) pengagihan kalsium dalam darah monyet, jika diketahui bahawa
= 1.60, dengan n = 100.

Untuk menyelesaikan masalah, anda boleh menggunakan formula berikut:

di mana ialah ralat statistik varians.

Cari ralat varians sampel menggunakan formula:
. Ia bersamaan dengan 0.11. Maknanya t- kriteria dengan kebarangkalian keyakinan 0.95 dan bilangan darjah kebebasan k= 100–1 = 99 diketahui daripada contoh sebelumnya.

Mari gunakan formula dan dapatkan:

atau 1.38
1,82

Selang keyakinan yang lebih tepat untuk varians am boleh dibina menggunakan (chi-square) - Ujian Pearson. Mata kritikal untuk kriteria ini diberikan dalam jadual khas. Apabila menggunakan kriteria aras keertian dua belah digunakan untuk membina selang keyakinan. Untuk sempadan bawah, aras keertian dikira dengan formula
, untuk bahagian atas
. Sebagai contoh, untuk tahap keyakinan = 0,99= 0,010,= 0.990. Sehubungan itu, mengikut jadual taburan nilai kritikal , dengan tahap keyakinan yang dikira dan bilangan darjah kebebasan k= 100 – 1= 99, cari nilainya
dan
. Kita mendapatkan
bersamaan dengan 135.80, dan
bersamaan dengan 70.06.

Untuk mencari had keyakinan varians am menggunakan kami menggunakan formula: untuk sempadan bawah
, untuk sempadan atas
. Gantikan data tugasan untuk nilai yang ditemui ke dalam formula:
= 1,17;
= 2.26. Justeru, dengan tahap keyakinan P= 0.99 atau 99% varians am akan terletak dalam julat dari 1.17 hingga 2.26 mg% inklusif.

Contoh 3.3 . Di antara 1000 biji gandum dari lot yang tiba di lif, 120 biji yang dijangkiti ergot ditemui. Ia adalah perlu untuk menentukan sempadan kemungkinan jumlah bahagian benih yang dijangkiti dalam kelompok gandum tertentu.

Had keyakinan untuk bahagian umum untuk semua nilai yang mungkin harus ditentukan oleh formula:

,

di mana n ialah bilangan pemerhatian; m ialah nombor mutlak salah satu kumpulan; t ialah sisihan ternormal.

Pecahan sampel benih yang dijangkiti adalah sama dengan
atau 12%. Dengan tahap keyakinan R= 95% sisihan ternormal ( t-Kriteria pelajar untuk k =
)t = 1,960.

Kami menggantikan data yang tersedia ke dalam formula:

Oleh itu, sempadan selang keyakinan adalah = 0.122–0.041 = 0.081, atau 8.1%; = 0.122 + 0.041 = 0.163, atau 16.3%.

Oleh itu, dengan tahap keyakinan 95%, boleh dinyatakan bahawa jumlah bahagian benih yang dijangkiti adalah antara 8.1 dan 16.3%.

Contoh 3.4 . Pekali variasi, yang mencirikan variasi kalsium (mg%) dalam serum darah monyet, adalah bersamaan dengan 10.6%. Saiz sampel n= 100. Ia adalah perlu untuk menentukan sempadan selang keyakinan 95% untuk parameter umum CV.

Had keyakinan untuk pekali umum variasi CV ditentukan oleh formula berikut:

dan
, di mana K nilai perantaraan yang dikira oleh formula
.

Mengetahui itu dengan tahap keyakinan R= 95% sisihan ternormal (ujian-t pelajar untuk k =
)t = 1.960, pra-kira nilai KEPADA:

.

atau 9.3%

atau 12.3%

Oleh itu, pekali umum variasi dengan kebarangkalian keyakinan 95% terletak dalam julat dari 9.3 hingga 12.3%. Dengan sampel berulang, pekali variasi tidak akan melebihi 12.3% dan tidak akan jatuh di bawah 9.3% dalam 95 kes daripada 100.

Soalan untuk mengawal diri:

Tugas untuk penyelesaian bebas.

1. Purata peratusan lemak dalam susu untuk penyusuan lembu kacukan Kholmogory adalah seperti berikut: 3.4; 3.6; 3.2; 3.1; 2.9; 3.7; 3.2; 3.6; 4.0; 3.4; 4.1; 3.8; 3.4; 4.0; 3.3; 3.7; 3.5; 3.6; 3.4; 3.8. Tetapkan selang keyakinan untuk min keseluruhan pada tahap keyakinan 95% (20 mata).

2. Pada 400 tumbuhan rai hibrid, bunga pertama muncul secara purata 70.5 hari selepas menyemai. Sisihan piawai ialah 6.9 hari. Tentukan ralat min dan selang keyakinan bagi min dan varians populasi pada aras keertian W= 0.05 dan W= 0.01 (25 mata).

3. Apabila mengkaji panjang daun 502 spesimen strawberi taman, data berikut diperoleh: = 7.86 cm; σ = 1.32 cm, \u003d ± 0.06 cm Tentukan selang keyakinan bagi min aritmetik populasi dengan aras keertian 0.01; 0.02; 0.05. (25 mata).

4. Apabila memeriksa 150 lelaki dewasa, ketinggian purata ialah 167 cm, dan σ \u003d 6 cm Apakah had purata am dan varians am dengan kebarangkalian keyakinan 0.99 dan 0.95? (25 mata).

5. Pengagihan kalsium dalam serum darah monyet dicirikan oleh penunjuk terpilih berikut: = 11.94 mg%, σ = 1,27, n = 100. Plotkan selang keyakinan 95% untuk min populasi taburan ini. Kira pekali variasi (25 mata).

6. Jumlah kandungan nitrogen dalam plasma darah tikus albino pada umur 37 dan 180 hari telah dikaji. Keputusan dinyatakan dalam gram setiap 100 cm 3 plasma. Pada umur 37 hari, 9 ekor tikus mempunyai: 0.98; 0.83; 0.99; 0.86; 0.90; 0.81; 0.94; 0.92; 0.87. Pada umur 180 hari, 8 ekor tikus mempunyai: 1.20; 1.18; 1.33; 1.21; 1.20; 1.07; 1.13; 1.12. Tetapkan selang keyakinan untuk perbezaan dengan tahap keyakinan 0.95 (50 mata).

7. Tentukan sempadan selang keyakinan 95% untuk varians umum taburan kalsium (mg%) dalam serum darah monyet, jika untuk taburan ini saiz sampel n = 100, ralat statistik varians sampel s σ 2 = 1.60 (40 mata).

8. Tentukan sempadan selang keyakinan 95% bagi varians am taburan 40 spikelet gandum sepanjang panjang (σ 2 = 40.87 mm 2). (25 mata).

9. Merokok dianggap sebagai faktor utama yang terdedah kepada penyakit pulmonari obstruktif. Merokok pasif tidak dianggap sebagai faktor sedemikian. Para saintis mempersoalkan keselamatan merokok pasif dan memeriksa saluran pernafasan pada bukan perokok, perokok pasif dan aktif. Untuk mencirikan keadaan saluran pernafasan, kami mengambil salah satu penunjuk fungsi pernafasan luaran - halaju volumetrik maksimum pada pertengahan pernafasan. Penurunan penunjuk ini adalah tanda gangguan patensi saluran udara. Data tinjauan ditunjukkan dalam jadual.

Bilangan yang diperiksa

Kadar aliran pertengahan ekspirasi maksimum, l/s

Sisihan piawai

Bukan perokok

bekerja di kawasan larangan merokok

bekerja di dalam bilik yang dipenuhi asap

perokok

menghisap sebilangan kecil rokok

purata bilangan perokok

menghisap sejumlah besar rokok

Daripada jadual, cari selang keyakinan 95% bagi min am dan varians am bagi setiap kumpulan. Apakah perbezaan antara kumpulan? Bentangkan keputusan secara grafik (25 mata).

10. Tentukan sempadan selang keyakinan 95% dan 99% untuk varians umum bilangan anak babi dalam 64 anak babi, jika ralat statistik varians sampel s σ 2 = 8.25 (30 mata).

11. Adalah diketahui bahawa purata berat arnab ialah 2.1 kg. Tentukan sempadan selang keyakinan 95% dan 99% untuk min dan varians umum apabila n= 30, σ = 0.56 kg (25 mata).

12. Dalam 100 biji, kandungan biji telinga diukur ( X), panjang spike ( Y) dan jisim bijirin di dalam telinga ( Z). Cari selang keyakinan untuk min dan varians am untuk P 1 = 0,95, P 2 = 0,99, P 3 = 0.999 jika = 19, = 6.766 cm, = 0.554 g; σ x 2 = 29.153, σ y 2 = 2.111, σ z 2 = 0.064. (25 mata).

13. Dalam 100 biji gandum musim sejuk yang dipilih secara rawak, bilangan spikelet telah dikira. Set sampel dicirikan oleh penunjuk berikut: = 15 spikelet dan σ = 2.28 pcs. Tentukan ketepatan hasil purata diperolehi ( ) dan plot selang keyakinan untuk min dan varians keseluruhan pada tahap keertian 95% dan 99% (30 mata).

14. Bilangan rusuk pada cengkerang fosil moluska Orthambonit kaligramma:

Adalah diketahui bahawa n = 19, σ = 4.25. Tentukan sempadan selang keyakinan bagi min am dan varians am pada tahap keertian W = 0.01 (25 mata).

15. Untuk menentukan hasil susu di ladang tenusu komersial, produktiviti 15 ekor lembu ditentukan setiap hari. Mengikut data bagi tahun tersebut, setiap lembu memberikan secara purata jumlah susu yang berikut setiap hari (l): 22; 19; 25; dua puluh; 27; 17; tiga puluh; 21; lapan belas; 24; 26; 23; 25; dua puluh; 24. Plot selang keyakinan untuk varians am dan min aritmetik. Bolehkah kita menjangkakan purata hasil susu tahunan bagi setiap lembu ialah 10,000 liter? (50 mata).

16. Bagi menentukan purata hasil gandum bagi ladang, pemotongan telah dijalankan pada plot sampel seluas 1, 3, 2, 5, 2, 6, 1, 3, 2, 11 dan 2 ha. Hasil (c/ha) daripada plot ialah 39.4; 38; 35.8; 40; 35; 42.7; 39.3; 41.6; 33; 42; 29 masing-masing. Plot selang keyakinan untuk varians am dan min aritmetik. Adakah mungkin untuk menjangkakan purata hasil bagi perusahaan pertanian ialah 42 c/ha? (50 mata).

Dalam statistik, terdapat dua jenis anggaran: titik dan selang. Anggaran Mata ialah statistik sampel tunggal yang digunakan untuk menganggar parameter populasi. Contohnya, min sampel ialah anggaran titik bagi min populasi, dan varians sampel S2- anggaran titik varians populasi σ2. telah ditunjukkan bahawa min sampel adalah anggaran yang tidak berat sebelah terhadap jangkaan populasi. Min sampel dipanggil tidak berat sebelah kerana min semua sampel bermakna (dengan saiz sampel yang sama n) adalah sama dengan jangkaan matematik populasi umum.

Untuk varians sampel S2 menjadi penganggar yang tidak berat sebelah bagi varians populasi σ2, penyebut varians sampel hendaklah ditetapkan sama dengan n – 1 , tetapi tidak n. Dengan kata lain, varians populasi ialah purata semua varians sampel yang mungkin.

Apabila menganggar parameter populasi, perlu diingat bahawa statistik sampel seperti , bergantung pada sampel tertentu. Untuk mengambil kira fakta ini, untuk mendapatkan anggaran selang jangkaan matematik populasi umum menganalisis taburan min sampel (untuk butiran lanjut, lihat). Selang yang dibina dicirikan oleh tahap keyakinan tertentu, iaitu kebarangkalian bahawa parameter sebenar populasi umum dianggarkan dengan betul. Selang keyakinan yang serupa boleh digunakan untuk menganggarkan perkadaran ciri R dan jisim teragih utama penduduk umum.

Muat turun nota dalam atau format, contoh dalam format

Pembinaan selang keyakinan untuk jangkaan matematik populasi umum dengan sisihan piawai yang diketahui

Membina selang keyakinan untuk perkadaran sifat dalam populasi umum

Dalam bahagian ini, konsep selang keyakinan dilanjutkan kepada data kategori. Ini membolehkan anda menganggarkan bahagian sifat dalam populasi umum R dengan bahagian sampel RS= X/n. Seperti yang dinyatakan, jika nilai nR dan n(1 - p) melebihi nombor 5, taburan binomial boleh dianggarkan dengan yang normal. Oleh itu, untuk menganggar bahagian sesuatu sifat dalam populasi umum R adalah mungkin untuk membina selang yang tahap keyakinannya sama dengan (1 - α)x100%.


di mana hlmS- bahagian sampel ciri, sama dengan X/n, iaitu bilangan kejayaan dibahagikan dengan saiz sampel, R- bahagian sifat dalam populasi umum, Z ialah nilai kritikal taburan normal piawai, n- saiz sampel.

Contoh 3 Mari kita andaikan bahawa sampel diekstrak daripada sistem maklumat, yang terdiri daripada 100 invois yang disiapkan pada bulan lepas. Katakan 10 daripada invois ini tidak betul. Dengan cara ini, R= 10/100 = 0.1. Tahap keyakinan 95% sepadan dengan nilai kritikal Z = 1.96.

Oleh itu, terdapat 95% kemungkinan bahawa antara 4.12% dan 15.88% daripada invois mengandungi ralat.

Untuk saiz sampel tertentu, selang keyakinan yang mengandungi perkadaran sifat dalam populasi umum nampaknya lebih luas daripada pembolehubah rawak berterusan. Ini kerana pengukuran pembolehubah rawak berterusan mengandungi lebih banyak maklumat daripada pengukuran data kategori. Dalam erti kata lain, data kategori yang mengambil hanya dua nilai mengandungi maklumat yang tidak mencukupi untuk menganggarkan parameter pengedarannya.

ATpengiraan anggaran yang diambil daripada populasi terhingga

Anggaran jangkaan matematik. Faktor pembetulan untuk populasi akhir ( fpc) digunakan untuk mengurangkan ralat piawai dengan faktor . Apabila mengira selang keyakinan untuk anggaran parameter populasi, faktor pembetulan digunakan dalam situasi di mana sampel diambil tanpa penggantian. Oleh itu, selang keyakinan untuk jangkaan matematik, mempunyai tahap keyakinan yang sama dengan (1 - α)x100%, dikira dengan formula:

Contoh 4 Untuk menggambarkan penggunaan faktor pembetulan bagi populasi terhingga, mari kita kembali kepada masalah mengira selang keyakinan bagi jumlah purata invois yang dibincangkan dalam Contoh 3 di atas. Katakan syarikat mengeluarkan 5,000 invois sebulan, dan Xᅳ=110.27 USD, S= $28.95 N = 5000, n = 100, α = 0.05, t99 = 1.9842. Menurut formula (6) kita dapat:

Anggaran bahagian ciri. Apabila memilih tiada pulangan, selang keyakinan untuk bahagian ciri yang mempunyai tahap keyakinan yang sama dengan (1 - α)x100%, dikira dengan formula:

Selang keyakinan dan isu etika

Apabila persampelan populasi dan merumuskan inferens statistik, masalah etika sering timbul. Perkara utama ialah bagaimana selang keyakinan dan anggaran titik statistik sampel bersetuju. Anggaran titik penerbitan tanpa menyatakan selang keyakinan yang sesuai (biasanya pada tahap keyakinan 95%) dan saiz sampel yang mana ia diperoleh boleh mengelirukan. Ini mungkin memberi pengguna tanggapan bahawa anggaran mata adalah perkara yang dia perlukan untuk meramalkan sifat keseluruhan populasi. Oleh itu, adalah perlu untuk memahami bahawa dalam mana-mana penyelidikan, bukan titik, tetapi anggaran selang harus diletakkan di hadapan. Di samping itu, perhatian khusus harus diberikan kepada pilihan saiz sampel yang betul.

Selalunya, objek manipulasi statistik adalah hasil tinjauan sosiologi penduduk mengenai pelbagai isu politik. Pada masa yang sama, hasil tinjauan diletakkan di muka depan akhbar, dan ralat pensampelan dan metodologi analisis statistik dicetak di suatu tempat di tengah-tengah. Untuk membuktikan kesahihan anggaran mata yang diperoleh, adalah perlu untuk menunjukkan saiz sampel berdasarkan mana ia diperoleh, sempadan selang keyakinan dan tahap keertiannya.

Nota seterusnya

Bahan daripada buku Levin et al. Perangkaan untuk pengurus digunakan. - M.: Williams, 2004. - hlm. 448–462

Teorem had pusat menyatakan bahawa, memandangkan saiz sampel yang cukup besar, taburan sampel min boleh dianggarkan dengan taburan normal. Harta ini tidak bergantung pada jenis taburan penduduk.

Dan lain-lain. Kesemuanya adalah anggaran rakan teori mereka, yang boleh diperolehi jika tidak ada sampel, tetapi populasi umum. Tetapi malangnya, populasi umum sangat mahal dan selalunya tidak tersedia.

Konsep anggaran selang

Sebarang anggaran sampel mempunyai beberapa taburan, kerana ialah pembolehubah rawak bergantung kepada nilai dalam sampel tertentu. Oleh itu, untuk inferens statistik yang lebih dipercayai, seseorang harus mengetahui bukan sahaja anggaran titik, tetapi juga selang, yang dengan kebarangkalian tinggi γ (gamma) meliputi penunjuk anggaran θ (theta).

Secara rasmi, ini adalah dua nilai tersebut (statistik) T1(X) dan T2(X), apa T1< T 2 , yang pada tahap kebarangkalian tertentu γ syarat dipenuhi:

Pendek kata, kemungkinan besar γ atau lebih nilai sebenar adalah antara mata T1(X) dan T2(X), yang dipanggil sempadan bawah dan atas selang keyakinan.

Salah satu syarat untuk membina selang keyakinan ialah kesempitan maksimumnya, i.e. ia sepatutnya sesingkat mungkin. Keinginan agak semula jadi, kerana. penyelidik cuba menyetempatkan penemuan parameter yang dikehendaki dengan lebih tepat.

Ia berikutan bahawa selang keyakinan harus meliputi kebarangkalian maksimum taburan. dan markah itu sendiri berada di tengah.

Iaitu, kebarangkalian sisihan (penunjuk sebenar dari anggaran) ke atas adalah sama dengan kebarangkalian sisihan ke bawah. Perlu juga diperhatikan bahawa untuk taburan condong, selang di sebelah kanan tidak sama dengan selang di sebelah kiri.

Angka di atas jelas menunjukkan bahawa lebih tinggi tahap keyakinan, lebih luas selang - hubungan langsung.

Ini adalah pengenalan kecil kepada teori anggaran selang parameter yang tidak diketahui. Mari kita teruskan untuk mencari had keyakinan untuk jangkaan matematik.

Selang keyakinan untuk jangkaan matematik

Jika data asal diedarkan melebihi , maka purata akan menjadi nilai normal. Ini berikutan daripada peraturan bahawa gabungan linear nilai normal juga mempunyai taburan normal. Oleh itu, untuk mengira kebarangkalian, kita boleh menggunakan radas matematik bagi hukum taburan normal.

Walau bagaimanapun, ini memerlukan pengetahuan tentang dua parameter - nilai yang dijangkakan dan varians, yang biasanya tidak diketahui. Anda boleh, sudah tentu, menggunakan anggaran dan bukannya parameter (min aritmetik dan ), tetapi kemudian taburan min tidak akan menjadi agak normal, ia akan diratakan sedikit. Warganegara William Gosset dari Ireland dengan bijak mencatat fakta ini apabila dia menerbitkan penemuannya dalam edisi Mac 1908 Biometrika. Untuk tujuan kerahsiaan, Gosset menandatangani dengan Pelajar. Ini adalah bagaimana taburan-t Pelajar muncul.

Walau bagaimanapun, taburan normal data, yang digunakan oleh K. Gauss dalam analisis kesilapan dalam pemerhatian astronomi, sangat jarang berlaku dalam kehidupan darat dan agak sukar untuk menetapkan ini (kira-kira 2 ribu pemerhatian diperlukan untuk ketepatan yang tinggi). Oleh itu, adalah lebih baik untuk menggugurkan andaian normal dan menggunakan kaedah yang tidak bergantung kepada taburan data asal.

Timbul persoalan: apakah taburan min aritmetik jika ia dikira daripada data taburan yang tidak diketahui? Jawapannya diberikan oleh teori kebarangkalian yang terkenal Teorem had pusat(CPT). Dalam matematik, terdapat beberapa versi (rumusan telah diperhalusi selama bertahun-tahun), tetapi kesemuanya, secara kasarnya, sampai kepada pernyataan bahawa jumlah sejumlah besar pembolehubah rawak bebas mematuhi undang-undang taburan normal.

Apabila mengira min aritmetik, jumlah pembolehubah rawak digunakan. Daripada ini ternyata min aritmetik mempunyai taburan normal, di mana nilai jangkaan adalah nilai jangkaan data awal, dan variansnya ialah .

Orang pintar tahu cara membuktikan CLT, tetapi kami akan mengesahkannya dengan bantuan percubaan yang dijalankan dalam Excel. Mari kita simulasi sampel 50 pembolehubah rawak teragih seragam (menggunakan fungsi Excel RANDOMBETWEEN). Kemudian kita akan membuat 1000 sampel tersebut dan mengira min aritmetik bagi setiap satu. Mari kita lihat pengedaran mereka.

Dapat dilihat bahawa taburan purata adalah hampir dengan hukum biasa. Jika jumlah sampel dan bilangannya dibuat lebih besar, maka persamaan akan menjadi lebih baik.

Sekarang kita telah melihat sendiri kesahan CLT, kita boleh, menggunakan , mengira selang keyakinan untuk min aritmetik, yang meliputi min sebenar atau jangkaan matematik dengan kebarangkalian yang diberikan.

Untuk menetapkan sempadan atas dan bawah, perlu mengetahui parameter taburan normal. Sebagai peraturan, mereka tidak, oleh itu, anggaran digunakan: min aritmetik dan varians sampel. Sekali lagi, kaedah ini memberikan anggaran yang baik hanya untuk sampel yang besar. Apabila sampel kecil, selalunya disyorkan untuk menggunakan pengedaran Pelajar. jangan percaya! Taburan pelajar untuk min hanya berlaku apabila data asal mempunyai taburan normal, iaitu hampir tidak pernah. Oleh itu, adalah lebih baik untuk segera menetapkan bar minimum untuk jumlah data yang diperlukan dan menggunakan kaedah asymptotically betul. Mereka mengatakan 30 pemerhatian sudah memadai. Ambil 50 - anda tidak boleh salah.

T 1.2 ialah sempadan bawah dan atas selang keyakinan

– contoh aritmetik min

s0– sisihan piawai sampel (tidak berat sebelah)

n - saiz sampel

γ – tahap keyakinan (biasanya sama dengan 0.9, 0.95 atau 0.99)

c γ =Φ -1 ((1+γ)/2) ialah timbal balik fungsi taburan normal piawai. Secara ringkas, ini ialah bilangan ralat piawai dari min aritmetik ke sempadan bawah atau atas (tiga kebarangkalian yang ditunjukkan sepadan dengan nilai 1.64, 1.96 dan 2.58).

Intipati formula adalah bahawa min aritmetik diambil dan kemudian jumlah tertentu diketepikan daripadanya ( dengan γ) ralat piawai ( s 0 /√n). Semuanya diketahui, ambil dan hitung.

Sebelum penggunaan besar-besaran PC, untuk mendapatkan nilai-nilai fungsi taburan normal dan songsangnya, mereka menggunakan . Ia masih digunakan, tetapi lebih cekap untuk beralih kepada formula Excel sedia dibuat. Semua elemen daripada formula di atas ( , dan ) boleh dikira dengan mudah dalam Excel. Tetapi terdapat juga formula sedia untuk mengira selang keyakinan - NORMA KEYAKINAN. Sintaksnya adalah seperti berikut.

NORM KEYAKINAN(alfa, standard_dev, saiz)

alfa– aras keertian atau aras keyakinan, yang dalam tatatanda di atas adalah sama dengan 1-γ, i.e. kebarangkalian bahawa matematikjangkaan akan berada di luar selang keyakinan. Dengan tahap keyakinan 0.95, alfa ialah 0.05, dan seterusnya.

standard_off ialah sisihan piawai bagi data sampel. Anda tidak perlu mengira ralat standard, Excel akan membahagikan dengan punca n.

saiz– saiz sampel (n).

Hasil daripada fungsi CONFIDENCE.NORM ialah sebutan kedua daripada formula untuk mengira selang keyakinan, i.e. separuh selang. Sehubungan itu, titik bawah dan atas adalah purata ± nilai yang diperolehi.

Oleh itu, adalah mungkin untuk membina algoritma sejagat untuk mengira selang keyakinan untuk min aritmetik, yang tidak bergantung pada taburan data awal. Harga untuk kesejagatan adalah sifat asimptotiknya, i.e. keperluan untuk menggunakan sampel yang agak besar. Walau bagaimanapun, dalam zaman teknologi moden, mengumpul jumlah data yang betul biasanya tidak sukar.

Menguji Hipotesis Statistik Menggunakan Selang Keyakinan

(modul 111)

Salah satu masalah utama yang diselesaikan dalam statistik ialah. Secara ringkasnya, intipatinya adalah ini. Andaian dibuat, sebagai contoh, bahawa jangkaan populasi umum adalah sama dengan beberapa nilai. Kemudian taburan cara sampel dibina, yang boleh diperhatikan dengan jangkaan yang diberikan. Seterusnya, kita melihat di mana dalam taburan bersyarat ini terletak purata sebenar. Jika ia melampaui had yang dibenarkan, maka penampilan purata sedemikian adalah sangat tidak mungkin, dan dengan satu pengulangan eksperimen hampir mustahil, yang bercanggah dengan hipotesis yang dikemukakan, yang berjaya ditolak. Jika purata tidak melepasi tahap kritikal, maka hipotesis tidak ditolak (tetapi ia tidak dibuktikan juga!).

Jadi, dengan bantuan selang keyakinan, dalam kes kami untuk jangkaan, anda juga boleh menguji beberapa hipotesis. Ia sangat mudah untuk dilakukan. Katakan min aritmetik untuk sesetengah sampel ialah 100. Hipotesis sedang diuji bahawa jangkaan adalah, katakan, 90. Iaitu, jika kita meletakkan soalan secara primitif, ia berbunyi seperti ini: bolehkah itu, dengan nilai sebenar min sama dengan 90, purata yang diperhatikan ialah 100?

Untuk menjawab soalan ini, maklumat tambahan tentang sisihan piawai dan saiz sampel akan diperlukan. Katakan sisihan piawai ialah 30, dan bilangan cerapan ialah 64 (untuk mengekstrak punca dengan mudah). Maka ralat piawai bagi min ialah 30/8 atau 3.75. Untuk mengira selang keyakinan 95%, anda perlu mengetepikan dua ralat piawai pada kedua-dua belah min (lebih tepat lagi, 1.96). Selang keyakinan ialah kira-kira 100 ± 7.5, atau dari 92.5 hingga 107.5.

Alasan selanjutnya adalah seperti berikut. Jika nilai yang diuji jatuh dalam selang keyakinan, maka ia tidak bercanggah dengan hipotesis, kerana sesuai dalam had turun naik rawak (dengan kebarangkalian 95%). Jika titik yang diuji berada di luar selang keyakinan, maka kebarangkalian kejadian sedemikian adalah sangat kecil, dalam apa jua keadaan di bawah tahap yang boleh diterima. Oleh itu, hipotesis ditolak kerana bercanggah dengan data yang diperhatikan. Dalam kes kami, hipotesis jangkaan berada di luar selang keyakinan (nilai 90 yang diuji tidak termasuk dalam selang 100±7.5), jadi ia harus ditolak. Menjawab soalan primitif di atas, seseorang harus berkata: tidak, ia tidak boleh, dalam apa jua keadaan, ini jarang berlaku. Selalunya, ini menunjukkan kebarangkalian khusus penolakan yang salah terhadap hipotesis (peringkat-p), dan bukan tahap tertentu, mengikut mana selang keyakinan dibina, tetapi lebih banyak lagi pada masa lain.

Seperti yang anda lihat, tidak sukar untuk membina selang keyakinan untuk min (atau jangkaan matematik). Perkara utama adalah untuk menangkap intipati, dan kemudian perkara akan pergi. Dalam amalan, kebanyakan menggunakan selang keyakinan 95%, iaitu kira-kira dua ralat standard lebar pada kedua-dua belah min.

Itu sahaja buat masa ini. Semua yang terbaik!