Riyazi gözləmə üçün etimad intervalı. Nümunələr və etimad intervalları

Riyazi gözləmə üçün etimad intervalı - bu, məlum ehtimalla ümumi əhalinin riyazi gözləntilərini ehtiva edən məlumatlardan hesablanan belə bir intervaldır. Riyazi gözlənti üçün təbii qiymətləndirmə onun müşahidə edilən qiymətlərinin arifmetik ortasıdır. Buna görə də dərs zamanı daha sonra "orta", "orta dəyər" terminlərindən istifadə edəcəyik. Etibar intervalının hesablanması məsələlərində ən çox tələb olunan cavab "Orta ədədin [xüsusi problemdə qiymətin] etibarlılıq intervalı [aşağı qiymətdən] [daha yüksək qiymətə] qədərdir". Etibar intervalının köməyi ilə təkcə orta qiymətləri deyil, həm də ümumi əhalinin bu və ya digər xüsusiyyətlərinin payını qiymətləndirmək mümkündür. Dərsdə yeni təriflərə və düsturlara gələcəyimiz orta dəyərlər, dispersiya, standart sapma və səhvlər təhlil edilir. Nümunə və Əhali Xüsusiyyətləri .

Ortanın nöqtə və interval təxminləri

Əgər ümumi əhalinin orta qiyməti ədədlə (nöqtə ilə) qiymətləndirilirsə, onda ümumi əhalinin naməlum orta qiymətinin qiymətləndirilməsi kimi müşahidələr seçməsindən hesablanmış xüsusi orta alınır. Bu halda, seçmənin orta dəyəri - təsadüfi dəyişən - ümumi əhalinin orta dəyəri ilə üst-üstə düşmür. Buna görə də nümunənin orta qiymətini göstərərkən eyni zamanda seçmə xətasını da göstərmək lazımdır. Standart xəta seçmə xətasının ölçüsü kimi istifadə olunur və bu, orta ilə eyni vahidlərlə ifadə edilir. Buna görə də tez-tez aşağıdakı qeydlərdən istifadə olunur: .

Orta dəyərin qiymətləndirilməsinin müəyyən ehtimalla əlaqələndirilməsi tələb olunursa, maraq doğuran ümumi kütlənin parametri tək bir rəqəmlə deyil, intervalla qiymətləndirilməlidir. Etibar intervalı müəyyən bir ehtimalla, Pümumi əhalinin təxmini göstəricisinin qiyməti tapılır. Ehtimal ilə olan etimad intervalı P = 1 - α təsadüfi dəyişəndir, aşağıdakı kimi hesablanır:

,

α = 1 - P, bunu statistikaya dair demək olar ki, hər hansı bir kitaba əlavədə tapmaq olar.

Təcrübədə ümumi orta və dispersiya məlum deyildir, ona görə də ümumi dispersiya seçmə dispersiya ilə, ümumi orta göstərici isə seçmə ortası ilə əvəz olunur. Beləliklə, əksər hallarda etimad intervalı aşağıdakı kimi hesablanır:

.

Etibar intervalı düsturu, əgər populyasiyanın ortasını qiymətləndirmək üçün istifadə edilə bilər

  • ümumi əhalinin standart sapması məlumdur;
  • və ya əhalinin standart kənarlaşması məlum deyil, lakin nümunənin ölçüsü 30-dan çoxdur.

Nümunə orta populyasiya ortasının qərəzsiz qiymətləndirilməsidir. Öz növbəsində, nümunə variasiyası populyasiya fərqinin qərəzsiz qiymətləndirilməsi deyil. Nümunə dispersiya düsturunda əhali fərqinin qərəzsiz qiymətləndirilməsini əldə etmək üçün seçmə ölçüsü belədir n ilə əvəz edilməlidir n-1.

Misal 1 Müəyyən bir şəhərdə təsadüfi seçilmiş 100 kafedən məlumat toplanır ki, onlarda işçilərin orta sayı 4,6 standart sapma ilə 10,5 nəfərdir. Kafe işçilərinin sayının 95% etibar intervalını müəyyən edin.

burada əhəmiyyətlilik səviyyəsi üçün standart normal paylanmanın kritik qiyməti α = 0,05 .

Beləliklə, kafe işçilərinin orta sayı üçün 95% inam intervalı 9,6-11,4 arasında olub.

Misal 2 64 müşahidədən ibarət ümumi populyasiyadan təsadüfi bir nümunə üçün aşağıdakı ümumi dəyərlər hesablandı:

müşahidələrdəki dəyərlərin cəmi,

dəyərlərin ortadan kvadrat sapmalarının cəmi .

Gözlənilən dəyər üçün 95% etimad intervalını hesablayın.

standart sapmanı hesablayın:

,

orta dəyəri hesablayın:

.

Etibar intervalı üçün ifadədəki dəyərləri əvəz edin:

burada əhəmiyyətlilik səviyyəsi üçün standart normal paylanmanın kritik qiyməti α = 0,05 .

Biz əldə edirik:

Beləliklə, bu seçmənin riyazi gözləntisi üçün 95% etimad intervalı 7,484 ilə 11,266 arasında dəyişdi.

Misal 3 100 müşahidədən ibarət ümumi populyasiyadan təsadüfi seçmə üçün orta dəyər 15,2 və standart sapma 3,2 hesablanmışdır. Gözlənilən dəyər üçün 95% etimad intervalını, sonra isə 99% etibar intervalını hesablayın. Nümunə gücü və onun dəyişməsi eyni qalsa, lakin etimad əmsalı artırsa, etimad intervalı daralacaq, yoxsa genişlənəcək?

Bu dəyərləri etimad intervalı üçün ifadə ilə əvəz edirik:

burada əhəmiyyətlilik səviyyəsi üçün standart normal paylanmanın kritik qiyməti α = 0,05 .

Biz əldə edirik:

.

Beləliklə, bu nümunənin orta göstəricisi üçün 95% etimad intervalı 14.57-dən 15.82-ə qədər idi.

Yenə də bu dəyərləri etimad intervalı üçün ifadə ilə əvəz edirik:

burada əhəmiyyətlilik səviyyəsi üçün standart normal paylanmanın kritik qiyməti α = 0,01 .

Biz əldə edirik:

.

Beləliklə, bu nümunənin orta qiyməti üçün 99% etimad intervalı 14.37-dən 16.02-ə qədər idi.

Göründüyü kimi, güvən əmsalı artdıqca standart normal paylanmanın kritik qiyməti də artır və deməli, intervalın başlanğıc və son nöqtələri ortadan daha uzaqda yerləşir və beləliklə, riyazi gözlənti üçün inam intervalı artır.

Xüsusi çəkisinin nöqtə və interval təxminləri

Nümunənin bəzi xüsusiyyətlərinin payı payın nöqtə təxmini kimi şərh edilə bilər səhümumi populyasiyada eyni xüsusiyyət. Əgər bu dəyəri ehtimalla əlaqələndirmək lazımdırsa, onda xüsusi çəkisinin etibarlılıq intervalı hesablanmalıdır. səh ehtimalı ilə ümumi populyasiyada olan xüsusiyyət P = 1 - α :

.

Misal 4 Müəyyən bir şəhərdə iki namizəd var AB bələdiyyə sədrliyinə namizəddir. 200 şəhər sakini arasında təsadüfi sorğu keçirilib, onlardan 46%-i namizədə səs verəcəklərini bildirib. A, 26% - namizəd üçün B 28%-i isə kimə səs verəcəyini bilmir. Namizədi dəstəkləyən şəhər sakinlərinin nisbəti üçün 95% etimad intervalını müəyyən edin A.

Təlimat

Qeyd edək ki, interval(l1 və ya l2), mərkəzi bölgəsi təxmin l* olacaq, həmçinin parametrin həqiqi dəyərinin ola biləcəyi ehtimalı yalnız inam olacaq. interval ohm və ya alfa etibar səviyyəsinin müvafiq dəyəri. Bu halda, l* özü nöqtə təxminlərinə istinad edəcəkdir. Məsələn, təsadüfi dəyərin X (x1, x2,..., xn) hər hansı nümunə dəyərlərinin nəticələrinə görə, paylanmanın asılı olacağı naməlum göstərici parametr l hesablamaq lazımdır. Bu halda, verilmiş l* parametrinin qiymətləndirilməsini əldə etmək o demək olacaq ki, hər bir nümunə üçün parametrin müəyyən bir dəyərini sətirə qoymaq, yəni Q indikatorunun müşahidə nəticələrinin funksiyasını yaratmaq lazımdır, düstur şəklində l* parametrinin təxmin edilən qiymətinə bərabər götürüləcək qiyməti : l*=Q*(x1, x2,..., xn).

Nəzərə alın ki, müşahidənin nəticələrinə dair istənilən funksiya statistik adlanır. Üstəlik, baxılan parametri (hadisəni) tam təsvir edirsə, o zaman kifayət qədər statistika adlanır. Və müşahidələrin nəticələri təsadüfi olduğu üçün l * də təsadüfi dəyişən olacaqdır. Statistikanın hesablanması vəzifəsi onun keyfiyyət meyarları nəzərə alınmaqla həyata keçirilməlidir. Burada nəzərə almaq lazımdır ki, qiymətləndirmənin paylanma qanunu kifayət qədər müəyyəndir, ehtimal sıxlığının W(x, l) paylanması.

Etibarı hesablaya bilərsiniz intervalƏgər qiymətləndirmənin paylanması ilə bağlı qanunu bilsəniz kifayət qədər asan. Məsələn, güvən interval riyazi gözlənti ilə bağlı təxminlər (təsadüfi dəyərin orta qiyməti) mx* =(1/n)*(x1+x2+ …+xn) . Bu qiymətləndirmə qərəzsiz olacaq, yəni göstəricinin riyazi gözləntisi və ya orta qiyməti parametrin həqiqi dəyərinə bərabər olacaqdır (M(mx*) = mx).

Siz müəyyən edə bilərsiniz ki, riyazi gözlənti ilə qiymətləndirmənin dispersiyası: bx*^2=Dx/n. Limit mərkəzi teoreminə əsaslanaraq, bu qiymətləndirmənin paylanma qanununun Qauss (normal) olması barədə müvafiq nəticə çıxara bilərik. Buna görə hesablamalar üçün F (z) indikatorundan - ehtimalların inteqralından istifadə edə bilərsiniz. Bu halda, etibarın uzunluğunu seçin interval və 2ld, belə ki, alırsınız: alfa \u003d P (mx-ld (düstura görə ehtimal inteqralının xüsusiyyətindən istifadə edərək: Ф (-z) \u003d 1- Ф (z)).

Güvən yaratmaq interval riyazi gözləntilərin təxminləri: - düsturun qiymətini tapın (alfa + 1) / 2; - ehtimal inteqral cədvəlindən ld / sqrt (Dx / n) bərabər dəyəri seçin; - həqiqi dispersiyanı qiymətləndirin: Dx * = (1 / n) * ( (x1 - mx*)^2+(x2 - mx*)^2+…+(xn - mx*)^2); interval düsturu üzrə: (mx*-ld, mx*+ld).

Etibar intervalı Nümunədə tədqiqatda əldə edilən (CI; ingilis dilində, etimad intervalı - CI) bütün belə xəstələrin (ümumi əhali) əhalisi haqqında nəticə çıxarmaq üçün tədqiqatın nəticələrinin dəqiqliyi (və ya qeyri-müəyyənliyi) ölçüsünü verir. ). 95% CI-nin düzgün tərifi aşağıdakı kimi tərtib edilə bilər: belə intervalların 95% populyasiyada həqiqi dəyəri ehtiva edəcəkdir. Bu şərh bir qədər az dəqiqdir: CI həqiqi dəyəri ehtiva etdiyinə 95% əmin ola biləcəyiniz dəyərlər diapazonudur. CI-dən istifadə edərkən, statistik əhəmiyyətin yoxlanılması nəticəsində əldə edilən P dəyərindən fərqli olaraq, kəmiyyət effektinin müəyyən edilməsinə diqqət yetirilir. P dəyəri heç bir məbləği qiymətləndirmir, əksinə "təsir yoxdur" sıfır fərziyyəsinə qarşı sübutun gücünün ölçüsü kimi xidmət edir. P-nin dəyəri özlüyündə fərqin böyüklüyü, hətta onun istiqaməti haqqında bizə heç nə demir. Buna görə də, P-nin müstəqil dəyərləri məqalələrdə və ya tezislərdə tamamilə məlumatsızdır. Bunun əksinə olaraq, CI həm müalicənin faydalılığı kimi dərhal maraq doğuran təsirin miqdarını, həm də sübutun gücünü göstərir. Buna görə də, DI birbaşa DM təcrübəsi ilə bağlıdır.

CI ilə təsvir edilən statistik təhlilə xal hesablama yanaşması maraq doğuran təsirin miqyasını (diaqnostik testin həssaslığı, proqnozlaşdırılan insident, müalicə ilə nisbi riskin azaldılması və s.) ölçmək və bu təsirdəki qeyri-müəyyənliyi ölçmək məqsədi daşıyır. Çox vaxt CI, həqiqi dəyərin yalan ola biləcəyi təxmininin hər iki tərəfindəki dəyərlər diapazonudur və buna 95% əmin ola bilərsiniz. 95% ehtimaldan istifadə etmək üçün konvensiya ixtiyaridir, eləcə də P dəyəri<0,05 для оценки статистической значимости, и авторы иногда используют 90% или 99% ДИ. Заметим, что слово «интервал» означает диапазон величин и поэтому стоит в единственном числе. Две величины, которые ограничивают интервал, называются «доверительными пределами».

CI, müxtəlif xəstə qrupları üzərində aparılan eyni tədqiqatın eyni nəticələr verməyəcəyi, lakin onların nəticələrinin həqiqi, lakin naməlum dəyər ətrafında paylanacağı fikrinə əsaslanır. Başqa sözlə, CI bunu "nümunədən asılı dəyişkənlik" kimi təsvir edir. CI digər səbəblərə görə əlavə qeyri-müəyyənliyi əks etdirmir; xüsusilə, xəstələrin seçmə itkisinin izləmə, zəif uyğunluq və ya qeyri-dəqiq nəticənin ölçülməsi, korluğun olmaması və s. təsirləri daxil deyil. Beləliklə, CI həmişə qeyri-müəyyənliyin ümumi məbləğini aşağı qiymətləndirir.

Etibar intervalının hesablanması

Cədvəl A1.1. Bəzi klinik ölçmələr üçün standart səhvlər və etibarlılıq intervalları

Tipik olaraq, CI iki nisbət arasındakı fərq (d) və bu fərqin qiymətləndirilməsində standart xəta (SE) kimi kəmiyyət ölçünün müşahidə edilən qiymətləndirməsindən hesablanır. Beləliklə əldə edilən təqribən 95% CI d ± 1,96 SE-dir. Düstur nəticə ölçüsünün xarakterinə və CI-nin əhatə dairəsinə uyğun olaraq dəyişir. Məsələn, hüceyrəsiz göyöskürək peyvəndinin randomizə edilmiş, plasebo-nəzarətli sınaq zamanı peyvəndi alan 1670 körpədən 72-də (4,3%) və nəzarət qrupunda 1665 körpədən 240-da (14,4%) göy öskürək inkişaf etmişdir. Mütləq riskin azaldılması kimi tanınan faiz fərqi 10,1% təşkil edir. Bu fərqin SE 0,99% təşkil edir. Müvafiq olaraq, 95% CI 10,1% + 1,96 x 0,99%, yəni. 8,2-dən 12,0-a qədər.

Fərqli fəlsəfi yanaşmalara baxmayaraq, CI-lər və statistik əhəmiyyət testləri riyazi olaraq sıx bağlıdır.

Beləliklə, P-nin dəyəri "əhəmiyyətlidir", yəni. R<0,05 соответствует 95% ДИ, который исключает величину эффекта, указывающую на отсутствие различия. Например, для различия между двумя средними пропорциями это ноль, а для относительного риска или отношения шансов - единица. При некоторых обстоятельствах эти два подхода могут быть не совсем эквивалентны. Преобладающая точка зрения: оценка с помощью ДИ - предпочтительный подход к суммированию результатов исследования, но ДИ и величина Р взаимодополняющи, и во многих статьях используются оба способа представления результатов.

CI-də ifadə edilən qiymətləndirmənin qeyri-müəyyənliyi (qeyri-dəqiqliyi) əsasən seçmə ölçüsünün kvadrat kökü ilə bağlıdır. Kiçik nümunələr böyük nümunələrə nisbətən daha az məlumat verir və daha kiçik nümunələrdə CI-lər müvafiq olaraq daha genişdir. Məsələn, Helicobacter pylori infeksiyasının diaqnozu üçün istifadə edilən üç testin performansını müqayisə edən məqalədə karbamid nəfəs testinin həssaslığının 95,8% (95% CI 75-100) olduğu bildirilir. 95,8% rəqəmi təsir edici görünsə də, 24 yetkin H. pylori xəstəsinin kiçik nümunə ölçüsü geniş CI ilə göstərildiyi kimi bu təxmində əhəmiyyətli qeyri-müəyyənliyin olduğunu göstərir. Həqiqətən də, 75%-lik aşağı hədd 95,8%-lik təxmindən xeyli aşağıdır. Eyni həssaslıq 240 nəfərdən ibarət nümunədə müşahidə edilsəydi, onda 95% CI 92,5-98,0 olardı ki, bu da testin yüksək həssas olduğuna daha çox əminlik verir.

Randomize nəzarət edilən sınaqlarda (RCT) qeyri-əhəmiyyətli nəticələr (yəni, P > 0,05 olanlar) yanlış şərhə xüsusilə həssasdır. CI burada xüsusilə faydalıdır, çünki o, nəticələrin klinik cəhətdən faydalı həqiqi təsirlə nə dərəcədə uyğun olduğunu göstərir. Məsələn, kolonda tikişlə ştapel anastomozu müqayisə edən RCT-də yara infeksiyası xəstələrin müvafiq olaraq 10,9% və 13,5% -də inkişaf etmişdir (P = 0,30). Bu fərq üçün 95% CI 2,6% (-2 ilə +8) təşkil edir. 652 xəstəni əhatə edən bu araşdırmada belə, iki prosedur nəticəsində yaranan infeksiyaların tezliyində cüzi fərq olduğu ehtimal edilir. Tədqiqat nə qədər kiçik olsa, qeyri-müəyyənlik bir o qədər çox olar. Sung və başqaları. 100 xəstədə kəskin varikoz qanaxma üçün oktreotid infuziyası ilə təcili skleroterapiyanı müqayisə edən RCT aparmışdır. Oktreotid qrupunda qanaxmanın dayandırılması nisbəti 84% təşkil etmişdir; skleroterapiya qrupunda - 90%, P = 0,56 verir. Qeyd edək ki, davam edən qanaxma nisbətləri qeyd olunan tədqiqatda yara infeksiyası ilə oxşardır. Bu halda, müdaxilələrdə fərq üçün 95% CI 6% (-7 ilə +19) təşkil edir. Bu diapazon klinik maraq doğuracaq 5% fərqlə müqayisədə olduqca genişdir. Aydındır ki, tədqiqat effektivlikdə əhəmiyyətli fərqi istisna etmir. Buna görə də, müəlliflərin "oktreotid infuziyası və skleroterapiya varikozlardan qanaxmanın müalicəsində eyni dərəcədə effektivdir" qənaəti qətiyyən etibarlı deyil. Mütləq riskin azaldılması üçün 95% CI (ARR) sıfırı ehtiva etdiyi bu kimi hallarda NNT üçün CI (müalicə üçün lazım olan rəqəm) şərh etmək olduqca çətindir. . NLP və onun CI ACP-nin qarşılıqlı göstəricilərindən əldə edilir (bu dəyərlər faizlə verilirsə, onları 100-ə vurun). Burada NPP = 100: 6 = 16.6 alırıq, 95% CI -14.3 ilə 5.3 arasında. Cədvəldəki "d" qeydindən göründüyü kimi. A1.1, bu CI NTPP üçün 5.3-dən sonsuza qədər və NTLP üçün 14.3-dən sonsuza qədər dəyərləri ehtiva edir.

CI-lər ən çox istifadə edilən statistik təxminlər və ya müqayisələr üçün qurula bilər. RCT-lər üçün bu, orta nisbətlər, nisbi risklər, ehtimal nisbətləri və NRR-lər arasındakı fərqi ehtiva edir. Eynilə, CI-lər diaqnostik test dəqiqliyi tədqiqatlarında edilən bütün əsas təxminlər üçün əldə edilə bilər - həssaslıq, spesifiklik, müsbət proqnozlaşdırıcı dəyər (bunların hamısı sadə nisbətlərdir) və ehtimal nisbətləri - meta-analizlərdə və müqayisə-nəzarətdə əldə edilən təxminlər. təhsil alır. DI-nin bu istifadələrinin çoxunu əhatə edən fərdi kompüter proqramı Statistics with Confidence kitabının ikinci nəşrində mövcuddur. Proporsiyalar üçün CI-lərin hesablanması üçün makrolar Excel və SPSS və Minitab statistik proqramları üçün http://www.uwcm.ac.uk/study/medicine/epidemiology_statistics/research/statistics/proportions, htm ünvanında sərbəst mövcuddur.

Müalicə effektinin çoxsaylı qiymətləndirmələri

Tədqiqatın ilkin nəticələri üçün CI-lərin qurulması arzuolunan olsa da, bütün nəticələr üçün tələb olunmur. CI klinik cəhətdən əhəmiyyətli müqayisələrə aiddir. Məsələn, iki qrupu müqayisə edərkən, yuxarıdakı nümunələrdə göstərildiyi kimi, qruplar arasındakı fərq üçün qurulan düzgün CI-dir, hər qrupda qiymətləndirmə üçün qurula bilən CI deyil. Hər qrupdakı ballar üçün ayrı-ayrı CI-lər vermək faydasız olmaqla yanaşı, bu təqdimat çaşdırıcı ola bilər. Eynilə, müxtəlif alt qruplarda müalicənin effektivliyini müqayisə edərkən düzgün yanaşma iki (və ya daha çox) alt qrupu birbaşa müqayisə etməkdir. Müalicənin yalnız bir alt qrupda təsirli olduğunu güman etmək düzgün deyil, əgər onun CI heç bir təsirə uyğun gələn dəyəri istisna edirsə, digərləri isə yox. CI-lər çoxlu alt qruplar üzrə nəticələri müqayisə edərkən də faydalıdır. Əncirdə. A1.1, maqnezium sulfatın plasebo ilə idarə olunan RCT-dən qadınların alt qruplarında preeklampsi olan qadınlarda eklampsiyanın nisbi riskini göstərir.

düyü. A1.2. Meşə Qrafiki, plaseboya qarşı ishalın qarşısının alınması üçün iribuynuzlu rotavirus peyvəndinin 11 randomizə edilmiş klinik sınaqlarının nəticələrini göstərir. İshalın nisbi riskini qiymətləndirmək üçün 95% etibarlılıq intervalından istifadə edilmişdir. Qara kvadratın ölçüsü məlumatın miqdarına mütənasibdir. Bundan əlavə, müalicənin effektivliyinin ümumi qiymətləndirilməsi və 95% etibarlılıq intervalı (almazla göstərilmişdir) göstərilir. Meta-analiz əvvəlcədən müəyyən edilmiş bəzi modelləri aşan təsadüfi təsirlər modelindən istifadə etdi; məsələn, nümunənin ölçüsünü hesablamaqda istifadə olunan ölçü ola bilər. Daha ciddi meyarlara əsasən, CI-lərin bütün diapazonu əvvəlcədən müəyyən edilmiş minimumdan artıq fayda göstərməlidir.

Biz artıq iki müalicənin eyni dərəcədə effektiv olduğunun göstəricisi kimi statistik əhəmiyyətin olmamasını qəbul etməyin yanlışlığını müzakirə etdik. Statistik əhəmiyyəti klinik əhəmiyyətə uyğunlaşdırmamaq da eyni dərəcədə vacibdir. Nəticə statistik cəhətdən əhəmiyyətli olduqda və müalicəyə cavabın böyüklüyü olduqda klinik əhəmiyyət kəsb edilə bilər

Tədqiqatlar nəticələrin statistik cəhətdən əhəmiyyətli olub-olmadığını, hansının klinik cəhətdən əhəmiyyətli, hansının olmadığını göstərə bilər. Əncirdə. A1.2 bütün CI-nin daxil olduğu dörd sınaqın nəticələrini göstərir<1, т.е. их результаты статистически значимы при Р <0,05 , . После высказанного предположения о том, что клинически важным различием было бы сокращение риска диареи на 20% (ОР = 0,8), все эти испытания показали клинически значимую оценку сокращения риска, и лишь в исследовании Treanor весь 95% ДИ меньше этой величины. Два других РКИ показали клинически важные результаты, которые не были статистически значимыми. Обратите внимание, что в трёх испытаниях точечные оценки эффективности лечения были почти идентичны, но ширина ДИ различалась (отражает размер выборки). Таким образом, по отдельности доказательная сила этих РКИ различна.

Tutaq ki, bəzi xüsusiyyətlərin normal paylanmasına malik çoxlu sayda əşyalarımız var (məsələn, ölçüsü və çəkisi dəyişən eyni tipli tərəvəzlərin tam anbarı). Siz bütün mal partiyasının orta xüsusiyyətlərini bilmək istəyirsiniz, lakin hər bir tərəvəzi ölçməyə və çəkməyə nə vaxtınız, nə də meyliniz var. Bunun lazım olmadığını başa düşürsən. Bəs təsadüfi yoxlama üçün neçə ədəd götürmək lazımdır?

Bu vəziyyət üçün faydalı bəzi düsturlar verməzdən əvvəl bəzi qeydləri xatırlayırıq.

Birincisi, əgər biz tərəvəzin bütün anbarını ölçsək (bu elementlər toplusu ümumi əhali adlanır), onda biz bütün partiyanın çəkisinin orta qiymətini bizim üçün mövcud olan bütün dəqiqliklə biləcəkdik. Gəlin bunu orta adlandıraq X müq .g az . - ümumi orta. Biz artıq bilirik ki, onun orta dəyəri və sapması məlumdursa, nəyin tam müəyyən olunduğunu bilirik . Düzdür, hələlik biz nə X orta, nə də s biz ümumi əhalini bilmirik. Biz yalnız bəzi nümunə götürə, ehtiyac duyduğumuz dəyərləri ölçə və bu nümunə üçün həm nümunədəki X sr orta dəyərini, həm də S sb standart sapmasını hesablaya bilərik.

Məlumdur ki, əgər bizim xüsusi çekimiz çoxlu sayda elementdən ibarətdirsə (adətən n 30-dan çoxdur) və onlar götürülür. həqiqətən təsadüfi, sonra s ümumi əhali demək olar ki, S-dən fərqlənməyəcək ..

Bundan əlavə, normal paylanma vəziyyətində aşağıdakı düsturlardan istifadə edə bilərik:

95% ehtimalla


99% ehtimalla



Ümumiyyətlə, R (t) ehtimalı ilə


Etibar intervalını bilmək istədiyimiz t-nin qiyməti ilə P (t) ehtimalının qiyməti arasındakı əlaqəni aşağıdakı cədvəldən götürmək olar:


Beləliklə, ümumi əhali üçün orta qiymətin hansı diapazonda olduğunu müəyyən etdik (verilmiş ehtimalla).

Kifayət qədər böyük bir nümunəmiz olmasa, əhalinin s = olduğunu iddia edə bilmərik S sel. Bundan əlavə, bu halda nümunənin normal paylanmaya yaxınlığı problemlidir. Bu halda, yerinə S sb də istifadə edin düsturda s:




lakin sabit ehtimal P(t) üçün t-nin qiyməti n nümunəsindəki elementlərin sayından asılı olacaq. n nə qədər böyükdürsə, nəticə etibarı intervalı (1) düsturu ilə verilən qiymətə bir o qədər yaxın olacaqdır. Bu vəziyyətdə t dəyərləri aşağıda təqdim etdiyimiz başqa bir cədvəldən (Tələbənin t-testi) götürülür:

Tələbənin 0.95 və 0.99 ehtimalı üçün t-test dəyərləri


Misal 3Şirkətin əməkdaşları arasından 30 nəfər təsadüfi seçilib. Nümunəyə görə, orta əmək haqqı (ayda) 5 min rubl orta kvadrat sapma ilə 30 min rubl olduğu ortaya çıxdı. 0,99 ehtimalı ilə firmada orta əmək haqqını təyin edin.

Qərar:Şərtə görə, bizdə n = 30, X cf. =30000, S=5000, P=0,99. Etibar intervalını tapmaq üçün Tələbə kriteriyasına uyğun düsturdan istifadə edirik. N \u003d 30 və P \u003d 0.99 üçün cədvələ görə biz t \u003d 2.756 tapırıq, buna görə də,


olanlar. arzu olunan etimad interval 27484< Х ср.ген < 32516.

Beləliklə, 0,99 ehtimalı ilə, intervalın (27484; 32516) şirkətdəki orta əmək haqqını ehtiva etdiyini iddia etmək olar.

Ümid edirik ki, hər dəfə yanınızda elektron cədvəl olmadan bu üsuldan istifadə edəcəksiniz. Hesablamalar Excel-də avtomatik həyata keçirilə bilər. Excel faylında olarkən yuxarı menyuda fx düyməsini sıxın. Sonra, funksiyalar arasından "statistik" növünü və qutuda təklif olunan siyahıdan - STEUDRASP seçin. Sonra kursoru "ehtimal" sahəsinə qoyaraq, sorğuda qarşılıqlı ehtimalın qiymətini daxil edin (yəni bizim vəziyyətimizdə 0,95 ehtimalının əvəzinə 0,05 ehtimalını yazmalısınız). Görünür, elektron cədvəl elə tərtib edilib ki, nəticə nə qədər səhv ola biləcəyimiz sualına cavab versin. Eynilə, "azadlıq dərəcəsi" sahəsinə nümunəniz üçün dəyəri (n-1) daxil edin.

Ağıl təkcə bilikdə deyil, həm də biliyi praktikada tətbiq etmək bacarığındadır. (Aristotel)

Etibar intervalları

ümumi baxış

Əhalidən bir nümunə götürərək, bizi maraqlandıran parametrin nöqtəli qiymətləndirməsini alacağıq və qiymətləndirmənin düzgünlüyünü göstərmək üçün standart xətanı hesablayacağıq.

Bununla belə, əksər hallarda standart xəta qəbuledilməzdir. Bu dəqiqlik ölçüsünü populyasiya parametri üçün interval qiymətləndirməsi ilə birləşdirmək daha faydalıdır.

Bu, parametr üçün inam intervalını (CI - Etibar Aralığı, CI - Etibar Aralığı) hesablamaq üçün seçmə statistikasının (parametrin) nəzəri ehtimal paylanmasına dair biliklərdən istifadə etməklə edilə bilər.

Ümumiyyətlə, etimad intervalı hər iki istiqamətdə qiymətləndirmələri standart xətanın (verilmiş parametrin) bir neçə misli qədər genişləndirir; intervalı müəyyən edən iki dəyər (etimad həddi) adətən vergüllə ayrılır və mötərizələrə alınır.

Orta üçün etimad intervalı

Normal paylanmadan istifadə

Nümunə ölçüsü böyükdürsə, seçmə orta göstəricisi normal paylanmaya malikdir, ona görə də seçmə ortasını nəzərdən keçirərkən normal paylanma haqqında bilik tətbiq oluna bilər.

Xüsusilə, seçmə vasitələrinin paylanmasının 95%-i əhalinin orta göstəricisinin 1,96 standart kənarlaşması (SD) daxilindədir.

Yalnız bir nümunəmiz olduqda, biz bunu ortanın standart xətası (SEM) adlandırırıq və orta üçün 95% etibarlılıq intervalını aşağıdakı kimi hesablayırıq:

Bu təcrübə bir neçə dəfə təkrarlanarsa, interval 95% vaxtın həqiqi populyasiyasını ehtiva edəcəkdir.

Bu, adətən, 95% etimad səviyyəsi ilə həqiqi əhalinin ortalamasının (ümumi orta) yerləşdiyi dəyərlər diapazonu kimi bir etimad intervalıdır.

Etibar intervalını bu şəkildə şərh etmək kifayət qədər sərt olmasa da (əhali ortası sabit dəyərdir və buna görə də onunla əlaqəli bir ehtimal ola bilməz), konseptual olaraq başa düşmək daha asandır.

İstifadəsi t- paylanması

Populyasiyadakı fərqin dəyərini bilirsinizsə, normal paylanmadan istifadə edə bilərsiniz. Həmçinin, seçmə ölçüsü kiçik olduqda, populyasiyanın əsasını təşkil edən məlumatlar normal şəkildə paylanırsa, seçmə orta normal paylanmaya uyğun gəlir.

Əgər əhalinin əsasını təşkil edən məlumatlar normal şəkildə paylanmayıbsa və/və ya ümumi dispersiya (əhali dispersiyası) naməlumdursa, seçmə orta göstəricisi uyğun gəlir. Tələbənin t-paylanması.

Əhali üçün 95% inam intervalını aşağıdakı kimi hesablayın:

Harada - faiz bəndi (faiz) t- 0,05 iki quyruqlu ehtimal verən (n-1) sərbəstlik dərəcəsi ilə tələbə paylanması.

Ümumiyyətlə, o, normal paylanmadan istifadə edərkən daha geniş interval təmin edir, çünki o, əhalinin standart kənarlaşmasını qiymətləndirməklə və/və ya kiçik seçmə ölçüsünə görə əlavə qeyri-müəyyənliyi nəzərə alır.

Nümunə ölçüsü böyük olduqda (100 və ya daha çox), iki paylama arasındakı fərq ( t-tələbə və normal) əhəmiyyətsizdir. Bununla belə, həmişə istifadə edin t- seçmənin ölçüsü böyük olsa belə, etimad intervallarının hesablanması zamanı paylanma.

Adətən 95% CI göstərilir. Digər etimad intervalları hesablana bilər, məsələn, orta üçün 99% CI.

Standart səhv və cədvəl dəyərinin məhsulu əvəzinə t- 0,05 iki quyruqlu ehtimala uyğun gələn paylama onu (standart xəta) 0,01 iki quyruqlu ehtimala uyğun gələn qiymətə vurun. Bu, 95% ilə müqayisədə daha geniş etimad intervalıdır, çünki o, intervalın həqiqətən də populyasiya ortalamasını ehtiva etdiyinə inamın artmasını əks etdirir.

Proporsiya üçün inam intervalı

Proporsiyaların seçmə paylanması binomial paylanmaya malikdir. Ancaq nümunə ölçüsü varsa n kifayət qədər böyükdürsə, nümunənin paylanması orta ilə təxminən normaldır.

Nümunə alma nisbəti ilə təxmin edin p=r/n(harada r- bizi maraqlandıran xüsusiyyətləri olan nümunədəki şəxslərin sayı) və standart səhv təxmin edilir:

Proporsiya üçün 95% etimad intervalı təxmin edilir:

Nümunə ölçüsü kiçikdirsə (adətən zaman np və ya n(1-p) daha kiçik 5 ), onda dəqiq inam intervallarını hesablamaq üçün binomial paylanmadan istifadə edilməlidir.

Qeyd edək ki, əgər səh sonra faizlə ifadə edilir (1-p) ilə əvəz edilmişdir (100p).

Etibar intervallarının şərhi

Etibar intervalını şərh edərkən bizi aşağıdakı suallar maraqlandırır:

Etibar intervalı nə qədər genişdir?

Geniş inam intervalı qiymətləndirmənin qeyri-dəqiq olduğunu göstərir; dar incə qiymətləndirməni göstərir.

Etibar intervalının eni standart səhvin ölçüsündən asılıdır, bu da öz növbəsində nümunənin ölçüsündən asılıdır və məlumatların dəyişkənliyindən rəqəmli dəyişəni nəzərə aldıqda, bir neçə nəfərdən ibarət böyük bir məlumat toplusunun tədqiqatlarına nisbətən daha geniş etimad intervalları verir. dəyişənlər.

CI xüsusi maraq doğuran hər hansı dəyərləri ehtiva edirmi?

Siz populyasiya parametri üçün ehtimal olunan dəyərin etimad intervalına düşdüyünü yoxlaya bilərsiniz. Əgər belədirsə, nəticələr bu ehtimal olunan dəyərə uyğundur. Əgər belə deyilsə, parametrin bu dəyərə malik olması ehtimalı azdır (95% etimad intervalı üçün şans demək olar ki, 5%).