MS EXCEL-də ortanın (dispersiya məlumdur) qiymətləndirilməsi üçün etibarlılıq intervalı. Kəmiyyət Təhlili Metodları: Etibarlılıq intervallarının qiymətləndirilməsi

"Katren-Style" Konstantin Kravçikin tibbi statistikaya dair silsiləsini dərc etməyə davam edir. Əvvəlki iki məqaləsində müəllif və kimi anlayışların izahına toxunmuşdu.

Konstantin Kravçik

Riyaziyyatçı-analitik. Tibb və humanitar elmlərdə statistik tədqiqatlar sahəsində mütəxəssis

Moskva şəhəri

Çox tez-tez klinik sınaqlar haqqında məqalələrdə sirli bir ifadə tapa bilərsiniz: "etibar intervalı" (95% CI və ya 95% CI - güvən intervalı). Məsələn, məqalədə belə ola bilər: "Tələbənin t-testi hesablanmış 95% etimad intervalı ilə fərqlərin əhəmiyyətini qiymətləndirmək üçün istifadə edilmişdir."

"95% etimad intervalı"nın dəyəri nədir və onu niyə hesablamaq lazımdır?

Etibar intervalı nədir? - Bu, əhalidəki həqiqi orta dəyərlərin aşağı düşdüyü diapazondur. Bəs, "doğru olmayan" ortalamalar varmı? Müəyyən mənada, bəli, edirlər. Biz izah etdik ki, bütün populyasiyada maraq parametrini ölçmək mümkün deyil, buna görə də tədqiqatçılar məhdud bir nümunə ilə kifayətlənirlər. Bu nümunədə (məsələn, bədən çəkisi ilə) bir orta dəyər (müəyyən çəki) var, ona görə biz bütün ümumi populyasiyada orta dəyəri mühakimə edirik. Lakin, çətin ki, nümunədəki orta çəki (xüsusilə kiçik) ümumi populyasiyada orta çəki ilə üst-üstə düşsün. Buna görə də ümumi əhalinin orta dəyərlərinin diapazonunu hesablamaq və istifadə etmək daha düzgündür.

Məsələn, tutaq ki, hemoglobin üçün 95% inam intervalı (95% CI) 110 ilə 122 q/L arasındadır. Bu o deməkdir ki, 95% ehtimalla ümumi populyasiyada hemoglobinin həqiqi orta dəyəri 110-122 q/l aralığında olacaqdır. Başqa sözlə, biz ümumi populyasiyada orta hemoglobini bilmirik, lakin 95% ehtimalla bu xüsusiyyət üçün dəyərlər diapazonunu göstərə bilərik.

Etibar intervalları xüsusilə qruplar arasında vasitələr fərqinə və ya təsir ölçüsü adlanan şeyə aiddir.

Tutaq ki, iki dəmir preparatının effektivliyini müqayisə etdik: biri uzun müddətdir ki, bazarda olan, digəri isə yeni qeydiyyatdan keçmişdir. Terapiya kursundan sonra tədqiq edilən xəstələr qruplarında hemoglobinin konsentrasiyası qiymətləndirildi və statistik proqram bizim üçün hesabladı ki, iki qrupun orta dəyərləri arasındakı fərq 95% ehtimalı ilə 1,72 - 14,36 q/l (Cədvəl 1).

Tab. 1. Müstəqil nümunələr üçün meyar
(qruplar hemoglobin səviyyəsinə görə müqayisə edilir)

Bunu aşağıdakı kimi şərh etmək lazımdır: yeni dərman qəbul edən ümumi əhalinin bir hissəsində hemoglobin artıq məlum olan dərman qəbul edənlərə nisbətən orta hesabla 1,72-14,36 q/l yüksək olacaqdır.

Başqa sözlə, ümumi populyasiyada 95% ehtimalı olan qruplarda hemoglobinin orta dəyərlərindəki fərq bu sərhədlər daxilindədir. Bunun çox və ya az olduğunu mühakimə etmək tədqiqatçının ixtiyarında olacaq. Bütün bunların mahiyyəti ondan ibarətdir ki, biz bir orta qiymətlə deyil, bir sıra dəyərlərlə işləyirik, buna görə də qruplar arasında bir parametrdəki fərqi daha etibarlı şəkildə qiymətləndiririk.

Statistik paketlərdə, tədqiqatçının mülahizəsinə əsasən, etimad intervalının hüdudlarını müstəqil şəkildə daraltmaq və ya genişləndirmək olar. Etibar intervalının ehtimallarını aşağı salmaqla biz vasitələrin diapazonunu daraldırıq. Məsələn, 90% CI-də vasitələrin diapazonu (və ya orta fərqlər) 95% CI-dən daha dar olacaq.

Əksinə, ehtimalın 99%-ə yüksəldilməsi dəyərlər diapazonunu genişləndirir. Qrupları müqayisə edərkən CI-nin aşağı həddi sıfır işarəsini keçə bilər. Məsələn, etimad intervalının sərhədlərini 99 %-ə qədər uzadsaq, onda intervalın sərhədləri –1 ilə 16 q/L arasında dəyişdi. Bu o deməkdir ki, ümumi populyasiyada öyrənilən əlamət üzrə orta göstəricilər arasındakı fərq 0 (M=0) olan qruplar mövcuddur.

Etibar intervalları statistik fərziyyələri yoxlamaq üçün istifadə edilə bilər. Etibar intervalı sıfır dəyərini keçərsə, o zaman qrupların öyrənilən parametrdə fərqlənmədiyini güman edən sıfır hipotezi doğrudur. Sərhədləri 99% -ə qədər genişləndirdiyimiz bir nümunə yuxarıda təsvir edilmişdir. Ümumi əhalinin bir yerində biz heç bir şəkildə fərqlənməyən qruplar tapdıq.

Hemoqlobində fərqin 95% inam intervalı, (q/l)


Şəkil iki qrup arasındakı orta hemoglobin fərqinin 95% etibar intervalını xətt kimi göstərir. Xətt sıfır işarəsini keçir, buna görə də sıfıra bərabər olan vasitələr arasında fərq var ki, bu da qrupların fərqlənmədiyinə dair sıfır fərziyyəni təsdiqləyir. Qruplar arasındakı fərq -2 ilə 5 q/l arasında dəyişir, yəni hemoglobin ya 2 q/l azala, ya da 5 q/l arta bilər.

Etibar intervalı çox vacib bir göstəricidir. Bunun sayəsində qruplardakı fərqlərin həqiqətən vasitələrdəki fərqə görə olub olmadığını görə bilərsiniz, yoxsa böyük bir seçmə ilə, çünki böyük bir seçmə ilə fərqləri tapmaq şansı kiçik olandan daha çoxdur.

Praktikada bu belə görünə bilər. 1000 nəfərdən nümunə götürdük, hemoglobinin səviyyəsini ölçdük və vasitələr arasındakı fərq üçün inam intervalının 1,2 ilə 1,5 q/L arasında olduğunu aşkar etdik. Bu halda statistik əhəmiyyətin səviyyəsi s

Görürük ki, hemoglobinin konsentrasiyası artıb, lakin demək olar ki, hiss olunmur, buna görə də statistik əhəmiyyət nümunənin ölçüsünə görə dəqiq ortaya çıxdı.

Etibar intervalları yalnız orta göstəricilər üçün deyil, həm də nisbətlər (və risk nisbətləri) üçün hesablana bilər. Məsələn, biz hazırlanmış dərman qəbul edərkən remissiyaya nail olan xəstələrin nisbətlərinin inam intervalı ilə maraqlanırıq. Fərz edək ki, nisbətlər üçün 95% CI, yəni belə xəstələrin nisbəti üçün 0,60-0,80 aralığındadır. Beləliklə deyə bilərik ki, bizim dərman 60-80% hallarda müalicəvi təsir göstərir.

Etibar intervalı

Etibar intervalı- kiçik seçmə ölçüsü ilə üstünlük verilən statistik parametrlərin interval (nöqtədən fərqli olaraq) qiymətləndirilməsi üçün riyazi statistikada istifadə olunan termin. Etibar intervalı naməlum parametri verilmiş etibarlılıqla əhatə edən intervaldır.

Etibar intervalları metodu ingilis statistik Ronald Fişerin ideyaları əsasında amerikalı statistik Jerzy Neumann tərəfindən işlənib hazırlanmışdır.

Tərif

Etibar intervalı parametri θ təsadüfi dəyişənlərin paylanması X etibar səviyyəsi 100 ilə p%, nümunə tərəfindən yaradılıb ( x 1 ,…,x n), sərhədləri olan interval adlanır ( x 1 ,…,x n) və ( x 1 ,…,x n) təsadüfi dəyişənlərin reallaşmasıdır L(X 1 ,…,X n) və U(X 1 ,…,X n) belə

.

Etibar intervalının sərhəd nöqtələri deyilir güvən məhdudiyyətləri.

Etibar intervalının intuisiyaya əsaslanan şərhi belə olardı: əgər səh böyükdür (məsələn, 0,95 və ya 0,99), onda etimad intervalı demək olar ki, əsl dəyəri ehtiva edir θ .

Etibar intervalı anlayışının başqa bir təfsiri: onu parametr dəyərlərinin intervalı kimi qəbul etmək olar θ eksperimental məlumatlar ilə uyğun gəlir və onlara zidd deyil.

Nümunələr

  • Normal nümunənin riyazi gözləntiləri üçün inam intervalı;
  • Normal nümunə dispersiyası üçün etibarlılıq intervalı.

Bayes güvən intervalı

Bayes statistikasında oxşar, lakin bəzi əsas detallarda fərqlənən etimad intervalının tərifi var. Burada təxmin edilən parametrin özü bəzi aprior paylanma ilə təsadüfi dəyişən hesab olunur (ən sadə halda vahid) və nümunə sabitdir (klassik statistikada hər şey tam əksinədir). Bayes etimad intervalı, parametr dəyərini arxa ehtimalla əhatə edən intervaldır:

.

Ümumiyyətlə, klassik və Bayes etimad intervalları fərqlidir. İngilisdilli ədəbiyyatda Bayes etimad intervalı adətən termin adlanır etibarlı interval, və klassik etimad intervalı.

Qeydlər

Mənbələr

Wikimedia Fondu. 2010.

  • Körpə (film)
  • kolonist

Digər lüğətlərdə "Güvən Aralığı" nın nə olduğuna baxın:

    Etibar intervalı- verilmiş ehtimal (etimad) ilə təxmin edilən paylanma parametrinin naməlum həqiqi dəyərini əhatə edən nümunə məlumatlarından hesablanan interval. Mənbə: QOST 20522 96: Torpaqlar. Nəticələrin statistik emalı üsulları ... Normativ-texniki sənədlərin terminlərinin lüğət-aparat kitabı

    etimad intervalı- ümumi əhalinin skalyar parametri üçün bu, çox güman ki, bu parametri ehtiva edən seqmentdir. Əlavə aydınlaşdırma olmadan bu ifadə mənasızdır. Etibar intervalının sərhədləri nümunədən təxmin edildiyi üçün təbiidir ... ... Sosioloji Statistika Lüğəti

    GÜVƏN ARALIĞI nöqtə qiymətləndirməsindən fərqlənən parametrlərin qiymətləndirilməsi üsuludur. Nümunə x1, . verilsin. . ., f(x, α) ehtimal sıxlığı olan paylanmadan xn və a*=a*(x1, . . ., xn) təxmin α, g(a*, α) ehtimal sıxlığıdır. təxmin etmək. axtarırlar...... Geoloji Ensiklopediya

    GÜVƏN ARALIĞI- (etibar intervalı) Seçmə sorğusundan əldə edilən populyasiya üçün parametr dəyərinin etibarlılığının seçmənin özünə görə 95% kimi müəyyən dərəcədə ehtimala malik olduğu interval. Genişlik…… İqtisadi lüğət

    etimad intervalı- müəyyən edilmiş kəmiyyətin həqiqi qiymətinin verilmiş inamlı ehtimalla yerləşdiyi intervaldır. Ümumi kimya: dərslik / A. V. Zholnin ... Kimyəvi terminlər

    Etibar intervalı CI- Güvən intervalı, CI * davyaralnыy interval, CI * işarə dəyərinin güvən intervalı, c.l üçün hesablanmışdır. paylama parametri (məsələn, xüsusiyyətin orta dəyəri) nümunə üzərində və müəyyən bir ehtimalla (məsələn, 95% üçün 95% ... Genetika. ensiklopedik lüğət

    GÜVƏN ARALIĞI- statistik parametrin qiymətləndirilməsi zamanı yaranan konsepsiya. dəyərlər intervalı üzrə paylanması. D. i. verilmiş əmsala uyğun q parametri üçün. etimad P, elə bir intervala (q1, q2) bərabərdir ki, bərabərsizlik ehtimalının hər hansı paylanması üçün ... ... Fiziki ensiklopediya

    etimad intervalı- - Telekommunikasiya mövzuları, əsas anlayışlar EN güvən intervalı ... Texniki Tərcüməçinin Təlimatı

    etimad intervalı- pasikliovimo intervalas statusas T sritis Standartizacija ir metrologija apibrėžtis Dydžio verčių intervallar, kuriame su pasirinktąja tikimybe yra matavimo rezultato vertė. attikmenys: ingilis. etimad intervalı vok. Vertrauensbereich, m rus.… … Penkiakalbis aiskinamasis metrologijos terminų žodynas

    etimad intervalı- pasikliovimo intervalas statusas T sritis chemija apibrėžtis Dydžio verčių intervalas, kuriame su pasirinktąja tikimybe yra matavimo rezultatų vertė. attikmenys: ingilis. güvən intervalı rus. etibar sahəsi; güvən intervalı... Chemijos terminų aiskinamasis žodynas

Tutaq ki, bəzi xüsusiyyətlərin normal paylanmasına malik çoxlu sayda əşyalarımız var (məsələn, ölçüsü və çəkisi dəyişən eyni tipli tərəvəzlərin tam anbarı). Siz bütün mal partiyasının orta xüsusiyyətlərini bilmək istəyirsiniz, lakin hər bir tərəvəzi ölçməyə və çəkməyə nə vaxtınız, nə də meyliniz var. Bunun lazım olmadığını başa düşürsən. Bəs təsadüfi yoxlama üçün neçə ədəd götürmək lazımdır?

Bu vəziyyət üçün faydalı bəzi düsturlar verməzdən əvvəl bəzi qeydləri xatırlayırıq.

Birincisi, əgər biz tərəvəzin bütün anbarını ölçsək (bu elementlər toplusu ümumi əhali adlanır), onda biz bütün partiyanın çəkisinin orta qiymətini bizim üçün mövcud olan bütün dəqiqliklə biləcəkdik. Gəlin bunu orta adlandıraq X müq .g az . - ümumi orta. Biz artıq bilirik ki, onun orta dəyəri və sapması məlumdursa, nəyin tam müəyyən olunduğunu bilirik . Düzdür, hələlik biz nə X orta, nə də s biz ümumi əhalini bilmirik. Biz yalnız bəzi nümunə götürə, ehtiyac duyduğumuz dəyərləri ölçə və bu nümunə üçün həm nümunədəki X sr orta dəyərini, həm də S sb standart sapmasını hesablaya bilərik.

Məlumdur ki, əgər bizim xüsusi çekimiz çoxlu sayda elementdən ibarətdirsə (adətən n 30-dan çoxdur) və onlar götürülür. həqiqətən təsadüfi, sonra s ümumi əhali demək olar ki, S-dən fərqlənməyəcək ..

Bundan əlavə, normal paylanma vəziyyətində aşağıdakı düsturlardan istifadə edə bilərik:

95% ehtimalla


99% ehtimalla



Ümumiyyətlə, R (t) ehtimalı ilə


Etibar intervalını bilmək istədiyimiz t-nin qiyməti ilə P (t) ehtimalının qiyməti arasındakı əlaqəni aşağıdakı cədvəldən götürmək olar:


Beləliklə, ümumi əhali üçün orta qiymətin hansı diapazonda olduğunu müəyyən etdik (verilmiş ehtimalla).

Kifayət qədər böyük bir nümunəmiz olmasa, əhalinin s = olduğunu iddia edə bilmərik S sel. Bundan əlavə, bu halda nümunənin normal paylanmaya yaxınlığı problemlidir. Bu halda, yerinə S sb də istifadə edin düsturda s:




lakin sabit ehtimal P(t) üçün t-nin qiyməti n nümunəsindəki elementlərin sayından asılı olacaq. n nə qədər böyükdürsə, nəticə etibarı intervalı (1) düsturu ilə verilən qiymətə bir o qədər yaxın olacaqdır. Bu vəziyyətdə t dəyərləri aşağıda təqdim etdiyimiz başqa bir cədvəldən (Tələbənin t-testi) götürülür:

Tələbənin 0.95 və 0.99 ehtimalı üçün t-test dəyərləri


Misal 3Şirkətin əməkdaşları arasından 30 nəfər təsadüfi seçilib. Nümunəyə görə, orta əmək haqqı (ayda) 5 min rubl orta kvadrat sapma ilə 30 min rubl olduğu ortaya çıxdı. 0,99 ehtimalı ilə firmada orta əmək haqqını təyin edin.

Qərar:Şərtə görə, bizdə n = 30, X cf. =30000, S=5000, P=0,99. Etibar intervalını tapmaq üçün Tələbə kriteriyasına uyğun düsturdan istifadə edirik. N \u003d 30 və P \u003d 0.99 üçün cədvələ görə biz t \u003d 2.756 tapırıq, buna görə də,


olanlar. arzu olunan etimad interval 27484< Х ср.ген < 32516.

Beləliklə, 0,99 ehtimalı ilə, intervalın (27484; 32516) şirkətdəki orta əmək haqqını ehtiva etdiyini iddia etmək olar.

Ümid edirik ki, hər dəfə yanınızda elektron cədvəl olmadan bu üsuldan istifadə edəcəksiniz. Hesablamalar Excel-də avtomatik həyata keçirilə bilər. Excel faylında olarkən yuxarı menyuda fx düyməsini sıxın. Sonra, funksiyalar arasından "statistik" növünü və qutuda təklif olunan siyahıdan - STEUDRASP seçin. Sonra kursoru "ehtimal" sahəsinə qoyaraq, sorğuda qarşılıqlı ehtimalın qiymətini daxil edin (yəni bizim vəziyyətimizdə 0,95 ehtimalının əvəzinə 0,05 ehtimalını yazmalısınız). Görünür, elektron cədvəl elə tərtib edilib ki, nəticə nə qədər səhv ola biləcəyimiz sualına cavab versin. Eynilə, "azadlıq dərəcəsi" sahəsinə nümunəniz üçün dəyəri (n-1) daxil edin.

Etibar intervalı bizə statistika sahəsindən gəldi. Bu, yüksək etibarlılıq dərəcəsi ilə naməlum parametri qiymətləndirməyə xidmət edən müəyyən edilmiş diapazondur. Bunu izah etməyin ən asan yolu bir nümunədir.

Tutaq ki, bəzi təsadüfi dəyişəni, məsələn, serverin müştəri sorğusuna cavab sürətini araşdırmaq lazımdır. İstifadəçi hər dəfə konkret saytın ünvanını yazdıqda, server fərqli sürətdə cavab verir. Beləliklə, araşdırılan cavab müddəti təsadüfi xarakter daşıyır. Beləliklə, etimad intervalı bu parametrin sərhədlərini müəyyən etməyə imkan verir və sonra 95% ehtimalla serverin hesabladığımız diapazonda olacağını iddia etmək mümkün olacaq.

Yaxud şirkətin brendi haqqında nə qədər adamın məlumatlı olduğunu öyrənmək lazımdır. Etibar intervalı hesablandıqda, məsələn, 95% ehtimalla bunu bilən istehlakçıların payının 27% -dən 34% -ə qədər olduğunu söyləmək mümkün olacaq.

Güvən səviyyəsi kimi bir dəyər bu terminlə yaxından əlaqəlidir. İstənilən parametrin etibarlılıq intervalına daxil olma ehtimalını təmsil edir. Bu dəyər bizim istədiyimiz diapazonun nə qədər böyük olacağını müəyyən edir. Aldığı dəyər nə qədər böyükdürsə, etimad intervalı da bir o qədər daralır və əksinə. Adətən 90%, 95% və ya 99% olaraq təyin olunur. 95% dəyəri ən populyardır.

Bu göstərici həm də müşahidələrin dispersiyasından təsirlənir və onun tərifi tədqiq olunan xüsusiyyətin tabe olması fərziyyəsinə əsaslanır.Bu ifadə Qauss qanunu kimi də tanınır. Onun fikrincə, ehtimal sıxlığı ilə təsvir edilə bilən fasiləsiz təsadüfi kəmiyyətin bütün ehtimallarının belə paylanması normal adlanır. Normal paylanma fərziyyəsinin səhv olduğu ortaya çıxarsa, təxmin yanlış çıxa bilər.

Birincisi, burada iki hal mümkündür. Dispersiya (təsadüfi dəyişənin yayılma dərəcəsi) məlum ola bilər və ya olmaya da bilər. Əgər məlumdursa, onda bizim inam intervalımız aşağıdakı düsturla hesablanır:

xsr - t*σ / (sqrt(n))<= α <= хср + t*σ / (sqrt(n)), где

α - işarə,

t Laplas paylama cədvəlindən bir parametrdir,

σ dispersiyanın kvadrat köküdür.

Dispersiya naməlumdursa, istənilən xüsusiyyətin bütün dəyərlərini bildiyimiz təqdirdə hesablana bilər. Bunun üçün aşağıdakı formula istifadə olunur:

σ2 = х2ср - (хр)2, burada

х2ср - tədqiq olunan əlamətin kvadratlarının orta qiyməti,

(xsr)2 bu xüsusiyyətin kvadratıdır.

Bu halda inam intervalının hesablandığı düstur bir qədər dəyişir:

xsr - t*s / (sqrt(n))<= α <= хср + t*s / (sqrt(n)), где

xsr - nümunə orta,

α - işarə,

t, Tələbənin paylama cədvəlindən istifadə edərək tapılan parametrdir t \u003d t (ɣ; n-1),

sqrt(n) ümumi nümunə ölçüsünün kvadrat köküdür,

s dispersiyanın kvadrat köküdür.

Bu misalı nəzərdən keçirək. Fərz edək ki, 7 ölçmənin nəticələrinə əsasən tədqiq olunan əlamət 30 və seçmə dispersiyasının 36-ya bərabər olduğu müəyyən edilmişdir. Ölçülmüş göstəricinin həqiqi dəyərini ehtiva edən 99% ehtimalı ilə inam intervalını tapmaq lazımdır. parametr.

Əvvəlcə t-nin nəyə bərabər olduğunu müəyyən edək: t \u003d t (0,99; 7-1) \u003d 3,71. Yuxarıdakı düsturdan istifadə edərək, əldə edirik:

xsr - t*s / (sqrt(n))<= α <= хср + t*s / (sqrt(n))

30 - 3,71*36 / (sqrt(7))<= α <= 30 + 3.71*36 / (sqrt(7))

21.587 <= α <= 38.413

Dispersiya üçün inam intervalı həm məlum orta dəyərdə, həm də riyazi gözləntiyə dair heç bir məlumat olmadıqda hesablanır və yalnız dispersiyanın qərəzsiz nöqtə qiymətləndirməsinin qiyməti məlumdur. Burada onun hesablanması üçün düsturları verməyəcəyik, çünki onlar olduqca mürəkkəbdir və istəsən, onları həmişə şəbəkədə tapmaq olar.

Yalnız qeyd edirik ki, Excel proqramı və ya belə adlanan bir şəbəkə xidmətindən istifadə edərək etimad intervalını təyin etmək rahatdır.