فاصل الثقة للتوقع الرياضي. العينات وفترات الثقة

فاصل الثقة للتوقع الرياضي - هذه فترة محسوبة من البيانات ، والتي تحتوي باحتمالية معروفة على التوقع الرياضي لعامة السكان. التقدير الطبيعي للتوقع الرياضي هو المتوسط ​​الحسابي لقيمه المرصودة. لذلك ، سنستخدم المصطلحين "متوسط" ، "متوسط ​​القيمة" أثناء الدرس. في مشاكل حساب فاصل الثقة ، تكون الإجابة المطلوبة غالبًا هي "تتراوح فترة الثقة لمتوسط ​​الرقم [القيمة في مشكلة معينة] من [قيمة أقل] إلى [قيمة أعلى]". بمساعدة فاصل الثقة ، من الممكن ليس فقط تقييم متوسط ​​القيم ، ولكن أيضًا تقييم حصة واحدة أو أخرى من السمات العامة للسكان. يتم تحليل القيم المتوسطة والتباين والانحراف المعياري والخطأ ، والتي من خلالها سنصل إلى تعريفات وصيغ جديدة ، في الدرس العينة وخصائص السكان .

تقديرات النقطة والفترات للمتوسط

إذا تم تقدير القيمة المتوسطة لعامة السكان برقم (نقطة) ، فسيتم أخذ متوسط ​​محدد محسوب من عينة من الملاحظات كتقدير للمتوسط ​​غير المعروف للجمهور العام. في هذه الحالة ، لا تتوافق قيمة متوسط ​​العينة - متغير عشوائي - مع القيمة المتوسطة لعامة السكان. لذلك ، عند الإشارة إلى القيمة المتوسطة للعينة ، من الضروري أيضًا الإشارة إلى خطأ العينة في نفس الوقت. يتم استخدام الخطأ القياسي كمقياس لخطأ أخذ العينات ، والذي يتم التعبير عنه بنفس الوحدات مثل المتوسط. لذلك ، غالبًا ما يتم استخدام الترميز التالي:.

إذا كان تقدير المتوسط ​​مطلوبًا لربطه باحتمالية معينة ، فيجب عندئذٍ تقدير معلمة المجتمع العام محل الاهتمام ليس برقم واحد ، ولكن بفاصل زمني. فاصل الثقة هو الفاصل الزمني الذي ، مع وجود احتمال معين ، صتم العثور على قيمة المؤشر التقديري لعامة السكان. الفاصل الزمني للثقة مع الاحتمال ص = 1 - α هو متغير عشوائي ، ويحسب على النحو التالي:

,

α = 1 - ص، والتي يمكن العثور عليها في ملحق أي كتاب تقريبًا عن الإحصاء.

في الممارسة العملية ، متوسط ​​المحتوى والتباين غير معروفين ، لذلك يتم استبدال تباين المحتوى بتباين العينة ، ويعني المحتوى بمتوسط ​​العينة. وبالتالي ، يتم حساب فاصل الثقة في معظم الحالات على النحو التالي:

.

يمكن استخدام صيغة فترة الثقة لتقدير متوسط ​​المحتوى إذا

  • يُعرف الانحراف المعياري لعامة السكان ؛
  • أو الانحراف المعياري للمجتمع غير معروف ، لكن حجم العينة أكبر من 30.

متوسط ​​العينة هو تقدير غير متحيز لمتوسط ​​السكان. بدوره ، عينة التباين ليس تقديرًا غير متحيز للتباين السكاني. للحصول على تقدير غير متحيز لتباين المجتمع في معادلة تباين العينة ، يكون حجم العينة هو نيجب استبداله بـ ن-1.

مثال 1يتم جمع المعلومات من 100 مقهى تم اختيارهم عشوائيًا في مدينة معينة بحيث يبلغ متوسط ​​عدد الموظفين فيها 10.5 مع انحراف معياري يبلغ 4.6. تحديد فاصل الثقة 95٪ من عدد العاملين في المقهى.

أين هي القيمة الحرجة للتوزيع الطبيعي القياسي لمستوى الأهمية α = 0,05 .

وبالتالي ، تراوح مجال الثقة 95٪ لمتوسط ​​عدد العاملين في المقهى بين 9.6 و 11.4.

مثال 2بالنسبة لعينة عشوائية من مجموعة عامة مكونة من 64 ملاحظة ، تم حساب القيم الإجمالية التالية:

مجموع القيم في الملاحظات ،

مجموع انحرافات القيم التربيعية عن المتوسط .

احسب فاصل الثقة 95٪ للقيمة المتوقعة.

احسب الانحراف المعياري:

,

احسب متوسط ​​القيمة:

.

استبدل القيم الموجودة في التعبير بفاصل الثقة:

أين هي القيمة الحرجة للتوزيع الطبيعي القياسي لمستوى الأهمية α = 0,05 .

نحن نحصل:

وهكذا ، فإن فاصل الثقة 95٪ للتوقع الرياضي لهذه العينة تراوح من 7.484 إلى 11.266.

مثال 3بالنسبة لعينة عشوائية من مجموعة عامة مكونة من 100 ملاحظة ، تم حساب القيمة المتوسطة 15.2 والانحراف المعياري 3.2. احسب فاصل الثقة 95٪ للقيمة المتوقعة ، ثم فاصل الثقة 99٪. إذا بقيت قوة العينة وتباينها كما هي ، لكن عامل الثقة يزداد ، فهل ستضيق فترة الثقة أم تتسع؟

نستبدل هذه القيم في التعبير عن فاصل الثقة:

أين هي القيمة الحرجة للتوزيع الطبيعي القياسي لمستوى الأهمية α = 0,05 .

نحن نحصل:

.

وبالتالي ، فإن فاصل الثقة 95٪ لمتوسط ​​هذه العينة كان من 14.57 إلى 15.82.

مرة أخرى ، نستبدل هذه القيم في التعبير عن فترة الثقة:

أين هي القيمة الحرجة للتوزيع الطبيعي القياسي لمستوى الأهمية α = 0,01 .

نحن نحصل:

.

وبالتالي ، فإن فاصل الثقة 99٪ لمتوسط ​​هذه العينة كان من 14.37 إلى 16.02.

كما ترى ، مع زيادة عامل الثقة ، تزداد القيمة الحرجة للتوزيع العادي القياسي أيضًا ، وبالتالي ، تقع نقطتا البداية والنهاية للفاصل الزمني بعيدًا عن الوسط ، وبالتالي فاصل الثقة للتوقع الرياضي يزيد.

تقديرات النقطة والفواصل للجاذبية النوعية

يمكن تفسير حصة بعض ميزات العينة على أنها تقدير نقطي للحصة صنفس الصفة في عامة السكان. إذا كانت هذه القيمة بحاجة إلى أن ترتبط باحتمالية ، فيجب حساب فاصل الثقة للجاذبية النوعية صميزة في عموم السكان مع احتمال ص = 1 - α :

.

مثال 4هناك اثنان من المرشحين في مدينة معينة أو بالترشح لمنصب رئيس البلدية. تم استطلاع آراء 200 من سكان المدينة بشكل عشوائي ، أجاب 46٪ منهم بأنهم سيصوتون للمرشح أ 26٪ - للمرشح بو 28٪ لا يعرفون لمن سيصوتون. حدد فاصل الثقة 95٪ لنسبة سكان المدينة الذين يدعمون المرشح أ.

تعليمات

يرجى ملاحظة ذلك فترة(l1 أو l2) ، المنطقة المركزية التي ستكون تقدير l * ، وأيضًا التي من المحتمل أن يتم فيها احتواء القيمة الحقيقية للمعلمة ، ستكون مجرد الثقة فترةأوم أو القيمة المقابلة لمستوى الثقة ألفا. في هذه الحالة ، ستشير l * نفسها إلى تقديرات النقاط. على سبيل المثال ، بناءً على نتائج أي قيم عينة لقيمة عشوائية X (x1 ، x2 ، ... ، xn) ، من الضروري حساب معلمة مؤشر غير معروفة l ، والتي سيعتمد عليها التوزيع. في هذه الحالة ، فإن الحصول على تقدير لمعامل معين l * يعني أنه سيكون من الضروري لكل عينة وضع قيمة معينة للمعامل في السطر ، أي لإنشاء دالة لنتائج مراقبة المؤشر Q ، سيتم أخذ قيمتها مساوية للقيمة المقدرة للمعامل l * في شكل صيغة: l * = Q * (x1، x2، ...، xn).

لاحظ أن أي دالة على نتائج الملاحظة تسمى إحصائية. علاوة على ذلك ، إذا وصفت بشكل كامل المعلمة (الظاهرة) قيد الدراسة ، فإنها تسمى إحصائيات كافية. ولأن نتائج الملاحظات عشوائية ، فإن l * سيكون أيضًا متغيرًا عشوائيًا. يجب تنفيذ مهمة حساب الإحصائيات مع مراعاة معايير جودتها. من الضروري هنا مراعاة أن قانون التوزيع الخاص بالتقدير محدد تمامًا ، وتوزيع كثافة الاحتمال W (x ، l).

يمكنك حساب الثقة فترةسهل بما فيه الكفاية إذا كنت تعرف القانون المتعلق بتوزيع التقييم. على سبيل المثال ، الثقة فترةتقديرات فيما يتعلق بالتوقع الرياضي (متوسط ​​قيمة قيمة عشوائية) mx * = (1 / n) * (x1 + x2 +… + xn). سيكون هذا التقدير غير متحيز ، أي أن التوقع الرياضي أو متوسط ​​قيمة المؤشر سيكون مساويًا للقيمة الحقيقية للمعامل (M (mx *) = mx).

يمكنك إثبات أن تباين التقدير بالتوقع الرياضي هو: bx * ^ 2 = Dx / n. استنادًا إلى نظرية الحد المركزية ، يمكننا استخلاص الاستنتاج المناسب بأن قانون التوزيع لهذا التقدير غاوسي (عادي). لذلك ، للحسابات ، يمكنك استخدام المؤشر Ф (ض) - تكامل الاحتمالات. في هذه الحالة ، اختر طول الثقة فترةو 2ld ، لذلك تحصل على: alpha \ u003d P (mx-ld (باستخدام خاصية احتمال التكامل وفقًا للصيغة: Ф (-z) \ u003d 1- (z)).

بناء الثقة فترةتقديرات التوقع الرياضي: - أوجد قيمة الصيغة (alpha + 1) / 2 ؛ - حدد القيمة التي تساوي ld / sqrt (Dx / n) من جدول الاحتمالات المتكامل ؛ - خذ تقدير التباين الحقيقي: Dx * = (1 / n) * ((x1 - mx *) ^ 2+ (x2 - mx *) ^ 2 +… + (xn - mx *) ^ 2) ؛ فترةحسب الصيغة: (mx * -ld، mx * + ld).

فاصل الثقة(CI ؛ باللغة الإنجليزية ، فاصل الثقة - CI) الذي تم الحصول عليه في الدراسة في العينة يعطي مقياسًا لدقة (أو عدم اليقين) لنتائج الدراسة ، من أجل استخلاص استنتاجات حول مجتمع كل هؤلاء المرضى (عموم السكان ). يمكن صياغة التعريف الصحيح لـ 95٪ CI على النحو التالي: 95٪ من هذه الفواصل ستحتوي على القيمة الحقيقية في المجتمع. هذا التفسير أقل دقة إلى حد ما: CI هو نطاق القيم الذي يمكنك أن تكون متأكدًا بنسبة 95٪ أنه يحتوي على القيمة الحقيقية. عند استخدام CI ، يكون التركيز على تحديد التأثير الكمي ، على عكس القيمة P ، التي يتم الحصول عليها نتيجة اختبار الأهمية الإحصائية. لا تقوم قيمة P بتقييم أي مبلغ ، ولكنها تعمل كمقياس لقوة الدليل ضد الفرضية الصفرية المتمثلة في "عدم وجود تأثير". لا تخبرنا قيمة P في حد ذاتها بأي شيء عن حجم الاختلاف أو حتى عن اتجاهه. لذلك ، فإن القيم المستقلة لـ P غير مفيدة على الإطلاق في المقالات أو الملخصات. في المقابل ، يشير CI إلى مقدار تأثير الاهتمام الفوري ، مثل فائدة العلاج ، وقوة الدليل. لذلك ، يرتبط DI ارتباطًا مباشرًا بممارسة DM.

يهدف نهج التقدير للتحليل الإحصائي ، الذي يوضحه CI ، إلى قياس حجم تأثير الاهتمام (حساسية الاختبار التشخيصي ، والوقوع المتوقع ، والحد من المخاطر النسبية مع العلاج ، وما إلى ذلك) وكذلك قياس عدم اليقين في ذلك تأثير. غالبًا ما يكون CI هو نطاق القيم على جانبي التقدير الذي من المحتمل أن تكمن فيه القيمة الحقيقية ، ويمكنك التأكد منه بنسبة 95٪. اصطلاح استخدام الاحتمال 95٪ تعسفي ، وكذلك قيمة P.<0,05 для оценки статистической значимости, и авторы иногда используют 90% или 99% ДИ. Заметим, что слово «интервал» означает диапазон величин и поэтому стоит в единственном числе. Две величины, которые ограничивают интервал, называются «доверительными пределами».

يعتمد CI على فكرة أن نفس الدراسة التي أجريت على مجموعات مختلفة من المرضى لن تسفر عن نتائج متطابقة ، ولكن سيتم توزيع نتائجهم حول القيمة الحقيقية ولكن غير المعروفة. بعبارة أخرى ، تصف CI هذا على أنه "تقلب يعتمد على العينة". لا يعكس CI عدم اليقين الإضافي لأسباب أخرى ؛ على وجه الخصوص ، لا يشمل آثار الخسارة الانتقائية للمرضى على التتبع ، أو ضعف الامتثال أو قياس النتائج غير الدقيق ، أو نقص التعمية ، إلخ. وبالتالي ، فإن CI دائمًا ما تقلل من تقدير المبلغ الإجمالي لعدم اليقين.

حساب فترة الثقة

الجدول A1.1. الأخطاء المعيارية وفترات الثقة لبعض القياسات السريرية

عادة ، يتم حساب CI من تقدير مرصود لمقياس كمي ، مثل الفرق (د) بين نسبتين ، والخطأ القياسي (SE) في تقدير هذا الاختلاف. التقريبي 95٪ CI الذي تم الحصول عليه بهذه الطريقة هو d ± 1.96 SE. تتغير الصيغة وفقًا لطبيعة مقياس النتيجة وتغطية CI. على سبيل المثال ، في تجربة عشوائية مضبوطة بالغفل لقاح السعال الديكي اللاخلوي ، ظهر السعال الديكي في 72 من 1670 (4.3٪) من الأطفال الذين تلقوا اللقاح و 240 من 1665 (14.4٪) في المجموعة الضابطة. الفرق في النسبة المئوية ، المعروف باسم الحد المطلق للمخاطر ، هو 10.1٪. SE لهذا الاختلاف هو 0.99٪. وفقًا لذلك ، فإن 95٪ CI هي 10.1٪ + 1.96 x 0.99٪ ، أي من 8.2 إلى 12.0.

على الرغم من الأساليب الفلسفية المختلفة ، فإن CIs واختبارات الدلالة الإحصائية ترتبط ارتباطًا وثيقًا رياضيًا.

وبالتالي ، فإن قيمة P هي "كبيرة" ، أي ص<0,05 соответствует 95% ДИ, который исключает величину эффекта, указывающую на отсутствие различия. Например, для различия между двумя средними пропорциями это ноль, а для относительного риска или отношения шансов - единица. При некоторых обстоятельствах эти два подхода могут быть не совсем эквивалентны. Преобладающая точка зрения: оценка с помощью ДИ - предпочтительный подход к суммированию результатов исследования, но ДИ и величина Р взаимодополняющи, и во многих статьях используются оба способа представления результатов.

يرتبط عدم اليقين (عدم الدقة) في التقدير ، المعبر عنه في CI ، إلى حد كبير بالجذر التربيعي لحجم العينة. توفر العينات الصغيرة معلومات أقل من العينات الكبيرة ، وتكون CI في المقابل أوسع في العينات الأصغر. على سبيل المثال ، أبلغت مقالة تقارن أداء ثلاثة اختبارات مستخدمة لتشخيص عدوى الملوية البوابية عن حساسية اختبار تنفس اليوريا بنسبة 95.8٪ (95٪ CI 75-100). في حين أن الرقم 95.8٪ يبدو مثيرًا للإعجاب ، فإن حجم العينة الصغير لـ 24 مريضًا بالبكتيريا الحلزونية البوابية يعني أن هناك قدرًا كبيرًا من عدم اليقين في هذا التقدير ، كما هو موضح بواسطة CI الواسع. في الواقع ، يعتبر الحد الأدنى البالغ 75٪ أقل بكثير من تقدير 95.8٪. إذا لوحظت نفس الحساسية في عينة من 240 شخصًا ، فإن 95٪ CI سيكون 92.5-98.0 ، مما يعطي مزيدًا من التأكيد على أن الاختبار شديد الحساسية.

في التجارب المعشاة ذات الشواهد (RCTs) ، تكون النتائج غير المهمة (أي تلك ذات P> 0.05) عرضة بشكل خاص لسوء التفسير. يعتبر CI مفيدًا بشكل خاص هنا لأنه يشير إلى مدى توافق النتائج مع التأثير الحقيقي المفيد سريريًا. على سبيل المثال ، في تجربة معشاة ذات شواهد تقارن الخياطة مقابل مفاغرة التيلة في القولون ، تطورت عدوى الجرح في 10.9٪ و 13.5٪ من المرضى ، على التوالي (P = 0.30). 95٪ CI لهذا الاختلاف هو 2.6٪ (-2 إلى +8). حتى في هذه الدراسة ، التي شملت 652 مريضًا ، يظل من المحتمل أن يكون هناك اختلاف بسيط في حدوث العدوى الناتجة عن الإجراءين. كلما كانت الدراسة أصغر ، زاد عدم اليقين. سونغ وآخرون. أجرى تجربة معشاة ذات شواهد تقارن تسريب الأوكتريوتيد مع العلاج المصلب الطارئ لنزيف الدوالي الحاد في 100 مريض. في مجموعة octreotide ، كان معدل توقف النزيف 84٪. في مجموعة المعالجة بالتصليب - 90٪ ، مما يعطي P = 0.56. لاحظ أن معدلات استمرار النزيف مماثلة لتلك الخاصة بعدوى الجرح في الدراسة المذكورة. ومع ذلك ، في هذه الحالة ، فإن 95٪ CI للاختلاف في التدخلات هو 6٪ (-7 إلى +19). هذا النطاق واسع جدًا مقارنة بفارق 5٪ قد يكون ذا أهمية إكلينيكية. من الواضح أن الدراسة لا تستبعد وجود فرق كبير في الفعالية. لذلك ، فإن استنتاج المؤلفين "إن حقن octreotide والعلاج المصلب لهما نفس القدر من الفعالية في علاج نزيف الدوالي" غير صحيح بالتأكيد. في مثل هذه الحالات حيث CI 95٪ للحد المطلق للمخاطر (ARR) يتضمن صفرًا ، كما هو الحال هنا ، يصعب تفسير CI لـ NNT (العدد المطلوب معالجته). يتم الحصول على NLP و CI الخاص به من معادلات ACP (بضربها في 100 إذا تم إعطاء هذه القيم كنسب مئوية). نحصل هنا على NPP = 100: 6 = 16.6 مع 95٪ CI من -14.3 إلى 5.3. كما يتضح من الحاشية "د" في الجدول. A1.1 ، يتضمن هذا CI قيم NTPP من 5.3 إلى ما لا نهاية و NTLP من 14.3 إلى ما لا نهاية.

يمكن إنشاء CIs للتقديرات أو المقارنات الإحصائية الأكثر استخدامًا. بالنسبة للتجارب المعشاة ذات الشواهد ، فإنه يشمل الفرق بين متوسط ​​النسب ، والمخاطر النسبية ، ونسب الأرجحية ، و NRRs. وبالمثل ، يمكن الحصول على مؤشرات الموثوقية لجميع التقديرات الرئيسية التي أجريت في دراسات دقة الاختبار التشخيصي - الحساسية والنوعية والقيمة التنبؤية الإيجابية (وكلها نسب بسيطة) ونسب الاحتمالية - التقديرات التي تم الحصول عليها في التحليلات التلوية والمقارنة مع التحكم دراسات. يتوفر برنامج كمبيوتر شخصي يغطي العديد من استخدامات DI مع الإصدار الثاني من الإحصائيات بثقة. تتوفر وحدات الماكرو لحساب CIs للنسب مجانًا لبرنامج Excel والبرامج الإحصائية SPSS و Minitab على http://www.uwcm.ac.uk/study/medicine/epidemiology_statistics/research/statistics/proportions، htm.

تقييمات متعددة لتأثير العلاج

في حين أن بناء CIs أمر مرغوب فيه لنتائج الدراسة الأولية ، إلا أنها ليست مطلوبة لجميع النتائج. يتعلق CI بمقارنات مهمة سريريًا. على سبيل المثال ، عند مقارنة مجموعتين ، يكون CI الصحيح هو الذي تم إنشاؤه للاختلاف بين المجموعات ، كما هو موضح في الأمثلة أعلاه ، وليس CI الذي يمكن بناؤه للتقدير في كل مجموعة. ليس فقط من غير المجدي إعطاء CIs منفصلة للنتائج في كل مجموعة ، هذا العرض التقديمي يمكن أن يكون مضللاً. وبالمثل ، فإن النهج الصحيح عند مقارنة فعالية العلاج في مجموعات فرعية مختلفة هو مقارنة مجموعتين فرعيتين (أو أكثر) مباشرة. من الخطأ افتراض أن العلاج فعال فقط في مجموعة فرعية واحدة إذا كان CI الخاص به يستبعد القيمة المقابلة لعدم وجود تأثير ، في حين أن البعض الآخر لا يفعل ذلك. تعد CIs مفيدة أيضًا عند مقارنة النتائج عبر مجموعات فرعية متعددة. على التين. يُظهر A1.1 الخطر النسبي لتسمم الحمل عند النساء المصابات بمقدمات الارتعاج في مجموعات فرعية من النساء من RCT خاضعة للتحكم الوهمي من كبريتات المغنيسيوم.

أرز. A1.2. يُظهر الرسم البياني للغابات نتائج 11 تجربة سريرية عشوائية للقاح فيروس الروتا البقري للوقاية من الإسهال مقابل العلاج الوهمي. تم استخدام فاصل الثقة 95٪ لتقدير الاختطار النسبي للإسهال. يتناسب حجم المربع الأسود مع كمية المعلومات. بالإضافة إلى ذلك ، يتم عرض تقدير موجز لفعالية العلاج وفاصل الثقة 95٪ (المشار إليه بواسطة الماس). استخدم التحليل التلوي نموذجًا للتأثيرات العشوائية يتجاوز بعض النماذج المحددة مسبقًا ؛ على سبيل المثال ، يمكن أن يكون الحجم المستخدم في حساب حجم العينة. بموجب معيار أكثر صرامة ، يجب أن يُظهر النطاق الكامل لمؤشرات الموثوقية فائدة تتجاوز الحد الأدنى المحدد مسبقًا.

لقد ناقشنا بالفعل مغالطة اعتبار عدم وجود دلالة إحصائية كمؤشر على أن علاجين فعالين بشكل متساوٍ. من المهم بنفس القدر عدم مساواة الدلالة الإحصائية بالأهمية السريرية. يمكن افتراض الأهمية السريرية عندما تكون النتيجة ذات دلالة إحصائية وحجم استجابة العلاج

يمكن أن تظهر الدراسات ما إذا كانت النتائج ذات دلالة إحصائية وأي منها مهمة سريريًا وأيها ليست كذلك. على التين. يظهر A1.2 نتائج أربع تجارب التي CI بأكملها<1, т.е. их результаты статистически значимы при Р <0,05 , . После высказанного предположения о том, что клинически важным различием было бы сокращение риска диареи на 20% (ОР = 0,8), все эти испытания показали клинически значимую оценку сокращения риска, и лишь в исследовании Treanor весь 95% ДИ меньше этой величины. Два других РКИ показали клинически важные результаты, которые не были статистически значимыми. Обратите внимание, что в трёх испытаниях точечные оценки эффективности лечения были почти идентичны, но ширина ДИ различалась (отражает размер выборки). Таким образом, по отдельности доказательная сила этих РКИ различна.

لنفترض أن لدينا عددًا كبيرًا من العناصر ذات التوزيع الطبيعي لبعض الخصائص (على سبيل المثال ، مستودع كامل للخضروات من نفس النوع ، يختلف حجمها ووزنها). تريد معرفة الخصائص المتوسطة لمجموعة البضائع بأكملها ، لكن ليس لديك الوقت ولا الميل لقياس ووزن كل خضرة. أنت تفهم أن هذا ليس ضروريًا. ولكن ما هو عدد القطع التي يجب أن تأخذها للفحص العشوائي؟

قبل إعطاء بعض الصيغ المفيدة لهذا الموقف ، نتذكر بعض الرموز.

أولاً ، إذا قمنا بقياس مخزن الخضروات بالكامل (تسمى هذه المجموعة من العناصر المجموعة العامة) ، فسنعرف بكل الدقة المتاحة لنا متوسط ​​قيمة وزن الدُفعة بأكملها. لنسمي هذا المتوسط X cf .g en . - العوارية العامة. نحن نعلم بالفعل ما يتم تحديده تمامًا إذا كانت قيمته المتوسطة وانحرافه معروفين . صحيح ، حتى الآن لسنا X متوسط ​​ولاس نحن لا نعرف عامة السكان. يمكننا فقط أخذ بعض العينات وقياس القيم التي نحتاجها وحساب هذه العينة كلاً من متوسط ​​القيمة X sr في العينة والانحراف المعياري S sb.

من المعروف أنه إذا كان الاختيار المخصص لدينا يحتوي على عدد كبير من العناصر (عادةً ما يكون n أكبر من 30) ، ويتم أخذها عشوائي حقًا، ثم s لن يختلف عموم السكان تقريبًا عن S ..

بالإضافة إلى ذلك ، في حالة التوزيع الطبيعي ، يمكننا استخدام الصيغ التالية:

باحتمال 95٪


باحتمال 99٪



بشكل عام ، مع الاحتمال Р (t)


يمكن أخذ العلاقة بين قيمة t وقيمة الاحتمال P (t) ، والتي نريد أن نعرف بها فاصل الثقة ، من الجدول التالي:


وبالتالي ، فقد حددنا في أي نطاق يكون متوسط ​​القيمة لعامة السكان (باحتمالية معينة).

ما لم يكن لدينا عينة كبيرة بما يكفي ، لا يمكننا الادعاء أن السكان لديهم s = اس سيل. بالإضافة إلى ذلك ، في هذه الحالة ، يعتبر تقارب العينة من التوزيع الطبيعي مشكلة. في هذه الحالة ، استخدم أيضًا S sb بدلاً من ذلكق في الصيغة:




لكن قيمة t للاحتمال الثابت P (t) ستعتمد على عدد العناصر في العينة n. كلما كان n أكبر ، كلما كان فاصل الثقة الناتج أقرب إلى القيمة المعطاة بواسطة الصيغة (1). يتم أخذ قيم t في هذه الحالة من جدول آخر (اختبار الطالب) ، والذي نقدمه أدناه:

قيم اختبار t للطالب للاحتمال 0.95 و 0.99


مثال 3تم اختيار 30 شخصًا بشكل عشوائي من موظفي الشركة. وفقًا للعينة ، اتضح أن متوسط ​​الراتب (شهريًا) هو 30 ألف روبل بمتوسط ​​انحراف مربع يبلغ 5 آلاف روبل. مع احتمال 0.99 تحديد متوسط ​​الراتب في الشركة.

المحلول:حسب الشرط ، لدينا n = 30 ، X cf. = 30000 ، S = 5000 ، P = 0.99. للعثور على فاصل الثقة ، نستخدم الصيغة المقابلة لمعيار الطالب. وفقًا لجدول n \ u003d 30 و P \ u003d 0.99 نجد t \ u003d 2.756 ، لذلك ،


أولئك. الثقة المنشودةالفاصل 27484< Х ср.ген < 32516.

لذلك ، مع وجود احتمال 0.99 ، يمكن القول أن الفترة الزمنية (27484 ؛ 32516) تحتوي على متوسط ​​الراتب في الشركة.

نأمل أن تستخدم هذه الطريقة دون الحاجة بالضرورة إلى وجود جدول بيانات معك في كل مرة. يمكن إجراء الحسابات تلقائيًا في Excel. أثناء وجودك في ملف Excel ، انقر فوق الزر fx في القائمة العلوية. ثم حدد من بين الوظائف النوع "الإحصائي" ، ومن القائمة المقترحة في المربع - STEUDRASP. بعد ذلك ، عند المطالبة ، ضع المؤشر في حقل "الاحتمال" ، واكتب قيمة الاحتمال المتبادل (أي ، في حالتنا ، بدلاً من احتمال 0.95 ، تحتاج إلى كتابة الاحتمال 0.05). على ما يبدو ، تم تصميم جدول البيانات بحيث تجيب النتيجة على سؤال حول مدى احتمالية أن نكون مخطئين. وبالمثل ، في حقل "درجة الحرية" ، أدخل القيمة (ن -1) لعينتك.

العقل ليس فقط في المعرفة ، ولكن أيضًا في القدرة على تطبيق المعرفة في الممارسة. (أرسطو)

فترات الثقة

مراجعة عامة

بأخذ عينة من السكان ، سنحصل على تقدير نقطي للمعلمة التي تهمنا ونحسب الخطأ القياسي للإشارة إلى دقة التقدير.

ومع ذلك ، بالنسبة لمعظم الحالات ، فإن الخطأ المعياري على هذا النحو غير مقبول. من المفيد أكثر الجمع بين مقياس الدقة هذا وتقدير الفاصل لمعلمة السكان.

يمكن القيام بذلك باستخدام المعرفة بالتوزيع الاحتمالي النظري لعينة الإحصاء (المعلمة) من أجل حساب فاصل الثقة (CI - Confidence Interval، CI - Confidence Interval) للمعلمة.

بشكل عام ، يمتد فاصل الثقة التقديرات في كلا الاتجاهين من خلال بعض مضاعفات الخطأ المعياري (لبارامتر معين) ؛ عادةً ما يتم فصل القيمتين (حدود الثقة) التي تحدد الفاصل الزمني بفاصلة ومحاطة بأقواس.

فاصل الثقة لوسط

باستخدام التوزيع الطبيعي

متوسط ​​العينة له توزيع طبيعي إذا كان حجم العينة كبيرًا ، لذلك يمكن تطبيق معرفة التوزيع الطبيعي عند النظر في متوسط ​​العينة.

على وجه الخصوص ، 95 ٪ من توزيع متوسط ​​العينة يقع ضمن 1.96 الانحراف المعياري (SD) من وسط السكان.

عندما يكون لدينا عينة واحدة فقط ، فإننا نسمي هذا الخطأ القياسي للمتوسط ​​(SEM) ونحسب فاصل الثقة 95 ٪ للمتوسط ​​على النحو التالي:

إذا تم تكرار هذه التجربة عدة مرات ، فسيحتوي الفاصل الزمني على عدد السكان الحقيقي يعني 95٪ من الوقت.

عادةً ما يكون هذا فاصل ثقة ، مثل نطاق القيم الذي يقع ضمنه متوسط ​​المحتوى الحقيقي (الوسط العام) بمستوى ثقة 95٪.

على الرغم من أنه ليس صارمًا تمامًا (متوسط ​​المحتوى هو قيمة ثابتة وبالتالي لا يمكن أن يكون له احتمالية مرتبطة به) لتفسير فاصل الثقة بهذه الطريقة ، فمن الأسهل من الناحية المفاهيمية فهمه.

إستعمال ر-توزيع

يمكنك استخدام التوزيع العادي إذا كنت تعرف قيمة التباين في المجتمع. أيضًا ، عندما يكون حجم العينة صغيرًا ، فإن متوسط ​​العينة يتبع التوزيع الطبيعي إذا كانت البيانات الأساسية للسكان موزعة بشكل طبيعي.

إذا لم يتم توزيع البيانات الأساسية للمحتوى بشكل طبيعي و / أو كان التباين العام (تباين المجتمع) غير معروف ، فإن متوسط ​​العينة يخضع توزيع t للطالب.

احسب فاصل الثقة 95٪ لمتوسط ​​المحتوى على النحو التالي:

أين - نقطة مئوية (نسبة مئوية) ر-توزيع الطلاب بدرجة (n-1) من الحرية ، مما يعطي احتمالية ثنائية الطرف تبلغ 0.05.

بشكل عام ، يوفر فاصلًا أوسع مما هو عليه عند استخدام التوزيع الطبيعي ، لأنه يأخذ في الاعتبار عدم اليقين الإضافي الذي يتم تقديمه عن طريق تقدير الانحراف المعياري للمجتمع و / أو بسبب صغر حجم العينة.

عندما يكون حجم العينة كبيرًا (بترتيب 100 أو أكثر) ، يكون الفرق بين التوزيعين ( t- طالبوطبيعي) لا يكاد يذكر. ومع ذلك ، استخدم دائمًا ر-التوزيع عند حساب فترات الثقة ، حتى لو كان حجم العينة كبيرًا.

عادة ما يتم إعطاء 95٪ CI. يمكن حساب فترات الثقة الأخرى ، مثل 99٪ CI للمتوسط.

بدلاً من ناتج الخطأ القياسي وقيمة الجدول ر-التوزيع الذي يتوافق مع احتمال ثنائي الطرف يبلغ 0.05 اضربه (خطأ معياري) بقيمة تتوافق مع احتمال ثنائي الطرف قدره 0.01. هذه فترة ثقة أوسع من حالة 95٪ لأنها تعكس زيادة الثقة في أن الفاصل الزمني يشمل بالفعل متوسط ​​المحتوى.

فاصل الثقة للنسبة

توزيع العينات للنسب له توزيع ذو حدين. ومع ذلك ، إذا كان حجم العينة نكبير بشكل معقول ، فإن توزيع العينة النسبي يكون طبيعيًا تقريبًا بمتوسط.

تقدير بنسبة أخذ العينات ع = ص / ن(أين ص- عدد الأفراد في العينة بالخصائص التي تهمنا) ويقدر الخطأ المعياري:

يتم تقدير فاصل الثقة 95٪ للنسبة:

إذا كان حجم العينة صغيرًا (عادةً متى npأو ن (1 - ع)أقل 5 ) ، ثم يجب استخدام التوزيع ذي الحدين من أجل حساب فترات الثقة الدقيقة.

لاحظ أنه إذا كان صمعبرًا عنها كنسبة مئوية ، إذن (1-ع)وحل محله (100 بكسل).

تفسير فترات الثقة

عند تفسير فاصل الثقة ، نهتم بالأسئلة التالية:

ما هو عرض فاصل الثقة؟

يشير فاصل الثقة الواسع إلى أن التقدير غير دقيق ؛ ضيق يشير إلى تقدير جيد.

يعتمد عرض فاصل الثقة على حجم الخطأ المعياري ، والذي يعتمد بدوره على حجم العينة ، وعند التفكير في متغير رقمي من تباين البيانات ، قم بإعطاء فترات ثقة أوسع من دراسات مجموعة بيانات كبيرة من عدد قليل المتغيرات.

هل تتضمن CI أي قيم ذات أهمية خاصة؟

يمكنك التحقق مما إذا كانت القيمة المحتملة لمعلمة المجتمع تقع ضمن فاصل الثقة. إذا كانت الإجابة بنعم ، فإن النتائج تتوافق مع هذه القيمة المحتملة. إذا لم يكن الأمر كذلك ، فمن غير المحتمل (بالنسبة لفاصل الثقة 95٪ ، تكون فرصة 5٪ تقريبًا) أن يكون للمعلمة هذه القيمة.