حساب معيار الطالب. توزيع اختبار t للطالب لاختبار الفرضية حول الوسط الحسابي وحساب فاصل الثقة في برنامج MS Excel

يسمح لنا اختبار الفرضيات الإحصائية بعمل استنتاجات قوية حول خصائص السكان بناءً على بيانات العينة. هناك فرضيات مختلفة. إحداها هي الفرضية حول المتوسط ​​(التوقع الرياضي). ويتمثل جوهرها في التوصل إلى استنتاج صحيح، يعتمد فقط على العينة المتاحة، حول المكان الذي قد يقع أو لا يقع فيه المتوسط ​​العام (لن نعرف الحقيقة الدقيقة أبدًا، ولكن يمكننا تضييق نطاق البحث).

لقد تم وصف المنهج العام لاختبار الفرضيات، لذلك دعونا ننتقل مباشرة إلى هذه النقطة. لنفترض أولاً أن العينة مأخوذة من مجتمع عادي ذي متغيرات عشوائية Xمع المتوسط ​​العام μ والتباين σ 2(أعلم، أعلم أن هذا لن يحدث، لكن لا تقاطعني!). ومن الواضح أن المتوسط ​​الحسابي لهذه العينة هو في حد ذاته متغير عشوائي. إذا قمت باستخراج العديد من هذه العينات وحساب متوسطاتها، فسيكون لها أيضًا توقعات رياضية μ و

ثم المتغير العشوائي

السؤال الذي يطرح نفسه: هل سيكون المعدل العام باحتمال 95% ضمن ±1.96؟ س س̅. وبعبارة أخرى، هي توزيعات المتغيرات العشوائية

مقابل.

تم طرح هذا السؤال (وحله) لأول مرة بواسطة كيميائي كان يعمل في مصنع بيرة غينيس في دبلن (أيرلندا). كان اسم الكيميائي ويليام سيلي جوسيت، وقد أخذ عينات من البيرة لتحليلها كيميائيًا. في مرحلة ما، على ما يبدو، بدأ ويليام يتعذب بسبب شكوك غامضة حول توزيع المتوسطات. لقد اتضح أنه أكثر تلطيخًا مما ينبغي أن يكون عليه التوزيع الطبيعي.

بعد جمع الأساس الرياضي وحساب قيم دالة التوزيع التي اكتشفها، كتب الكيميائي في دبلن ويليام جوسيت مذكرة نُشرت في عدد مارس 1908 من مجلة القياسات الحيوية (رئيس التحرير - كارل بيرسون). لأن نهى غينيس بشكل صارم عن الكشف عن أسرار التخمير، ووقع جوسيت بالاسم المستعار الطالب.

على الرغم من أن K. Pearson قد اخترع التوزيع بالفعل، إلا أن الفكرة العامة للحياة الطبيعية لا تزال مهيمنة. ولم يكن أحد ليتصور أن توزيع درجات العينة قد لا يكون طبيعيا. لذلك، ظلت مقالة W. Gosset عمليا دون أن يلاحظها أحد ونسيانها. وفقط رونالد فيشر قدّر اكتشاف جوسيت. استخدم فيشر التوزيع الجديد في عمله وأطلق عليه الاسم توزيع الطالب. وبالتالي أصبح معيار اختبار الفرضيات اختبار الطالب. وهكذا حدثت «الثورة» في الإحصاء، التي دخلت عصر تحليل بيانات العينات. وكانت هذه رحلة قصيرة في التاريخ.

دعونا نرى ما يمكن أن يراه دبليو جوسيت. لنقم بإنشاء 20 ألف عينة عادية من 6 ملاحظات بمتوسط ​​( ) 50 والانحراف المعياري ( σ ) 10. ثم نقوم بتطبيع العينة باستخدام الوسائل التباين العام:

سنقوم بتجميع المتوسطات الناتجة البالغ عددها 20 ألفًا في فترات طولها 0.1 وحساب الترددات. دعونا نصور في الرسم البياني توزيع التردد الفعلي (Norm) والنظري (ENorm) لوسائل العينة.

النقاط (الترددات المرصودة) تتطابق عمليا مع الخط (الترددات النظرية). وهذا أمر مفهوم، لأن البيانات مأخوذة من نفس عامة السكان، والاختلافات ليست سوى أخطاء في العينات.

دعونا نجري تجربة جديدة. نحن تطبيع المتوسطات باستخدام تباين العينة.

دعونا نحسب الترددات مرة أخرى ونرسمها على الرسم البياني في شكل نقاط، مع ترك خط التوزيع الطبيعي القياسي للمقارنة. دعونا نشير إلى التكرار التجريبي للمتوسطات، على سبيل المثال، بالحرف ر.

ويمكن ملاحظة أن التوزيعات هذه المرة لا تتطابق كثيرًا. قريب، نعم، ولكن ليس هو نفسه. أصبحت ذيول أكثر "ثقيلة".

لم يكن لدى Gosset-Student أحدث إصدار من MS Excel، ولكن هذا هو بالضبط التأثير الذي لاحظه. لماذا يحدث هذا؟ والتفسير هو أن المتغير العشوائي

لا يعتمد فقط على خطأ المعاينة (البسط)، ولكن أيضًا على الخطأ المعياري للوسط (المقام)، وهو أيضًا متغير عشوائي.

دعونا نلقي نظرة سريعة على التوزيع الذي يجب أن يكون عليه مثل هذا المتغير العشوائي. أولاً، عليك أن تتذكر (أو تتعلم) شيئًا ما من الإحصائيات الرياضية. هناك نظرية فيشر التي تنص على أنه في عينة من التوزيع الطبيعي:

1. متوسطة وتباين العينة ق 2هي كميات مستقلة.

2. نسبة العينة إلى تباين المجتمع مضروبة في عدد درجات الحرية لها توزيع χ 2(مربع كاي) بنفس عدد درجات الحرية، أي.

أين ك- عدد درجات الحرية (باللغة الإنجليزية درجات الحرية (d.f.))

وتستند العديد من النتائج الأخرى في إحصائيات النماذج العادية إلى هذا القانون.

دعنا نعود إلى توزيع المتوسط. اقسم بسط ومقام التعبير

على σ X̅. نحن نحصل

البسط هو متغير عشوائي عادي قياسي (نشير إليه ξ (الحادي عشر)). دعونا نعبر عن المقام من نظرية فيشر.

ثم سوف يأخذ التعبير الأصلي النموذج

وهذا ما هو عليه بشكل عام (علاقة الطالب). يمكنك استخلاص وظيفة التوزيع الخاصة بها مباشرة، لأن توزيعات كلا المتغيرين العشوائيين في هذا التعبير معروفة. دعونا نترك هذه المتعة لعلماء الرياضيات.

تحتوي دالة توزيع الطالب على صيغة يصعب فهمها، لذا لا داعي لتحليلها. لا أحد يستخدمه على أي حال، لأنه... يتم إعطاء الاحتمالات في جداول خاصة لتوزيعات الطلاب (تسمى أحيانًا جداول معاملات الطلاب)، أو يتم تضمينها في صيغ الكمبيوتر.

لذلك، مسلحًا بهذه المعرفة الجديدة، يمكنك فهم التعريف الرسمي لتوزيع الطلاب.
متغير عشوائي يخضع لتوزيع الطالب ب كدرجات الحرية هي نسبة المتغيرات العشوائية المستقلة

أين ξ موزعة وفقا للقانون العادي القياسي، و χ 2 كيطيع التوزيع χ 2ج كدرجات الحرية.

وبالتالي، فإن صيغة اختبار الطالب للوسط الحسابي

هناك حالة خاصة للعلاقة الطلابية

ويترتب على الصيغة والتعريف أن توزيع اختبار الطالب يعتمد فقط على عدد درجات الحرية.

في ك> اختبار 30 t عمليا لا يختلف عن التوزيع الطبيعي القياسي.

على عكس مربع كاي، يمكن أن يكون اختبار t أحادي الذيل أو ثنائي الذيل. وعادة ما يستخدمون الاتجاهين، على افتراض أن الانحراف يمكن أن يحدث في كلا الاتجاهين عن المتوسط. ولكن إذا كانت حالة المشكلة تسمح بالانحراف في اتجاه واحد فقط، فمن المعقول استخدام معيار أحادي الجانب. وهذا يزيد من القوة قليلاً، لأن... عند مستوى دلالة ثابت، تقترب القيمة الحرجة من الصفر قليلاً.

شروط استخدام اختبار الطالب

على الرغم من أن اكتشاف الطالب قد أحدث ثورة في الإحصاء في وقت ما، إلا أن اختبار t لا يزال محدودًا للغاية في إمكانيات تطبيقه، لأنه في حد ذاته يأتي من افتراض التوزيع الطبيعي للبيانات الأصلية. إذا كانت البيانات غير طبيعية (وهذا هو الحال عادة)، فلن يكون لاختبار t توزيع الطالب. ومع ذلك، بسبب عمل نظرية الحد المركزي، فإن المتوسط ​​حتى بالنسبة للبيانات غير الطبيعية يكتسب بسرعة توزيعًا على شكل جرس.

لنأخذ على سبيل المثال البيانات التي تميل بشكل واضح نحو اليمين، مثل توزيع مربع كاي مع 5 درجات من الحرية.

لنقم الآن بإنشاء 20 ألف عينة ونلاحظ كيف يتغير توزيع المتوسطات حسب حجمها.

الفرق ملحوظ تمامًا في العينات الصغيرة التي تصل إلى 15-20 ملاحظة. ولكن بعد ذلك يختفي بسرعة. وبالتالي، فإن عدم التوزيع الطبيعي، بالطبع، ليس جيدًا، ولكنه ليس حرجًا.

الأهم من ذلك كله، أن اختبار t "يخشى" من القيم المتطرفة، أي. انحرافات غير طبيعية. لنأخذ 20 ألف عينة عادية تتألف كل منها من 15 ملاحظة ونضيف قيمة عشوائية متطرفة لبعضها.

وتبين أن الصورة قاتمة. تختلف التكرارات الفعلية للمتوسطات كثيرًا عن التكرارات النظرية. استخدام توزيع t في مثل هذه الحالة يصبح مهمة محفوفة بالمخاطر للغاية.

لذلك، في العينات غير الصغيرة جدًا (من 15 ملاحظة)، يكون اختبار t مقاومًا نسبيًا للتوزيع غير الطبيعي للبيانات الأصلية. لكن القيم المتطرفة في البيانات تشوه بشكل كبير توزيع اختبار t، والذي بدوره يمكن أن يؤدي إلى أخطاء في الاستدلال الإحصائي، لذلك يجب التخلص من الملاحظات الشاذة. في كثير من الأحيان، تتم إزالة جميع القيم التي تقع ضمن الانحرافات المعيارية ±2 من المتوسط ​​من العينة.

مثال لاختبار فرضية حول التوقع الرياضي باستخدام اختبار الطالب في برنامج MS Excel

يحتوي Excel على العديد من الوظائف المتعلقة بتوزيع t. دعونا ننظر إليهم.

STUDENT.DIST - توزيع t للطلاب "الكلاسيكي" على الجانب الأيسر. الإدخال هو قيمة معيار t، وعدد درجات الحرية، والخيار (0 أو 1) الذي يحدد ما يجب حسابه: الكثافة أو قيمة الوظيفة. عند الإخراج نحصل، على التوالي، على الكثافة أو احتمال أن يكون المتغير العشوائي أقل من معيار t المحدد في الوسيطة.

STUDENT.DIST.2X – التوزيع في الاتجاهين. الوسيطة هي القيمة المطلقة (modulo) لاختبار t وعدد درجات الحرية. ونتيجة لذلك، نحصل على احتمال الحصول على نفس قيمة معيار t أو حتى أكبر، أي. مستوى الأهمية الفعلي (مستوى ع).

STUDENT.DIST.PH – توزيع t على الجانب الأيمن. لذا، 1-STUDENT.DIST(2;5;1) = STUDENT.DIST.PH(2;5) = 0.05097. إذا كان اختبار t موجبًا، فإن الاحتمال الناتج هو المستوى p.

STUDENT.INR - يستخدم لحساب معكوس الجانب الأيسر لتوزيع t. والحجة هي الاحتمال وعدد درجات الحرية. عند الإخراج نحصل على قيمة معيار t المقابلة لهذا الاحتمال. عدد الاحتمالات على اليسار. ولذلك، فإن الذيل الأيسر يتطلب مستوى الأهمية نفسه α ، وللصحيح 1 - α .

STUDENT.OBR.2X – القيمة العكسية لتوزيع الطالب على الوجهين، أي. قيمة اختبار t (modulo). يتم أيضًا توفير مستوى الأهمية للمدخلات α . فقط هذه المرة يتم العد من كلا الجانبين في وقت واحد، لذلك يتم توزيع الاحتمال إلى طرفين. لذا، STUDENT.ARV(1-0.025;5) = STUDENT.ARV.2X(0.05;5) = 2.57058

STUDENT.TEST هي دالة لاختبار الفرضية حول مساواة التوقعات الرياضية في عينتين. يستبدل مجموعة من الحسابات، لأن يكفي تحديد نطاقين فقط بالبيانات وبضعة معلمات أخرى. الإخراج هو المستوى p.

CONFIDENCE.STUDENT – حساب فاصل الثقة للمتوسط ​​مع مراعاة توزيع t.

دعونا نفكر في هذا المثال التدريبي. يتم تعبئة الأسمنت في المؤسسة في أكياس سعة 50 كجم. بسبب العشوائية، يسمح ببعض الانحراف عن الكتلة المتوقعة في الكيس الواحد، ولكن يجب أن يبقى المتوسط ​​العام 50 كجم. قام قسم مراقبة الجودة بوزن 9 أكياس عشوائياً وحصل على النتائج التالية: متوسط ​​الوزن ( ) كان 50.3 كجم، الانحراف المعياري ( س) – 0.5 كجم.

هل تتفق هذه النتيجة مع الفرضية الصفرية القائلة بأن المتوسط ​​العام هو 50 كجم؟ بمعنى آخر، هل من الممكن الحصول على مثل هذه النتيجة عن طريق الصدفة البحتة إذا كانت المعدات تعمل بشكل صحيح وتنتج حشوة متوسطة تبلغ 50 كجم؟ إذا لم يتم رفض الفرضية، فإن الاختلاف الناتج يتناسب مع نطاق التقلبات العشوائية، أما إذا تم رفض الفرضية، فمن المرجح أن يكون هناك خلل في إعدادات الآلة التي تملأ الأكياس. يجب فحصه وتكوينه.

الشرط القصير في التدوين المقبول عمومًا يبدو هكذا.

ح0: μ = 50 كجم

H1: μ ≠ 50 كجم

هناك سبب لافتراض أن توزيع الأكياس المعبأة يتبع التوزيع الطبيعي (أو لا يختلف كثيرًا عنه). وهذا يعني أنه لاختبار الفرضية المتعلقة بالتوقع الرياضي، يمكنك استخدام اختبار الطالب. يمكن أن تحدث الانحرافات العشوائية في أي اتجاه، مما يعني أن هناك حاجة إلى اختبار t على الوجهين.

أولاً، سوف نستخدم وسائل ما قبل الطوفان: حساب معيار t يدويًا ومقارنته بقيمة الجدول الحرجة. اختبار t المحسوب:

الآن دعونا نحدد ما إذا كان الرقم الناتج يتجاوز المستوى الحرج عند مستوى الأهمية α = 0.05. دعونا نستخدم جدول توزيع الطالب (المتوفر في أي كتاب إحصائي مدرسي).

توضح الأعمدة احتمال الجانب الأيمن للتوزيع، والصفوف توضح عدد درجات الحرية. نحن مهتمون باختبار t ثنائي الطرف بمستوى دلالة 0.05، وهو ما يعادل قيمة t لنصف مستوى الأهمية على اليمين: 1 - 0.05/2 = 0.975. عدد درجات الحرية هو حجم العينة ناقص 1، أي. 9 - 1 = 8. عند التقاطع نجد القيمة الجدولية لاختبار t - 2.306. إذا استخدمنا التوزيع الطبيعي القياسي، فستكون النقطة الحرجة 1.96، لكنها أكبر هنا، لأن يبدو توزيع t في العينات الصغيرة أكثر تسطيحًا.

دعونا نقارن القيمة الفعلية (1.8) والقيمة الجدولية (2.306). وتبين أن المعيار المحسوب أقل من المعيار المجدول. وبالتالي فإن البيانات المتوفرة لا تتعارض مع الفرضية H0 القائلة بأن المتوسط ​​العام هو 50 كجم (ولكنها لا تثبت ذلك أيضاً). هذا كل ما يمكننا تعلمه باستخدام الجداول. يمكنك بالطبع أيضًا محاولة العثور على المستوى p، لكنه سيكون تقريبيًا. وكقاعدة عامة، يتم استخدام المستوى p لاختبار الفرضيات. لذلك، ننتقل بعد ذلك إلى Excel.

لا توجد وظيفة جاهزة لحساب اختبار t في Excel. لكن هذا ليس مخيفًا، لأن صيغة اختبار t الخاصة بالطالب بسيطة جدًا ويمكن إنشاؤها بسهولة في خلية Excel.

لقد حصلنا على نفس 1.8. دعونا أولا العثور على القيمة الحرجة. نحن نأخذ ألفا 0.05، والمعيار ذو ذيلين. نحن بحاجة إلى دالة التوزيع t العكسية للفرضية ذات الوجهين STUDENT.OBR.2X.

القيمة الناتجة تقطع المنطقة الحرجة. ولا يدخل فيها اختبار t المرصود، وبالتالي لا يتم رفض الفرضية.

ومع ذلك، فهذه هي نفس الطريقة لاختبار الفرضية باستخدام قيمة جدولية. سيكون من المفيد حساب المستوى p، أي. احتمال الحصول على الانحراف الملحوظ أو الأكبر عن متوسط ​​50 كجم إذا كانت هذه الفرضية صحيحة. سوف تحتاج إلى وظيفة توزيع الطالب للفرضية ذات الوجهين STUDENT.DIST.2X.

المستوى P هو 0.1096، وهو أكبر من مستوى الأهمية المقبول وهو 0.05 - ونحن لا نرفض الفرضية. لكن الآن يمكننا الحكم على درجة الإثبات. تبين أن المستوى P قريب جدًا من المستوى عند رفض الفرضية، وهذا يؤدي إلى أفكار مختلفة. على سبيل المثال، أن العينة كانت صغيرة جدًا بحيث لا يمكنها اكتشاف انحراف كبير.

وبعد مرور بعض الوقت، قرر قسم المراقبة مرة أخرى التحقق من كيفية الحفاظ على معيار تعبئة الأكياس. هذه المرة، لمزيد من الموثوقية، لم يتم اختيار 9 أكياس، بل 25 حقيبة. ومن الواضح بديهياً أن انتشار المتوسط ​​سوف ينخفض، وبالتالي فإن فرص العثور على فشل في النظام تصبح أكبر.

لنفترض أنه تم الحصول على نفس قيم المتوسط ​​والانحراف المعياري للعينة في المرة الأولى (50.3 و 0.5 على التوالي). دعونا نحسب اختبار t.


القيمة الحرجة لـ 24 درجة حرية و α = 0.05 هي 2.064. والصورة أدناه توضح أن اختبار t يقع ضمن نطاق رفض الفرضية.

يمكننا أن نستنتج أنه مع احتمال ثقة أكثر من 95٪، فإن المتوسط ​​العام يختلف عن 50 كجم. لكي نكون أكثر إقناعا، دعونا ننظر إلى المستوى p (السطر الأخير في الجدول). احتمال الحصول على متوسط ​​بنفس الانحراف أو حتى أكبر من 50، إذا كانت الفرضية صحيحة، هو 0.0062، أو 0.62٪، وهو أمر مستحيل عمليا بقياس واحد. بشكل عام، نحن نرفض الفرضية باعتبارها غير محتملة.

حساب فترة الثقة باستخدام توزيع t للطالب

هناك طريقة إحصائية أخرى ترتبط ارتباطًا وثيقًا باختبار الفرضيات - حساب فترات الثقة. إذا كان الفاصل الزمني الناتج يحتوي على قيمة مقابلة للفرضية الصفرية، فهذا يعادل حقيقة عدم رفض الفرضية الصفرية. وبخلاف ذلك، يتم رفض الفرضية بمستوى الثقة المقابل. في بعض الحالات، لا يقوم المحللون باختبار الفرضيات بالشكل الكلاسيكي على الإطلاق، ولكنهم يحسبون فترات الثقة فقط. يتيح لك هذا الأسلوب استخراج المزيد من المعلومات المفيدة.

لنحسب فترات الثقة للمتوسط ​​لـ 9 و25 ملاحظة. للقيام بذلك، سوف نستخدم دالة Excel CONFIDENT.STUDENT. ومن الغريب أن كل شيء هنا بسيط للغاية. تحتاج وسيطات الوظيفة فقط إلى الإشارة إلى مستوى الأهمية α والانحراف المعياري للعينة وحجم العينة. عند الإخراج، نحصل على نصف عرض فاصل الثقة، أي القيمة التي يجب وضعها على جانبي المتوسط. بعد إجراء الحسابات ورسم مخطط مرئي، نحصل على ما يلي.

كما ترون، مع عينة مكونة من 9 ملاحظات، فإن القيمة 50 تقع ضمن فترة الثقة (لم يتم رفض الفرضية)، ومع 25 ملاحظة لا تقع ضمن فترة الثقة (تم رفض الفرضية). علاوة على ذلك، في تجربة أجريت على 25 كيسًا، يمكن القول أنه مع احتمال 97.5% يتجاوز المتوسط ​​العام 50.1 كجم (الحد الأدنى لفاصل الثقة هو 50.094 كجم). وهذه معلومات قيمة للغاية.

وهكذا قمنا بحل نفس المشكلة بثلاث طرق:

1. استخدام المنهج القديم في مقارنة القيم المحسوبة والمجدولة لاختبار t
2. أكثر حداثة، وذلك بحساب مستوى p، مما يضيف درجة من الثقة عند رفض الفرضية.
3. أكثر إفادة من خلال حساب فترة الثقة والحصول على الحد الأدنى لقيمة المتوسط ​​العام.

من المهم أن نتذكر أن اختبار t يشير إلى الطرق البارامترية، لأنه يعتمد على التوزيع الطبيعي (له معلمتين: المتوسط ​​والتباين). لذلك، لتطبيقه الناجح، من المهم على الأقل أن تكون الحالة الطبيعية التقريبية للبيانات الأولية وغياب القيم المتطرفة أمرًا مهمًا.

أخيرًا، أقترح مشاهدة مقطع فيديو حول كيفية إجراء العمليات الحسابية المتعلقة باختبار الطالب في برنامج Excel.

سنستخدم خلال المثال معلومات وهمية حتى يتمكن القارئ من إجراء التحويلات اللازمة بنفسه.

لنفترض أننا، في سياق البحث، قمنا بدراسة تأثير الدواء A على محتوى المادة B (بالمليمول/جم) في الأنسجة C وتركيز المادة D في الدم (بالمليمول/لتر) لدى المرضى مقسمة وفقًا لبعض المعايير E إلى 3 مجموعات متساوية الحجم (ن = 10). وتظهر نتائج هذه الدراسة الوهمية في الجدول:

محتوى المادة ب، مليمول/جم

المادة د، مليمول/لتر

زيادة في التركيز


نود أن ننبهك إلى أننا نأخذ عينات بحجم 10 في الاعتبار لسهولة عرض البيانات وإجراء العمليات الحسابية؛ ومن الناحية العملية، لا يكون حجم العينة هذا كافيًا في العادة لتكوين نتيجة إحصائية.

على سبيل المثال، خذ بعين الاعتبار البيانات الموجودة في العمود الأول من الجدول.

الإحصاء الوصفي

متوسط ​​العينة

يتم الحصول على المتوسط ​​الحسابي، والذي غالبًا ما يسمى ببساطة "المتوسط"، عن طريق جمع جميع القيم وتقسيم هذا المجموع على عدد القيم في المجموعة. يمكن إظهار ذلك باستخدام صيغة جبرية. يمكن تمثيل مجموعة من الملاحظات n للمتغير x بالشكل x 1 , x 2 , x 3 , ..., x n

صيغة تحديد الوسط الحسابي للملاحظات (تُنطق "X مع خط"):

= (X 1 + X 2 + ... + X ن) / ن

= (12 + 13 + 14 + 15 + 14 + 13 + 13 + 10 + 11 + 16) / 10 = 13,1;

تباين العينة

إحدى طرق قياس تشتت البيانات هي تحديد الدرجة التي تنحرف بها كل ملاحظة عن الوسط الحسابي. من الواضح أنه كلما زاد الانحراف، زاد التباين وتقلب الملاحظات. ومع ذلك، لا يمكننا استخدام متوسط ​​هذه الانحرافات كمقياس للتشتت، لأن الانحرافات الإيجابية تعوض الانحرافات السلبية (مجموعها صفر). لحل هذه المشكلة، نقوم بتربيع كل انحراف وإيجاد متوسط ​​مربعات الانحرافات؛ وتسمى هذه الكمية بالتباين أو التشتت. لنأخذ n الملاحظات× 1، × 2، × 3، ...، × ن، المتوسط وهو يساوي. حساب التباين هذا، يشار إليه عادة باسمس2,هذه الملاحظات:

تباين العينة لهذا المؤشر هو s 2 = 3.2.

الانحراف المعياري

الانحراف المعياري (متوسط ​​المربع) هو الجذر التربيعي الموجب للتباين. باستخدام ملاحظات n كمثال، يبدو الأمر كما يلي:

يمكننا أن نفكر في الانحراف المعياري كنوع من الانحراف المتوسط ​​للملاحظات عن المتوسط. ويتم حسابه بنفس الوحدات (الأبعاد) مثل البيانات الأصلية.

الصورة = جذر (ق 2) = جذر (3،2) = 1.79.

معامل الاختلاف

إذا قمت بقسمة الانحراف المعياري على الوسط الحسابي وعبر عن النتيجة كنسبة مئوية، فستحصل على معامل الاختلاف.

السيرة الذاتية = (1.79 / 13.1) * 100% = 13.7

عينة يعني خطأ

1.79/جذر(10) = 0.57;

معامل الطالب (اختبار t لعينة واحدة)

يستخدم لاختبار الفرضية حول الفرق بين القيمة المتوسطة وبعض القيمة المعروفة m

يتم حساب عدد درجات الحرية كـ f=n-1.

في هذه الحالة، يقع فاصل الثقة للوسط بين حدود 11.87 و14.39.

بالنسبة لمستوى الثقة 95% m=11.87 أو m=14.39، فهذا = |13.1-11.82| = |13.1-14.38| = 1.28

وبناء على ذلك، في هذه الحالة، بالنسبة لعدد درجات الحرية f = 10 - 1 = 9 ومستوى الثقة 95% t = 2.26.

حوار الإحصائيات والجداول الأساسية

في الوحدة الإحصائيات والجداول الأساسيةدعنا نختار الإحصاء الوصفي.

سوف يظهر صندوف حوار الإحصاء الوصفي.

في الميدان المتغيراتدعنا نختار مجموعة 1.

الضغط نعمنحصل على جداول النتائج بإحصائيات وصفية للمتغيرات المختارة.

سوف يظهر صندوف حوار اختبار t لعينة واحدة.

لنفترض أننا نعلم أن متوسط ​​محتوى المادة B في النسيج C هو 11.

جدول النتائج مع الإحصاء الوصفي واختبار الطالب هو كما يلي:

كان علينا أن نرفض الفرضية القائلة بأن متوسط ​​محتوى المادة B في الأنسجة C هو 11.

وبما أن القيمة المحسوبة للمعيار أكبر من القيمة المجدولة (2.26)، يتم رفض الفرضية الصفرية عند مستوى الأهمية المحدد، وتعتبر الاختلافات بين العينة والقيمة المعروفة ذات دلالة إحصائية. وبالتالي يتم التأكد من الاستنتاج حول وجود فروق باستخدام اختبار الطالب باستخدام هذه الطريقة.

​ اختبار t للطالب هو اسم عام لفئة من طرق الاختبار الإحصائي للفرضيات (الاختبارات الإحصائية) بناءً على توزيع الطالب. تتضمن الاستخدامات الأكثر شيوعًا لاختبار t اختبار تساوي المتوسطات في عينتين.

1. تاريخ تطور اختبار t

تم تطوير هذا المعيار ويليام جوسيتلتقييم جودة البيرة في شركة غينيس. بسبب التزامات الشركة فيما يتعلق بعدم الكشف عن الأسرار التجارية، تم نشر مقال جوسيت عام 1908 في مجلة القياسات الحيوية تحت اسم مستعار "الطالب".

2. ما هو الغرض من اختبار الطالب؟

يستخدم اختبار الطالب لتحديد الأهمية الإحصائية للاختلافات في المتوسطات. يمكن استخدامهما في حالات المقارنة بين العينات المستقلة ( على سبيل المثال، مجموعات مرضى السكري ومجموعات الأصحاء) ، وعند مقارنة المجموعات السكانية ذات الصلة ( على سبيل المثال، متوسط ​​معدل ضربات القلب لدى نفس المرضى قبل وبعد تناول دواء مضاد لاضطراب النظم).

3. ما هي الحالات التي يمكن فيها استخدام اختبار الطالب؟

لتطبيق اختبار الطالب، من الضروري أن تكون البيانات الأصلية موجودة التوزيع الطبيعي. وفي حالة تطبيق معيار العينتين للعينات المستقلة، فمن الضروري أيضًا استيفاء الشرط المساواة (التجانس) من الفروق.

إذا لم يتم استيفاء هذه الشروط، ينبغي استخدام أساليب مماثلة عند مقارنة وسائل العينة. إحصائيات غير معلمية، ومن أشهرها اختبار مان ويتني يو(كاختبار لعينتين للعينات المستقلة)، و معيار التوقيعو اختبار ويلكوكسون(تستخدم في حالات العينات التابعة).

4. كيف يتم حساب اختبار الطالب؟

لمقارنة القيم المتوسطة، يتم حساب اختبار الطالب باستخدام الصيغة التالية:

أين م 1- المتوسط ​​الحسابي لأول مجموعة (مجموعة) تمت مقارنتها، م 2- المتوسط ​​الحسابي للمجموعة الثانية من السكان (المجموعة)، م 1- متوسط ​​الخطأ للوسط الحسابي الأول، م 2- متوسط ​​الخطأ للوسط الحسابي الثاني.

5. كيفية تفسير قيمة اختبار t للطالب؟

ويجب تفسير قيمة اختبار t للطالب الناتج بشكل صحيح. للقيام بذلك، نحن بحاجة إلى معرفة عدد المواضيع في كل مجموعة (ن 1 و ن 2). إيجاد عدد درجات الحرية Fوفقا للصيغة التالية:

و = (ن 1 + ن 2) - 2

بعد ذلك، نحدد القيمة الحرجة لاختبار t للطالب لمستوى الأهمية المطلوب (على سبيل المثال، p = 0.05) ولعدد معين من درجات الحرية Fحسب الجدول( انظر أدناه).

نقوم بمقارنة القيم الحرجة والمحسوبة للمعيار:

  • إذا كانت القيمة المحسوبة لاختبار الطالب يساوي أو أكبرالحرجة، التي وجدناها من الجدول، نستنتج أن الاختلافات بين القيم المقارنة ذات دلالة إحصائية.
  • إذا كانت قيمة اختبار الطالب المحسوب أقلجدولي، مما يعني أن الاختلافات بين القيم المقارنة ليست ذات دلالة إحصائية.

6. مثال لحساب اختبار الطالب

لدراسة فعالية مستحضر الحديد الجديد، تم اختيار مجموعتين من المرضى الذين يعانون من فقر الدم. في المجموعة الأولى، تلقى المرضى دواءً جديدًا لمدة أسبوعين، وفي المجموعة الثانية تلقوا دواءً وهميًا. بعد ذلك، تم قياس مستويات الهيموجلوبين في الدم المحيطي. في المجموعة الأولى، كان متوسط ​​مستوى الهيموجلوبين 115.4±1.2 جم/لتر، وفي المجموعة الثانية - 103.7±2.3 جم/لتر (يتم تقديم البيانات بالتنسيق م ± م) ، السكان الذين تتم مقارنتهم لديهم توزيع طبيعي. وكان عدد المجموعة الأولى 34، والثانية - 40 مريضا. من الضروري استخلاص نتيجة حول الأهمية الإحصائية للاختلافات التي تم الحصول عليها وفعالية مستحضر الحديد الجديد.

حل:لتقييم أهمية الاختلافات، نستخدم اختبار الطالب، والذي يتم حسابه على أنه الفرق في القيم المتوسطة مقسومًا على مجموع الأخطاء المربعة:

وبعد إجراء الحسابات، تبين أن قيمة اختبار t هي 4.51. نجد عدد درجات الحرية كـ (34 + 40) - 2 = 72. ونقارن قيمة اختبار الطالب الناتجة البالغة 4.51 مع القيمة الحرجة عند p = 0.05 الموضحة في الجدول: 1.993. وبما أن القيمة المحسوبة للمعيار أكبر من القيمة الحرجة، نستنتج أن الفروق الملحوظة ذات دلالة إحصائية (مستوى الدلالة p<0,05).

ما هي الحالات التي يمكن فيها استخدام اختبار الطالب؟

لتطبيق اختبار الطالب، من الضروري أن تكون البيانات الأصلية موجودة التوزيع الطبيعي. وفي حالة تطبيق معيار العينتين للعينات المستقلة، فمن الضروري أيضًا استيفاء الشرط المساواة (التجانس) من الفروق.

إذا لم يتم استيفاء هذه الشروط، ينبغي استخدام أساليب مماثلة عند مقارنة وسائل العينة. إحصائيات غير معلمية، ومن أشهرها اختبار مان ويتني يو(كاختبار لعينتين للعينات المستقلة)، و معيار التوقيعو اختبار ويلكوكسون(تستخدم في حالات العينات التابعة).

لمقارنة القيم المتوسطة، يتم حساب اختبار الطالب باستخدام الصيغة التالية:

أين م 1- المتوسط ​​الحسابي لأول مجموعة (مجموعة) تمت مقارنتها، م 2- المتوسط ​​الحسابي للمجموعة الثانية من السكان (المجموعة)، م 1- متوسط ​​الخطأ للوسط الحسابي الأول، م 2- متوسط ​​الخطأ للوسط الحسابي الثاني.

كيفية تفسير قيمة اختبار الطالب؟

ويجب تفسير قيمة اختبار t للطالب الناتج بشكل صحيح. للقيام بذلك، نحن بحاجة إلى معرفة عدد المواضيع في كل مجموعة (ن 1 و ن 2). إيجاد عدد درجات الحرية Fوفقا للصيغة التالية:

و = (ن 1 + ن 2) - 2

بعد ذلك، نحدد القيمة الحرجة لاختبار t للطالب لمستوى الأهمية المطلوب (على سبيل المثال، p = 0.05) ولعدد معين من درجات الحرية Fحسب الجدول( انظر أدناه).

نقوم بمقارنة القيم الحرجة والمحسوبة للمعيار:

· إذا كانت القيمة المحسوبة لاختبار الطالب يساوي أو أكبرالحرجة، التي وجدناها من الجدول، نستنتج أن الاختلافات بين القيم المقارنة ذات دلالة إحصائية.

· إذا كانت قيمة اختبار الطالب المحسوب أقلجدولي، مما يعني أن الاختلافات بين القيم المقارنة ليست ذات دلالة إحصائية.

مثال لحساب اختبار الطالب

لدراسة فعالية مستحضر الحديد الجديد، تم اختيار مجموعتين من المرضى الذين يعانون من فقر الدم. في المجموعة الأولى، تلقى المرضى دواءً جديدًا لمدة أسبوعين، وفي المجموعة الثانية تلقوا دواءً وهميًا. بعد ذلك، تم قياس مستويات الهيموجلوبين في الدم المحيطي. في المجموعة الأولى، كان متوسط ​​مستوى الهيموجلوبين 115.4±1.2 جم/لتر، وفي المجموعة الثانية - 103.7±2.3 جم/لتر (يتم تقديم البيانات بالتنسيق م ± م) ، السكان الذين تتم مقارنتهم لديهم توزيع طبيعي. وكان عدد المجموعة الأولى 34، والثانية - 40 مريضا. من الضروري استخلاص نتيجة حول الأهمية الإحصائية للاختلافات التي تم الحصول عليها وفعالية مستحضر الحديد الجديد.

حل:لتقييم أهمية الاختلافات، نستخدم اختبار الطالب، والذي يتم حسابه على أنه الفرق في القيم المتوسطة مقسومًا على مجموع الأخطاء المربعة:

وبعد إجراء الحسابات، تبين أن قيمة اختبار t هي 4.51. نجد عدد درجات الحرية كـ (34 + 40) - 2 = 72. ونقارن قيمة اختبار الطالب الناتجة البالغة 4.51 مع القيمة الحرجة عند p = 0.05 الموضحة في الجدول: 1.993. وبما أن القيمة المحسوبة للمعيار أكبر من القيمة الحرجة، نستنتج أن الفروق الملحوظة ذات دلالة إحصائية (مستوى الدلالة p<0,05).

توزيع فيشر هو توزيع متغير عشوائي

أين هي المتغيرات العشوائية × 1و × 2مستقلة ولها توزيعات مربع كاي مع عدد درجات الحرية ك 1و ك 2على التوالى. وفي نفس الوقت الزوجين (ك1 ، ك2)- زوج من "درجات الحرية" لتوزيع فيشر، وهما: ك 1هو عدد درجات حرية البسط، و ك 2– عدد درجات حرية المقام . توزيع متغير عشوائي Fسمي على اسم الإحصائي الإنجليزي العظيم ر. فيشر (1890-1962)، الذي استخدمه بنشاط في أعماله.

يتم استخدام توزيع فيشر عند اختبار الفرضيات حول مدى كفاية النموذج في تحليل الانحدار، ومساواة التباينات، وفي مشاكل الإحصاء التطبيقية الأخرى.

جدول القيم الحرجة للطالب.

بداية النموذج

عدد درجات الحرية، و قيمة اختبار t للطالب عند p = 0.05
12.706
4.303
3.182
2.776
2.571
2.447
2.365
2.306
2.262
2.228
2.201
2.179
2.160
2.145
2.131
2.120
2.110
2.101
2.093
2.086
2.080
2.074
2.069
2.064
2.060
2.056
2.052
2.048
2.045
2.042
2.040
2.037
2.035
2.032
2.030
2.028
2.026
2.024
40-41 2.021
42-43 2.018
44-45 2.015
46-47 2.013
48-49 2.011
50-51 2.009
52-53 2.007
54-55 2.005
56-57 2.003
58-59 2.002
60-61 2.000
62-63 1.999
64-65 1.998
66-67 1.997
68-69 1.995
70-71 1.994
72-73 1.993
74-75 1.993
76-77 1.992
78-79 1.991
80-89 1.990
90-99 1.987
100-119 1.984
120-139 1.980
140-159 1.977
160-179 1.975
180-199 1.973
1.972
1.960

جدول توزيع الطلاب

تُستخدم جداول التكامل الاحتمالي للعينات الكبيرة من عدد لا نهائي من السكان. ولكن بالفعل في (ن)< 100 получается Несоответствие между

البيانات الجدولية والحد من الاحتمال؛ في (ن)< 30 погрешность становится значительной. Несоответствие вызывается главным образом характером распределения единиц генеральной совокупности. При большом объеме выборки особенность распределения в гене-

لا يهم عموم السكان، لأن توزيع انحرافات مؤشر العينة عن الخاصية العامة في عينة كبيرة يكون دائمًا طبيعيًا.

الاسم. في عينات صغيرة (ن)< 30 характер распределения генеральной совокупности сказывается на распределении ошибок выборки. Поэтому для расчета ошибки выборки при небольшом объеме наблюдения (уже менее 100 единиц) отбор должен проводиться из со-

السكان ذوي التوزيع الطبيعي. تم تطوير نظرية العينات الصغيرة من قبل الإحصائي الإنجليزي دبليو جوسيت (الذي كتب تحت اسم مستعار الطالب) في بداية القرن العشرين. في

وفي عام 1908، أنشأ توزيعًا خاصًا يسمح، حتى مع العينات الصغيرة، بالربط بين (t) واحتمال الثقة F(t). بالنسبة لـ (n) > 100، تعطي جداول توزيع الطلاب نفس النتائج التي تعطيها جداول التكامل الاحتمالي لابلاس للعدد 30< (n ) <

100 اختلافات لا تذكر. لذلك، تشمل العينات الصغيرة عمليا عينات بحجم أقل من 30 وحدة (بالطبع، تعتبر العينة التي يزيد حجمها عن 100 وحدة كبيرة).

ويعود استخدام العينات الصغيرة في بعض الحالات إلى طبيعة السكان الذين يتم مسحهم. وبالتالي، في أعمال التربية، من الأسهل تحقيق الخبرة "الخالصة" بعدد صغير

المؤامرات. يتم أيضًا تنفيذ التجربة الإنتاجية والاقتصادية المتعلقة بالتكاليف الاقتصادية على عدد صغير من التجارب. وكما ذكرنا سابقًا، في حالة العينة الصغيرة، لا يمكن حساب كل من احتمالات الثقة وحدود الثقة للمتوسط ​​العام إلا لمجموعة سكانية موزعة بشكل طبيعي.

يتم وصف الكثافة الاحتمالية لتوزيع الطلاب بواسطة الوظيفة.

1 + ت2

و (ر ، ن) := مليار

ن - 1

تي - المتغير الحالي ن - حجم العينة؛

B هي الكمية التي تعتمد فقط على (n).

يحتوي توزيع الطالب على معلمة واحدة فقط: (d.f.) - عدد درجات الحرية (يشار إليها أحيانًا بـ (k)). وهذا التوزيع، مثل التوزيع الطبيعي، متماثل حول النقطة (t) = 0، لكنه أكثر استواءً. مع زيادة حجم العينة، وبالتالي عدد درجات الحرية، يقترب توزيع الطلاب بسرعة من الوضع الطبيعي. عدد درجات الحرية يساوي عدد قيم الميزات الفردية التي يجب توزيعها

تفترض لتحديد الخاصية المطلوبة. وبالتالي، لحساب التباين، يجب معرفة القيمة المتوسطة. لذلك، عند حساب التباين، استخدم (d.f.) = n - 1.

يتم نشر جداول توزيع الطلاب في نسختين:

1. وعلى غرار جداول التكامل الاحتمالية، فإن القيم (ر) وما يقابلها

الاحتمالات الحالية F(t) لأعداد مختلفة من درجات الحرية؛

2. يتم إعطاء القيم (t) لاحتمالات الثقة الأكثر استخدامًا

0.70؛ 0.75؛ 0.80؛ 0.85؛ 0.90؛ 0.95 و 0.99 أو 1 - 0.70 = 0.3؛ 1 - 0.80 = 0.2؛ …… 1 - 0.99 = 0.01.

3. بأعداد مختلفة من درجات الحرية. ويرد هذا النوع من الجدول في الملحق

(جدول 1 – 20) وكذلك قيمة (t) – اختبار الطالب عند مستوى دلالة 0.7