قيمة التباين. التباين والانحراف المعياري

من بين العديد من المؤشرات المستخدمة في الإحصاء، من الضروري تسليط الضوء على حساب التباين. تجدر الإشارة إلى أن إجراء هذا الحساب يدويًا يعد مهمة شاقة إلى حد ما. ولحسن الحظ، يحتوي برنامج Excel على وظائف تسمح لك بأتمتة إجراء الحساب. دعنا نتعرف على الخوارزمية الخاصة بالعمل مع هذه الأدوات.

التشتت هو مؤشر للتباين، وهو متوسط ​​مربع الانحرافات عن التوقع الرياضي. وبالتالي فهو يعبر عن انتشار الأرقام حول القيمة المتوسطة. يمكن إجراء حساب التباين لكل من عامة السكان والعينة.

الطريقة الأولى: الحساب على أساس عدد السكان

لحساب هذا المؤشر في Excel لعامة السكان، استخدم الدالة ديسب.ز. بناء جملة هذا التعبير كما يلي:

DISP.G(Number1;Number2;...)

في المجمل، يمكن استخدام من 1 إلى 255 وسيطة. يمكن أن تكون الوسائط إما قيمًا رقمية أو مراجع للخلايا الموجودة فيها.

دعونا نرى كيفية حساب هذه القيمة لنطاق يحتوي على بيانات رقمية.


الطريقة الثانية: الحساب حسب العينة

على عكس حساب القيمة على أساس عدد السكان، عند حساب العينة، لا يشير المقام إلى العدد الإجمالي للأرقام، بل يشير إلى رقم واحد أقل. ويتم ذلك لغرض تصحيح الخطأ. يأخذ Excel هذا الفارق الدقيق في الاعتبار في وظيفة خاصة مصممة لهذا النوع من الحسابات - DISP.V. يتم تمثيل بناء الجملة الخاص به بالصيغة التالية:

DISP.B(Number1;Number2;...)

يمكن أيضًا أن يتراوح عدد الوسائط، كما في الوظيفة السابقة، من 1 إلى 255.


كما ترون، يمكن لبرنامج Excel تسهيل حساب التباين إلى حد كبير. ويمكن حساب هذه الإحصائية عن طريق التطبيق، سواء من المجتمع أو من العينة. في هذه الحالة، تتلخص جميع إجراءات المستخدم في تحديد نطاق الأرقام المراد معالجتها، ويقوم برنامج Excel بالعمل الرئيسي بنفسه. وبطبيعة الحال، سيوفر هذا قدرا كبيرا من وقت المستخدم.

التشتت في الإحصاءتم العثور عليه كقيم فردية للخاصية المربعة من . اعتمادا على البيانات الأولية، يتم تحديده باستخدام صيغ التباين البسيطة والمرجحة:

1. (للبيانات غير المجمعة) يتم حسابها باستخدام الصيغة:

2. التباين المرجح (لسلسلة التباين):

حيث n هو التردد (تكرار العامل X)

مثال على إيجاد التباين

تصف هذه الصفحة مثالًا قياسيًا لإيجاد التباين، ويمكنك أيضًا الاطلاع على المشكلات الأخرى للعثور عليه

مثال 1. البيانات التالية متاحة لمجموعة مكونة من 20 طالبًا بالمراسلة. من الضروري بناء سلسلة فاصلة لتوزيع الخاصية وحساب متوسط ​​قيمة الخاصية ودراسة تشتتها

دعونا نبني تجميع الفاصل الزمني. دعونا نحدد نطاق الفاصل الزمني باستخدام الصيغة:

حيث X max هي القيمة القصوى لخاصية التجميع؛
X دقيقة - الحد الأدنى لقيمة خاصية التجميع؛
ن – عدد الفواصل الزمنية:

نحن نقبل ن = 5. الخطوة هي: ح = (192 - 159)/ 5 = 6.6

لنقم بإنشاء تجميع بفواصل زمنية

لمزيد من الحسابات، سنقوم ببناء جدول مساعد:

X'i هو منتصف الفاصل الزمني. (على سبيل المثال، منتصف الفاصل الزمني 159 – 165.6 = 162.3)

نحدد متوسط ​​طول الطلاب باستخدام صيغة المتوسط ​​الحسابي المرجح:

دعونا نحدد التباين باستخدام الصيغة:

يمكن تحويل صيغة التشتت على النحو التالي:

من هذه الصيغة يتبع ذلك التباين يساوي الفرق بين متوسط ​​مربعات الخيارات والمربع والمتوسط.

التشتت في سلسلة الاختلافمع فترات متساوية باستخدام طريقة اللحظات يمكن حسابها بالطريقة التالية باستخدام خاصية التشتت الثانية (تقسيم جميع الخيارات على قيمة الفاصل الزمني). تحديد التباين، يتم حسابها باستخدام طريقة اللحظات، باستخدام الصيغة التالية أقل شاقة:

حيث i هي قيمة الفاصل الزمني؛
A هو صفر تقليدي، وهو مناسب لاستخدام منتصف الفاصل الزمني بأعلى تردد؛
m1 هو مربع لحظة الترتيب الأول؛
م2 - لحظة الدرجة الثانية

(إذا كانت هناك تغيرات مميزة في مجتمع إحصائي بحيث لا يوجد سوى خيارين متبادلين فقط، فإن هذا التباين يسمى البديل) يمكن حسابه باستخدام الصيغة:

بالتعويض q = 1- p في صيغة التشتت هذه، نحصل على:

أنواع التباين

التباين الكلييقيس تباين الخاصية بين جميع السكان ككل تحت تأثير جميع العوامل التي تسبب هذا التباين. وهو يساوي متوسط ​​مربع انحرافات القيم الفردية للخاصية x عن القيمة المتوسطة الإجمالية لـ x ويمكن تعريفه على أنه تباين بسيط أو تباين مرجح.

يميز الاختلاف العشوائي، أي. جزء من التباين الناتج عن تأثير عوامل غير محسوبة ولا يعتمد على سمة العامل التي تشكل أساس المجموعة. مثل هذا التشتت يساوي متوسط ​​مربع انحرافات القيم الفردية للسمة داخل المجموعة X عن الوسط الحسابي للمجموعة ويمكن حسابه على أنه تشتت بسيط أو تشتت مرجح.

هكذا، مقاييس التباين داخل المجموعةتباين السمة داخل المجموعة ويتم تحديده بواسطة الصيغة:

حيث xi هو متوسط ​​المجموعة؛
ni هو عدد الوحدات في المجموعة.

على سبيل المثال، تظهر التباينات داخل المجموعة التي يجب تحديدها في مهمة دراسة تأثير مؤهلات العمال على مستوى إنتاجية العمل في ورشة العمل اختلافات في الإنتاج في كل مجموعة ناجمة عن جميع العوامل المحتملة (الحالة الفنية للمعدات، وتوافر المعدات). الأدوات والمواد، عمر العمال، كثافة اليد العاملة، وما إلى ذلك.)، باستثناء الاختلافات في فئة المؤهلات (داخل المجموعة، جميع العمال لديهم نفس المؤهلات).

ويعكس متوسط ​​التباينات داخل المجموعة العشوائية، أي ذلك الجزء من التباين الذي حدث تحت تأثير جميع العوامل الأخرى، باستثناء عامل التجميع. ويتم حسابها باستخدام الصيغة:

يميز الاختلاف المنهجي للخاصية الناتجة، والذي يرجع إلى تأثير علامة العامل التي تشكل أساس المجموعة. وهو يساوي مربع متوسط ​​انحرافات متوسطات المجموعة عن المتوسط ​​العام. يتم حساب التباين بين المجموعات باستخدام الصيغة:

قاعدة إضافة التباين في الإحصائيات

وفق قاعدة إضافة الفروقإجمالي التباين يساوي مجموع متوسط ​​التباينات داخل المجموعة وبين المجموعة:

معنى هذه القاعدةهو أن التباين الكلي الذي ينشأ تحت تأثير جميع العوامل يساوي مجموع التباينات التي تنشأ تحت تأثير جميع العوامل الأخرى والتباين الذي ينشأ بسبب عامل التجميع.

باستخدام صيغة إضافة التباينات، يمكنك تحديد التباين الثالث غير المعروف من تباينين ​​معروفين، وكذلك الحكم على قوة تأثير خاصية التجميع.

خصائص التشتت

1. إذا تم تقليل (زيادة) جميع قيم الخاصية بنفس المقدار الثابت، فلن يتغير التشتت.
2. إذا تم تقليل (زيادة) جميع قيم الخاصية بنفس عدد المرات n، فإن التباين سينخفض ​​(يزيد) في المقابل بمقدار n ^ 2 مرة.

يتم تعريف التشتت في الإحصاء على أنه الانحراف المعياري للقيم الفردية للخاصية المربعة من الوسط الحسابي. طريقة شائعة لحساب الانحرافات التربيعية للخيارات عن المتوسط ​​ثم حساب متوسطها.

في التحليل الإحصائي الاقتصادي، من المعتاد تقييم تباين إحدى الخصائص في أغلب الأحيان باستخدام الانحراف المعياري؛ وهو الجذر التربيعي للتباين.

(3)

يميز التقلب المطلق للقيم ذات الخصائص المتغيرة ويتم التعبير عنه بنفس وحدات القياس مثل الخيارات. في الإحصائيات، غالبًا ما تكون هناك حاجة لمقارنة تنوع الخصائص المختلفة. ولإجراء مثل هذه المقارنات، يتم استخدام مقياس نسبي للتباين، وهو معامل التباين.

خصائص التشتت:

1) إذا قمت بطرح أي رقم من جميع الخيارات، فلن يتغير التباين؛

2) إذا تم قسمة جميع قيم الخيار على أي رقم b، فإن التباين سينخفض ​​بمقدار b^2 مرة، أي.

3) إذا حسبت متوسط ​​مربع الانحرافات عن أي رقم بوسط حسابي غير متساوي فسيكون أكبر من التباين. وفي الوقت نفسه، بقيمة محددة جيدًا لكل مربع من الفرق بين القيمة المتوسطة ج.

يمكن تعريف التشتت على أنه الفرق بين المتوسط ​​التربيعي والمتوسط ​​التربيعي.

17. الاختلافات بين المجموعات والمجموعات. قاعدة إضافة التباين

إذا تم تقسيم مجتمع إحصائي إلى مجموعات أو أجزاء وفقًا للخاصية التي تتم دراستها، فيمكن حساب أنواع التشتت التالية لمثل هذا المجتمع: مجموعة (خاصة)، متوسط ​​المجموعة (خاصة)، وبين المجموعات.

التباين الكلي- يعكس تباين الخاصية بسبب جميع الظروف والأسباب التي تعمل في مجموعة إحصائية معينة.

تباين المجموعة- يساوي متوسط ​​مربع انحرافات القيم الفردية لخاصية معينة ضمن مجموعة عن الوسط الحسابي لهذه المجموعة، ويسمى وسط المجموعة. ومع ذلك، فإن متوسط ​​المجموعة لا يتطابق مع المتوسط ​​العام لجميع السكان.

يعكس تباين المجموعة تباين السمة فقط بسبب الظروف والأسباب التي تعمل داخل المجموعة.

متوسط ​​تباينات المجموعة- يتم تعريفه على أنه الوسط الحسابي المرجح لتباينات المجموعة، حيث تمثل الأوزان أحجام المجموعة.

التباين بين المجموعات- يساوي متوسط ​​مربع انحرافات متوسطات المجموعة عن المتوسط ​​العام.

يميز التشتت بين المجموعات تباين الخاصية الناتجة بسبب خاصية التجميع.

هناك علاقة معينة بين أنواع التشتت التي تم النظر فيها: التشتت الإجمالي يساوي مجموع المجموعة المتوسطة والتشتت بين المجموعات.

وتسمى هذه العلاقة بقاعدة إضافة التباين.

18. السلسلة الديناميكية ومكوناتها. أنواع السلاسل الزمنية.

صف في الإحصائيات- هذه بيانات رقمية توضح تغير الظاهرة في الزمان أو المكان وتجعل من الممكن إجراء مقارنة إحصائية للظواهر سواء في عملية تطورها في الزمن أو في أشكال وأنواع العمليات المختلفة. بفضل هذا، من الممكن اكتشاف الاعتماد المتبادل للظواهر.

في الإحصاء، عادة ما تسمى عملية تطور حركة الظواهر الاجتماعية مع مرور الوقت بالديناميكيات. لعرض الديناميكيات، يتم إنشاء سلسلة الديناميكيات (الزمنية، الزمنية)، وهي عبارة عن سلسلة من القيم المتغيرة بمرور الوقت لمؤشر إحصائي (على سبيل المثال، عدد الأشخاص المدانين على مدى 10 سنوات)، مرتبة حسب الترتيب الزمني. العناصر المكونة لها هي القيم الرقمية لمؤشر معين والفترات أو النقاط الزمنية التي تتعلق بها.

أهم ما يميز السلسلة الديناميكية- حجمها (حجمها وحجمها) لظاهرة معينة تحققت في فترة معينة أو في لحظة معينة. وعليه فإن حجم حدود السلسلة الديناميكية هو مستواها. يميزالمستويات الأولية والمتوسطة والنهائية للسلسلة الديناميكية. مستوى اوليُظهر قيمة الأول والنهائي - قيمة الحد الأخير من السلسلة. مستوى متوسطيمثل متوسط ​​نطاق التباين الزمني ويتم حسابه اعتمادًا على ما إذا كانت السلسلة الديناميكية فاصلة أم مؤقتة.

سمة أخرى مهمة للسلسلة الديناميكية- الزمن المنقضي من الملاحظة الأولية إلى الملاحظة النهائية، أو عدد هذه الملاحظات.

هناك أنواع مختلفة من السلاسل الزمنية، ويمكن تصنيفها وفقا للمعايير التالية.

1) اعتمادًا على طريقة التعبير عن المستويات، يتم تقسيم سلسلة الديناميكيات إلى سلسلة من المؤشرات المطلقة والمشتقة (القيم النسبية والمتوسطة).

2) اعتمادًا على كيفية تعبير مستويات السلسلة عن حالة الظاهرة في نقاط زمنية معينة (في بداية الشهر، الربع، السنة، إلخ) أو قيمتها خلال فترات زمنية معينة (على سبيل المثال، في اليوم الواحد، الشهر والسنة وما إلى ذلك) وما إلى ذلك)، التمييز بين سلسلة ديناميكيات اللحظة والفاصل الزمني، على التوالي. نادرًا ما يتم استخدام سلسلة اللحظات في العمل التحليلي لوكالات إنفاذ القانون.

في النظرية الإحصائية، يتم تمييز الديناميكيات وفقًا لعدد من معايير التصنيف الأخرى: اعتمادًا على المسافة بين المستويات - مع مستويات متساوية ومستويات غير متساوية في الوقت المناسب؛ اعتمادًا على وجود الاتجاه الرئيسي للعملية قيد الدراسة - الثابت وغير الثابت. عند تحليل السلاسل الزمنية يتم اتباع ما يلي: يتم عرض مستويات السلسلة على شكل مكونات:

ص ر = تب + ه (ر)

حيث TP هو مكون حتمي يحدد الاتجاه العام للتغيير مع مرور الوقت أو الاتجاه.

E (t) هو مكون عشوائي يسبب تقلبات في المستويات.

تصف هذه الصفحة مثالًا قياسيًا لإيجاد التباين، ويمكنك أيضًا الاطلاع على المشكلات الأخرى للعثور عليه

مثال 1. تحديد المجموعة ومتوسط ​​المجموعة والتباين الكلي والمجموع

مثال 2. إيجاد التباين ومعامل التباين في جدول التجميع

مثال 3. إيجاد التباين في سلسلة منفصلة

مثال 4. البيانات التالية متاحة لمجموعة مكونة من 20 طالبًا بالمراسلة. من الضروري بناء سلسلة فاصلة لتوزيع الخاصية وحساب متوسط ​​قيمة الخاصية ودراسة تشتتها

دعونا نبني تجميع الفاصل الزمني. دعونا نحدد نطاق الفاصل الزمني باستخدام الصيغة:

حيث X max هي القيمة القصوى لخاصية التجميع؛
X دقيقة - الحد الأدنى لقيمة خاصية التجميع؛
ن – عدد الفواصل الزمنية:

نحن نقبل ن = 5. الخطوة هي: ح = (192 - 159)/ 5 = 6.6

لنقم بإنشاء تجميع بفواصل زمنية

لمزيد من الحسابات، سنقوم ببناء جدول مساعد:

X"i – منتصف الفاصل الزمني. (على سبيل المثال، منتصف الفاصل الزمني 159 – 165.6 = 162.3)

نحدد متوسط ​​طول الطلاب باستخدام صيغة المتوسط ​​الحسابي المرجح:

دعونا نحدد التباين باستخدام الصيغة:

يمكن تحويل الصيغة على النحو التالي:

من هذه الصيغة يتبع ذلك التباين يساوي الفرق بين متوسط ​​مربعات الخيارات والمربع والمتوسط.

التشتت في سلسلة الاختلافمع فترات متساوية باستخدام طريقة اللحظات يمكن حسابها بالطريقة التالية باستخدام خاصية التشتت الثانية (تقسيم جميع الخيارات على قيمة الفاصل الزمني). تحديد التباين، يتم حسابها باستخدام طريقة اللحظات، باستخدام الصيغة التالية أقل شاقة:

حيث i هي قيمة الفاصل الزمني؛
A هو صفر تقليدي، وهو مناسب لاستخدام منتصف الفاصل الزمني بأعلى تردد؛
m1 هو مربع لحظة الترتيب الأول؛
م2 - لحظة الدرجة الثانية

تباين السمات البديلة (إذا كانت هناك تغيرات مميزة في مجتمع إحصائي بحيث لا يوجد سوى خيارين متبادلين فقط، فإن هذا التباين يسمى البديل) يمكن حسابه باستخدام الصيغة:

بالتعويض q = 1- p في صيغة التشتت هذه، نحصل على:

أنواع التباين

التباين الكلييقيس تباين الخاصية بين جميع السكان ككل تحت تأثير جميع العوامل التي تسبب هذا التباين. وهو يساوي متوسط ​​مربع انحرافات القيم الفردية للخاصية x عن القيمة المتوسطة الإجمالية لـ x ويمكن تعريفه على أنه تباين بسيط أو تباين مرجح.

التباين داخل المجموعة يميز الاختلاف العشوائي، أي. جزء من التباين الناتج عن تأثير عوامل غير محسوبة ولا يعتمد على سمة العامل التي تشكل أساس المجموعة. مثل هذا التشتت يساوي متوسط ​​مربع انحرافات القيم الفردية للسمة داخل المجموعة X عن الوسط الحسابي للمجموعة ويمكن حسابه على أنه تشتت بسيط أو تشتت مرجح.



هكذا، مقاييس التباين داخل المجموعةتباين السمة داخل المجموعة ويتم تحديده بواسطة الصيغة:

حيث xi هو متوسط ​​المجموعة؛
ni هو عدد الوحدات في المجموعة.

على سبيل المثال، تظهر التباينات داخل المجموعة التي يجب تحديدها في مهمة دراسة تأثير مؤهلات العمال على مستوى إنتاجية العمل في ورشة العمل اختلافات في الإنتاج في كل مجموعة ناجمة عن جميع العوامل المحتملة (الحالة الفنية للمعدات، وتوافر المعدات). الأدوات والمواد، عمر العمال، كثافة اليد العاملة، وما إلى ذلك.)، باستثناء الاختلافات في فئة المؤهلات (داخل المجموعة، جميع العمال لديهم نفس المؤهلات).

التباين هو مقياس للتشتت يصف الانحراف المقارن بين قيم البيانات والمتوسط. وهو مقياس التشتت الأكثر استخدامًا في الإحصائيات، ويتم حسابه عن طريق جمع وتربيع انحراف كل قيمة بيانات عن المتوسط. صيغة حساب التباين موضحة أدناه:

ق 2 - تباين العينة؛

x av - متوسط ​​العينة؛

نحجم العينة (عدد قيم البيانات)،

(x i - x avg) هو الانحراف عن متوسط ​​القيمة لكل قيمة في مجموعة البيانات.

لفهم الصيغة بشكل أفضل، دعونا نلقي نظرة على مثال. أنا لا أحب الطبخ حقًا، لذلك نادرًا ما أفعله. ومع ذلك، لكي لا أتضور جوعا، من وقت لآخر، يجب أن أذهب إلى الموقد لتنفيذ خطة تشبع الجسم بالبروتينات والدهون والكربوهيدرات. توضح مجموعة البيانات أدناه عدد المرات التي تقوم فيها رينات بالطهي كل شهر:

الخطوة الأولى في حساب التباين هي تحديد متوسط ​​العينة، وهو في مثالنا 7.8 مرة شهريًا. ويمكن إجراء بقية الحسابات بشكل أسهل باستخدام الجدول التالي.

تبدو المرحلة النهائية لحساب التباين كما يلي:

بالنسبة لأولئك الذين يحبون إجراء جميع الحسابات دفعة واحدة، ستبدو المعادلة كما يلي:

استخدام طريقة العد الخام (مثال للطبخ)

هناك طريقة أكثر فعالية لحساب التباين، تعرف باسم طريقة العد الأولي. على الرغم من أن المعادلة قد تبدو مرهقة للغاية للوهلة الأولى، إلا أنها في الواقع ليست مخيفة إلى هذا الحد. يمكنك التأكد من ذلك، ومن ثم تحديد الطريقة التي تفضلها.

هو مجموع كل قيمة بيانات بعد التربيع،

هو مربع مجموع كل قيم البيانات.

لا تفقد عقلك الآن. لنضع كل هذا في جدول وسترى أن هناك حسابات أقل هنا مما كانت عليه في المثال السابق.

وكما ترون، كانت النتيجة هي نفسها عند استخدام الطريقة السابقة. تصبح مزايا هذه الطريقة واضحة مع زيادة حجم العينة (n).

حساب التباين في Excel

كما خمنت على الأرجح، يحتوي برنامج Excel على صيغة تسمح لك بحساب التباين. علاوة على ذلك، بدءًا من Excel 2010، يمكنك العثور على 4 أنواع من صيغ التباين:

1) VARIANCE.V - يُرجع تباين العينة. يتم تجاهل القيم المنطقية والنص.

2) DISP.G - إرجاع تباين المحتوى. يتم تجاهل القيم المنطقية والنص.

3) التباين - يُرجع تباين العينة، مع مراعاة القيم المنطقية والنصية.

4) التباين - إرجاع تباين المحتوى، مع مراعاة القيم المنطقية والنصية.

أولا، دعونا نفهم الفرق بين العينة والمجتمع. الغرض من الإحصائيات الوصفية هو تلخيص البيانات أو عرضها بحيث تحصل بسرعة على الصورة الكبيرة، أو نظرة عامة إذا جاز التعبير. يسمح لك الاستدلال الإحصائي بإجراء استنتاجات حول السكان بناءً على عينة من البيانات من هذا السكان. يمثل السكان جميع النتائج أو القياسات المحتملة التي تهمنا. العينة هي مجموعة فرعية من السكان.

على سبيل المثال، نحن مهتمون بمجموعة من الطلاب من إحدى الجامعات الروسية ونحتاج إلى تحديد متوسط ​​درجات المجموعة. يمكننا حساب متوسط ​​​​أداء الطلاب، ومن ثم سيكون الرقم الناتج معلمة، حيث سيشارك جميع السكان في حساباتنا. ومع ذلك، إذا أردنا حساب المعدل التراكمي لجميع الطلاب في بلدنا، فستكون هذه المجموعة هي عينتنا.

الفرق في صيغة حساب التباين بين العينة والمجتمع هو المقام. حيث بالنسبة للعينة ستكون مساوية (n-1)، وبالنسبة لعموم السكان فقط n.

الآن دعونا نلقي نظرة على وظائف حساب التباين مع النهايات أ،ينص الوصف على أن القيم النصية والمنطقية تؤخذ بعين الاعتبار في الحساب. في هذه الحالة، عند حساب تباين مجموعة بيانات معينة حيث تحدث قيم غير رقمية، سيقوم Excel بتفسير القيم النصية والقيم المنطقية الخاطئة على أنها تساوي 0، والقيم المنطقية الحقيقية تساوي 1.

لذا، إذا كان لديك مصفوفة بيانات، فلن يكون حساب تباينها أمرًا صعبًا باستخدام إحدى وظائف Excel المذكورة أعلاه.