التباين المرجح. تباين المتغير العشوائي المنفصل

تشتتمتغير عشوائي- قياس انتشار معين متغير عشوائي، هذا هو لها الانحرافاتمن التوقعات الرياضية. في الإحصاء، غالبًا ما يُستخدم الترميز (مربع سيجما) للدلالة على التشتت. يسمى الجذر التربيعي للتباين الذي يساوي الانحراف المعياريأو انتشار قياسي. ويقاس الانحراف المعياري بنفس وحدات المتغير العشوائي نفسه، ويقاس التباين بمربعات تلك الوحدة.

على الرغم من أنه من الملائم جدًا استخدام قيمة واحدة فقط (مثل المتوسط ​​أو المنوال والوسيط) لتقدير العينة بأكملها، إلا أن هذا النهج يمكن أن يؤدي بسهولة إلى استنتاجات غير صحيحة. والسبب في هذا الموقف لا يكمن في القيمة نفسها، ولكن في حقيقة أن قيمة واحدة لا تعكس بأي حال من الأحوال انتشار قيم البيانات.

على سبيل المثال، في العينة:

متوسط ​​القيمة هو 5.

ومع ذلك، في العينة نفسها لا يوجد عنصر واحد بقيمة 5. وقد تحتاج إلى معرفة درجة قرب كل عنصر في العينة من قيمته المتوسطة. أو بمعنى آخر، سوف تحتاج إلى معرفة تباين القيم. بمعرفة درجة التغيير في البيانات، يمكنك تفسيرها بشكل أفضل متوسط ​​القيمة, الوسيطو موضة. يتم تحديد درجة تغير قيم العينة من خلال حساب تباينها وانحرافها المعياري.



التباين والجذر التربيعي للتباين، المسمى الانحراف المعياري، يميز متوسط ​​الانحراف عن متوسط ​​العينة. ومن بين هاتين الكميتين، الأهم الانحراف المعياري. ويمكن اعتبار هذه القيمة بمثابة متوسط ​​المسافة التي تكون فيها العناصر من العنصر الأوسط للعينة.

من الصعب تفسير التباين بشكل هادف. ومع ذلك، فإن الجذر التربيعي لهذه القيمة هو الانحراف المعياري ويمكن تفسيره بسهولة.

يتم حساب الانحراف المعياري عن طريق تحديد التباين أولاً ثم أخذ الجذر التربيعي للتباين.

على سبيل المثال، بالنسبة لمصفوفة البيانات الموضحة في الشكل، سيتم الحصول على القيم التالية:

الصورة 1

هنا متوسط ​​قيمة الفروق التربيعية هو 717.43. للحصول على الانحراف المعياري، كل ما تبقى هو أخذ الجذر التربيعي لهذا الرقم.

وستكون النتيجة حوالي 26.78.

تذكر أنه يتم تفسير الانحراف المعياري على أنه متوسط ​​المسافة التي تفصلها العناصر عن متوسط ​​العينة.

يقيس الانحراف المعياري مدى جودة وصف المتوسط ​​للعينة بأكملها.

لنفترض أنك رئيس قسم إنتاج تجميع أجهزة الكمبيوتر. ويشير التقرير ربع السنوي إلى أن الإنتاج في الربع الأخير بلغ 2500 جهاز كمبيوتر. هل هذا جيد أم سيء؟ لقد طلبت (أو يوجد هذا العمود بالفعل في التقرير) لعرض الانحراف المعياري لهذه البيانات في التقرير. رقم الانحراف المعياري، على سبيل المثال، هو 2000. يصبح من الواضح لك، كرئيس القسم، أن خط الإنتاج يتطلب إدارة أفضل (انحرافات كبيرة جدًا في عدد أجهزة الكمبيوتر المجمعة).

تذكر أنه عندما يكون الانحراف المعياري كبيرًا، فإن البيانات متناثرة على نطاق واسع حول المتوسط، وعندما يكون الانحراف المعياري صغيرًا، فإنها تتجمع بالقرب من المتوسط.

تم تصميم الوظائف الإحصائية الأربع VAR() وVAR() وSTDEV() وSTDEV() لحساب التباين والانحراف المعياري للأرقام في نطاق من الخلايا. قبل أن تتمكن من حساب التباين والانحراف المعياري لمجموعة من البيانات، تحتاج إلى تحديد ما إذا كانت البيانات تمثل مجتمعًا أم عينة من المجتمع. في حالة العينة من عامة السكان، يجب عليك استخدام الدالتين VAR() وSTDEV()، وفي حالة العامة، الدالتين VAR() وSTDEV():

سكان وظيفة

ديسبر ()

ستاندوتلونب()
عينة

ديسب ()

ستدف ()

يشير التشتت (وكذلك الانحراف المعياري)، كما لاحظنا، إلى مدى تشتت القيم المضمنة في مجموعة البيانات حول الوسط الحسابي.

تشير قيمة التباين أو الانحراف المعياري الصغيرة إلى أن جميع البيانات تتركز حول الوسط الحسابي، وتشير القيمة الكبيرة لهذه القيم إلى أن البيانات متناثرة على نطاق واسع من القيم.

من الصعب جدًا تفسير التشتت بشكل مفيد (ماذا تعني القيمة الصغيرة، القيمة الكبيرة؟). أداء المهام 3سيسمح لك بإظهار معنى التباين لمجموعة بيانات بشكل مرئي على الرسم البياني.

مهام

· التمرين 1.

· 2.1. إعطاء المفاهيم: التشتت والانحراف المعياري؛ تعيينهم الرمزي لمعالجة البيانات الإحصائية.

· 2.2. أكمل ورقة العمل وفقًا للشكل 1 وقم بإجراء الحسابات اللازمة.

· 2.3. إعطاء الصيغ الأساسية المستخدمة في العمليات الحسابية

· 2.4. شرح جميع التسميات (،،)

· 2.5. شرح المعنى العملي لمفهومي التشتت والانحراف المعياري.

المهمة 2.

1.1. إعطاء المفاهيم: عامة السكان والعينة؛ التوقع الرياضي ومتوسطه الحسابي الرمزي لمعالجة البيانات الإحصائية.

1.2. وفقا للشكل 2، قم بإعداد ورقة عمل وإجراء الحسابات.

1.3. توفير الصيغ الأساسية المستخدمة في الحسابات (لعموم السكان والعينة).

الشكل 2

1.4. اشرح سبب إمكانية الحصول على قيم المتوسط ​​الحسابي في عينات مثل 46.43 و48.78 (انظر ملحق الملف). استخلاص النتائج.

المهمة 3.

توجد عينتان بمجموعتين مختلفتين من البيانات، ولكن المتوسط ​​بالنسبة لهما سيكون هو نفسه:

الشكل 3

3.1. أكمل ورقة العمل وفقًا للشكل 3 وقم بإجراء الحسابات اللازمة.

3.2. إعطاء الصيغ الحسابية الأساسية.

3.3. إنشاء الرسوم البيانية وفقا للأرقام 4، 5.

3.4. شرح التبعيات التي تم الحصول عليها.

3.5. إجراء حسابات مماثلة لبيانات عينتين.

العينة الأصلية 11119999

تحديد قيم العينة الثانية بحيث يكون الوسط الحسابي للعينة الثانية هو نفسه، على سبيل المثال:

حدد قيم العينة الثانية بنفسك. رتّب الحسابات والرسوم البيانية المشابهة للأشكال 3 و4 و5. وأظهر الصيغ الأساسية التي تم استخدامها في الحسابات.

استخلاص الاستنتاجات المناسبة.

قم بإعداد جميع المهام في شكل تقرير يحتوي على جميع الصور والرسوم البيانية والصيغ والشروحات الموجزة اللازمة.

ملحوظة: يجب شرح بناء الرسوم البيانية بالرسومات والشروحات المختصرة.

تباين المتغير العشوائي هو مقياس لانتشار قيم هذا المتغير. التباين المنخفض يعني أن القيم متجمعة بالقرب من بعضها البعض. يشير التشتت الكبير إلى انتشار قوي للقيم. يستخدم مفهوم التباين للمتغير العشوائي في الإحصاء. على سبيل المثال، إذا قمت بمقارنة التباين بين قيمتين (مثل بين المرضى الذكور والإناث)، فيمكنك اختبار أهمية المتغير. يتم استخدام التباين أيضًا عند إنشاء نماذج إحصائية، نظرًا لأن التباين المنخفض يمكن أن يكون علامة على أنك تقوم بتجاوز القيم.

خطوات

حساب تباين العينة

  1. سجل قيم العينة.في معظم الحالات، لا يتمكن الإحصائيون من الوصول إلا إلى عينات من مجموعات سكانية محددة. على سبيل المثال، كقاعدة عامة، لا يقوم الإحصائيون بتحليل تكلفة الحفاظ على إجمالي جميع السيارات في روسيا - فهم يقومون بتحليل عينة عشوائية من عدة آلاف من السيارات. ستساعد هذه العينة في تحديد متوسط ​​\u200b\u200bتكلفة السيارة، ولكن على الأرجح، ستكون القيمة الناتجة بعيدة عن القيمة الحقيقية.

    • على سبيل المثال، دعونا نحلل عدد الكعك الذي تم بيعه في مقهى على مدار 6 أيام، بترتيب عشوائي. تبدو العينة كما يلي: 17، 15، 23، 7، 9، 13. هذه عينة وليست مجموعة سكانية، لأنه ليس لدينا بيانات عن الكعك المباع لكل يوم يكون فيه المقهى مفتوحًا.
    • إذا تم إعطاؤك مجتمعًا بدلاً من عينة من القيم، فانتقل إلى القسم التالي.
  2. اكتب صيغة لحساب تباين العينة.التشتت هو مقياس لانتشار قيم كمية معينة. كلما اقتربت قيمة التباين من الصفر، كلما اقتربت القيم من تجميعها معًا. عند العمل مع عينة من القيم، استخدم الصيغة التالية لحساب التباين:

    • ق 2 (\displaystyle s^(2)) = ∑[(س ط (\displaystyle x_(i))-x̅) 2 (\displaystyle ^(2))] / (ن - 1)
    • ق 2 (\displaystyle s^(2))- هذا هو التشتت. يتم قياس التشتت بالوحدات المربعة.
    • س ط (\displaystyle x_(i))- كل قيمة في العينة.
    • س ط (\displaystyle x_(i))تحتاج إلى طرح x̅، وتربيعها، ثم إضافة النتائج.
    • x̅ – متوسط ​​العينة (متوسط ​​العينة).
    • ن – عدد القيم في العينة.
  3. حساب متوسط ​​العينة.ويشار إليه بـ x̅. يتم حساب متوسط ​​العينة كوسيلة حسابية بسيطة: قم بجمع كافة القيم الموجودة في العينة، ثم قسمة النتيجة على عدد القيم الموجودة في العينة.

    • في مثالنا، أضف القيم الموجودة في العينة: 15 + 17 + 23 + 7 + 9 + 13 = 84
      الآن قم بتقسيم النتيجة على عدد القيم في العينة (في مثالنا هناك 6): 84 ÷ 6 = 14.
      متوسط ​​العينة x̅ = 14.
    • متوسط ​​العينة هو القيمة المركزية التي تتوزع حولها القيم في العينة. إذا كانت القيم الموجودة في مجموعة العينة حول متوسط ​​العينة، فإن التباين صغير؛ وإلا فإن التباين كبير.
  4. اطرح متوسط ​​العينة من كل قيمة في العينة.الآن احسب الفرق س ط (\displaystyle x_(i))- س̅، أين س ط (\displaystyle x_(i))- كل قيمة في العينة. تشير كل نتيجة يتم الحصول عليها إلى درجة انحراف قيمة معينة عن متوسط ​​العينة، أي مدى بعد هذه القيمة عن متوسط ​​العينة.

    • في مثالنا:
      × 1 (\displaystyle x_(1))- س = 17 - 14 = 3
      × 2 (\displaystyle x_(2))- س̅ = 15 - 14 = 1
      × 3 (\displaystyle x_(3))- س = 23 - 14 = 9
      × 4 (\displaystyle x_(4))- س̅ = 7 - 14 = -7
      × 5 (\displaystyle x_(5))- س̅ = 9 - 14 = -5
      × 6 (\displaystyle x_(6))- س̅ = 13 - 14 = -1
    • من السهل التحقق من صحة النتائج التي تم الحصول عليها، حيث يجب أن يكون مجموعها يساوي الصفر. ويرتبط ذلك بتعريف المتوسط، حيث أن القيم السالبة (المسافات من المتوسط ​​إلى القيم الأصغر) تقابلها تماما القيم الموجبة (المسافات من المتوسط ​​إلى القيم الأكبر).
  5. كما ذكر أعلاه، مجموع الاختلافات س ط (\displaystyle x_(i))- x̅ يجب أن تساوي الصفر. وهذا يعني أن متوسط ​​التباين يكون دائمًا صفرًا، وهو ما لا يعطي أي فكرة عن انتشار قيم كمية معينة. لحل هذه المشكلة، قم بتربيع كل اختلاف س ط (\displaystyle x_(i))- س̅. سيؤدي هذا إلى حصولك على أرقام موجبة فقط، والتي لن يصل مجموعها إلى 0 أبدًا.

    • في مثالنا:
      (× 1 (\displaystyle x_(1))-x̅) 2 = 3 2 = 9 (\displaystyle ^(2)=3^(2)=9)
      (x 2 (\displaystyle (x_(2))-x̅) 2 = 1 2 = 1 (\displaystyle ^(2)=1^(2)=1)
      9 2 = 81
      (-7) 2 = 49
      (-5) 2 = 25
      (-1) 2 = 1
    • لقد وجدت مربع الفرق - x̅) 2 (\displaystyle ^(2))لكل قيمة في العينة
  6. احسب مجموع مربعات الاختلافات.بمعنى، ابحث عن ذلك الجزء من الصيغة المكتوب بهذا الشكل: ∑[( س ط (\displaystyle x_(i))-x̅) 2 (\displaystyle ^(2))]. هنا الإشارة Σ تعني مجموع الفروق المربعة لكل قيمة س ط (\displaystyle x_(i))في العينة. لقد وجدت بالفعل الاختلافات التربيعية (س ط (\displaystyle (x_(i))-x̅) 2 (\displaystyle ^(2))لكل قيمة س ط (\displaystyle x_(i))في العينة؛ الآن فقط أضف هذه المربعات.

    • في مثالنا: 9 + 1 + 81 + 49 + 25 + 1 = 166 .
  7. اقسم النتيجة على n - 1، حيث n هو عدد القيم في العينة.منذ بعض الوقت، لحساب تباين العينة، قام الإحصائيون ببساطة بتقسيم النتيجة على n؛ في هذه الحالة سوف تحصل على متوسط ​​التباين التربيعي، وهو مثالي لوصف التباين في عينة معينة. لكن تذكر أن أي عينة لا تمثل سوى جزء صغير من مجموعة القيم. إذا أخذت عينة أخرى وأجريت نفس الحسابات، فسوف تحصل على نتيجة مختلفة. كما اتضح، فإن القسمة على n - 1 (بدلاً من n فقط) تعطي تقديرًا أكثر دقة لتباين السكان، وهو ما يهمك. أصبح القسمة على n – 1 أمرًا شائعًا، لذا تم تضمينه في صيغة حساب تباين العينة.

    • في مثالنا، تتضمن العينة 6 قيم، أي n = 6.
      تباين العينة = ث 2 = 166 6 − 1 = (\displaystyle s^(2)=(\frac (166)(6-1))=) 33,2
  8. الفرق بين التباين والانحراف المعياري.لاحظ أن الصيغة تحتوي على أس، لذلك يتم قياس التشتت بوحدات مربعة من القيمة التي يتم تحليلها. في بعض الأحيان يكون من الصعب جدًا تشغيل مثل هذا الحجم؛ في مثل هذه الحالات، استخدم الانحراف المعياري، الذي يساوي الجذر التربيعي للتباين. ولهذا السبب يشار إلى تباين العينة على أنه ق 2 (\displaystyle s^(2))، والانحراف المعياري للعينة كما هو س (\displaystyle s).

    • في مثالنا، الانحراف المعياري للعينة هو: s = √33.2 = 5.76.

    حساب التباين السكاني

    1. تحليل مجموعة من القيم.تتضمن المجموعة جميع قيم الكمية قيد النظر. على سبيل المثال، إذا كنت تدرس عمر سكان منطقة لينينغراد، فإن المجموع يشمل عمر جميع سكان هذه المنطقة. عند العمل مع السكان، يوصى بإنشاء جدول وإدخال القيم السكانية فيه. خذ بعين الاعتبار المثال التالي:

      • يوجد في غرفة معينة 6 أحواض سمك. يحتوي كل حوض أسماك على العدد التالي من الأسماك:
        × 1 = 5 (\displaystyle x_(1)=5)
        × 2 = 5 (\displaystyle x_(2)=5)
        × 3 = 8 (\displaystyle x_(3)=8)
        × 4 = 12 (\displaystyle x_(4)=12)
        × 5 = 15 (\displaystyle x_(5)=15)
        × 6 = 18 (\displaystyle x_(6)=18)
    2. اكتب صيغة لحساب التباين السكاني.وبما أن السكان يشمل جميع قيم كمية معينة، فإن الصيغة أدناه تسمح لك بالحصول على القيمة الدقيقة لتباين السكان. لتمييز التباين السكاني عن تباين العينة (وهو مجرد تقدير)، يستخدم الإحصائيون متغيرات مختلفة:

      • σ 2 (\displaystyle ^(2)) = (∑(س ط (\displaystyle x_(i)) - μ) 2 (\displaystyle ^(2)))/ن
      • σ 2 (\displaystyle ^(2))- التشتت السكاني (اقرأ باسم "مربع سيجما"). يتم قياس التشتت بالوحدات المربعة.
      • س ط (\displaystyle x_(i))- كل قيمة في مجملها.
      • Σ – علامة المجموع. أي من كل قيمة س ط (\displaystyle x_(i))تحتاج إلى طرح μ وتربيعها ثم إضافة النتائج.
      • μ - متوسط ​​عدد السكان.
      • ن – عدد القيم في السكان.
    3. احسب متوسط ​​عدد السكان.عند العمل مع مجتمع ما، يُشار إلى متوسطه بـ μ (mu). يتم حساب المتوسط ​​السكاني كوسيلة حسابية بسيطة: قم بجمع جميع القيم في المجتمع، ثم قسمة النتيجة على عدد القيم في المجتمع.

      • ضع في اعتبارك أن المتوسطات لا يتم حسابها دائمًا على أنها المتوسط ​​الحسابي.
      • في مثالنا، يعني عدد السكان: μ = 5 + 5 + 8 + 12 + 15 + 18 6 (\displaystyle (\frac (5+5+8+12+15+18)(6))) = 10,5
    4. اطرح متوسط ​​عدد السكان من كل قيمة في عدد السكان.كلما اقتربت قيمة الفرق من الصفر، كلما اقتربت القيمة المحددة من متوسط ​​المجتمع. أوجد الفرق بين كل قيمة في المجتمع ووسطها، وستحصل على فكرة أولية عن توزيع القيم.

      • في مثالنا:
        × 1 (\displaystyle x_(1))- μ = 5 - 10.5 = -5.5
        × 2 (\displaystyle x_(2))- μ = 5 - 10.5 = -5.5
        × 3 (\displaystyle x_(3))- μ = 8 - 10.5 = -2.5
        × 4 (\displaystyle x_(4))- μ = 12 - 10.5 = 1.5
        × 5 (\displaystyle x_(5))- μ = 15 - 10.5 = 4.5
        × 6 (\displaystyle x_(6))- μ = 18 - 10.5 = 7.5
    5. مربع كل نتيجة تم الحصول عليها.ستكون قيم الفرق إيجابية وسلبية؛ إذا تم رسم هذه القيم على خط الأعداد، فسوف تقع على يمين ويسار متوسط ​​المجتمع. هذا ليس جيدًا لحساب التباين لأن الأرقام الموجبة والسالبة تلغي بعضها البعض. لذا، قم بتربيع كل فرق للحصول على أرقام موجبة حصريًا.

      • في مثالنا:
        (س ط (\displaystyle x_(i)) - μ) 2 (\displaystyle ^(2))لكل قيمة سكانية (من i = 1 إلى i = 6):
        (-5,5)2 (\displaystyle ^(2)) = 30,25
        (-5,5)2 (\displaystyle ^(2))، أين س ن (\displaystyle x_(n))- القيمة الأخيرة في عدد السكان.
      • لحساب القيمة المتوسطة للنتائج التي تم الحصول عليها، تحتاج إلى إيجاد مجموعها وتقسيمه على n :(( × 1 (\displaystyle x_(1)) - μ) 2 (\displaystyle ^(2)) + (× 2 (\displaystyle x_(2)) - μ) 2 (\displaystyle ^(2)) + ... + (س ن (\displaystyle x_(n)) - μ) 2 (\displaystyle ^(2)))/ن
      • الآن لنكتب الشرح أعلاه باستخدام المتغيرات: (∑( س ط (\displaystyle x_(i)) - μ) 2 (\displaystyle ^(2))) / n واحصل على صيغة لحساب التباين السكاني.

التباين هو مقياس للتشتت يصف الانحراف المقارن بين قيم البيانات والمتوسط. وهو مقياس التشتت الأكثر استخدامًا في الإحصائيات، ويتم حسابه عن طريق جمع وتربيع انحراف كل قيمة بيانات عن المتوسط. صيغة حساب التباين موضحة أدناه:

ق 2 - تباين العينة؛

x av - متوسط ​​العينة؛

نحجم العينة (عدد قيم البيانات)،

(x i - x avg) هو الانحراف عن متوسط ​​القيمة لكل قيمة في مجموعة البيانات.

لفهم الصيغة بشكل أفضل، دعونا نلقي نظرة على مثال. أنا لا أحب الطبخ حقًا، لذلك نادرًا ما أفعله. ومع ذلك، لكي لا أتضور جوعا، من وقت لآخر، يجب أن أذهب إلى الموقد لتنفيذ خطة تشبع الجسم بالبروتينات والدهون والكربوهيدرات. توضح مجموعة البيانات أدناه عدد المرات التي تقوم فيها رينات بالطهي كل شهر:

الخطوة الأولى في حساب التباين هي تحديد متوسط ​​العينة، وهو في مثالنا 7.8 مرة شهريًا. ويمكن إجراء بقية الحسابات بشكل أسهل باستخدام الجدول التالي.

تبدو المرحلة النهائية لحساب التباين كما يلي:

بالنسبة لأولئك الذين يحبون إجراء جميع الحسابات دفعة واحدة، ستبدو المعادلة كما يلي:

استخدام طريقة العد الخام (مثال للطبخ)

هناك طريقة أكثر فعالية لحساب التباين، تعرف باسم طريقة العد الأولي. على الرغم من أن المعادلة قد تبدو مرهقة للغاية للوهلة الأولى، إلا أنها في الواقع ليست مخيفة إلى هذا الحد. يمكنك التأكد من ذلك، ومن ثم تحديد الطريقة التي تفضلها.

هو مجموع كل قيمة بيانات بعد التربيع،

هو مربع مجموع كل قيم البيانات.

لا تفقد عقلك الآن. لنضع كل هذا في جدول وسترى أن هناك حسابات أقل هنا مما كانت عليه في المثال السابق.

وكما ترون، كانت النتيجة هي نفسها عند استخدام الطريقة السابقة. تصبح مزايا هذه الطريقة واضحة مع زيادة حجم العينة (n).

حساب التباين في Excel

كما خمنت على الأرجح، يحتوي برنامج Excel على صيغة تسمح لك بحساب التباين. علاوة على ذلك، بدءًا من Excel 2010، يمكنك العثور على 4 أنواع من صيغ التباين:

1) VARIANCE.V - يُرجع تباين العينة. يتم تجاهل القيم المنطقية والنص.

2) DISP.G - إرجاع تباين المحتوى. يتم تجاهل القيم المنطقية والنص.

3) التباين - يُرجع تباين العينة، مع مراعاة القيم المنطقية والنصية.

4) التباين - إرجاع تباين المحتوى، مع مراعاة القيم المنطقية والنصية.

أولا، دعونا نفهم الفرق بين العينة والمجتمع. الغرض من الإحصائيات الوصفية هو تلخيص البيانات أو عرضها بحيث تحصل بسرعة على الصورة الكبيرة، أو نظرة عامة إذا جاز التعبير. يسمح لك الاستدلال الإحصائي بإجراء استنتاجات حول السكان بناءً على عينة من البيانات من هذا السكان. يمثل السكان جميع النتائج أو القياسات المحتملة التي تهمنا. العينة هي مجموعة فرعية من السكان.

على سبيل المثال، نحن مهتمون بمجموعة من الطلاب من إحدى الجامعات الروسية ونحتاج إلى تحديد متوسط ​​درجات المجموعة. يمكننا حساب متوسط ​​​​أداء الطلاب، ومن ثم سيكون الرقم الناتج معلمة، حيث سيشارك جميع السكان في حساباتنا. ومع ذلك، إذا أردنا حساب المعدل التراكمي لجميع الطلاب في بلدنا، فستكون هذه المجموعة هي عينتنا.

الفرق في صيغة حساب التباين بين العينة والمجتمع هو المقام. حيث بالنسبة للعينة ستكون مساوية (n-1)، وبالنسبة لعموم السكان فقط n.

الآن دعونا نلقي نظرة على وظائف حساب التباين مع النهايات أ،ينص الوصف على أن القيم النصية والمنطقية تؤخذ بعين الاعتبار في الحساب. في هذه الحالة، عند حساب تباين مجموعة بيانات معينة حيث تحدث قيم غير رقمية، سيقوم Excel بتفسير القيم النصية والقيم المنطقية الخاطئة على أنها تساوي 0، والقيم المنطقية الحقيقية تساوي 1.

لذا، إذا كان لديك مصفوفة بيانات، فلن يكون حساب تباينها أمرًا صعبًا باستخدام إحدى وظائف Excel المذكورة أعلاه.

في كثير من الأحيان في الإحصائيات، عند تحليل ظاهرة أو عملية ما، من الضروري أن تأخذ في الاعتبار ليس فقط المعلومات المتعلقة بالمستويات المتوسطة للمؤشرات التي تتم دراستها، ولكن أيضًا مبعثر أو اختلاف في قيم الوحدات الفردية ، وهي سمة مهمة للسكان الذين تتم دراستهم.

والأكثر عرضة للتغير هي أسعار الأسهم، والعرض والطلب، وأسعار الفائدة على مدى فترات زمنية مختلفة وفي أماكن مختلفة.

المؤشرات الرئيسية التي تميز الاختلاف هي المدى والتشتت والانحراف المعياري ومعامل الاختلاف.

نطاق الاختلاف يمثل الفرق بين القيم القصوى والدنيا للخاصية: R = Xmax - Xmin. عيب هذا المؤشر هو أنه يقيم فقط حدود تباين السمة ولا يعكس تباينها ضمن هذه الحدود.

تشتت يفتقر إلى هذا النقص. يتم حسابه على أنه متوسط ​​مربع انحرافات القيم المميزة عن متوسط ​​قيمتها:

طريقة مبسطة لحساب التباين يتم تنفيذها باستخدام الصيغ التالية (البسيطة والمرجحة):

يتم عرض أمثلة لتطبيق هذه الصيغ في المهمتين 1 و 2.

المؤشر المستخدم على نطاق واسع في الممارسة هو الانحراف المعياري :

يعرف الانحراف المعياري بأنه الجذر التربيعي للتباين وله نفس بعد الخاصية محل الدراسة.

تتيح لنا المؤشرات المدروسة الحصول على القيمة المطلقة للتغير، أي. تقييمها بوحدات قياس الخاصية محل الدراسة. على عكسهم، معامل الاختلاف يقيس التباين من الناحية النسبية - نسبة إلى المستوى المتوسط، وهو ما يكون مفضلاً في كثير من الحالات.

صيغة لحساب معامل الاختلاف.

أمثلة على حل المشكلات حول موضوع "مؤشرات الاختلاف في الإحصاء"

المشكلة 1 . عند دراسة تأثير الإعلان على حجم متوسط ​​الودائع الشهرية في بنوك المنطقة، تم فحص بنكين. تم الحصول على النتائج التالية:

يُعرِّف:
1) لكل بنك: أ) متوسط ​​الإيداع شهريًا؛ ب) تشتت المساهمة؛
2) متوسط ​​الإيداع الشهري لبنكين معًا؛
3) فرق الودائع لبنكين، اعتمادًا على الإعلان؛
4) تباين الودائع لبنكين، اعتمادًا على جميع العوامل باستثناء الإعلان؛
5) التباين الكلي باستخدام قاعدة الجمع.
6) معامل التحديد.
7) علاقة الارتباط.

حل

1) لنقم بإنشاء جدول حسابي لبنك به إعلانات . لتحديد متوسط ​​الإيداع الشهري، سنجد نقاط المنتصف للفترات. في هذه الحالة، يتم مساواة قيمة الفاصل الزمني المفتوح (الأول) بشكل مشروط بقيمة الفاصل الزمني المجاور له (الثاني).

سنجد متوسط ​​حجم الودائع باستخدام صيغة المتوسط ​​الحسابي المرجح:

29000/50 = 580 فرك.

نجد تباين المساهمة باستخدام الصيغة:

23 400/50 = 468

سنقوم بتنفيذ إجراءات مماثلة للبنك دون الإعلان :

2) دعونا نجد متوسط ​​حجم الودائع للبنكين معًا. Хсп =(580×50+542.8×50)/100 = 561.4 فرك.

3) سنوجد تباين الوديعة لبنكين، اعتماداً على الإعلان، باستخدام الصيغة: σ 2 =pq (صيغة تباين صفة بديلة). حيث p=0.5 هي نسبة العوامل التي تعتمد على الإعلان؛ ف=1-0.5، ثم σ 2 =0.5*0.5=0.25.

4) بما أن حصة العوامل الأخرى هي 0.5، فإن تباين الوديعة لبنكين، اعتمادًا على جميع العوامل باستثناء الإعلان، هو أيضًا 0.25.

5) تحديد التباين الكلي باستخدام قاعدة الجمع.

= (468*50+636,16*50)/100=552,08

= [(580-561,4)250+(542,8-561,4)250] / 100= 34 596/ 100=345,96

σ 2 = σ 2 حقيقة + σ 2 بقية = 552.08+345.96 = 898.04

6) معامل التحديد η 2 = σ 2 حقيقة / σ 2 = 345.96/898.04 = 0.39 = 39% - حجم المساهمة يعتمد على الإعلان بنسبة 39%.

7) نسبة الارتباط التجريبية η = √η 2 = √0.39 = 0.62 - العلاقة قريبة جدًا.

المشكلة 2 . هناك مجموعة من المؤسسات حسب حجم المنتجات القابلة للتسويق:

تحديد: 1) تشتت قيمة المنتجات القابلة للتسويق. 2) الانحراف المعياري. 3) معامل الاختلاف.

حل

1) حسب الشرط، يتم عرض سلسلة التوزيع الفاصلة. يجب التعبير عنه بشكل منفصل، أي إيجاد منتصف الفاصل الزمني (x"). في مجموعات ذات فترات مغلقة، نجد الوسط باستخدام وسط حسابي بسيط. في المجموعات ذات الحد الأعلى - كالفرق بين هذا الحد الأعلى ونصف حجم الفاصل الزمني التالي (200-(400-200):2=100).

في مجموعات ذات حد أدنى - مجموع هذا الحد الأدنى ونصف حجم الفاصل الزمني السابق (800+(800-600):2=900).

نقوم بحساب متوسط ​​قيمة المنتجات القابلة للتسويق باستخدام الصيغة:

Хср = k×((Σ((x"-a):k)×f):Σf)+a. هنا a=500 هو حجم الخيار عند أعلى تردد، k=600-400=200 هو حجم الخيار حجم الفاصل الزمني عند أعلى تردد لنضع النتيجة في الجدول:

لذا فإن متوسط ​​قيمة الإنتاج التجاري خلال الفترة قيد الدراسة يساوي بشكل عام Хсп = (-5:37)×200+500=472.97 ألف روبل.

2) نجد التباين باستخدام الصيغة التالية:

σ 2 = (33/37)*2002-(472.97-500)2 = 35,675.67-730.62 = 34,945.05

3) الانحراف المعياري: σ = ±√σ 2 = ±√34945.05 ≈ ±186.94 ألف روبل.

4) معامل الاختلاف: V = (σ /Хсп)*100 = (186.94 / 472.97)*100 = 39.52%

إلا أن هذه الخاصية وحدها لا تكفي لدراسة المتغير العشوائي. دعونا نتخيل اثنين من الرماة يطلقون النار على الهدف. أحدهما يطلق النار بدقة ويضرب بالقرب من المنتصف، بينما الآخر... يستمتع فقط ولا يصوب حتى. لكن المضحك هو أنه متوسطوستكون النتيجة بالضبط نفس مطلق النار الأول! يتم توضيح هذا الموقف بشكل تقليدي من خلال المتغيرات العشوائية التالية:

أما التوقع الرياضي "القناص" فهو يساوي "الشخص المثير للاهتمام": - فهو أيضًا صفر!

وبالتالي، هناك حاجة لتحديد مدى ذلك مبعثرالرصاص (قيم متغيرة عشوائية) نسبة إلى مركز الهدف (التوقع الرياضي). حسنا و نثرالمترجمة من اللاتينية ليست طريقة أخرى غير تشتت .

دعونا نرى كيف يتم تحديد هذه الخاصية العددية باستخدام أحد الأمثلة من الجزء الأول من الدرس:

هناك وجدنا توقعًا رياضيًا مخيبًا للآمال لهذه اللعبة، والآن علينا حساب تباينها، والذي يُشار إليه بـخلال .

دعنا نتعرف على مدى "تشتت" المكاسب/الخسائر بالنسبة إلى القيمة المتوسطة. من الواضح أننا بحاجة إلى الحساب لهذا الغرض اختلافاتبين قيم متغيرة عشوائيةوهي توقع رياضي:

–5 – (–0,5) = –4,5
2,5 – (–0,5) = 3
10 – (–0,5) = 10,5

الآن يبدو أنك بحاجة إلى تلخيص النتائج، لكن هذه الطريقة ليست مناسبة - لأن التقلبات إلى اليسار سوف تلغي بعضها البعض مع التقلبات إلى اليمين. لذلك، على سبيل المثال، مطلق النار "الهواة". (المثال أعلاه)الاختلافات ستكون ، وعند إضافتها سيعطون صفرًا، لذلك لن نحصل على أي تقدير لمدى تشتت إطلاق النار.

للتغلب على هذه المشكلة يمكنك التفكير وحداتالاختلافات، ولكن لأسباب فنية ترسخ هذا النهج عندما تم تربيعها. من الأنسب صياغة الحل في جدول:

وهنا يطرح الحساب متوسط ​​الوزنقيمة الانحرافات التربيعية. ما هذا؟ إنها ملكهم القيمة المتوقعة، وهو مقياس للتشتت:

تعريفالفروق. من التعريف يتضح ذلك على الفور لا يمكن أن يكون التباين سلبيا- خذ ملاحظة للممارسة!

دعونا نتذكر كيفية العثور على القيمة المتوقعة. اضرب الفروق المربعة في الاحتمالات المقابلة (مواصلة الجدول):
- بالمعنى المجازي، هذه هي "قوة الجر"،
وتلخيص النتائج:

ألا تعتقد أنه بالمقارنة مع المكاسب، تبين أن النتيجة كبيرة جدًا؟ هذا صحيح - لقد قمنا بتربيعها، وللعودة إلى أبعاد لعبتنا، نحتاج إلى استخراج الجذر التربيعي. تسمى هذه الكمية الانحراف المعياري ويرمز له بالحرف اليوناني "سيجما":

تسمى هذه القيمة أحيانًا الانحراف المعياري .

ما هو معناها؟ فإذا انحرفنا عن التوقع الرياضي إلى اليسار واليمين بالانحراف المعياري:

- عندها سيتم "تركيز" القيم الأكثر احتمالا للمتغير العشوائي في هذه الفترة. ما نلاحظه في الواقع:

ومع ذلك، يحدث أنه عند تحليل التشتت، يتم العمل دائمًا تقريبًا بمفهوم التشتت. دعونا معرفة ما يعنيه فيما يتعلق بالألعاب. إذا كنا نتحدث في حالة الأسهم عن "دقة" الضربات نسبة إلى مركز الهدف، فإن التشتت هنا يتميز بأمرين:

أولاً، من الواضح أنه مع زيادة الرهانات، يزداد التشتت أيضاً. لذلك، على سبيل المثال، إذا زدنا بمقدار 10 مرات، فإن التوقع الرياضي سيزيد بمقدار 10 مرات، وسيزيد التباين بمقدار 100 مرة (لأن هذه كمية تربيعية). لكن لاحظ أن قواعد اللعبة نفسها لم تتغير! فقط المعدلات تغيرت، تقريبًا، قبل أن نراهن بـ 10 روبل، أصبح الآن 100.

النقطة الثانية الأكثر إثارة للاهتمام هي أن التباين يميز أسلوب اللعب. أصلح رهانات اللعبة عقليًا عند مستوى معين، ودعنا نرى ما هو:

لعبة التباين المنخفض هي لعبة حذرة. يميل اللاعب إلى اختيار المخططات الأكثر موثوقية، حيث لا يخسر/يربح الكثير في وقت واحد. على سبيل المثال، نظام الأحمر/الأسود في لعبة الروليت (انظر المثال 4 من المقال المتغيرات العشوائية) .

لعبة التباين العالي. غالبا ما يتم استدعاؤها مشتتلعبة. هذا هو أسلوب اللعب المغامر أو العدواني، حيث يختار اللاعب مخططات "الأدرينالين". دعونا نتذكر على الأقل "مارتينجال"حيث تكون المبالغ على المحك أكبر من اللعبة "الهادئة" في النقطة السابقة.

الوضع في لعبة البوكر يدل: هناك ما يسمى ضيقاللاعبون الذين يميلون إلى توخي الحذر و"المرتعشين" بشأن أموال الألعاب الخاصة بهم (تمويل). وليس من المستغرب أن لا يتقلب تمويلهم بشكل كبير (تباين منخفض). على العكس من ذلك، إذا كان اللاعب لديه تباين كبير، فهو معتدٍ. غالبًا ما يخاطر ويراهن بمراهنات كبيرة ويمكنه إما كسر بنك ضخم أو خسارة قطع صغيرة.

نفس الشيء يحدث في الفوركس، وهكذا - هناك الكثير من الأمثلة.

علاوة على ذلك، في جميع الأحوال، لا يهم ما إذا كانت اللعبة تُلعب مقابل أجر ضئيل أو آلاف الدولارات. كل مستوى له لاعبين منخفضين وعاليين التشتت. حسنًا، كما نتذكر، متوسط ​​الفوز “مسؤول” القيمة المتوقعة.

ربما لاحظت أن العثور على التباين هو عملية طويلة ومضنية. لكن الرياضيات سخية:

صيغة لإيجاد التباين

هذه الصيغة مشتقة مباشرة من تعريف التباين، وقمنا بوضعها موضع الاستخدام على الفور. سأقوم بنسخ العلامة مع لعبتنا أعلاه:

والتوقع الرياضي الموجود.

دعونا نحسب التباين بالطريقة الثانية. أولاً، دعونا نوجد التوقع الرياضي - مربع المتغير العشوائي. بواسطة تحديد التوقع الرياضي:

في هذه الحالة:

وهكذا، وفقا للصيغة:

كما يقولون، اشعر بالفرق. ومن الناحية العملية، بالطبع، من الأفضل استخدام الصيغة (ما لم يتطلب الشرط خلاف ذلك).

نتقن تقنية الحل والتصميم:

مثال 6

أوجد التوقع الرياضي والتباين والانحراف المعياري.

تم العثور على هذه المهمة في كل مكان، وكقاعدة عامة، لا معنى لها.
يمكنك أن تتخيل عدة مصابيح كهربائية بأرقام تضيء في مستشفى المجانين مع احتمالات معينة :)

حل: من الملائم تلخيص الحسابات الأساسية في جدول. أولاً، نكتب البيانات الأولية في السطرين العلويين. ثم نقوم بحساب المنتجات، ثم وأخيرا المبالغ في العمود الأيمن:

في الواقع، كل شيء تقريبا جاهز. يوضح السطر الثالث توقعًا رياضيًا جاهزًا: .

نحسب التباين باستخدام الصيغة:

وأخيرا الانحراف المعياري:
- شخصيًا، عادةً ما أقوم بالتقريب إلى منزلتين عشريتين.

يمكن إجراء جميع العمليات الحسابية على الآلة الحاسبة، أو حتى الأفضل – في برنامج Excel:

من الصعب أن تخطئ هنا :)

إجابة:

أولئك الذين يرغبون يمكنهم تبسيط حياتهم بشكل أكبر والاستفادة من خدماتي آلة حاسبة (تجريبي)، والتي لن تحل هذه المشكلة على الفور فحسب، بل ستبنيها أيضًا الرسومات الموضوعية (سوف نصل إلى هناك قريبا). يمكن أن يكون البرنامج تحميل من المكتبة– إذا قمت بتنزيل مادة تعليمية واحدة على الأقل، أو تلقيتها طريق اخر. شكرا لدعم المشروع!

زوجان من المهام لحلها بنفسك:

مثال 7

احسب تباين المتغير العشوائي في المثال السابق حسب التعريف.

ومثال مشابه:

مثال 8

يتم تحديد المتغير العشوائي المنفصل بواسطة قانون التوزيع الخاص به:

نعم، يمكن أن تكون قيم المتغيرات العشوائية كبيرة جدًا (مثال من العمل الحقيقي)وهنا، إذا أمكن، استخدم Excel. كما، بالمناسبة، في المثال 7 - إنه أسرع وأكثر موثوقية وأكثر متعة.

الحلول والأجوبة في أسفل الصفحة.

في ختام الجزء الثاني من الدرس، سننظر إلى مشكلة نموذجية أخرى، يمكن للمرء أن يقول حتى لغزًا صغيرًا:

مثال 9

يمكن للمتغير العشوائي المنفصل أن يأخذ قيمتين فقط: و و. الاحتمال والتوقع الرياضي والتباين معروفان.

حل: لنبدأ باحتمال غير معروف. وبما أن المتغير العشوائي يمكن أن يأخذ قيمتين فقط، فإن مجموع احتمالات الأحداث المقابلة هو:

ومنذ ذلك الحين .

كل ما تبقى هو العثور عليه...، من السهل القول :) ولكن حسنًا، ها نحن ذا. حسب تعريف التوقع الرياضي:
– استبدال الكميات المعروفة :

– ولا يمكن استخلاص أي شيء من هذه المعادلة، باستثناء أنه يمكنك إعادة كتابتها في الاتجاه المعتاد:

أو:

أعتقد أنه يمكنك تخمين الخطوات التالية. دعونا نؤلف ونحل النظام:

الكسور العشرية هي، بطبيعة الحال، وصمة عار كاملة؛ اضرب المعادلتين في 10:

ونقسم على 2 :

هذا أفضل. من المعادلة الأولى نعبر عن:
(هذه هي الطريقة الأسهل)– نعوض في المعادلة الثانية :


نحن نبني تربيعوقم بالتبسيط:

اضرب بـ:

وكانت النتيجة معادلة من الدرجة الثانية، نجد تمييزها:
- عظيم!

ونحصل على حلين:

1) إذا ، الذي - التي ;

2) إذا ، الذي - التي .

يتم استيفاء الشرط بواسطة الزوج الأول من القيم. مع احتمال كبير أن يكون كل شيء صحيحًا، ولكن مع ذلك، دعنا نكتب قانون التوزيع:

وإجراء فحص، أي العثور على التوقع: