سلسلة التوزيع الإحصائي. لنقم ببناء سلسلة توزيع إحصائية

التجميع- هذا هو تقسيم السكان إلى مجموعات متجانسة حسب بعض الخصائص.

الغرض من الخدمة. باستخدام الآلة الحاسبة على الإنترنت يمكنك:

  • بناء سلسلة الاختلاف، قم ببناء رسم بياني ومضلع؛
  • العثور على مؤشرات التباين (المتوسط، والوضع (بما في ذلك بيانيا)، والوسيط، ونطاق التباين، والرباعيات، والعشريات، ومعامل التمايز الربعي، ومعامل التباين ومؤشرات أخرى)؛

تعليمات. لتجميع سلسلة، يجب عليك تحديد نوع سلسلة التباين التي تم الحصول عليها (منفصلة أو بفاصل زمني) والإشارة إلى كمية البيانات (عدد الصفوف). يتم حفظ الحل الناتج في ملف Word (انظر مثال تجميع البيانات الإحصائية).

عدد بيانات الإدخال
",0);">

إذا تم بالفعل تنفيذ التجميع و سلسلة الاختلاف المنفصلةأو سلسلة الفاصلة، فأنت بحاجة إلى استخدام الآلة الحاسبة عبر الإنترنت Variation Indices. اختبار الفرضية حول نوع التوزيعويتم ذلك باستخدام خدمة دراسة استمارة التوزيع.

أنواع المجموعات الإحصائية

سلسلة الاختلاف. وفي حالة رصد متغير عشوائي منفصل، يمكن مواجهة نفس القيمة عدة مرات. يتم تسجيل هذه القيم x i للمتغير العشوائي مما يشير إلى n i عدد مرات ظهوره في n الملاحظات، وهذا هو تكرار هذه القيمة.
في حالة وجود متغير عشوائي مستمر، يتم استخدام التجميع عمليا.
  1. التجميع النموذجي- هذا هو تقسيم السكان غير المتجانسين نوعياً قيد الدراسة إلى طبقات وأنواع اجتماعية واقتصادية ومجموعات متجانسة من الوحدات. لإنشاء هذا التجميع، استخدم معلمة سلسلة التباين المنفصلة.
  2. يسمى التجمع الهيكلي، حيث يتم تقسيم السكان المتجانسين إلى مجموعات تميز بنيتها وفقًا لبعض الخصائص المتباينة. لإنشاء هذا التجميع، استخدم معلمة سلسلة الفاصل الزمني.
  3. تسمى المجموعة التي تكشف العلاقات بين الظواهر التي تتم دراستها وخصائصها المجموعة التحليلية(انظر التجميع التحليلي للسلسلة).

مبادئ بناء المجموعات الإحصائية

تسمى سلسلة الملاحظات المرتبة بترتيب تصاعدي بسلسلة الاختلافات. ميزة التجميعهي الخاصية التي يتم من خلالها تقسيم السكان إلى مجموعات منفصلة. ويسمى أساس المجموعة. يمكن أن يعتمد التجميع على الخصائص الكمية والنوعية.
بعد تحديد أساس التجميع، ينبغي تحديد مسألة عدد المجموعات التي ينبغي تقسيم السكان قيد الدراسة إليها.

عند استخدام أجهزة الكمبيوتر الشخصية لمعالجة البيانات الإحصائية، يتم تجميع وحدات الكائنات باستخدام الإجراءات القياسية.
يعتمد أحد هذه الإجراءات على استخدام صيغة Sturgess لتحديد العدد الأمثل للمجموعات:

ك = 1+3.322*سجل(ن)

حيث k هو عدد المجموعات، N هو عدد الوحدات السكانية.

يتم حساب طول الفترات الجزئية كـ h=(x max -x min)/k

ثم يتم حساب عدد المشاهدات التي تقع ضمن هذه الفترات، والتي تؤخذ على أنها ترددات n i . ترددات قليلة وقيمتها أقل من 5 (ن ط< 5), следует объединить. в этом случае надо объединить и соответствующие интервалы.
يتم أخذ القيم الوسطى للفترات x i =(c i-1 +c i)/2 كقيم جديدة.

يتم تقديمها في شكل سلسلة توزيع ويتم تقديمها في النموذج.

سلسلة التوزيع هي أحد أنواع المجموعات.

نطاق التوزيع- يمثل توزيعًا منظمًا لوحدات السكان التي تتم دراستها إلى مجموعات وفقًا لخصائص مختلفة معينة.

اعتمادا على الخاصية الكامنة وراء تشكيل سلسلة التوزيع، يتم تمييزها المنسوبة والمتغيرةصفوف التوزيع:

  • عزوي- تسمى سلاسل التوزيع التي تم إنشاؤها وفقًا للخصائص النوعية.
  • تسمى سلاسل التوزيع المبنية بترتيب تصاعدي أو تنازلي لقيم الخاصية الكمية متغير.
تتكون سلسلة تباين التوزيع من عمودين:

يوفر العمود الأول القيم الكمية للخاصية المتغيرة، والتي تسمى خياراتويتم تعيينها. خيار منفصل - يتم التعبير عنه كعدد صحيح. يتراوح خيار الفاصل الزمني من وإلى. اعتمادًا على نوع الخيارات، يمكنك إنشاء سلسلة تباينات منفصلة أو بفاصل زمني.
ويحتوي العمود الثاني عدد الخيارات المحددة، معبراً عنها بالترددات أو الترددات:

الترددات- هذه هي الأرقام المطلقة التي توضح عدد المرات التي تحدث فيها قيمة معينة لميزة ما، والتي تشير إلى . يجب أن يكون مجموع جميع التكرارات مساوياً لعدد الوحدات في إجمالي عدد السكان.

الترددات() يتم التعبير عن التكرارات كنسبة مئوية من الإجمالي. يجب أن يكون مجموع جميع التكرارات المعبر عنها كنسب مئوية مساوياً لـ 100% في كسور الواحد.

التمثيل البياني لسلسلة التوزيع

يتم عرض سلسلة التوزيع بشكل مرئي باستخدام الصور الرسومية.

يتم تصوير سلسلة التوزيع على النحو التالي:
  • مضلع
  • الرسوم البيانية
  • يتراكم
  • الزيتون

مضلع

عند إنشاء مضلع، يتم رسم قيم الخاصية المتغيرة على المحور الأفقي (المحور السيني)، ويتم رسم الترددات أو الترددات على المحور الرأسي (المحور الصادي).

المضلع في الشكل 6.1 يعتمد على بيانات التعداد الجزئي لسكان روسيا في عام 1994.

6.1. توزيع حجم الأسرة

حالة: تتوفر بيانات عن توزيع 25 عاملاً بإحدى المنشآت حسب فئات التعرفة:
4; 2; 4; 6; 5; 6; 4; 1; 3; 1; 2; 5; 2; 6; 3; 1; 2; 3; 4; 5; 4; 6; 2; 3; 4
مهمة: إنشاء سلسلة تباينات منفصلة وتصويرها بيانياً كمضلع توزيع.
حل:
في هذا المثال، الخيارات هي درجة أجر الموظف. لتحديد الترددات، من الضروري حساب عدد الموظفين ذوي فئة التعريفة المقابلة.

يتم استخدام المضلع لسلسلة التباين المنفصلة.

لبناء مضلع التوزيع (الشكل 1)، نرسم القيم الكمية للخاصية المتغيرة - المتغيرات - على طول محور الإحداثي السيني (X)، والترددات أو الترددات على طول المحور الإحداثي.

إذا تم التعبير عن قيم الخاصية في شكل فواصل زمنية، فإن هذه السلسلة تسمى الفاصل الزمني.
سلسلة الفاصلةيتم تصوير التوزيعات بيانياً على شكل رسم بياني أو تراكمي أو ogive.

الجدول الإحصائي

حالة: يتم توفير بيانات عن حجم ودائع 20 فردا في بنك واحد (ألف روبل) 60؛ 25؛ 12؛ 10؛ 68؛ 35؛ 2؛ 17؛ 51؛ 9؛ 3؛ 130؛ 24؛ 85؛ 100؛ 152؛ 6؛ 18؛ 7؛ 42.
مهمة: أنشئ سلسلة تباين بفواصل زمنية متساوية.
حل:

  1. يتكون السكان الأولي من 20 وحدة (ن = 20).
  2. باستخدام صيغة Sturgess، نحدد العدد المطلوب من المجموعات المستخدمة: n=1+3.322*lg20=5
  3. لنحسب قيمة الفترة المتساوية: i=(152 - 2) /5 = 30 ألف روبل
  4. دعونا نقسم السكان الأوليين إلى 5 مجموعات بفاصل 30 ألف روبل.
  5. نعرض نتائج التجميع في الجدول:

مع مثل هذا التسجيل للخاصية المستمرة، عندما تحدث نفس القيمة مرتين (كالحد الأعلى لفاصل زمني واحد والحد الأدنى لفاصل زمني آخر)، فإن هذه القيمة تنتمي إلى المجموعة التي تعمل فيها هذه القيمة كحد أعلى.

شريط الرسم البياني

لإنشاء رسم بياني، تتم الإشارة إلى قيم حدود الفواصل الزمنية على طول محور الإحداثي السيني، وبناءً عليها، يتم إنشاء مستطيلات يتناسب ارتفاعها مع الترددات (أو الترددات).

في التين. 6.2. يُظهر رسمًا بيانيًا لتوزيع السكان الروس في عام 1997 حسب الفئة العمرية.

أرز. 6.2. توزيع السكان الروس حسب الفئات العمرية

حالة: يتم توزيع 30 موظف بالشركة على الراتب الشهري

مهمة: عرض سلسلة تباين الفاصل الزمني بيانياً على شكل رسم بياني وتراكمي.
حل:

  1. يتم تحديد الحدود غير المعروفة للفاصل الزمني المفتوح (الأول) بقيمة الفاصل الزمني الثاني: 7000 - 5000 = 2000 روبل. وبنفس القيمة نجد الحد الأدنى للفاصل الزمني الأول: 5000 - 2000 = 3000 روبل.
  2. لإنشاء رسم بياني في نظام إحداثي مستطيل، نرسم على طول محور الإحداثي السيني المقاطع التي تتوافق قيمها مع فترات سلسلة الدوالي.
    تعمل هذه الأجزاء كقاعدة سفلية، ويكون التردد المقابل (التردد) بمثابة ارتفاع المستطيلات المشكلة.
  3. دعونا نبني الرسم البياني:

لبناء التراكمات، من الضروري حساب الترددات المتراكمة (الترددات). يتم تحديدها من خلال الجمع التسلسلي للترددات (الترددات) للفترات السابقة ويتم تحديدها بـ S. توضح الترددات المتراكمة عدد وحدات السكان التي لها قيمة مميزة لا تزيد عن تلك قيد النظر.

يتراكم

يتم تصوير توزيع الخاصية في سلسلة التباين على الترددات المتراكمة (الترددات) باستخدام التراكم.

يتراكمأو يتم إنشاء منحنى تراكمي، على عكس المضلع، من الترددات أو الترددات المتراكمة. في هذه الحالة، يتم وضع قيم الخاصية على محور الإحداثي، ويتم وضع الترددات أو الترددات المتراكمة على المحور الإحداثي (الشكل 6.3).

أرز. 6.3. يتراكم توزيع حجم الأسرة

4. دعونا نحسب التكرارات المتراكمة:
يتم حساب التكرار التراكمي للفاصل الأول على النحو التالي: 0 + 4 = 4، للثاني: 4 + 12 = 16؛ والثالث: 4 + 12 + 8 = 24، إلخ.

عند إنشاء تراكم، يتم تعيين التردد (التردد) المتراكم للفاصل الزمني المقابل إلى الحد الأعلى:

أوجيفا

أوجيفاتم إنشاؤه بشكل مشابه للتراكم مع الاختلاف الوحيد وهو أن الترددات المتراكمة يتم وضعها على محور الإحداثي، ويتم وضع القيم المميزة على المحور الإحداثي.

أحد أنواع التراكمات هو منحنى التركيز أو مؤامرة لورنتز. لبناء منحنى التركيز، يتم رسم مقياس مقياس بالنسب المئوية من 0 إلى 100 على محوري نظام الإحداثيات المستطيل، وفي نفس الوقت يتم الإشارة إلى التكرارات المتراكمة على محور الإحداثيات، والقيم المتراكمة للحصة (في المئة) من حجم الخاصية يشار إليها على المحور الإحداثي.

يتوافق التوزيع الموحد للخاصية مع قطري المربع على الرسم البياني (الشكل 6.4). وفي حالة التوزيع غير المتساوي، يمثل الرسم البياني منحنى مقعرًا اعتمادًا على مستوى تركيز السمة.

6.4. منحنى التركيز

2. مفهوم سلسلة التوزيع سلسلة التوزيع المنفصلة والفاصلة

صفوف التوزيعتسمى تجمعات من نوع خاص يعرف فيها لكل صفة أو مجموعة خصائص أو صنف من الخصائص عدد الوحدات في المجموعة أو نسبة هذا العدد في المجموع. أولئك. سلسلة التوزيع- مجموعة مرتبة من قيم السمات، مرتبة ترتيبًا تصاعديًا أو تنازليًا مع أوزانها المقابلة. يمكن بناء سلسلة التوزيع إما عن طريق الخصائص الكمية أو السمات.

تسمى سلسلة التوزيع المبنية على أساس كمي بسلسلة التباين. هم منفصلة وفاصلة. يمكن إنشاء سلسلة التوزيع بناءً على خاصية متغيرة باستمرار (عندما يمكن للخاصية أن تأخذ أي قيم خلال أي فترة زمنية) وعلى خاصية متغيرة بشكل منفصل (تأخذ قيمًا صحيحة محددة بدقة).

منفصلةسلسلة التباين للتوزيع هي مجموعة مرتبة من الخيارات مع تردداتها أو تفاصيلها المقابلة. تعمل متغيرات السلسلة المنفصلة على تغيير قيم السمة بشكل منفصل ومستمر، وعادةً ما يكون ذلك نتيجة لعدد.

منفصلة

عادةً ما يتم إنشاء سلسلة التباين إذا كانت قيم الخاصية قيد الدراسة قد تختلف عن بعضها البعض بما لا يقل عن مقدار محدود معين. في سلسلة منفصلة، ​​يتم تحديد القيم النقطية للخاصية. مثال : توزيع البدلات الرجالية المباعة حسب المتاجر شهريا حسب الحجم.

فاصلة

سلسلة التباين عبارة عن مجموعة مرتبة من الفواصل الزمنية لقيم متغير عشوائي مع التكرارات المقابلة أو ترددات قيم المتغير التي تقع في كل منها. تم تصميم سلسلة الفواصل الزمنية لتحليل توزيع خاصية متغيرة باستمرار، والتي يتم تسجيل قيمتها في أغلب الأحيان عن طريق القياس أو الوزن. المتغيرات من هذه السلسلة هي التجمعات.

مثال : توزيع المشتريات في محل بقالة حسب المبلغ.

إذا كانت استجابة التردد في سلسلة التباين المنفصلة تتعلق مباشرة بمتغير من السلسلة، فإنها في سلسلة الفاصل تشير إلى مجموعة من المتغيرات.

من السهل تحليل سلسلة التوزيع باستخدام تمثيلها الرسومي، مما يسمح للمرء بالحكم على شكل التوزيع والأنماط. يتم تصوير سلسلة منفصلة على الرسم البياني كخط متقطع - مضلع التوزيع. ولبنائه، في نظام إحداثي مستطيل، يتم رسم القيم المرتبة (المرتبة) للخاصية المتغيرة على طول محور الإحداثيات على نفس المقياس، ويتم رسم مقياس للتعبير عن الترددات على طول المحور الإحداثي.

يتم تصوير سلسلة الفاصل الزمني على أنها الرسوم البيانية التوزيع(أي المخططات الشريطية).

عند إنشاء الرسم البياني، يتم رسم قيم الفواصل الزمنية على محور الإحداثي السيني، ويتم تصوير الترددات بواسطة مستطيلات مبنية على الفواصل الزمنية المقابلة. يجب أن يكون ارتفاع الأعمدة في حالة الفترات المتساوية متناسبا مع الترددات.

يمكن تحويل أي رسم بياني إلى مضلع توزيع، للقيام بذلك، من الضروري ربط رؤوس مستطيلاته بقطاعات مستقيمة.

2. طريقة المؤشر لتحليل تأثير متوسط ​​الإنتاج ومتوسط ​​عدد الموظفين على التغيرات في حجم الإنتاج

طريقة الفهرسيستخدم لتحليل الديناميكيات ومقارنة المؤشرات العامة وكذلك العوامل المؤثرة على التغيرات في مستويات هذه المؤشرات. باستخدام المؤشرات، من الممكن تحديد تأثير متوسط ​​الإنتاج ومتوسط ​​عدد الموظفين على التغيرات في حجم الإنتاج. تم حل هذه المشكلة عن طريق بناء نظام من المؤشرات التحليلية.

ويرتبط مؤشر حجم الإنتاج بمتوسط ​​عدد العاملين ومؤشر متوسط ​​الإنتاج بنفس الطريقة التي يرتبط بها حجم الإنتاج (Q) بالإنتاج ( ث)والارقام( ص) .

يمكننا أن نستنتج أن حجم الإنتاج سيكون مساوياً لمنتج متوسط ​​الإنتاج ومتوسط ​​عدد الموظفين:

س = ث ص،حيث Q هو حجم الإنتاج،

ث - متوسط ​​الناتج،

ص - متوسط ​​عدد الموظفين.

كما ترون، نحن نتحدث عن العلاقة بين الظواهر في الإحصائيات: ناتج عاملين يعطي الحجم الإجمالي للظاهرة الناتجة. ومن الواضح أيضًا أن هذا الارتباط وظيفي، لذلك تمت دراسة ديناميكيات هذا الارتباط باستخدام المؤشرات. على سبيل المثال، هذا هو النظام التالي:

جو × جونيور = جوور.

على سبيل المثال، يمكن تقسيم مؤشر حجم الإنتاج Jwr، باعتباره مؤشرًا لظاهرة إنتاجية، إلى مؤشرين عامليين: مؤشر متوسط ​​الإنتاج (Jw)، ومؤشر متوسط ​​عدد الموظفين (Jr):

مؤشر الفهرس الفهرس

حجم متوسط ​​الرواتب

رقم مخرجات الإنتاج

أين ج ث- مؤشر إنتاجية العمل المحسوب باستخدام صيغة لاسبير؛

الابن- مؤشر عدد الموظفين، محسوبا باستخدام صيغة باش.

تُستخدم أنظمة الفهرس لتحديد تأثير العوامل الفردية على تكوين مستوى مؤشر الأداء، فهي تسمح بتحديد قيمة المجهول من خلال قيمتين معروفتين للمؤشر.

بناءً على نظام المؤشرات المذكور أعلاه، يمكن للمرء أيضًا العثور على الزيادة المطلقة في حجم الإنتاج، المتحللة إلى تأثير العوامل.

1. الزيادة العامة في حجم الإنتاج:

∆wr = ∑w 1 r 1 - ∑w 0 r 0 .

2. الزيادة بسبب عمل مؤشر متوسط ​​الناتج:

∆wr/w = ∑w 1 r 1 - ∑w 0 r 1 .

3. الزيادة بسبب عمل مؤشر متوسط ​​عدد الموظفين:

∆wr/ص = ∑ث 0 ص 1 - ∑ث 0 ص 0

∆wr = ∆wr/w + ∆wr/r.

مثال.البيانات التالية معروفة

يمكننا تحديد كيفية تغير حجم الإنتاج بالقيم النسبية والمطلقة وكيف أثرت العوامل الفردية على هذا التغيير.

وكان حجم الإنتاج:

في فترة الأساس

ث 0 * ص 0 = 2000 * 90 = 180000،

وفي التقارير

ث 1 * ص 1 = 2100 * 100 = 210000.

وبالتالي ارتفع حجم الإنتاج بمقدار 30 ألفاً أو 1.16%.

∆wr=∑w 1 r 1 - ∑w 0 r 0= (210000-180000)=30000

أو (210000:180000)*100%=1.16%.

ويعود هذا التغير في حجم الإنتاج إلى:

1) زيادة في متوسط ​​عدد الموظفين بمقدار 10 أشخاص أو 111.1%

ص 1 / ص 0 = 100 / 90 = 1.11 أو 111.1%.

وبالقيمة المطلقة، وبسبب هذا العامل، زاد حجم الإنتاج بمقدار 20.000:

ث 0 ص 1 – ث 0 ص 0 = ث 0 (ص 1 -ص 0) = 2000 (100-90) = 20000.

2) زيادة في متوسط ​​الإنتاج بنسبة 105% أو 10000:

ث 1 ص 1 /ث 0 ص 1 = 2100*100/2000*100 = 1.05 أو 105%.

الزيادة بالقيمة المطلقة هي:

ث 1 ص 1 - ث 0 ص 1 = (ث 1 -ث 0)ص 1 = (2100-2000)*100 = 10000.

ومن هنا كان التأثير المشترك للعوامل:

1. بالقيمة المطلقة

10000 + 20000 = 30000

2. من الناحية النسبية

1,11 * 1,05 = 1,16 (116%)

وبذلك تكون الزيادة 1.16%. تم الحصول على كلتا النتيجتين سابقًا.

كلمة "فهرس" في الترجمة تعني المؤشر والمؤشر. في الإحصاء، يتم تفسير المؤشر على أنه مؤشر نسبي يميز التغير في ظاهرة ما في الزمان أو المكان أو مقارنة بالخطة. وبما أن الفهرس قيمة نسبية، فإن أسماء الفهارس تتوافق مع أسماء القيم النسبية.

في الحالات التي نقوم فيها بتحليل التغييرات مع مرور الوقت في المنتجات المقارنة، يمكننا إثارة مسألة كيفية تغير مكونات المؤشر (السعر أو الحجم المادي أو هيكل الإنتاج أو مبيعات الأنواع الفردية من المنتجات) في ظل ظروف مختلفة (في مناطق مختلفة) . وفي هذا الصدد، يتم بناء مؤشرات التكوين الثابت، والتركيب المتغير، والتغيرات الهيكلية.

مؤشر التكوين الدائم (الثابت) –هذا هو المؤشر الذي يميز ديناميكيات القيمة المتوسطة لنفس التركيبة الثابتة للسكان.

مبدأ بناء مؤشر ذو تركيبة ثابتة هو التخلص من تأثير التغيرات في هيكل الأوزان على القيمة المفهرسة من خلال حساب مستوى المتوسط ​​المرجح للمؤشر المفهرس بنفس الأوزان.

مؤشر التكوين الثابت مطابق في الشكل للمؤشر الإجمالي. النموذج الكلي هو الأكثر شيوعا.

ويحسب مؤشر التركيبة الثابتة بأوزان ثابتة على مستوى الفترة الواحدة ويظهر التغير في القيمة المؤشرة فقط. مؤشر التركيب الثابت يلغي تأثير التغيرات في هيكل الأوزان على القيمة المفهرسة من خلال حساب مستوى المتوسط ​​المرجح للمؤشر المفهرس بنفس الأوزان. تقارن مؤشرات التكوين الثابت المؤشرات المحسوبة على أساس بنية الظواهر غير المتغيرة.

إن أهم مرحلة في دراسة الظواهر والعمليات الاجتماعية والاقتصادية هي تنظيم البيانات الأولية، وعلى هذا الأساس، الحصول على ملخص موجز للكائن بأكمله باستخدام المؤشرات العامة، والذي يتم تحقيقه من خلال تلخيص وتجميع المواد الإحصائية الأولية.

ملخص إحصائي - هذا عبارة عن مجموعة معقدة من العمليات المتسلسلة لتعميم حقائق فردية محددة تشكل مجموعة من أجل تحديد السمات والأنماط النموذجية المتأصلة في الظاهرة قيد الدراسة ككل. يتضمن إجراء ملخص إحصائي الخطوات التالية :

  • اختيار خصائص التجميع؛
  • تحديد ترتيب تشكيل المجموعة؛
  • تطوير نظام المؤشرات الإحصائية لوصف المجموعات والكائن ككل؛
  • تطوير تخطيطات الجدول الإحصائي لتقديم نتائج موجزة.

التجمع الإحصائي يسمى تقسيم وحدات السكان محل الدراسة إلى مجموعات متجانسة وفقا لخصائص معينة ضرورية لهم. تعتبر المجموعات من أهم الأساليب الإحصائية لتلخيص البيانات الإحصائية، وهي أساس الحساب الصحيح للمؤشرات الإحصائية.

تتميز الأنواع التالية من المجموعات: النموذجية والهيكلية والتحليلية. وتتحد كل هذه التجمعات من خلال حقيقة أن وحدات الكائن تنقسم إلى مجموعات حسب بعض الخصائص.

ميزة التجميع هي الخاصية التي يتم من خلالها تقسيم وحدات السكان إلى مجموعات منفصلة. تعتمد استنتاجات الدراسة الإحصائية على الاختيار الصحيح لخاصية التجميع. كأساس للتجميع، من الضروري استخدام خصائص هامة ذات أساس نظري (كمية أو نوعية).

الخصائص الكمية للتجميع لها تعبير رقمي (حجم التداول، عمر الشخص، دخل الأسرة، وما إلى ذلك)، و العلامات النوعية للتجمع تعكس حالة الوحدة السكانية (الجنس، الحالة الاجتماعية، صناعة المؤسسة، شكل ملكيتها، وما إلى ذلك).

بعد تحديد أساس التجميع، يجب تحديد مسألة عدد المجموعات التي ينبغي تقسيم السكان قيد الدراسة إليها. ويعتمد عدد المجموعات على أهداف الدراسة ونوع المؤشر الذي يقوم عليه التجميع، وحجم السكان، ودرجة الاختلاف في الخاصية.

على سبيل المثال، فإن تجميع المؤسسات حسب نوع الملكية يأخذ في الاعتبار الممتلكات الخاضعة للبلديات والفدرالية والفدرالية. إذا تم التجميع وفقًا لمعيار كمي، فمن الضروري إيلاء اهتمام خاص لعدد وحدات الكائن قيد الدراسة ودرجة تقلب خاصية التجميع.

بمجرد تحديد عدد المجموعات، يجب تحديد فترات التجميع. فاصلة - هذه هي قيم الخصائص المتغيرة التي تقع ضمن حدود معينة. كل فاصل له قيمته الخاصة، والحدود العليا والسفلى، أو على الأقل واحد منهم.

الحد الأدنى للفاصل الزمني تسمى أصغر قيمة للخاصية في الفترة و الحد الأعلى - أعلى قيمة للخاصية في الفترة. قيمة الفاصل الزمني هي الفرق بين الحدود العلوية والسفلية.

فترات التجميع، حسب حجمها، هي: متساوية وغير متساوية. إذا ظهر تباين الخاصية ضمن حدود ضيقة نسبيًا وكان التوزيع منتظمًا، فسيتم بناء المجموعة على فترات متساوية. يتم تحديد قيمة الفاصل الزمني المتساوي بالصيغة التالية :

حيث Xmax، Xmin هي القيم القصوى والدنيا للخاصية في المجموع؛ ن - عدد المجموعات.

إن أبسط تجميع تتميز فيه كل مجموعة مختارة بمؤشر واحد يمثل سلسلة توزيع.

سلسلة التوزيع الإحصائي - هذا توزيع منظم للوحدات السكانية إلى مجموعات حسب خاصية معينة. اعتمادا على الخاصية الكامنة وراء تشكيل سلسلة التوزيع، يتم التمييز بين سلسلة التوزيع السمة والمتغيرة.

عزوي تسمى سلاسل التوزيع المبنية على أساس الخصائص النوعية، أي الخصائص التي ليس لها تعبير عددي (التوزيع حسب نوع العمل، حسب الجنس، حسب المهنة، الخ). تميز سلسلة التوزيع السمة تكوين السكان وفقًا لبعض الخصائص الأساسية. تتيح هذه البيانات، المأخوذة على عدة فترات، دراسة التغيرات في البنية.

سلسلة متغيرة تسمى سلسلة التوزيع المبنية على أساس كمي. تتكون أي سلسلة متغيرة من عنصرين: الخيارات والترددات. خيارات تسمى القيم الفردية للخاصية التي تأخذها في سلسلة التباين، أي القيمة المحددة للخاصية المتغيرة.

الترددات يتم استدعاء أرقام المتغيرات الفردية أو كل مجموعة من سلسلة التباين، أي أنها أرقام توضح عدد مرات حدوث متغيرات معينة في سلسلة التوزيع. يحدد مجموع جميع الترددات حجم السكان بأكمله وحجمهم. الترددات تسمى الترددات المعبر عنها بكسور الوحدة أو كنسبة مئوية من الإجمالي. وبناء على ذلك، فإن مجموع الترددات يساوي 1 أو 100٪.

اعتمادًا على طبيعة تباين الخاصية، يتم التمييز بين ثلاثة أشكال من سلاسل التباين: السلسلة المرتبة، والسلسلة المنفصلة، ​​والسلسلة الفاصلة.

سلسلة الاختلافات المرتبة - هذا هو توزيع الوحدات الفردية للسكان بترتيب تصاعدي أو تنازلي للخاصية قيد الدراسة. يتيح لك التصنيف تقسيم البيانات الكمية إلى مجموعات بسهولة، والكشف الفوري عن أصغر وأكبر قيم السمة، وتسليط الضوء على القيم التي تتكرر في أغلب الأحيان.

سلسلة الاختلاف المنفصلة يصف توزيع الوحدات السكانية وفقًا لخاصية منفصلة تأخذ قيمًا صحيحة فقط. على سبيل المثال، فئة التعريفة، عدد الأطفال في الأسرة، عدد الموظفين في المؤسسة، إلخ.

إذا كانت السمة لها تغيير مستمر، والتي ضمن حدود معينة يمكن أن تأخذ أي قيم ("من - إلى")، فمن الضروري بناء هذه الخاصية سلسلة الاختلافات الفاصلة . على سبيل المثال، مقدار الدخل، ومدة الخدمة، وتكلفة الأصول الثابتة للمؤسسة، وما إلى ذلك.

أمثلة على حل المشكلات في موضوع "الملخص الإحصائي والتجميع"

المشكلة 1 . هناك معلومات حول عدد الكتب التي حصل عليها الطلاب من خلال الاشتراكات خلال العام الدراسي الماضي.

إنشاء سلسلة توزيع تباين مرتبة ومنفصلة، ​​مع تحديد عناصر السلسلة.

حل

تمثل هذه المجموعة العديد من الخيارات لعدد الكتب التي يتلقاها الطلاب. دعونا نحسب عدد هذه الخيارات ونرتبها في شكل سلسلة توزيع متباينة ومرتبة متباينة.

المشكلة 2 . توجد بيانات عن تكلفة الأصول الثابتة لـ 50 مؤسسة بألف روبل.

إنشاء سلسلة توزيع، مع تسليط الضوء على 5 مجموعات من المؤسسات (على فترات متساوية).

حل

لحل هذه المشكلة، سنختار القيم الأكبر والأصغر لقيمة الأصول الثابتة للمؤسسات. هذه هي 30.0 و 10.2 ألف روبل.

لنجد حجم الفاصل الزمني: h = (30.0-10.2):5= 3.96 ألف روبل.

ثم ستشمل المجموعة الأولى الشركات التي تبلغ أصولها الثابتة 10.2 ألف روبل. ما يصل إلى 10.2+3.96=14.16 ألف روبل. سيكون هناك 9 شركات من هذا القبيل، وستضم المجموعة الثانية الشركات التي تبلغ أصولها الثابتة 14.16 ألف روبل. ما يصل إلى 14.16+3.96=18.12 ألف روبل. وسيكون عدد هذه المنشآت 16 منشأة، وكذلك نجد عدد المنشآت المدرجة في المجموعات الثالثة والرابعة والخامسة.

نضع سلسلة التوزيع الناتجة في الجدول.

المشكلة 3 . تم الحصول على البيانات التالية لعدد من مؤسسات الصناعة الخفيفة:

قم بتجميع المؤسسات حسب عدد العمال، وتشكيل 6 مجموعات على فترات متساوية. احسب لكل مجموعة:

1. عدد المؤسسات
2. عدد العاملين
3. حجم المنتجات المنتجة سنوياً
4. متوسط ​​الإنتاج الفعلي لكل عامل
5. حجم الأصول الثابتة
6. متوسط ​​حجم الأصول الثابتة للمشروع الواحد
7. متوسط ​​قيمة المنتجات التي تنتجها المؤسسة الواحدة

تقديم نتائج الحساب في الجداول. استخلاص النتائج.

حل

لحل هذه المشكلة، سنختار القيم الأكبر والأصغر لمتوسط ​​عدد العاملين في المؤسسة. هذه هي 43 و 256.

لنجد حجم الفاصل الزمني: h = (256-43):6 = 35.5

ثم ستشمل المجموعة الأولى المؤسسات التي يتراوح متوسط ​​عدد العاملين فيها من 43 إلى 43 + 35.5 = 78.5 شخصًا. سيكون هناك 5 مؤسسات من هذا القبيل، وستضم المجموعة الثانية المؤسسات التي يتراوح متوسط ​​عدد العاملين فيها من 78.5 إلى 78.5 + 35.5 = 114 شخصًا. وسيكون عدد هذه المنشآت 12، وكذلك نجد عدد المنشآت المدرجة في المجموعات الثالثة والرابعة والخامسة والسادسة.

نضع سلسلة التوزيع الناتجة في جدول ونحسب المؤشرات اللازمة لكل مجموعة:

خاتمة : كما يتبين من الجدول، المجموعة الثانية من المؤسسات هي الأكثر عددا. وتضم 12 مؤسسة. أصغر المجموعات هي المجموعتان الخامسة والسادسة (مؤسستان لكل منهما). هذه هي أكبر الشركات (من حيث عدد العمال).

وبما أن المجموعة الثانية هي الأكبر، فإن حجم المنتجات التي تنتجها مؤسسات هذه المجموعة سنويا وحجم الأصول الثابتة أعلى بكثير من غيرها. وفي الوقت نفسه، فإن متوسط ​​الإنتاج الفعلي لكل عامل في مؤسسات هذه المجموعة ليس هو الأكبر. شركات المجموعة الرابعة تقود هنا. تمثل هذه المجموعة أيضًا حجمًا كبيرًا إلى حد ما من الأصول الثابتة.

في الختام، نلاحظ أن متوسط ​​حجم الأصول الثابتة ومتوسط ​​كمية الإنتاج التي تنتجها مؤسسة واحدة يتناسب طرديا مع حجم المؤسسة (من حيث عدد العمال).

سلسلة التوزيع الإحصائي– هذا هو التوزيع المنظم للوحدات السكانية إلى مجموعات وفقًا لخصائص معينة ومتغيرة.
اعتمادا على الخاصية الكامنة وراء تشكيل سلسلة التوزيع، هناك سلسلة التوزيع السمة والمتغيرة.

إن وجود صفة مشتركة هو أساس تكوين المجتمع الإحصائي الذي يمثل نتائج وصف أو قياس الخصائص العامة لموضوعات الدراسة.

موضوع الدراسة في الإحصاء هو تغيير (متغير) الخصائص أو الخصائص الإحصائية.

أنواع الخصائص الإحصائية.

تسمى سلسلة التوزيع المنسوبةبنيت وفقا لمعايير الجودة. عزوي– هذه علامة لها اسم (مثلاً المهنة: خياطة، معلمة، إلخ).
وعادة ما يتم تقديم سلسلة التوزيع في شكل جداول. في الجدول 2.8 يوضح سلسلة توزيع السمات.
الجدول 2.8 - توزيع أنواع المساعدة القانونية التي يقدمها المحامون لمواطني إحدى مناطق الاتحاد الروسي.

سلسلة الاختلاف– هذه هي قيم الخاصية (أو فترات القيم) وتردداتها.
سلسلة الاختلاف هي سلسلة التوزيع، مبنية على أساس كمي. تتكون أي سلسلة متغيرة من عنصرين: الخيارات والترددات.
تعتبر المتغيرات هي القيم الفردية للخاصية التي تأخذها في سلسلة التباين.
الترددات هي أعداد المتغيرات الفردية أو كل مجموعة من سلسلة الاختلافات، أي. هذه أرقام توضح عدد مرات ظهور خيارات معينة في سلسلة التوزيع. يحدد مجموع جميع الترددات حجم السكان بأكمله وحجمهم.
التكرارات هي التكرارات التي يتم التعبير عنها كأجزاء من الوحدة أو كنسبة مئوية من الإجمالي. وعليه فإن مجموع التكرارات يساوي 1 أو 100%. تسمح سلسلة الاختلافات بتقدير شكل قانون التوزيع بناءً على البيانات الفعلية.

اعتمادا على طبيعة الاختلاف في السمة، هناك سلسلة الاختلاف المنفصلة والفاصلة.
ويرد في الجدول مثال على سلسلة التباين المنفصلة. 2.9.
الجدول 2.9 - توزيع الأسر حسب عدد الغرف المشغولة في الشقق الفردية في عام 1989 في الاتحاد الروسي.

يعرض العمود الأول من الجدول خيارات لسلسلة تباينات منفصلة، ​​ويحتوي العمود الثاني على ترددات سلسلة التباين، ويحتوي العمود الثالث على مؤشرات التكرار.

سلسلة الاختلاف

تتم دراسة خاصية كمية معينة في عموم السكان. ويتم استخراج عينة حجمية منه بشكل عشوائي نأي أن عدد عناصر العينة يساوي ن. في المرحلة الأولى من المعالجة الإحصائية تتراوحالعينات، أي. ترتيب الأرقام س 1 , س 2 , …, س نتصاعدي. كل قيمة ملحوظة × طمُسَمًّى خيار. تكرار م طهو عدد ملاحظات القيمة × طفي العينة. التردد النسبي (التردد) ث طهي نسبة التردد م طلحجم العينة ن: .
عند دراسة سلسلة التباين، يتم أيضًا استخدام مفاهيم التردد المتراكم والتكرار المتراكم. يترك سبعض العدد. ثم عدد الخيارات , التي تكون قيمها أقل س، يسمى التردد المتراكم: لـ x i نويسمى التردد المتراكم ث ط ماكس.
تسمى الخاصية متغيرًا منفصلاً إذا كانت قيمها الفردية (المتغيرات) تختلف عن بعضها البعض بقيمة محدودة معينة (عادةً ما تكون عددًا صحيحًا). تسمى سلسلة التباين لهذه الخاصية بسلسلة التباين المنفصلة.

الجدول 1. منظر عام لسلسلة ترددات التباين المنفصلة

القيم المميزة× ط × 1 × 2 س ن
التردداتم ط م 1 م 2 م ن

تسمى الخاصية متغيرة باستمرار إذا كانت قيمها تختلف عن بعضها البعض بمقدار صغير اعتباطيا، أي. يمكن أن تأخذ الإشارة أي قيمة في فترة زمنية معينة. تسمى سلسلة التباين المستمرة لمثل هذه الخاصية بالفاصل الزمني.

الجدول 2. منظر عام لسلسلة تباين الفاصل الزمني للترددات

الجدول 3. الصور الرسومية لسلسلة الاختلاف

صفمضلع أو رسم بيانيوظيفة التوزيع التجريبية
منفصلة
فاصلة
ومن خلال مراجعة نتائج الملاحظات، يتم تحديد عدد القيم المتغيرة التي تقع في كل فترة زمنية محددة. ومن المفترض أن كل فاصل ينتمي إلى أحد طرفيه: إما في جميع الحالات إلى اليسار (في أغلب الأحيان) أو في جميع الحالات إلى اليمين، والترددات أو الترددات توضح عدد الخيارات الواردة ضمن الحدود المحددة. اختلافات أنا - أنا +1تسمى فترات جزئية. لتبسيط الحسابات اللاحقة، يمكن استبدال سلسلة تباين الفاصل الزمني بسلسلة منفصلة مشروطة. في هذه الحالة، القيمة المتوسطة أنا-يتم أخذ الفاصل الزمني كخيار × ط، وتردد الفاصل الزمني المقابل م ط- لتكرار هذه الفترة.
للتمثيل الرسومي لسلسلة التباين، الأكثر استخدامًا هي المضلع والرسم البياني والمنحنى التراكمي ووظيفة التوزيع التجريبي.

في الجدول 2.3 (تجميع السكان الروس حسب متوسط ​​دخل الفرد في أبريل 1994) معروض سلسلة الاختلافات الفاصلة.
من السهل تحليل سلسلة التوزيع باستخدام صورة رسومية، مما يسمح للمرء بالحكم على شكل التوزيع. يتم تقديم تمثيل مرئي لطبيعة التغيرات في ترددات سلسلة التباين بواسطة المضلع والرسم البياني.
يتم استخدام المضلع عند تصوير سلسلة التباين المنفصلة.
دعونا، على سبيل المثال، نرسم بيانيًا توزيع مخزون المساكن حسب نوع الشقة (الجدول 2.10).
الجدول 2.10 - توزيع مخزون المساكن في المنطقة الحضرية حسب نوع الشقة (أرقام مشروطة).


أرز. منطقة توزيع المساكن


ليس فقط قيم التردد، ولكن أيضًا ترددات سلسلة التباين يمكن رسمها على المحاور الإحداثية.
يتم استخدام الرسم البياني لتصوير سلسلة تباين الفاصل الزمني. عند إنشاء الرسم البياني، يتم رسم قيم الفواصل الزمنية على محور الإحداثي السيني، ويتم تصوير الترددات بواسطة مستطيلات مبنية على الفواصل الزمنية المقابلة. يجب أن يكون ارتفاع الأعمدة في حالة الفترات المتساوية متناسبا مع الترددات. الرسم البياني هو رسم بياني يتم فيه تصوير سلسلة كأشرطة مجاورة لبعضها البعض.
دعونا نصور بيانيا سلسلة التوزيع الفاصلة الواردة في الجدول. 2.11.
الجدول 2.11 - توزيع الأسر حسب حجم مساحة المعيشة للشخص الواحد (أرقام مشروطة).
ن ص / ص مجموعات العائلات حسب حجم مساحة المعيشة للشخص الواحد عدد الأسر التي لديها حجم معين من مساحة المعيشة العدد التراكمي للعائلات
1 3 – 5 10 10
2 5 – 7 20 30
3 7 – 9 40 70
4 9 – 11 30 100
5 11 – 13 15 115
المجموع 115 ----


أرز. 2.2. رسم بياني لتوزيع الأسر حسب حجم مساحة المعيشة للشخص الواحد


باستخدام بيانات السلسلة المتراكمة (الجدول 2.11)، نقوم بالبناء التوزيع التراكمي.


أرز. 2.3. التوزيع التراكمي للأسر حسب حجم مساحة المعيشة للشخص الواحد


يعد تمثيل سلسلة التباين في شكل تراكم فعالًا بشكل خاص لسلسلة التباين التي يتم التعبير عن تردداتها ككسر أو نسب مئوية من مجموع ترددات السلسلة.
إذا قمنا بتغيير المحاور عند تصوير سلسلة التباين بيانياً في شكل تراكمات، فسنحصل على ذلك ogiva. في التين. يُظهر الشكل 2.4 ogive تم إنشاؤها على أساس البيانات الواردة في الجدول. 2.11.
يمكن تحويل الرسم البياني إلى مضلع توزيع من خلال إيجاد نقاط منتصف جوانب المستطيلات ثم ربط هذه النقاط بخطوط مستقيمة. يظهر مضلع التوزيع الناتج في الشكل. 2.2 بخط منقط.
عند إنشاء رسم بياني لتوزيع سلسلة التباين بفواصل زمنية غير متساوية، فليست الترددات هي التي يتم رسمها على طول المحور الإحداثي، ولكن كثافة توزيع الخاصية في الفواصل الزمنية المقابلة.
كثافة التوزيع هي التردد المحسوب لكل وحدة عرض الفاصل الزمني، أي. كم عدد الوحدات في كل مجموعة لكل وحدة قيمة الفاصل. ويرد في الجدول مثال لحساب كثافة التوزيع. 2.12.
الجدول 2.12 - توزيع المؤسسات حسب عدد الموظفين (أرقام مشروطة)
ن ص / ص مجموعات الشركات حسب عدد الموظفين والأشخاص. عدد المؤسسات حجم الفاصل الزمني، والناس. كثافة التوزيع
أ 1 2 3=1/2
1 ما يصل إلى 20 15 20 0,75
2 20 – 80 27 60 0,25
3 80 – 150 35 70 0,5
4 150 – 300 60 150 0,4
5 300 – 500 10 200 0,05
المجموع 147 ---- ----

يمكن استخدامه أيضًا لتمثيل سلسلة التباين بيانيًا المنحنى التراكمي. باستخدام التراكم (منحنى المجموع)، يتم تصوير سلسلة من الترددات المتراكمة. يتم تحديد التكرارات التراكمية من خلال جمع التكرارات بشكل تسلسلي عبر المجموعات وإظهار عدد الوحدات في المجتمع التي لها قيم سمات لا تزيد عن القيمة قيد النظر.


أرز. 2.4. أوجي توزيع الأسر حسب حجم مساحة المعيشة للشخص الواحد

عند إنشاء تراكمات سلسلة تباين الفاصل الزمني، يتم رسم متغيرات السلسلة على طول محور الإحداثي، ويتم رسم الترددات المتراكمة على طول المحور الإحداثي.