التوزيع المستمر المنتظم في MS EXCEL. القوانين الموحدة والأسية لتوزيع متغير عشوائي مستمر

تمت دراسة هذه المسألة بالتفصيل منذ فترة طويلة ، وكانت طريقة الإحداثيات القطبية ، التي اقترحها جورج بوكس ​​وميرفين مولر وجورج مارساجليا في عام 1958 ، هي الأكثر استخدامًا. تتيح لك هذه الطريقة الحصول على زوج من المتغيرات العشوائية المستقلة الموزعة بشكل طبيعي بمتوسط ​​0 والتباين 1 على النحو التالي:

حيث Z 0 و Z 1 هي القيم المرغوبة ، s \ u003d u 2 + v 2 ، و u و v هي متغيرات عشوائية موزعة بشكل موحد على المقطع (-1 ، 1) ، يتم تحديدها بطريقة تجعل الشرط 0< s < 1.
يستخدم الكثيرون هذه الصيغ دون تفكير ، ولا يشك الكثيرون في وجودها ، لأنهم يستخدمون تطبيقات جاهزة. لكن هناك أشخاص لديهم أسئلة: "من أين أتت هذه الصيغة؟ ولماذا تحصل على زوج من القيم مرة واحدة؟ سأحاول فيما يلي إعطاء إجابة واضحة على هذه الأسئلة.


بادئ ذي بدء ، اسمحوا لي أن أذكرك بكثافة الاحتمال ، ودالة التوزيع لمتغير عشوائي والدالة العكسية. لنفترض أن هناك متغيرًا عشوائيًا ، يتم توزيعه بواسطة دالة الكثافة f (x) ، والتي لها الشكل التالي:

هذا يعني أن احتمال أن تكون قيمة هذا المتغير العشوائي في الفترة (أ ، ب) يساوي مساحة المنطقة المظللة. ونتيجة لذلك ، يجب أن تكون مساحة المنطقة المظللة بأكملها مساوية للوحدة ، لأنه على أي حال ستقع قيمة المتغير العشوائي في مجال الوظيفة f.
دالة توزيع المتغير العشوائي هي جزء لا يتجزأ من دالة الكثافة. وفي هذه الحالة سيكون شكلها التقريبي كما يلي:

المعنى هنا هو أن قيمة المتغير العشوائي ستكون أقل من A مع احتمال B. ونتيجة لذلك ، لا تتناقص الوظيفة أبدًا ، وتكمن قيمها في الفترة الزمنية.

الدالة العكسية هي دالة تُرجع وسيطة الدالة الأصلية إذا قمت بتمرير قيمة الوظيفة الأصلية إليها. على سبيل المثال ، بالنسبة للدالة x 2 ، سيكون معكوس دالة استخراج الجذر ، أما بالنسبة لـ sin (x) فهو arcsin (x) ، إلخ.

نظرًا لأن معظم مولدات الأرقام شبه العشوائية تعطي توزيعًا موحدًا فقط عند الإخراج ، فغالبًا ما يصبح من الضروري تحويلها إلى آخر. في هذه الحالة ، بالنسبة إلى Gaussian العادي:

أساس جميع طرق تحويل التوزيع المنتظم إلى أي توزيع آخر هو طريقة التحويل العكسي. يعمل على النحو التالي. تم العثور على دالة معكوسة لوظيفة التوزيع المطلوب ، وتم تمرير متغير عشوائي موزع بشكل موحد على المقطع (0 ، 1) كوسيطة. عند الإخراج نحصل على قيمة بالتوزيع المطلوب. من أجل الوضوح ، ها هي الصورة التالية.

وبالتالي ، يتم تلطيخ مقطع موحد وفقًا للتوزيع الجديد ، حيث يتم إسقاطه على محور آخر من خلال دالة عكسية. لكن المشكلة هي أن تكامل كثافة التوزيع الغاوسي ليس من السهل حسابه ، لذلك كان على العلماء المذكورين أعلاه أن يغشوا.

يوجد توزيع مربع كاي (توزيع بيرسون) ، وهو توزيع مجموع مربعات ك المتغيرات العشوائية العادية المستقلة. وفي حالة k = 2 ، يكون هذا التوزيع أسيًا.

هذا يعني أنه إذا كانت نقطة في نظام إحداثيات مستطيل تحتوي على إحداثيات عشوائية X و Y موزعة بشكل طبيعي ، فبعد تحويل هذه الإحداثيات إلى النظام القطبي (r ، θ) ، مربع نصف القطر (المسافة من الأصل إلى النقطة) سيتم توزيعها بشكل أسي ، لأن مربع نصف القطر هو مجموع مربعات الإحداثيات (وفقًا لقانون فيثاغورس). ستبدو كثافة توزيع هذه النقاط على المستوى كما يلي:


نظرًا لأنها متساوية في جميع الاتجاهات ، سيكون للزاوية توزيع منتظم في النطاق من 0 إلى 2π. العكس صحيح أيضًا: إذا حددت نقطة في نظام الإحداثيات القطبية باستخدام متغيرين عشوائيين مستقلين (الزاوية الموزعة بشكل موحد ونصف القطر الموزع أسيًا) ، فإن الإحداثيات المستطيلة لهذه النقطة ستكون متغيرات عشوائية عادية ومستقلة. كما أن الحصول على التوزيع الأسي من التوزيع المنتظم أسهل بكثير بالفعل ، باستخدام نفس طريقة التحويل العكسي. هذا هو جوهر طريقة Box-Muller القطبية.
الآن دعنا نحصل على الصيغ.

(1)

للحصول على r و ، من الضروري إنشاء متغيرين عشوائيين موزعين بشكل موحد على المقطع (0 ، 1) (دعنا نسميهما u و v) ، يجب تحويل توزيع أحدهما (دعنا نقول v) إلى أسي إلى الحصول على نصف القطر. تبدو دالة التوزيع الأسي كما يلي:

وظيفتها العكسية:

نظرًا لأن التوزيع المنتظم متماثل ، فسيعمل التحويل بالمثل مع الوظيفة

يتبع من صيغة توزيع مربع كاي أن λ = 0.5. نعوض بـ λ ، v في هذه الدالة ونحصل على مربع نصف القطر ، ثم نصف القطر نفسه:

نحصل على الزاوية عن طريق مد جزء الوحدة إلى 2π:

الآن نستبدل r و بالصيغتين (1) ونحصل على:

(2)

هذه الصيغ جاهزة للاستخدام. سيكون X و Y مستقلين ويتم توزيعهما بشكل طبيعي مع تباين 1 ومتوسط ​​0. للحصول على توزيع بخصائص أخرى ، يكفي ضرب نتيجة الدالة في الانحراف المعياري وإضافة المتوسط.
لكن من الممكن التخلص من الدوال المثلثية بتحديد الزاوية ليس بشكل مباشر ، ولكن بشكل غير مباشر من خلال إحداثيات مستطيلة لنقطة عشوائية في دائرة. بعد ذلك ، من خلال هذه الإحداثيات ، سيكون من الممكن حساب طول متجه نصف القطر ، ثم إيجاد جيب التمام والجيب بقسمة x و y عليهما ، على التوالي. كيف ولماذا تعمل؟
نختار نقطة عشوائية من الموزعة بشكل موحد في دائرة نصف قطر الوحدة ونشير إلى مربع طول متجه نصف قطر هذه النقطة بالحرف s:

يتم الاختيار عن طريق تعيين إحداثيات مستطيلة x و y عشوائية موزعة بشكل موحد في الفاصل الزمني (-1 ، 1) ، والتخلص من النقاط التي لا تنتمي إلى الدائرة ، وكذلك النقطة المركزية التي تكون فيها زاوية متجه نصف القطر غير معرف. هذا هو الشرط 0< s < 1. Тогда, как и в случае с Гауссовским распределением на плоскости, угол θ будет распределен равномерно. Это очевидно - количество точек в каждом направлении одинаково, значит каждый угол равновероятен. Но есть и менее очевидный факт - s тоже будет иметь равномерное распределение. Полученные s и θ будут независимы друг от друга. Поэтому мы можем воспользоваться значением s для получения экспоненциального распределения, не генерируя третью случайную величину. Подставим теперь s в формулы (2) вместо v, а вместо тригонометрических функций - их расчет делением координаты на длину радиус-вектора, которая в данном случае является корнем из s:

نحصل على الصيغ ، كما في بداية المقال. عيب هذه الطريقة هو رفض النقاط غير المدرجة في الدائرة. أي باستخدام 78.5٪ فقط من المتغيرات العشوائية المتولدة. في أجهزة الكمبيوتر القديمة ، كان الافتقار إلى الدوال المثلثية لا يزال يمثل ميزة كبيرة. الآن ، عندما تحسب تعليمات أحد المعالجين الجيب وجيب التمام في وقت واحد ، أعتقد أن هاتين الطريقتين لا يزالان قادرين على المنافسة.

أنا شخصياً لدي سؤالان آخران:

  • لماذا يتم توزيع قيمة s بالتساوي؟
  • لماذا يتم توزيع مجموع مربعات متغيرين عشوائيين عاديين أضعافا مضاعفة؟
نظرًا لأن s هي مربع نصف القطر (للبساطة ، فإن نصف القطر هو طول متجه نصف القطر الذي يحدد موضع نقطة عشوائية) ، نكتشف أولاً كيفية توزيع نصف القطر. نظرًا لأن الدائرة مملوءة بشكل موحد ، فمن الواضح أن عدد النقاط ذات نصف القطر r يتناسب مع محيط الدائرة ذات نصف القطر r. يتناسب محيط الدائرة مع نصف القطر. هذا يعني أن كثافة توزيع نصف القطر تزداد بشكل موحد من مركز الدائرة إلى حوافها. ودالة الكثافة لها الصيغة f (x) = 2x على الفترة (0 ، 1). المعامل 2: مساحة الشكل تحت الرسم البياني تساوي واحدًا. عندما يتم تربيع هذه الكثافة ، فإنها تصبح موحدة. نظرًا لأنه من الناحية النظرية ، في هذه الحالة ، من الضروري قسمة دالة الكثافة على مشتق دالة التحويل (أي من x 2). وبصريا يحدث هذا على النحو التالي:

إذا تم إجراء تحويل مماثل لمتغير عشوائي عادي ، فإن دالة الكثافة لمربعه ستصبح مشابهة للقطع الزائد. وإضافة مربعين من المتغيرات العشوائية العادية هي بالفعل عملية أكثر تعقيدًا مرتبطة بالتكامل المزدوج. وحقيقة أن النتيجة ستكون توزيعًا أسيًا ، شخصيًا ، يبقى بالنسبة لي التحقق من ذلك بطريقة عملية أو قبولها كبديهية. وبالنسبة لأولئك المهتمين ، أقترح أن تتعرف على الموضوع عن كثب ، وتستمد المعرفة من هذه الكتب:

  • وينتزل إي. نظرية الاحتمالات
  • كنوت دي. فن البرمجة المجلد 2

في الختام ، سأقدم مثالاً على تنفيذ مولد الأرقام العشوائية الموزعة بشكل طبيعي في JavaScript:

الوظيفة Gauss () (var ready = false ؛ var second = 0.0 ؛ this.next = function (mean ، dev) (الوسط = الوسط == غير محدد؟ 0.0: يعني ؛ dev = dev == undefined؟ 1.0: dev ؛ if ( هذا. عشوائي () - 1.0 ؛ s = u * u + v * v ؛) بينما (s> 1.0 || s == 0.0) ؛ var r = Math.sqrt (-2.0 * Math.log (s) / s) ؛ this.second = r * u؛ this.ready = true؛ return r * v * dev + mean؛))؛) g = new Gauss ()؛ // إنشاء كائن a = g.next () ؛ // أنشئ زوجًا من القيم واحصل على أول واحد b = g.next () ؛ // احصل على ثاني c = g.next () ؛ // قم بإنشاء زوج من القيم مرة أخرى واحصل على القيمة الأولى
المعلمات المتوسطة (التوقع الرياضي) و dev (الانحراف المعياري) اختيارية. ألفت انتباهكم إلى حقيقة أن اللوغاريتم طبيعي.

ستأخذ دالة التوزيع في هذه الحالة ، وفقًا لـ (5.7) ، الشكل:

حيث: m هو التوقع الرياضي ، s هو الانحراف المعياري.

يُطلق على التوزيع الطبيعي أيضًا اسم Gaussian بعد عالم الرياضيات الألماني Gauss. حقيقة أن المتغير العشوائي له توزيع طبيعي مع المعلمات: m ،، يشار إليها على النحو التالي: N (m، s) حيث: m = a = M؛

في كثير من الأحيان ، في الصيغ ، يتم الإشارة إلى التوقع الرياضي بواسطة أ . إذا تم توزيع متغير عشوائي وفقًا للقانون N (0،1) ، فإنه يسمى القيمة العادية المعيارية أو المعيارية. دالة التوزيع الخاصة بها لها الشكل:

.

يظهر الرسم البياني لكثافة التوزيع الطبيعي ، والذي يسمى المنحنى الطبيعي أو منحنى جاوس ، في الشكل 5.4.

أرز. 5.4. كثافة التوزيع الطبيعي

يعتبر تحديد الخصائص العددية لمتغير عشوائي من خلال كثافته في مثال.

مثال 6.

يتم إعطاء متغير عشوائي مستمر بواسطة كثافة التوزيع: .

حدد نوع التوزيع ، وابحث عن التوقع الرياضي M (X) والتباين D (X).

بمقارنة كثافة التوزيع المحددة بـ (5.16) ، يمكننا أن نستنتج أن قانون التوزيع الطبيعي مع m = 4 معطى. لذلك ، التوقع الرياضي M (X) = 4 ، التباين D (X) = 9.

الانحراف المعياري s = 3.

وظيفة لابلاس ، والتي لها الشكل:

,

يرتبط بدالة التوزيع الطبيعي (5.17) ، من خلال العلاقة:

F 0 (x) \ u003d F (x) + 0.5.

وظيفة لابلاس غريبة.

Ф (-x) = - (x).

تم جدولة قيم دالة لابلاس Ф (х) وأخذت من الجدول وفقًا لقيمة x (انظر الملحق 1).

يلعب التوزيع الطبيعي للمتغير العشوائي المستمر دورًا مهمًا في نظرية الاحتمال وفي وصف الواقع ؛ فهو منتشر جدًا في الظواهر الطبيعية العشوائية. من الناحية العملية ، غالبًا ما توجد متغيرات عشوائية يتم تشكيلها على وجه التحديد نتيجة لتجميع العديد من المصطلحات العشوائية. على وجه الخصوص ، يوضح تحليل أخطاء القياس أنها عبارة عن مجموع أنواع مختلفة من الأخطاء. تبين الممارسة أن التوزيع الاحتمالي لأخطاء القياس قريب من القانون العادي.

باستخدام دالة لابلاس ، يمكن للمرء حل مشاكل حساب احتمال الوقوع في فترة زمنية معينة وانحراف معين عن متغير عشوائي عادي.

ضع في اعتبارك توزيعًا مستمرًا منتظمًا. دعونا نحسب التوقع الرياضي والتباين. دعونا ننشئ قيمًا عشوائية باستخدام وظيفة MS EXCELراند () والوظيفة الإضافية لحزمة التحليل ، سنقوم بتقييم المتوسط ​​والانحراف المعياري.

وزعت بالتساويفي الفترة الزمنية ، يكون للمتغير العشوائي:

دعنا ننشئ مصفوفة من 50 رقمًا من النطاق)