MS EXCEL'de düzgün sürekli dağılım. Sürekli bir rasgele değişkenin tekdüze ve üstel dağılım yasaları

Bu konu uzun zamandır ayrıntılı olarak incelenmiştir ve 1958'de George Box, Mervyn Muller ve George Marsaglia tarafından önerilen kutupsal koordinat yöntemi en yaygın şekilde kullanılmıştır. Bu yöntem, aşağıdaki gibi ortalama 0 ve varyans 1 ile bir çift bağımsız normal dağılımlı rasgele değişken elde etmenizi sağlar:

Z 0 ve Z 1'in istenen değerler olduğu yerde, s \u003d u 2 + v 2 ve u ve v, 0 koşulu yerine getirilecek şekilde seçilen segment (-1, 1) üzerinde eşit olarak dağıtılmış rastgele değişkenlerdir.< s < 1.
Birçoğu bu formülleri düşünmeden kullanır ve birçoğu hazır uygulamaları kullandıkları için varlığından bile şüphelenmez. Ancak soruları olan insanlar var: “Bu formül nereden geldi? Ve neden aynı anda bir çift değer alıyorsunuz? Aşağıda, bu sorulara net bir cevap vermeye çalışacağım.


Öncelikle olasılık yoğunluğunun, bir rasgele değişkenin dağılım fonksiyonunun ve ters fonksiyonunun ne olduğunu hatırlatalım. Dağılımı, aşağıdaki forma sahip yoğunluk fonksiyonu f(x) tarafından verilen bir rastgele değişken olduğunu varsayalım:

Bu, bu rastgele değişkenin değerinin (A, B) aralığında olma olasılığının, gölgeli alanın alanına eşit olduğu anlamına gelir. Ve sonuç olarak, tüm gölgeli alanın alanı bire eşit olmalıdır, çünkü her durumda rastgele değişkenin değeri f fonksiyonunun alanına girecektir.
Rastgele bir değişkenin dağılım fonksiyonu, yoğunluk fonksiyonunun bir integralidir. Ve bu durumda, yaklaşık şekli aşağıdaki gibi olacaktır:

Buradaki anlam, rastgele değişkenin değerinin B olasılıkla A'dan küçük olacağıdır. Ve sonuç olarak, fonksiyon asla azalmaz ve değerleri aralıkta bulunur.

Bir ters fonksiyon, içine orijinal fonksiyonun değerini iletirseniz, orijinal fonksiyonun bağımsız değişkenini döndüren bir fonksiyondur. Örneğin, x 2 fonksiyonu için tersi, kök çıkarma fonksiyonu olacaktır, sin (x) için ise arcsin (x), vb.

Çoğu sözde rasgele sayı üreteci, çıktıda yalnızca tekdüze bir dağılım verdiğinden, genellikle onu başka birine dönüştürmek gerekli hale gelir. Bu durumda, normal bir Gauss'a:

Düzgün bir dağılımı başka bir dağılıma dönüştürmeye yönelik tüm yöntemlerin temeli, ters dönüşüm yöntemidir. Aşağıdaki gibi çalışır. İstenen dağılımın işlevine ters olan bir işlev bulunur ve segmente (0, 1) eşit olarak dağıtılan rastgele bir değişken ona argüman olarak iletilir. Çıktıda gerekli dağılıma sahip bir değer elde ederiz. Açıklık için, işte aşağıdaki resim.

Böylece, tek biçimli bir parça, olduğu gibi, yeni dağılıma göre lekelenir ve bir ters fonksiyon aracılığıyla başka bir eksene yansıtılır. Ancak sorun şu ki, Gauss dağılımının yoğunluğunun integralini hesaplamak kolay değil, bu nedenle yukarıdaki bilim adamları hile yapmak zorunda kaldı.

K bağımsız normal rasgele değişkenin karelerinin toplamının dağılımı olan bir ki-kare dağılımı (Pearson dağılımı) vardır. Ve k = 2 olduğu durumda bu dağılım üsteldir.

Bunun anlamı, dikdörtgen koordinat sistemindeki bir noktanın rastgele X ve Y koordinatları normal olarak dağıtılmışsa, bu koordinatları kutupsal sisteme (r, θ) dönüştürdükten sonra, yarıçapın karesi (orijin noktasından noktaya olan mesafe) anlamına gelir. yarıçapın karesi koordinatların karelerinin toplamı olduğu için (Pisagor yasasına göre) üstel olarak dağıtılacaktır. Düzlemdeki bu tür noktaların dağılım yoğunluğu şöyle görünecektir:


Tüm yönlerde eşit olduğundan, θ açısı 0 ila 2π aralığında düzgün bir dağılıma sahip olacaktır. Tersi de doğrudur: kutupsal koordinat sisteminde iki bağımsız rasgele değişken (açı düzgün dağılmış ve yarıçap üstel olarak dağılmış) kullanarak bir nokta belirtirseniz, bu noktanın dikdörtgen koordinatları bağımsız normal rasgele değişkenler olacaktır. Ve tekdüze dağılımdan üstel dağılımın elde edilmesi, aynı ters dönüşüm yöntemi kullanılarak zaten çok daha kolaydır. Box-Muller polar yönteminin özü budur.
Şimdi formülleri alalım.

(1)

r ve θ'yı elde etmek için, (0, 1) segmentine düzgün bir şekilde dağılmış iki rasgele değişken oluşturmak gerekir (bunlara u ve v diyelim), bunlardan birinin dağılımı (v diyelim) üstel olarak dönüştürülmelidir. yarıçapı elde edin. Üstel dağılım işlevi şöyle görünür:

Ters işlevi:

Düzgün dağılım simetrik olduğundan, dönüşüm fonksiyonla benzer şekilde çalışacaktır.

Ki-kare dağılım formülünden λ = 0.5 çıkar. Bu fonksiyonda λ, v yerine koyarız ve yarıçapın karesini ve ardından yarıçapın kendisini elde ederiz:

Birim segmenti 2π'ye uzatarak açıyı elde ederiz:

Şimdi formül (1)'de r ve θ'yı değiştiriyoruz ve şunu elde ediyoruz:

(2)

Bu formüller kullanıma hazırdır. X ve Y bağımsız olacak ve varyansı 1 ve ortalaması 0 olacak şekilde normal dağılacaktır. Diğer özelliklere sahip bir dağılım elde etmek için, fonksiyonun sonucunu standart sapma ile çarpıp ortalamayı toplamak yeterlidir.
Ancak açıyı doğrudan değil, bir çemberdeki rastgele bir noktanın dikdörtgen koordinatları aracılığıyla dolaylı olarak belirterek trigonometrik fonksiyonlardan kurtulmak mümkündür. Daha sonra bu koordinatlar üzerinden yarıçap vektörünün uzunluğunu hesaplamak ve ardından sırasıyla x ve y'yi ona bölerek kosinüs ve sinüsü bulmak mümkün olacaktır. Nasıl ve neden çalışır?
Birim yarıçap dairesinde düzgün dağılmış rastgele bir nokta seçiyoruz ve bu noktanın yarıçap vektörünün uzunluğunun karesini s harfi ile gösteriyoruz:

Seçim, (-1, 1) aralığında düzgün bir şekilde dağıtılmış rastgele x ve y dikdörtgen koordinatları atayarak ve daireye ait olmayan noktaların yanı sıra yarıçap vektörünün açısının olduğu merkezi noktayı atarak yapılır. tanımlanmamış. Yani, koşul 0< s < 1. Тогда, как и в случае с Гауссовским распределением на плоскости, угол θ будет распределен равномерно. Это очевидно - количество точек в каждом направлении одинаково, значит каждый угол равновероятен. Но есть и менее очевидный факт - s тоже будет иметь равномерное распределение. Полученные s и θ будут независимы друг от друга. Поэтому мы можем воспользоваться значением s для получения экспоненциального распределения, не генерируя третью случайную величину. Подставим теперь s в формулы (2) вместо v, а вместо тригонометрических функций - их расчет делением координаты на длину радиус-вектора, которая в данном случае является корнем из s:

Makalenin başında olduğu gibi formülleri alıyoruz. Bu yöntemin dezavantajı, daireye dahil olmayan noktaların reddedilmesidir. Yani, üretilen rasgele değişkenlerin yalnızca %78,5'ini kullanmak. Eski bilgisayarlarda, trigonometrik fonksiyonların olmaması hala büyük bir avantajdı. Şimdi, bir işlemci talimatı aynı anda sinüs ve kosinüsü bir anda hesapladığında, bu yöntemlerin hala rekabet edebileceğini düşünüyorum.

Kişisel olarak iki sorum daha var:

  • s'nin değeri neden eşit olarak dağılmıştır?
  • Neden iki normal rasgele değişkenin karelerinin toplamı üstel olarak dağılıyor?
s, yarıçapın karesi olduğu için (basit olması için yarıçap, rastgele bir noktanın konumunu belirten yarıçap vektörünün uzunluğudur), önce yarıçapların nasıl dağıldığını buluruz. Çember üniform olarak dolu olduğundan, r yarıçaplı noktaların sayısının r yarıçaplı çemberin çevresiyle orantılı olduğu açıktır. Bir çemberin çevresi yarıçapı ile orantılıdır. Bu, yarıçapların dağılım yoğunluğunun dairenin merkezinden kenarlarına doğru düzgün bir şekilde arttığı anlamına gelir. Ve yoğunluk fonksiyonu (0, 1) aralığında f(x) = 2x formuna sahiptir. Katsayı 2, böylece grafiğin altındaki şeklin alanı bire eşit olur. Böyle bir yoğunluğun karesi alındığında, üniform hale gelir. Teorik olarak, bu durumda bunun için yoğunluk fonksiyonunu dönüşüm fonksiyonunun türevine (yani x 2'den) bölmek gerekir. Ve görsel olarak şöyle olur:

Normal bir rasgele değişken için benzer bir dönüşüm yapılırsa, karesinin yoğunluk fonksiyonu bir hiperbole benzer olacaktır. Ve normal rasgele değişkenlerin iki karesinin eklenmesi zaten çifte entegrasyonla ilişkili çok daha karmaşık bir süreçtir. Ve sonucun üstel bir dağılım olacağı gerçeği, kişisel olarak, bunu pratik bir yöntemle kontrol etmek veya bir aksiyom olarak kabul etmek bana kalıyor. Ve ilgilenenler için, bu kitaplardan bilgi alarak konuyu daha yakından tanımanızı öneririm:

  • Wentzel E.Ş. Olasılık teorisi
  • Knut D.E. Programlama Sanatı Cilt 2

Sonuç olarak, JavaScript'te normal olarak dağıtılan bir rasgele sayı üretecinin uygulanmasına bir örnek vereceğim:

Gauss() işlevi ( var hazır = yanlış; var saniye = 0,0; this.next = işlev(ortalama, dev) ( ortalama = ortalama == tanımsız ? 0,0: ortalama; dev = dev == tanımsız ? 1,0: dev; if () this.ready) ( this.ready = false; return this.second * dev + ortalama; ) else ( var u, v, s; do ( u = 2.0 * Math.random() - 1.0; v = 2.0 * Math. random() - 1.0; s = u * u + v * v; ) while (s > 1.0 || s == 0.0); var r = Math.sqrt(-2.0 * Math.log(s) / s); this.second = r * u; this.ready = true; r * v * dev + demek; ) ); ) g = new Gauss(); // bir nesne yarat a = g.next(); // bir çift değer oluştur ve ilkini al b = g.next(); // ikinciyi al c = g.next(); // tekrar bir çift değer oluştur ve ilkini al
Ortalama (matematiksel beklenti) ve dev (standart sapma) parametreleri isteğe bağlıdır. Dikkatinizi logaritmanın doğal olduğu gerçeğine çekiyorum.

Bu durumda (5.7)'ye göre dağılım fonksiyonu şu şekli alacaktır:

burada: m matematiksel beklentidir, s standart sapmadır.

Normal dağılım, Alman matematikçi Gauss'tan sonra Gauss olarak da adlandırılır. Rastgele bir değişkenin m,, parametreleriyle normal dağılıma sahip olması şu şekilde gösterilir: N (m, s), burada: m =a =M ;

Oldukça sık olarak, formüllerde matematiksel beklenti şu şekilde gösterilir: A . Bir rasgele değişken N(0,1) yasasına göre dağıtılıyorsa, buna normalleştirilmiş veya standartlaştırılmış normal değer denir. Bunun için dağıtım işlevi şu şekildedir:

.

Normal eğri veya Gauss eğrisi olarak adlandırılan normal dağılımın yoğunluğunun grafiği Şekil 5.4'te gösterilmektedir.

Pirinç. 5.4. Normal dağılım yoğunluğu

Bir rastgele değişkenin sayısal özelliklerinin yoğunluğu ile belirlenmesi bir örnek üzerinde ele alınmıştır.

Örnek 6.

Dağılım yoğunluğu tarafından sürekli bir rastgele değişken verilir: .

Dağılım türünü belirleyin, M(X) matematiksel beklentisini ve D(X) varyansını bulun.

Verilen dağılım yoğunluğunu (5.16) ile karşılaştırarak, m = 4 ile normal dağılım yasasının verildiği sonucuna varabiliriz. Bu nedenle, matematiksel beklenti M(X)=4, varyans D(X)=9.

Standart sapma s=3.

Şu forma sahip Laplace işlevi:

,

normal dağılım fonksiyonu (5.17) ile aşağıdaki ilişki ile ilişkilidir:

F 0 (x) \u003d F (x) + 0,5.

Laplace işlevi tektir.

Ф(-x)=-Ф(x).

Laplace fonksiyonunun Ф(х) değerleri tablo haline getirilir ve x değerine göre tablodan alınır (bkz. Ek 1).

Sürekli bir rastgele değişkenin normal dağılımı, olasılık teorisinde ve gerçekliğin tanımlanmasında önemli bir rol oynar; rastgele doğa olaylarında çok yaygındır. Uygulamada, çok sık olarak, tam olarak birçok rasgele terimin toplamının bir sonucu olarak oluşan rasgele değişkenler vardır. Özellikle ölçüm hatalarının analizi, bunların çeşitli türden hataların toplamı olduğunu gösterir. Uygulama, ölçüm hatalarının olasılık dağılımının normal yasaya yakın olduğunu göstermektedir.

Laplace işlevini kullanarak, normal bir rasgele değişkenin belirli bir aralığa ve belirli bir sapmaya düşme olasılığını hesaplama sorunları çözülebilir.

Düzgün bir sürekli dağılım düşünün. Matematiksel beklenti ve varyansı hesaplayalım. MS EXCEL işlevini kullanarak rastgele değerler üretelimRAND() ve Analysis Package eklentisi ile ortalama ve standart sapmayı değerlendireceğiz.

aynı oranda paylaştırılmış aralıkta, rasgele değişkenin sahip olduğu:

Aralıktan 50 sayıdan oluşan bir dizi oluşturalım )