Tasainen jatkuva jakelu MS EXCELissä. Jatkuvan satunnaismuuttujan jakauman yhtenäiset ja eksponentiaaliset lait

Tätä kysymystä on tutkittu yksityiskohtaisesti pitkään, ja yleisimmin käytetty menetelmä on George Boxin, Mervyn Mullerin ja George Marsaglian vuonna 1958 ehdottama napakoordinaattimenetelmä. Tällä menetelmällä voit saada riippumattoman normaalijakauman satunnaismuuttujan parin, jonka matemaattinen odotusarvo on 0 ja varianssi 1 seuraavasti:

Missä Z 0 ja Z 1 ovat haluttuja arvoja, s = u 2 + v 2 ja u ja v ovat satunnaismuuttujia, jotka jakautuvat tasaisesti välillä (-1, 1) valittuna siten, että ehto 0 täyttyy.< s < 1.
Monet ihmiset käyttävät näitä kaavoja ajattelematta, ja monet eivät edes epäile niiden olemassaoloa, koska he käyttävät valmiita toteutuksia. Mutta on ihmisiä, joilla on kysymyksiä: "Mistä tämä kaava tuli? Ja miksi saat pari määrää kerralla?” Seuraavaksi yritän antaa selkeän vastauksen näihin kysymyksiin.


Aluksi haluan muistuttaa, mitä ovat todennäköisyystiheys, satunnaismuuttujan jakaumafunktio ja käänteisfunktio. Oletetaan, että on olemassa tietty satunnaismuuttuja, jonka jakauman määrittää tiheysfunktio f(x), jolla on seuraava muoto:

Tämä tarkoittaa, että todennäköisyys, että tietyn satunnaismuuttujan arvo on välillä (A, B), on yhtä suuri kuin varjostetun alueen pinta-ala. Ja tämän seurauksena koko varjostetun alueen pinta-alan on oltava yhtä suuri kuin yksi, koska joka tapauksessa satunnaismuuttujan arvo putoaa funktion f määrittelyalueeseen.
Satunnaismuuttujan jakaumafunktio on tiheysfunktion integraali. Ja tässä tapauksessa sen likimääräinen ulkonäkö on seuraava:

Tarkoitus tässä on, että satunnaismuuttujan arvo on pienempi kuin A todennäköisyydellä B. Tämän seurauksena funktio ei koskaan pienene, vaan sen arvot ovat välissä.

Käänteisfunktio on funktio, joka palauttaa argumentin alkuperäiselle funktiolle, jos alkuperäisen funktion arvo välitetään siihen. Esimerkiksi funktiolle x 2 käänteisfunktio on juuren erottamisen funktio, sin(x):lle se on arcsin(x) jne.

Koska useimmat näennäissatunnaislukugeneraattorit tuottavat vain tasaisen jakauman lähtönä, on usein tarve muuntaa se joksikin muuksi. Tässä tapauksessa normaali Gaussin:

Kaikkien menetelmien perustana tasaisen jakauman muuttamiseksi toiseksi on käänteismuunnosmenetelmä. Se toimii seuraavasti. Löytyy funktio, joka on käänteinen vaaditun jakauman funktiolle, ja siihen välitetään argumenttina satunnaismuuttuja, joka jakautuu tasaisesti välillä (0, 1). Lähdöstä saamme arvon vaaditulla jakaumalla. Selvyyden vuoksi tarjoan seuraavan kuvan.

Siten tasainen segmentti ikäänkuin levitetään uuden jakauman mukaisesti, projisoidaan toiselle akselille käänteisfunktion kautta. Mutta ongelmana on, että Gaussin jakauman tiheyden integraalia ei ole helppo laskea, joten yllä olevien tutkijoiden oli huijattava.

On olemassa khin neliöjakauma (Pearson-jakauma), joka on k itsenäisen normaalin satunnaismuuttujan neliösumman jakauma. Ja jos k = 2, tämä jakauma on eksponentiaalinen.

Tämä tarkoittaa, että jos suorakaiteen muotoisessa koordinaatistossa on satunnaiset X- ja Y-koordinaatit, jotka jakautuvat normaalisti, sitten kun nämä koordinaatit on muunnettu napajärjestelmään (r, θ), säteen neliö (etäisyys origosta pisteeseen) jaetaan eksponentiaalisen lain mukaan, koska säteen neliö on koordinaattien neliöiden summa (Pythagoraan lain mukaan). Tällaisten pisteiden jakautumistiheys tasossa näyttää tältä:


Koska se on sama kaikkiin suuntiin, kulmalla θ on tasainen jakautuminen alueella 0 - 2π. Päinvastoin on myös totta: jos määrität pisteen napakoordinaatistossa käyttämällä kahta riippumatonta satunnaismuuttujaa (tasaisesti jakautunut kulma ja eksponentiaalisesti jakautunut säde), tämän pisteen suorakulmaiset koordinaatit ovat itsenäisiä normaaleja satunnaismuuttujia. Ja on paljon helpompaa saada eksponentiaalinen jakauma tasaisesta jakaumasta samalla käänteismuunnosmenetelmällä. Tämä on polaarisen Box-Muller-menetelmän ydin.
Nyt johdetaan kaavat.

(1)

R:n ja θ:n saamiseksi on generoitava kaksi satunnaismuuttujaa, jotka jakautuvat tasaisesti välille (0, 1) (kutsutaanko niitä u:ksi ja v:ksi), joista toisen jakauma (oletetaan v) on muutettava eksponentiaaliseksi. saada säde. Eksponenttijakaumafunktio näyttää tältä:

Sen käänteisfunktio on:

Koska tasainen jakautuminen on symmetrinen, muunnos toimii samalla tavalla funktion kanssa

Khin-neliöjakaumakaavasta seuraa, että λ = 0,5. Korvaa λ, v tähän funktioon ja hanki säteen neliö ja sitten itse säde:

Saadaan kulma venyttämällä yksikkösegmenttiä arvoon 2π:

Nyt korvataan r ja θ kaavoihin (1) ja saadaan:

(2)

Nämä kaavat ovat jo valmiita käyttöön. X ja Y ovat riippumattomia ja normaalijakautuneita varianssilla 1 ja matemaattisella odotuksella 0. Muilla ominaisuuksilla olevan jakauman saamiseksi riittää, että funktion tulos kerrotaan keskihajonnalla ja lasketaan yhteen matemaattinen odotus.
Mutta trigonometrisista funktioista on mahdollista päästä eroon määrittämällä kulmaa ei suoraan, vaan epäsuorasti ympyrän satunnaisen pisteen suorakulmaisten koordinaattien kautta. Sitten näiden koordinaattien kautta on mahdollista laskea sädevektorin pituus ja löytää sitten kosini ja sini jakamalla x ja y sillä. Miten ja miksi se toimii?
Valitaan satunnainen piste niistä, jotka jakautuvat tasaisesti yksikkösäteen ympyrään ja merkitään tämän pisteen sädevektorin pituuden neliö kirjaimella s:

Valinta tehdään määrittämällä satunnaiset suorakulmaiset koordinaatit x ja y, jotka jakautuvat tasaisesti välissä (-1, 1), ja hylkäämällä pisteet, jotka eivät kuulu ympyrään, sekä keskipiste, jossa sädevektorin kulma ei ole määritelty. Eli ehdon 0 on täytyttävä< s < 1. Тогда, как и в случае с Гауссовским распределением на плоскости, угол θ будет распределен равномерно. Это очевидно - количество точек в каждом направлении одинаково, значит каждый угол равновероятен. Но есть и менее очевидный факт - s тоже будет иметь равномерное распределение. Полученные s и θ будут независимы друг от друга. Поэтому мы можем воспользоваться значением s для получения экспоненциального распределения, не генерируя третью случайную величину. Подставим теперь s в формулы (2) вместо v, а вместо тригонометрических функций - их расчет делением координаты на длину радиус-вектора, которая в данном случае является корнем из s:

Saamme kaavat kuten artikkelin alussa. Tämän menetelmän haittana on, että se hylkää pisteet, jotka eivät sisälly ympyrään. Eli käytetään vain 78,5 % luoduista satunnaismuuttujista. Vanhemmissa tietokoneissa trigonometriatoimintojen puute oli edelleen suuri etu. Nyt kun yksi prosessorikomento laskee sekä sinin että kosinin hetkessä, uskon, että nämä menetelmät voivat silti kilpailla.

Henkilökohtaisesti minulla on vielä kaksi kysymystä:

  • Miksi s:n arvo jakautuu tasaisesti?
  • Miksi kahden normaalin satunnaismuuttujan neliöiden summa jakautuu eksponentiaalisesti?
Koska s on säteen neliö (yksinkertaisuuden vuoksi kutsun sädettä sen sädevektorin pituudeksi, joka määrittää satunnaisen pisteen sijainnin), selvitetään ensin, kuinka säteet jakautuvat. Koska ympyrä on täytetty tasaisesti, on selvää, että pisteiden lukumäärä, joiden säde on r, on verrannollinen säteisen r ympyrän pituuteen. Ja ympyrän ympärysmitta on verrannollinen säteeseen. Tämä tarkoittaa, että säteiden jakautumistiheys kasvaa tasaisesti ympyrän keskustasta sen reunoihin. Ja tiheysfunktiolla on muoto f(x) = 2x välillä (0, 1). Kerroin 2 niin, että kaavion alla olevan kuvan pinta-ala on yksi. Kun tämä tiheys on neliöity, siitä tulee tasainen. Koska teoriassa tässä tapauksessa on välttämätöntä jakaa tiheysfunktio sen muunnosfunktion derivaatalla (eli x 2). Ja ilmeisesti se tapahtuu näin:

Jos samanlainen muunnos tehdään normaalille satunnaismuuttujalle, niin sen neliön tiheysfunktio osoittautuu samankaltaiseksi kuin hyperbola. Ja kahden normaalien satunnaismuuttujien neliön lisääminen on paljon monimutkaisempi prosessi, joka liittyy kaksoisintegraatioon. Ja se, että tuloksena tulee eksponentiaalinen jakauma, minun on henkilökohtaisesti vain tarkistettava käytännön menetelmällä tai hyväksyttävä aksioomana. Ja niille, jotka ovat kiinnostuneita, ehdotan, että tutustut aiheeseen tarkemmin ja hankit tietoa näistä kirjoista:

  • Ventzel E.S. Todennäköisyysteoria
  • Knut D.E. Ohjelmoinnin taito, osa 2

Lopuksi tässä on esimerkki normaalijakauman satunnaislukugeneraattorin toteuttamisesta JavaScriptissä:

Funktio Gauss() ( var ready = false; var second = 0.0; this.next = function(keskiarvo, dev) ( keskiarvo = keskiarvo == määrittelemätön ? 0.0: keskiarvo; dev = dev == määrittelemätön ? 1.0: dev; if ( this.ready) ( this.ready = false; palauta this.second * dev + mean; ) else ( var u, v, s; do ( u = 2.0 * Math.random() - 1.0; v = 2.0 * Math. satunnainen() - 1,0; s = u * u + v * v; ) while (s > 1,0 || s == 0,0); var r = Math.sqrt(-2,0 * Math.log(s) / s); this.second = r * u; this.ready = tosi; paluu r * v * dev + keskiarvo; ) ); ) g = new Gauss(); // objektin luominen a = g.next(); // luo arvopari ja hanki ensimmäinen b = g.next(); // hanki toinen c = g.next(); // luo arvopari uudelleen ja hanki ensimmäinen
Parametrit keskiarvo (matemaattinen odotus) ja dev (keskihajonta) ovat valinnaisia. Kiinnitän huomionne siihen tosiasiaan, että logaritmi on luonnollinen.

Jakaumafunktio on tässä tapauksessa kohdan (5.7) mukaan muodossa:

missä: m – matemaattinen odotusarvo, s – keskihajonta.

Normaalijakaumaa kutsutaan myös Gaussiseksi saksalaisen matemaatikon Gaussin mukaan. Se tosiasia, että satunnaismuuttujalla on normaalijakauma parametrein: m, merkitään seuraavasti: N (m,s), missä: m =a =M ;

Melko usein kaavoissa matemaattinen odotus on merkitty A . Jos satunnaismuuttuja jakautuu lain N(0,1) mukaan, niin sitä kutsutaan normalisoiduksi tai standardoiduksi normaalimuuttujaksi. Sen jakelufunktiolla on muoto:

.

Normaalijakauman tiheyskäyrä, jota kutsutaan normaaliksi tai Gaussin käyräksi, on esitetty kuvassa 5.4.

Riisi. 5.4. Normaalijakauman tiheys

Satunnaismuuttujan numeeristen ominaisuuksien määrittämistä sen tiheydellä tarkastellaan esimerkin avulla.

Esimerkki 6.

Jatkuva satunnaismuuttuja määritellään jakautumistiheydellä: .

Määritä jakauman tyyppi, löydä matemaattinen odotus M(X) ja varianssi D(X).

Vertaamalla annettua jakautumistiheyttä (5.16) voidaan päätellä, että normaalijakauman laki m = 4 on annettu. Siksi matemaattinen odotus M(X)=4, varianssi D(X)=9.

Keskihajonta s=3.

Laplace-funktio, jonka muoto on:

,

liittyy normaalijakaumafunktioon (5.17), relaatio:

F 0 (x) = Ф(x) + 0,5.

Laplace-funktio on outo.

Ф(-x)=-Ф(x).

Laplacen funktion Ф(х) arvot on taulukoitu ja otettu taulukosta x:n arvon mukaan (katso liite 1).

Jatkuvan satunnaismuuttujan normaalijakaumalla on tärkeä rooli todennäköisyysteoriassa ja todellisuuden kuvaamisessa, se on hyvin yleistä satunnaisissa luonnonilmiöissä. Käytännössä kohtaamme hyvin usein satunnaismuuttujia, jotka muodostuvat juuri monien satunnaistermien summauksen tuloksena. Erityisesti mittausvirheiden analyysi osoittaa, että ne ovat erityyppisten virheiden summa. Käytäntö osoittaa, että mittausvirheiden todennäköisyysjakauma on lähellä normaalilakia.

Laplace-funktion avulla voit ratkaista ongelman laskea todennäköisyys putoaa tiettyyn väliin ja normaalin satunnaismuuttujan tiettyyn poikkeamaan.

Harkitse tasaista jatkuvaa jakautumista. Lasketaan matemaattinen odotus ja varianssi. Luodaan satunnaisia ​​arvoja MS EXCEL -toiminnollaRAND() ja Analysis Package -lisäosat, arvioimme keskiarvon ja keskihajonnan.

Tasaisesti jaettu segmentissä satunnaismuuttujalla on:

Luodaan 50 luvun joukko alueelta)