Natimbang na pagkakaiba-iba. Pagpapakalat ng isang discrete random variable

Pagpapakalatrandom variable- isang sukatan ng pagpapakalat ng isang naibigay random variable, iyon ay, siya mga paglihis mula sa inaasahan sa matematika. Sa mga istatistika, ang notasyon (sigma squared) ay kadalasang ginagamit upang tukuyin ang pagkakaiba. Ang square root ng variance ay tinatawag karaniwang lihis o karaniwang pagkalat. Ang karaniwang paglihis ay sinusukat sa parehong mga yunit bilang ang random na variable mismo, at ang pagkakaiba ay sinusukat sa mga parisukat ng yunit na iyon.

Bagama't napakaginhawang gumamit lamang ng isang halaga (tulad ng mean o mode at median) upang tantyahin ang buong sample, madaling humantong ang diskarteng ito sa mga maling konklusyon. Ang dahilan para sa sitwasyong ito ay hindi nakasalalay sa halaga mismo, ngunit sa katotohanan na ang isang halaga ay hindi sa anumang paraan ay sumasalamin sa pagkalat ng mga halaga ng data.

Halimbawa, sa sample:

ang average ay 5.

Gayunpaman, walang elemento sa mismong sample na may halagang 5. Maaaring kailanganin mong malaman kung gaano kalapit ang bawat elemento ng sample sa ibig sabihin ng halaga nito. O, sa madaling salita, kailangan mong malaman ang pagkakaiba-iba ng mga halaga. Ang pag-alam sa lawak kung saan ang data ay nagbago, maaari mong mas mahusay na bigyang-kahulugan ibig sabihin, panggitna at fashion. Ang antas ng pagbabago sa mga halaga ng sample ay tinutukoy sa pamamagitan ng pagkalkula ng kanilang pagkakaiba-iba at karaniwang paglihis.



Ang variance at ang square root ng variance, na tinatawag na standard deviation, ay nagpapakilala sa mean deviation mula sa sample mean. Sa dalawang dami na ito, ang pinakamahalaga ay karaniwang lihis. Ang halagang ito ay maaaring katawanin bilang ang average na distansya kung saan ang mga elemento ay mula sa gitnang elemento ng sample.

Ang pagpapakalat ay mahirap bigyang kahulugan. Gayunpaman, ang parisukat na ugat ng halagang ito ay ang karaniwang paglihis at angkop ito sa interpretasyon.

Ang karaniwang paglihis ay kinakalkula sa pamamagitan ng unang pagtukoy sa pagkakaiba at pagkatapos ay pagkalkula ng square root ng variance.

Halimbawa, para sa array ng data na ipinapakita sa figure, ang mga sumusunod na halaga ay makukuha:

Larawan 1

Dito, ang ibig sabihin ng squared differences ay 717.43. Upang makuha ang karaniwang paglihis, nananatili lamang na kunin ang square root ng numerong ito.

Ang resulta ay humigit-kumulang 26.78.

Dapat tandaan na ang karaniwang paglihis ay binibigyang kahulugan bilang ang average na distansya kung saan ang mga elemento ay mula sa sample mean.

Ang karaniwang paglihis ay nagpapakita kung gaano kahusay na inilalarawan ng mean ang buong sample.

Sabihin nating ikaw ang pinuno ng departamento ng produksyon para sa pag-assemble ng PC. Sinasabi ng quarterly report na ang output para sa huling quarter ay 2500 PCs. Masama ba o mabuti? Hiniling mo (o mayroon nang column na ito sa ulat) na ipakita ang karaniwang paglihis para sa data na ito sa ulat. Ang karaniwang numero ng paglihis, halimbawa, ay 2000. Nagiging malinaw sa iyo, bilang pinuno ng departamento, na ang linya ng produksyon ay nangangailangan ng mas mahusay na kontrol (masyadong malalaking paglihis sa bilang ng mga PC na binuo).

Alalahanin na kapag ang standard deviation ay malaki, ang data ay malawak na nakakalat sa paligid ng mean, at kapag ang standard deviation ay maliit, ito ay kumpol malapit sa mean.

Apat na istatistikal na function na VARP(), VARP(), STDEV() at STDEV() ay idinisenyo upang kalkulahin ang variance at standard deviation ng mga numero sa isang hanay ng mga cell. Bago mo makalkula ang variance at standard deviation ng isang set ng data, kailangan mong tukuyin kung ang data ay kumakatawan sa populasyon o isang sample ng populasyon. Sa kaso ng sample mula sa pangkalahatang populasyon, dapat gamitin ang VARP() at STDEV() function, at sa kaso ng pangkalahatang populasyon, dapat gamitin ang VARP() at STDEV() function:

Populasyon Function

VARP()

STDLONG()
Sample

VARI()

STDEV()

Ang pagkakaiba-iba (pati na rin ang karaniwang paglihis), tulad ng nabanggit namin, ay nagpapahiwatig ng lawak kung saan ang mga halaga na kasama sa set ng data ay nakakalat sa paligid ng arithmetic mean.

Ang isang maliit na halaga ng variance o standard deviation ay nagpapahiwatig na ang lahat ng data ay nakasentro sa paligid ng arithmetic mean, at ang isang malaking halaga ng mga halagang ito ay nagpapahiwatig na ang data ay nakakalat sa isang malawak na hanay ng mga halaga.

Ang pagkakaiba ay medyo mahirap bigyang kahulugan (ano ang ibig sabihin ng isang maliit na halaga, isang malaking halaga?). Pagganap Mga Gawain 3 ay magbibigay-daan sa iyong biswal, sa isang graph, na ipakita ang kahulugan ng pagkakaiba para sa isang set ng data.

Mga gawain

· Ehersisyo 1.

· 2.1. Ibigay ang mga konsepto: variance at standard deviation; ang kanilang simbolikong pagtatalaga sa pagpoproseso ng istatistikal na datos.

· 2.2. Gumuhit ng worksheet alinsunod sa Figure 1 at gawin ang mga kinakailangang kalkulasyon.

· 2.3. Ibigay ang mga pangunahing formula na ginamit sa mga kalkulasyon

· 2.4. Ipaliwanag ang lahat ng notasyon ( , , )

· 2.5. Ipaliwanag ang praktikal na kahulugan ng konsepto ng variance at standard deviation.

Gawain 2.

1.1. Ibigay ang mga konsepto: pangkalahatang populasyon at sample; mathematical expectation at arithmetic mean ng kanilang symbolic designation sa statistical data processing.

1.2. Alinsunod sa Figure 2, gumuhit ng worksheet at gumawa ng mga kalkulasyon.

1.3. Ibigay ang mga pangunahing formula na ginamit sa mga kalkulasyon (para sa pangkalahatang populasyon at sample).

Figure 2

1.4. Ipaliwanag kung bakit posible na makakuha ng mga halaga ng arithmetic na paraan sa mga sample bilang 46.43 at 48.78 (tingnan ang Apendise ng file). Sa pangkalahatan.

Gawain 3.

Mayroong dalawang sample na may magkaibang hanay ng data, ngunit ang average para sa kanila ay magiging pareho:

Larawan 3

3.1. Gumuhit ng worksheet alinsunod sa Figure 3 at gawin ang mga kinakailangang kalkulasyon.

3.2. Ibigay ang mga pangunahing formula ng pagkalkula.

3.3. Bumuo ng mga graph alinsunod sa mga figure 4, 5.

3.4. Ipaliwanag ang mga nagresultang dependencies.

3.5. Magsagawa ng mga katulad na kalkulasyon para sa dalawang sample na ito.

Paunang sample 11119999

Piliin ang mga halaga ng pangalawang sample upang ang ibig sabihin ng aritmetika para sa pangalawang sample ay pareho, halimbawa:

Piliin mo ang mga halaga para sa pangalawang sample. Ayusin ang mga kalkulasyon at paglalagay tulad ng mga figure 3, 4, 5. Ipakita ang mga pangunahing formula na ginamit sa mga kalkulasyon.

Gumuhit ng angkop na konklusyon.

Ang lahat ng mga gawain ay dapat iharap sa anyo ng isang ulat na may lahat ng kinakailangang mga numero, mga graph, mga formula at maikling paliwanag.

Tandaan: ang pagbuo ng mga graph ay dapat ipaliwanag na may mga figure at maikling paliwanag.

Ang pagpapakalat ng isang random na variable ay isang sukatan ng pagkalat ng mga halaga ng variable na ito. Ang maliit na pagkakaiba-iba ay nangangahulugan na ang mga halaga ay naka-cluster malapit sa isa't isa. Ang isang malaking pagkakaiba ay nagpapahiwatig ng isang malakas na scatter ng mga halaga. Ang konsepto ng pagpapakalat ng isang random na variable ay ginagamit sa mga istatistika. Halimbawa, kung ihahambing mo ang pagkakaiba-iba ng mga halaga ng dalawang dami (tulad ng mga resulta ng mga obserbasyon ng mga pasyenteng lalaki at babae), maaari mong subukan ang kahalagahan ng ilang variable. Ginagamit din ang pagkakaiba-iba kapag gumagawa ng mga istatistikal na modelo, dahil ang maliit na pagkakaiba ay maaaring maging senyales na ikaw ay nag-overfitting sa mga halaga.

Mga hakbang

Sample na Pagkalkula ng Variance

  1. Itala ang mga sample na halaga. Sa karamihan ng mga kaso, mga sample lang ng ilang partikular na populasyon ang available sa mga statistician. Halimbawa, bilang panuntunan, hindi sinusuri ng mga istatistika ang halaga ng pagpapanatili ng populasyon ng lahat ng mga kotse sa Russia - sinusuri nila ang isang random na sample ng ilang libong mga kotse. Ang ganitong sample ay makakatulong na matukoy ang average na gastos sa bawat kotse, ngunit malamang, ang resultang halaga ay malayo sa tunay.

    • Halimbawa, suriin natin ang bilang ng mga bun na ibinebenta sa isang cafe sa loob ng 6 na araw, na kinuha sa random na pagkakasunud-sunod. Ang sample ay may sumusunod na anyo: 17, 15, 23, 7, 9, 13. Ito ay isang sample, hindi isang populasyon, dahil wala kaming data sa mga bun na ibinebenta para sa bawat araw na bukas ang cafe.
    • Kung binigyan ka ng isang populasyon at hindi isang sample ng mga halaga, lumaktaw sa susunod na seksyon.
  2. Isulat ang formula para sa pagkalkula ng sample variance. Ang pagpapakalat ay isang sukatan ng pagkalat ng mga halaga ng ilang dami. Kung mas malapit ang halaga ng pagpapakalat sa zero, mas malapit ang mga halaga ay pinagsama-sama. Kapag nagtatrabaho sa isang sample ng mga halaga, gamitin ang sumusunod na formula upang kalkulahin ang pagkakaiba:

    • s 2 (\displaystyle s^(2)) = ∑[(x i (\displaystyle x_(i))-x̅) 2 (\displaystyle ^(2))] / (n - 1)
    • s 2 (\displaystyle s^(2)) ay ang pagpapakalat. Ang dispersion ay sinusukat sa square units.
    • x i (\displaystyle x_(i))- bawat halaga sa sample.
    • x i (\displaystyle x_(i)) kailangan mong ibawas ang xᅳ, parisukat ito, at pagkatapos ay idagdag ang mga resulta.
    • xᅳ – sample mean (sample mean).
    • n ay ang bilang ng mga halaga sa sample.
  3. Kalkulahin ang sample mean. Ito ay tinutukoy bilang xᅳ. Ang sample mean ay nakalkula tulad ng isang normal na arithmetic mean: idagdag ang lahat ng mga halaga sa sample, at pagkatapos ay hatiin ang resulta sa bilang ng mga halaga sa sample.

    • Sa aming halimbawa, idagdag ang mga halaga sa sample: 15 + 17 + 23 + 7 + 9 + 13 = 84
      Ngayon hatiin ang resulta sa bilang ng mga halaga sa sample (sa aming halimbawa ay mayroong 6): 84 ÷ 6 = 14.
      Halimbawang ibig sabihin xᅳ = 14.
    • Ang sample mean ay ang sentral na halaga kung saan ipinamamahagi ang mga halaga sa sample. Kung ang mga halaga sa sample cluster sa paligid ng sample ay nangangahulugan, kung gayon ang pagkakaiba ay maliit; kung hindi, ang pagpapakalat ay malaki.
  4. Ibawas ang sample mean sa bawat value sa sample. Ngayon kalkulahin ang pagkakaiba x i (\displaystyle x_(i))- xᅳ, saan x i (\displaystyle x_(i))- bawat halaga sa sample. Ang bawat resulta na nakuha ay nagpapahiwatig ng lawak kung saan ang isang partikular na halaga ay lumihis mula sa sample mean, iyon ay, kung gaano kalayo ang halagang ito mula sa sample mean.

    • Sa aming halimbawa:
      x 1 (\displaystyle x_(1))- x̅ = 17 - 14 = 3
      x 2 (\displaystyle x_(2))- x̅ = 15 - 14 = 1
      x 3 (\displaystyle x_(3))- xᅳ = 23 - 14 = 9
      x 4 (\displaystyle x_(4))- x̅ = 7 - 14 = -7
      x 5 (\displaystyle x_(5))- x̅ = 9 - 14 = -5
      x 6 (\displaystyle x_(6))- x̅ = 13 - 14 = -1
    • Ang kawastuhan ng mga resultang nakuha ay madaling i-verify, dahil ang kanilang kabuuan ay dapat na katumbas ng zero. Ito ay nauugnay sa pagpapasiya ng average na halaga, dahil ang mga negatibong halaga (distansya mula sa average na halaga hanggang sa mas maliit na halaga) ay ganap na na-offset ng mga positibong halaga (distansya mula sa average na halaga hanggang sa mas malaking halaga).
  5. Tulad ng nabanggit sa itaas, ang kabuuan ng mga pagkakaiba x i (\displaystyle x_(i))- Dapat ay katumbas ng zero ang xᅳ. Nangangahulugan ito na ang ibig sabihin ng pagkakaiba ay palaging zero, na hindi nagbibigay ng anumang ideya ng pagkalat ng mga halaga ng ilang dami. Upang malutas ang problemang ito, parisukat ang bawat pagkakaiba x i (\displaystyle x_(i))- xᅳ. Magreresulta ito sa pagkuha mo lamang ng mga positibong numero na, kapag pinagsama-sama, ay hindi kailanman magdadagdag ng hanggang 0.

    • Sa aming halimbawa:
      (x 1 (\displaystyle x_(1))-x̅) 2 = 3 2 = 9 (\displaystyle ^(2)=3^(2)=9)
      (x 2 (\displaystyle (x_(2)))-x̅) 2 = 1 2 = 1 (\displaystyle ^(2)=1^(2)=1)
      9 2 = 81
      (-7) 2 = 49
      (-5) 2 = 25
      (-1) 2 = 1
    • Natagpuan mo ang parisukat ng pagkakaiba - x̅) 2 (\displaystyle ^(2)) para sa bawat halaga sa sample.
  6. Kalkulahin ang kabuuan ng mga squared differences. Iyon ay, hanapin ang bahagi ng formula na nakasulat tulad nito: ∑[( x i (\displaystyle x_(i))-x̅) 2 (\displaystyle ^(2))]. Dito ang sign na Σ ay nangangahulugang ang kabuuan ng mga parisukat na pagkakaiba para sa bawat halaga x i (\displaystyle x_(i)) sa sample. Nahanap mo na ang mga squared differences (x i (\displaystyle (x_(i)))-x̅) 2 (\displaystyle ^(2)) para sa bawat halaga x i (\displaystyle x_(i)) sa sample; ngayon idagdag lamang ang mga parisukat na ito.

    • Sa aming halimbawa: 9 + 1 + 81 + 49 + 25 + 1 = 166 .
  7. Hatiin ang resulta sa n - 1, kung saan ang n ay ang bilang ng mga halaga sa sample. Ilang oras na ang nakalipas, upang kalkulahin ang sample na pagkakaiba, hinati lang ng mga istatistika ang resulta sa n; sa kasong ito, makukuha mo ang mean ng squared variance, na mainam para sa paglalarawan ng variance ng isang ibinigay na sample. Ngunit tandaan na ang anumang sample ay maliit na bahagi lamang ng pangkalahatang populasyon ng mga halaga. Kung kukuha ka ng ibang sample at gagawin ang parehong mga kalkulasyon, makakakuha ka ng ibang resulta. Sa lumalabas, ang paghahati sa n - 1 (sa halip na n lang) ay nagbibigay ng mas mahusay na pagtatantya ng pagkakaiba-iba ng populasyon, na siyang hinahanap mo. Ang paghahati sa n - 1 ay naging karaniwan, kaya ito ay kasama sa formula para sa pagkalkula ng sample na pagkakaiba.

    • Sa aming halimbawa, ang sample ay may kasamang 6 na halaga, iyon ay, n = 6.
      Sample na pagkakaiba = s 2 = 166 6 − 1 = (\displaystyle s^(2)=(\frac (166)(6-1))=) 33,2
  8. Ang pagkakaiba sa pagitan ng pagkakaiba at ang karaniwang paglihis. Tandaan na ang formula ay naglalaman ng isang exponent, kaya ang pagkakaiba ay sinusukat sa mga square unit ng nasuri na halaga. Minsan ang naturang halaga ay medyo mahirap gamitin; sa mga ganitong kaso, ginagamit ang standard deviation, na katumbas ng square root ng variance. Iyon ang dahilan kung bakit ang sample na pagkakaiba ay tinutukoy bilang s 2 (\displaystyle s^(2)), at ang sample na standard deviation bilang s (\displaystyle s).

    • Sa aming halimbawa, ang sample na standard deviation ay: s = √33.2 = 5.76.

    Pagkalkula ng pagkakaiba-iba ng populasyon

    1. Suriin ang ilang hanay ng mga halaga. Kasama sa set ang lahat ng mga halaga ng dami na isinasaalang-alang. Halimbawa, kung pinag-aaralan mo ang edad ng mga residente ng rehiyon ng Leningrad, kung gayon ang populasyon ay kasama ang edad ng lahat ng residente ng rehiyong ito. Sa kaso ng pagtatrabaho sa isang pinagsama-samang, inirerekumenda na lumikha ng isang talahanayan at ipasok ang mga halaga ng pinagsama-samang ito. Isaalang-alang ang sumusunod na halimbawa:

      • Mayroong 6 na aquarium sa isang partikular na silid. Ang bawat aquarium ay naglalaman ng sumusunod na bilang ng mga isda:
        x 1 = 5 (\displaystyle x_(1)=5)
        x 2 = 5 (\displaystyle x_(2)=5)
        x 3 = 8 (\displaystyle x_(3)=8)
        x 4 = 12 (\displaystyle x_(4)=12)
        x 5 = 15 (\displaystyle x_(5)=15)
        x 6 = 18 (\displaystyle x_(6)=18)
    2. Isulat ang formula para sa pagkalkula ng pagkakaiba-iba ng populasyon. Dahil ang populasyon ay kasama ang lahat ng mga halaga ng isang tiyak na dami, ang sumusunod na formula ay nagbibigay-daan sa iyo upang makuha ang eksaktong halaga ng pagkakaiba-iba ng populasyon. Upang makilala ang pagkakaiba ng populasyon mula sa sample na pagkakaiba (na isang pagtatantya lamang), gumagamit ang mga istatistika ng iba't ibang mga variable:

      • σ 2 (\displaystyle ^(2)) = (∑(x i (\displaystyle x_(i)) - μ) 2 (\displaystyle ^(2))) / n
      • σ 2 (\displaystyle ^(2))- pagkakaiba-iba ng populasyon (basahin bilang "sigma squared"). Ang dispersion ay sinusukat sa square units.
      • x i (\displaystyle x_(i))- bawat halaga sa pinagsama-samang.
      • Ang Σ ay ang tanda ng kabuuan. Iyon ay, para sa bawat halaga x i (\displaystyle x_(i)) ibawas ang μ, parisukat ito, at pagkatapos ay idagdag ang mga resulta.
      • μ ay ang ibig sabihin ng populasyon.
      • n ay ang bilang ng mga halaga sa pangkalahatang populasyon.
    3. Kalkulahin ang ibig sabihin ng populasyon. Kapag nagtatrabaho sa pangkalahatang populasyon, ang average na halaga nito ay tinutukoy bilang μ (mu). Ang ibig sabihin ng populasyon ay kinakalkula bilang karaniwang ibig sabihin ng aritmetika: idagdag ang lahat ng mga halaga sa populasyon, at pagkatapos ay hatiin ang resulta sa bilang ng mga halaga sa populasyon.

      • Tandaan na ang mga average ay hindi palaging kinakalkula bilang arithmetic mean.
      • Sa aming halimbawa, ang ibig sabihin ng populasyon ay: μ = 5 + 5 + 8 + 12 + 15 + 18 6 (\displaystyle (\frac (5+5+8+12+15+18)(6))) = 10,5
    4. Ibawas ang ibig sabihin ng populasyon sa bawat halaga sa populasyon. Kung mas malapit ang halaga ng pagkakaiba sa zero, mas malapit ang partikular na halaga sa ibig sabihin ng populasyon. Hanapin ang pagkakaiba sa pagitan ng bawat halaga sa populasyon at ang ibig sabihin nito, at makikita mo ang unang pagtingin sa pamamahagi ng mga halaga.

      • Sa aming halimbawa:
        x 1 (\displaystyle x_(1))- μ = 5 - 10.5 = -5.5
        x 2 (\displaystyle x_(2))- μ = 5 - 10.5 = -5.5
        x 3 (\displaystyle x_(3))- μ = 8 - 10.5 = -2.5
        x 4 (\displaystyle x_(4))- μ = 12 - 10.5 = 1.5
        x 5 (\displaystyle x_(5))- μ = 15 - 10.5 = 4.5
        x 6 (\displaystyle x_(6))- μ = 18 - 10.5 = 7.5
    5. Square bawat resulta na makukuha mo. Ang mga halaga ng pagkakaiba ay parehong positibo at negatibo; kung ilalagay mo ang mga halagang ito sa isang linya ng numero, magsisinungaling sila sa kanan at kaliwa ng ibig sabihin ng populasyon. Hindi ito maganda para sa pagkalkula ng pagkakaiba, dahil ang mga positibo at negatibong numero ay magkakansela sa isa't isa. Samakatuwid, parisukat ang bawat pagkakaiba upang makakuha ng mga eksklusibong positibong numero.

      • Sa aming halimbawa:
        (x i (\displaystyle x_(i)) - μ) 2 (\displaystyle ^(2)) para sa bawat halaga ng populasyon (mula i = 1 hanggang i = 6):
        (-5,5)2 (\displaystyle ^(2)) = 30,25
        (-5,5)2 (\displaystyle ^(2)), saan x n (\displaystyle x_(n)) ay ang huling halaga sa populasyon.
      • Upang kalkulahin ang average na halaga ng mga resulta na nakuha, kailangan mong hanapin ang kanilang kabuuan at hatiin ito sa n: (( x 1 (\displaystyle x_(1)) - μ) 2 (\displaystyle ^(2)) + (x 2 (\displaystyle x_(2)) - μ) 2 (\displaystyle ^(2)) + ... + (x n (\displaystyle x_(n)) - μ) 2 (\displaystyle ^(2))) / n
      • Ngayon isulat natin ang paliwanag sa itaas gamit ang mga variable: (∑( x i (\displaystyle x_(i)) - μ) 2 (\displaystyle ^(2))) / n at kumuha ng formula para sa pagkalkula ng pagkakaiba-iba ng populasyon.

Ang dispersion ay isang sukatan ng dispersion na naglalarawan ng kamag-anak na paglihis sa pagitan ng mga halaga ng data at ang ibig sabihin. Ito ang pinakakaraniwang ginagamit na sukat ng dispersion sa mga istatistika, na kinakalkula sa pamamagitan ng pagsusuma, squared, ang paglihis ng bawat halaga ng data mula sa mean. Ang formula para sa pagkalkula ng pagkakaiba ay ipinapakita sa ibaba:

s 2 - sample na pagkakaiba-iba;

x cf ay ang ibig sabihin ng halaga ng sample;

n laki ng sample (bilang ng mga halaga ng data),

(x i – x cf) ay ang paglihis mula sa mean na halaga para sa bawat halaga ng set ng data.

Upang mas maunawaan ang formula, tingnan natin ang isang halimbawa. Hindi naman ako mahilig magluto kaya bihira lang ako. Gayunpaman, upang hindi mamatay sa gutom, paminsan-minsan ay kailangan kong pumunta sa kalan upang ipatupad ang plano na ibabad ang aking katawan sa mga protina, taba at carbohydrates. Ipinapakita ng set ng data sa ibaba kung gaano karaming beses nagluluto ng pagkain si Renat bawat buwan:

Ang unang hakbang sa pagkalkula ng pagkakaiba ay upang matukoy ang sample mean, na sa aming halimbawa ay 7.8 beses sa isang buwan. Ang natitirang mga kalkulasyon ay maaaring mapadali sa tulong ng sumusunod na talahanayan.

Ang huling yugto ng pagkalkula ng pagkakaiba ay ganito ang hitsura:

Para sa mga gustong gawin ang lahat ng mga kalkulasyon nang sabay-sabay, ang equation ay magiging ganito:

Gamit ang paraan ng raw count (halimbawa sa pagluluto)

Mayroong mas mahusay na paraan upang kalkulahin ang pagkakaiba, na kilala bilang ang "raw counting" na paraan. Bagaman sa unang sulyap ang equation ay maaaring mukhang medyo masalimuot, sa katunayan hindi ito nakakatakot. Maaari mong i-verify ito, at pagkatapos ay magpasya kung aling paraan ang pinakagusto mo.

ay ang kabuuan ng bawat halaga ng data pagkatapos i-squaring,

ay ang parisukat ng kabuuan ng lahat ng mga halaga ng data.

Huwag masiraan ng isip ngayon. Ilagay natin ang lahat sa anyo ng isang talahanayan, at pagkatapos ay makikita mo na mayroong mas kaunting mga kalkulasyon dito kaysa sa nakaraang halimbawa.

Tulad ng nakikita mo, ang resulta ay pareho sa paggamit ng nakaraang pamamaraan. Ang mga pakinabang ng pamamaraang ito ay nagiging maliwanag habang lumalaki ang laki ng sample (n).

Pagkalkula ng pagkakaiba-iba sa Excel

Tulad ng malamang na nahulaan mo na, ang Excel ay may formula na nagbibigay-daan sa iyong kalkulahin ang pagkakaiba. Bukod dito, simula sa Excel 2010, makakahanap ka ng 4 na uri ng dispersion formula:

1) VAR.V - Ibinabalik ang pagkakaiba ng sample. Binabalewala ang mga halaga at teksto ng Boolean.

2) VAR.G - Ibinabalik ang pagkakaiba-iba ng populasyon. Binabalewala ang mga halaga at teksto ng Boolean.

3) VASP - Ibinabalik ang sample na variance, na isinasaalang-alang ang mga halaga ng boolean at text.

4) VARP - Ibinabalik ang pagkakaiba ng populasyon, na isinasaalang-alang ang lohikal at mga halaga ng teksto.

Una, tingnan natin ang pagkakaiba sa pagitan ng isang sample at isang populasyon. Ang layunin ng mga deskriptibong istatistika ay upang buod o magpakita ng data sa paraang mabilis na makakuha ng isang malaking larawan, kumbaga, isang pangkalahatang-ideya. Nagbibigay-daan sa iyo ang statistic inference na gumawa ng mga inferences tungkol sa isang populasyon batay sa isang sample ng data mula sa populasyon na ito. Kinakatawan ng populasyon ang lahat ng posibleng resulta o sukat na interesado sa atin. Ang sample ay isang subset ng isang populasyon.

Halimbawa, interesado kami sa kabuuan ng isang pangkat ng mga mag-aaral mula sa isa sa mga unibersidad ng Russia at kailangan naming matukoy ang average na marka ng grupo. Maaari naming kalkulahin ang average na pagganap ng mga mag-aaral, at pagkatapos ay ang resultang figure ay magiging isang parameter, dahil ang buong populasyon ay kasangkot sa aming mga kalkulasyon. Gayunpaman, kung gusto nating kalkulahin ang GPA ng lahat ng mga mag-aaral sa ating bansa, ang grupong ito ang magiging sample natin.

Ang pagkakaiba sa formula para sa pagkalkula ng pagkakaiba sa pagitan ng sample at populasyon ay nasa denominator. Kung saan para sa sample ito ay magiging katumbas ng (n-1), at para sa pangkalahatang populasyon lamang n.

Ngayon ay haharapin natin ang mga pag-andar ng pagkalkula ng pagkakaiba-iba sa mga pagtatapos PERO, sa paglalarawan kung saan sinasabing ang pagkalkula ay isinasaalang-alang ang teksto at mga lohikal na halaga. Sa kasong ito, kapag kinakalkula ang pagkakaiba-iba ng isang partikular na set ng data kung saan nangyayari ang mga di-numerong halaga, bibigyang-kahulugan ng Excel ang teksto at mga maling halaga ng boolean bilang 0, at ang mga tunay na halaga ng boolean bilang 1.

Kaya, kung mayroon kang hanay ng data, hindi magiging mahirap na kalkulahin ang pagkakaiba nito gamit ang isa sa mga function ng Excel na nakalista sa itaas.

Kadalasan sa mga istatistika, kapag sinusuri ang isang kababalaghan o proseso, kinakailangang isaalang-alang hindi lamang ang impormasyon tungkol sa mga average na antas ng pinag-aralan na mga tagapagpahiwatig, kundi pati na rin scatter o pagkakaiba-iba sa mga halaga ng mga indibidwal na yunit , na isang mahalagang katangian ng pinag-aralan na populasyon.

Ang mga presyo ng stock, dami ng supply at demand, mga rate ng interes sa iba't ibang yugto ng panahon at sa iba't ibang lugar ay napapailalim sa pinakamalaking pagkakaiba-iba.

Ang mga pangunahing tagapagpahiwatig na nagpapakilala sa pagkakaiba-iba , ay ang range, variance, standard deviation at coefficient of variation.

Pagbabago ng span ay ang pagkakaiba sa pagitan ng maximum at minimum na mga halaga ng katangian: R = Xmax – Xmin. Ang kawalan ng tagapagpahiwatig na ito ay sinusuri lamang nito ang mga hangganan ng pagkakaiba-iba ng katangian at hindi sumasalamin sa pagbabagu-bago nito sa loob ng mga hangganang ito.

Pagpapakalat wala sa pagkukulang na ito. Kinakalkula ito bilang average na parisukat ng mga paglihis ng mga halaga ng katangian mula sa kanilang average na halaga:

Pinasimpleng paraan upang makalkula ang pagkakaiba ay isinasagawa gamit ang mga sumusunod na formula (simple at may timbang):

Ang mga halimbawa ng aplikasyon ng mga formula na ito ay ipinakita sa mga gawain 1 at 2.

Ang isang malawakang ginagamit na tagapagpahiwatig sa pagsasanay ay karaniwang lihis :

Ang standard deviation ay tinukoy bilang square root ng variance at may parehong dimensyon sa trait na pinag-aaralan.

Ginagawang posible ng mga itinuturing na tagapagpahiwatig na makuha ang ganap na halaga ng pagkakaiba-iba, i.e. suriin ito sa mga yunit ng sukat ng katangiang pinag-aaralan. Hindi tulad nila, ang koepisyent ng pagkakaiba-iba sinusukat ang pagbabagu-bago sa mga kamag-anak na termino - nauugnay sa average na antas, na sa maraming mga kaso ay mas kanais-nais.

Formula para sa pagkalkula ng koepisyent ng pagkakaiba-iba.

Mga halimbawa ng paglutas ng mga problema sa paksang "Mga tagapagpahiwatig ng pagkakaiba-iba sa mga istatistika"

Gawain 1 . Kapag pinag-aaralan ang impluwensya ng advertising sa laki ng average na buwanang deposito sa mga bangko ng distrito, 2 bangko ang sinuri. Ang mga sumusunod na resulta ay nakuha:

tukuyin:
1) para sa bawat bangko: a) average na buwanang deposito; b) pagpapakalat ng kontribusyon;
2) ang average na buwanang deposito para sa dalawang bangko na magkasama;
3) Pagpapakalat ng deposito para sa 2 bangko, depende sa advertising;
4) Pagpapakalat ng deposito para sa 2 bangko, depende sa lahat ng mga kadahilanan maliban sa advertising;
5) Kabuuang pagkakaiba-iba gamit ang panuntunan sa pagdaragdag;
6) Koepisyent ng pagpapasiya;
7) Kaugnayang ugnayan.

Solusyon

1) Gumawa tayo ng talahanayan ng pagkalkula para sa isang bangko na may advertising . Upang matukoy ang average na buwanang deposito, hinahanap namin ang mga midpoint ng mga agwat. Sa kasong ito, ang halaga ng bukas na agwat (ang una) ay may kondisyon na katumbas sa halaga ng agwat na katabi nito (ang pangalawa).

Nahanap namin ang average na laki ng kontribusyon gamit ang weighted arithmetic mean formula:

29,000/50 = 580 rubles

Ang pagpapakalat ng kontribusyon ay matatagpuan sa pamamagitan ng formula:

23 400/50 = 468

Magsasagawa kami ng mga katulad na aksyon para sa isang bangko na walang mga ad :

2) Hanapin ang average na deposito para sa dalawang bangko nang magkasama. Xav \u003d (580 × 50 + 542.8 × 50) / 100 \u003d 561.4 rubles.

3) Ang pagkakaiba-iba ng deposito, para sa dalawang bangko, depende sa advertising, makikita natin sa pamamagitan ng formula: σ 2 =pq (formula ng pagkakaiba-iba ng isang alternatibong katangian). Dito ang p=0.5 ay ang proporsyon ng mga salik na nakadepende sa advertising; q=1-0.5, pagkatapos ay σ 2 =0.5*0.5=0.25.

4) Dahil ang bahagi ng iba pang mga kadahilanan ay 0.5, kung gayon ang pagkakaiba-iba ng deposito para sa dalawang bangko, na nakasalalay sa lahat ng mga kadahilanan maliban sa advertising, ay 0.25 din.

5) Tukuyin ang kabuuang pagkakaiba gamit ang tuntunin sa pagdaragdag.

= (468*50+636,16*50)/100=552,08

= [(580-561,4)250+(542,8-561,4)250] / 100= 34 596/ 100=345,96

σ 2 \u003d σ 2 katotohanan + σ 2 pahinga \u003d 552.08 + 345.96 \u003d 898.04

6) Coefficient of determination η 2 = σ 2 fact / σ 2 = 345.96/898.04 = 0.39 = 39% - ang laki ng kontribusyon ay depende sa advertising ng 39%.

7) Empirical correlation ratio η = √η 2 = √0.39 = 0.62 - medyo malapit ang relasyon.

Gawain 2 . Mayroong pagpapangkat ng mga negosyo ayon sa halaga ng mga mabibiling produkto:

Tukuyin: 1) ang pagpapakalat ng halaga ng mga mabibiling produkto; 2) karaniwang paglihis; 3) koepisyent ng pagkakaiba-iba.

Solusyon

1) Ayon sa kundisyon, ipinakita ang isang serye ng pamamahagi ng pagitan. Dapat itong ipahayag nang discretely, iyon ay, hanapin ang gitna ng pagitan (x "). Sa mga pangkat ng mga saradong agwat, makikita natin ang gitna sa pamamagitan ng isang simpleng arithmetic mean. Sa mga pangkat na may pinakamataas na limitasyon, bilang pagkakaiba sa pagitan ng itaas na limitasyong ito. at kalahati ng laki ng pagitan kasunod nito (200-(400 -200):2=100).

Sa mga pangkat na may mas mababang limitasyon - ang kabuuan ng mas mababang limitasyong ito at kalahati ng laki ng nakaraang agwat (800+(800-600):2=900).

Ang pagkalkula ng average na halaga ng mga mabibiling produkto ay ginagawa ayon sa pormula:

Хср = k×((Σ((x"-a):k)×f):Σf)+a. Dito ang a=500 ay ang laki ng variant sa pinakamataas na frequency, ang k=600-400=200 ay ang laki ng pagitan sa pinakamataas na dalas Ilagay natin ang resulta sa isang talahanayan:

Kaya, ang average na halaga ng mabibiling output para sa panahon na pinag-aaralan sa kabuuan ay Xav = (-5:37) × 200 + 500 = 472.97 thousand rubles.

2) Nahanap namin ang pagpapakalat gamit ang sumusunod na formula:

σ 2 \u003d (33/37) * 2002-(472.97-500) 2 \u003d 35,675.67-730.62 \u003d 34,945.05

3) standard deviation: σ = ±√σ 2 = ±√34 945.05 ≈ ±186.94 thousand rubles.

4) koepisyent ng pagkakaiba-iba: V \u003d (σ / Xav) * 100 \u003d (186.94 / 472.97) * 100 \u003d 39.52%

Gayunpaman, ang katangiang ito lamang ay hindi pa sapat para sa pag-aaral ng isang random na variable. Isipin ang dalawang shooters na bumaril sa isang target. Ang isa ay bumaril nang tumpak at tumama malapit sa gitna, at ang isa pa ... nagsasaya lang at hindi man lang nagpuntirya. Pero ang nakakatuwa dun karaniwan ang resulta ay eksaktong kapareho ng unang tagabaril! Ang sitwasyong ito ay may kondisyong inilalarawan ng mga sumusunod na random na variable:

Ang "sniper" mathematical expectation ay katumbas ng , gayunpaman, para sa "interesting person": - ito ay zero din!

Kaya, mayroong pangangailangan upang mabilang kung gaano kalayo nakakalat bullet (mga halaga ng isang random na variable) na may kaugnayan sa gitna ng target (pag-asa). mabuti at nakakalat isinalin mula sa Latin lamang bilang pagpapakalat .

Tingnan natin kung paano tinutukoy ang numerical na katangiang ito sa isa sa mga halimbawa ng unang bahagi ng aralin:

Doon ay natagpuan namin ang isang nakakabigo na pag-asa sa matematika ng larong ito, at ngayon kailangan naming kalkulahin ang pagkakaiba nito, na denoted sa pamamagitan ng .

Alamin natin kung gaano kalayo ang "scattered" ng mga panalo/talo sa average na halaga. Malinaw, para dito kailangan nating kalkulahin pagkakaiba sa pagitan mga halaga ng isang random na variable at siya inaasahan sa matematika:

–5 – (–0,5) = –4,5
2,5 – (–0,5) = 3
10 – (–0,5) = 10,5

Ngayon ay tila kinakailangan upang buod ang mga resulta, ngunit ang paraang ito ay hindi maganda - sa kadahilanang ang mga oscillations sa kaliwa ay magkakansela sa bawat isa sa mga oscillations sa kanan. Kaya, halimbawa, ang "amateur" na tagabaril (halimbawa sa itaas) ang mga pagkakaiba ay magiging , at kapag idinagdag ay magbibigay sila ng zero, kaya hindi kami makakakuha ng anumang pagtatantya ng pagkalat ng kanyang pagbaril.

Upang makayanan ang inis na ito, isaalang-alang mga module mga pagkakaiba, ngunit para sa mga teknikal na kadahilanan, ang diskarte ay nag-ugat kapag ang mga ito ay kuwadrado. Ito ay mas maginhawa upang ayusin ang solusyon sa isang talahanayan:

At dito nagmamakaawa na kalkulahin weighted average ang halaga ng mga squared deviations. Ano ito? Ito ay sa kanila inaasahang halaga, na siyang sukatan ng pagkalat:

kahulugan pagpapakalat. Ito ay kaagad na malinaw mula sa kahulugan na hindi maaaring negatibo ang pagkakaiba- tandaan para sa pagsasanay!

Tandaan natin kung paano hanapin ang inaasahan. I-multiply ang mga squared differences sa mga katumbas na probabilities (Pagpapatuloy ng talahanayan):
- sa makasagisag na pagsasalita, ito ay "lakas ng traksyon",
at ibuod ang mga resulta:

Hindi mo ba naisip na laban sa background ng mga panalo, ang resulta ay naging napakalaki? Tama - kami ay nag-squaring, at upang bumalik sa dimensyon ng aming laro, kailangan naming kunin ang square root. Ang halagang ito ay tinatawag karaniwang lihis at tinutukoy ng letrang Griyego na "sigma":

Minsan ang kahulugan na ito ay tinatawag karaniwang lihis .

Ano ang kahulugan nito? Kung lumihis tayo mula sa inaasahan sa matematika sa kaliwa at kanan sa pamamagitan ng karaniwang paglihis:

– kung gayon ang pinaka-malamang na mga halaga ng random na variable ay magiging "puro" sa pagitan na ito. Kung ano talaga ang nakikita natin:

Gayunpaman, nangyari na sa pagsusuri ng scattering halos palaging gumana sa konsepto ng dispersion. Tingnan natin kung ano ang ibig sabihin nito kaugnay ng mga laro. Kung sa kaso ng mga tagabaril ay pinag-uusapan natin ang "katumpakan" ng mga hit na nauugnay sa gitna ng target, kung gayon narito ang pagpapakalat ng dalawang bagay:

Una, malinaw na habang tumataas ang mga rate, tumataas din ang pagkakaiba. Kaya, halimbawa, kung tataas tayo ng 10 beses, ang inaasahan sa matematika ay tataas ng 10 beses, at ang pagkakaiba ay tataas ng 100 beses (sa sandaling ito ay isang quadratic na halaga). Ngunit tandaan na ang mga patakaran ng laro ay hindi nagbago! Ang mga rate lang ang nagbago, halos nagsasalita, dati kaming tumaya ng 10 rubles, ngayon ay 100.

Ang pangalawa, mas kawili-wiling punto ay na ang pagkakaiba ay nagpapakilala sa estilo ng paglalaro. Ayusin sa isip ang mga rate ng laro sa ilang tiyak na antas, at tingnan kung ano dito:

Ang isang mababang pagkakaiba ng laro ay isang maingat na laro. Ang manlalaro ay may posibilidad na pumili ng pinaka-maaasahang mga scheme, kung saan hindi siya matatalo/manalo ng sobra sa isang pagkakataon. Halimbawa, ang pula/itim na sistema sa roulette (tingnan ang Halimbawa 4 ng artikulo mga random na variable) .

Mataas na pagkakaiba ng laro. Madalas siyang tinatawag pagpapakalat laro. Ito ay isang adventurous o agresibong istilo ng paglalaro kung saan pinipili ng manlalaro ang mga "adrenaline" scheme. Alalahanin man lang natin "Martingale", kung saan ang mga sums na nakataya ay mga order ng magnitude na mas malaki kaysa sa "tahimik" na laro ng nakaraang talata.

Ang sitwasyon sa poker ay nagpapahiwatig: may mga tinatawag na masikip mga manlalaro na may posibilidad na maging maingat at "iiling" sa kanilang mga pondo sa laro (bankroll). Hindi nakakagulat na ang kanilang bankroll ay hindi gaanong nagbabago (mababa ang pagkakaiba-iba). Sa kabaligtaran, kung ang isang manlalaro ay may mataas na pagkakaiba, kung gayon ito ang aggressor. Madalas siyang nakipagsapalaran, gumagawa ng malalaking taya at maaaring masira ang isang malaking bangko at magkawatak-watak.

Ang parehong bagay ay nangyayari sa Forex, at iba pa - mayroong maraming mga halimbawa.

Bukod dito, sa lahat ng kaso hindi mahalaga kung ang laro ay para sa isang sentimos o para sa libu-libong dolyar. Ang bawat antas ay may mababa at mataas na pagkakaiba-iba ng mga manlalaro. Well, para sa average na panalo, tulad ng naaalala natin, "responsable" inaasahang halaga.

Marahil ay napansin mo na ang paghahanap ng pagkakaiba ay isang mahaba at maingat na proseso. Ngunit ang matematika ay mapagbigay:

Formula para sa paghahanap ng pagkakaiba

Ang pormula na ito ay direktang hinango mula sa kahulugan ng pagkakaiba, at agad naming inilagay ito sa sirkulasyon. Kokopyahin ko ang plato sa aming laro mula sa itaas:

at ang nahanap na inaasahan.

Kinakalkula namin ang pagkakaiba sa pangalawang paraan. Una, hanapin natin ang mathematical expectation - ang parisukat ng random variable . Sa pamamagitan ng kahulugan ng inaasahan sa matematika:

Sa kasong ito:

Kaya, ayon sa formula:

Sabi nga nila, feel the difference. At sa pagsasagawa, siyempre, mas mahusay na ilapat ang formula (maliban kung ang kundisyon ay nangangailangan ng iba).

Kabisado namin ang pamamaraan ng paglutas at pagdidisenyo:

Halimbawa 6

Hanapin ang mathematical expectation, variance at standard deviation nito.

Ang gawaing ito ay matatagpuan sa lahat ng dako, at, bilang isang panuntunan, napupunta nang walang makabuluhang kahulugan.
Maaari mong isipin ang ilang mga bombilya na may mga numero na lumiliwanag sa isang baliw na may ilang mga posibilidad :)

Solusyon: Ito ay maginhawa upang ibuod ang mga pangunahing kalkulasyon sa isang talahanayan. Una, isinusulat namin ang paunang data sa dalawang nangungunang linya. Pagkatapos ay kinakalkula namin ang mga produkto, pagkatapos at sa wakas ang mga kabuuan sa kanang hanay:

Actually, halos handa na ang lahat. Sa ikatlong linya, ang isang handa na pag-asa sa matematika ay iginuhit: .

Ang pagpapakalat ay kinakalkula ng formula:

At sa wakas, ang karaniwang paglihis:
- Sa personal, karaniwan kong iniikot sa 2 decimal na lugar.

Ang lahat ng mga kalkulasyon ay maaaring isagawa sa isang calculator, at kahit na mas mahusay - sa Excel:

Mahirap magkamali dito :)

Sagot:

Ang mga nagnanais ay mas pasimplehin ang kanilang buhay at samantalahin ang aking calculator (demo), na hindi lamang agad na malulutas ang problemang ito, ngunit bumubuo rin pampakay na graphics (malapit na). Ang programa ay maaaring download sa library– kung nag-download ka ng kahit isang materyal sa pag-aaral, o nakatanggap ibang paraan. Salamat sa pagsuporta sa proyekto!

Ang ilang mga gawain para sa independiyenteng solusyon:

Halimbawa 7

Kalkulahin ang pagkakaiba ng random variable ng nakaraang halimbawa sa pamamagitan ng kahulugan.

At isang katulad na halimbawa:

Halimbawa 8

Ang isang discrete random variable ay ibinibigay ng sarili nitong batas sa pamamahagi:

Oo, ang mga halaga ng random na variable ay maaaring masyadong malaki (halimbawa mula sa totoong trabaho), at dito, kung maaari, gamitin ang Excel. Bilang, sa pamamagitan ng paraan, sa Halimbawa 7 - ito ay mas mabilis, mas maaasahan at mas kaaya-aya.

Mga solusyon at sagot sa ibaba ng pahina.

Sa pagtatapos ng ika-2 bahagi ng aralin, susuriin natin ang isa pang karaniwang gawain, maaari pa ngang sabihin ng isang maliit na rebus:

Halimbawa 9

Ang isang discrete random variable ay maaaring tumagal lamang ng dalawang halaga: at , at . Ang posibilidad, mathematical na inaasahan at pagkakaiba ay kilala.

Solusyon: Magsimula tayo sa hindi kilalang posibilidad. Dahil ang isang random na variable ay maaaring tumagal lamang ng dalawang halaga, kung gayon ang kabuuan ng mga probabilidad ng mga kaukulang kaganapan:

at simula noon .

Ito ay nananatiling upang mahanap ..., madaling sabihin :) Ngunit oh well, ito ay nagsimula. Sa pamamagitan ng kahulugan ng inaasahan sa matematika:
- palitan ang mga kilalang halaga:

- at wala nang mapipiga sa equation na ito, maliban na maaari mong muling isulat ito sa karaniwang direksyon:

o:

Tungkol sa mga karagdagang aksyon, sa tingin ko maaari mong hulaan. Gawin at lutasin natin ang system:

Ang mga desimal ay, siyempre, isang kumpletong kahihiyan; i-multiply ang parehong equation sa 10:

at hatiin sa 2:

Mas mabuti iyon. Mula sa 1st equation ipinapahayag namin:
(ito ang mas madaling paraan)- kapalit sa 2nd equation:


Nagtatayo kami parisukat at gumawa ng mga pagpapasimple:

Kami ay nagpaparami sa:

Ang resulta, quadratic equation, hanapin ang diskriminasyon nito:
- perpekto!

at nakakakuha kami ng dalawang solusyon:

1) kung , pagkatapos ;

2) kung , tapos .

Ang unang pares ng mga halaga ay nakakatugon sa kondisyon. Sa isang mataas na posibilidad, ang lahat ay tama, ngunit, gayunpaman, isinulat namin ang batas ng pamamahagi:

at magsagawa ng tseke, ibig sabihin, hanapin ang inaasahan: