Ağırlıklı varyans. Ayrık bir rastgele değişkenin dağılımı

Dağılımrastgele değişken- belirli bir dağılımın bir ölçüsü rastgele değişken, yani, onun sapmalar matematiksel beklentiden. İstatistikte, gösterim (sigma kare) genellikle varyansı belirtmek için kullanılır. Varyansın karekökü denir standart sapma veya standart yayılma. Standart sapma, rastgele değişkenin kendisiyle aynı birimlerde ölçülür ve varyans, o birimin karelerinde ölçülür.

Örneklemin tamamını tahmin etmek için yalnızca bir değer (ortalama veya mod ve medyan gibi) kullanmak çok uygun olsa da, bu yaklaşım kolayca yanlış sonuçlara yol açabilir. Bu durumun nedeni, değerin kendisinde değil, bir değerin hiçbir şekilde veri değerlerinin yayılmasını yansıtmamasıdır.

Örneğin, örnekte:

ortalama 5'tir.

Ancak, numunenin kendisinde 5 değerine sahip bir eleman yoktur. Numunenin her bir elemanının ortalama değerine ne kadar yakın olduğunu bilmeniz gerekebilir. Veya başka bir deyişle, değerlerin varyansını bilmeniz gerekir. Verilerin ne ölçüde değiştiğini bilerek, daha iyi yorumlayabilirsiniz. kastetmek, medyan ve moda. Örnek değerlerindeki değişim derecesi, varyansları ve standart sapmaları hesaplanarak belirlenir.



Standart sapma olarak adlandırılan varyans ve varyansın karekökü, örnek ortalamasından ortalama sapmayı karakterize eder. Bu iki miktar arasında en önemlisi, standart sapma. Bu değer, elemanların numunenin orta elemanından ortalama uzaklığı olarak gösterilebilir.

Dağılımın anlamlı bir şekilde yorumlanması zordur. Ancak, bu değerin karekökü standart sapmadır ve yoruma uygundur.

Standart sapma, önce varyans belirlenerek ve ardından varyansın karekökü hesaplanarak hesaplanır.

Örneğin, şekilde gösterilen veri dizisi için aşağıdaki değerler elde edilecektir:

Resim 1

Burada farkların karelerinin ortalaması 717,43'tür. Standart sapmayı elde etmek için geriye sadece bu sayının karekökünü almak kalıyor.

Sonuç yaklaşık olarak 26.78 olacaktır.

Standart sapmanın, elemanların numune ortalamasından ortalama uzaklığı olarak yorumlandığı unutulmamalıdır.

Standart sapma, ortalamanın tüm numuneyi ne kadar iyi tanımladığını gösterir.

Diyelim ki bir PC montajı için üretim departmanının başındasınız. Üç aylık rapor, son çeyrek çıktısının 2500 PC olduğunu söylüyor. Kötü mü yoksa iyi mi? Raporda bu veriler için standart sapmayı görüntülemeyi istediniz (veya raporda bu sütun zaten var). Örneğin, standart sapma sayısı 2000'dir. Bölüm başkanı olarak, üretim hattının daha iyi kontrol edilmesi gerektiği (montaj yapılan bilgisayarların sayısında çok büyük sapmalar) sizin için açıkça anlaşılır.

Standart sapma büyük olduğunda, verilerin ortalamanın etrafına geniş bir şekilde dağıldığını ve standart sapma küçük olduğunda ortalamaya yakın kümelendiğini hatırlayın.

Dört istatistiksel işlev VARP(), VARP(), STDEV() ve STDEV(), bir hücre aralığındaki sayıların varyansını ve standart sapmasını hesaplamak için tasarlanmıştır. Bir veri setinin varyansını ve standart sapmasını hesaplamadan önce, verilerin popülasyonu mu yoksa popülasyonun bir örneğini mi temsil ettiğini belirlemeniz gerekir. Genel popülasyondan bir örnek olması durumunda VARP() ve STDEV() işlevleri kullanılmalı ve genel popülasyon durumunda VARP() ve STDEV() işlevleri kullanılmalıdır:

Nüfus İşlev

VARP()

STDLONG()
Örneklem

VARI()

STDEV()

Varyans (standart sapmanın yanı sıra), belirttiğimiz gibi, veri kümesine dahil edilen değerlerin aritmetik ortalamanın etrafına ne ölçüde dağıldığını gösterir.

Varyansın veya standart sapmanın küçük bir değeri, tüm verilerin aritmetik ortalama etrafında toplandığını ve bu değerlerin büyük bir değeri, verilerin geniş bir değer aralığına dağıldığını gösterir.

Varyansı anlamlı bir şekilde yorumlamak oldukça zordur (küçük bir değer, büyük bir değer ne anlama gelir?). Verim Görevler 3 bir grafik üzerinde, bir veri kümesi için varyansın anlamını görsel olarak göstermenize olanak tanır.

Görevler

· 1. Egzersiz.

· 2.1. Kavramları verin: varyans ve standart sapma; istatistiksel veri işlemede sembolik atamaları.

· 2.2. Şekil 1'e göre bir çalışma yaprağı hazırlayınız ve gerekli hesaplamaları yapınız.

· 2.3. Hesaplamalarda kullanılan temel formülleri veriniz.

· 2.4. Tüm gösterimleri açıklayın ( , , )

· 2.5. Varyans ve standart sapma kavramının pratik anlamını açıklayın.

Görev 2.

1.1. Kavramları verin: genel popülasyon ve örneklem; istatistiksel veri işlemede matematiksel beklenti ve sembolik atamalarının aritmetik ortalaması.

1.2. Şekil 2'ye göre bir çalışma sayfası hazırlayın ve hesaplamalar yapın.

1.3. Hesaplamalarda kullanılan temel formülleri veriniz (genel evren ve örneklem için).

şekil 2

1.4. Örneklerde 46.43 ve 48.78 gibi aritmetik ortalama değerleri elde etmenin neden mümkün olduğunu açıklayın (bkz. dosya Ek). Sonuçlandırmak için.

Görev 3.

Farklı veri kümesine sahip iki örnek vardır, ancak bunların ortalaması aynı olacaktır:

Figür 3

3.1. Şekil 3'e göre bir çalışma yaprağı hazırlayınız ve gerekli hesaplamaları yapınız.

3.2. Temel hesaplama formüllerini verin.

3.3. Şekil 4, 5'e göre grafikler oluşturun.

3.4. Ortaya çıkan bağımlılıkları açıklayın.

3.5. Bu iki örnek için benzer hesaplamalar yapın.

İlk örnek 11119999

İkinci örneğin aritmetik ortalaması aynı olacak şekilde ikinci örneğin değerlerini seçin, örneğin:

İkinci örnek için değerleri kendiniz seçin. Hesaplamaları ve çizimleri şekil 3, 4, 5 gibi düzenleyin. Hesaplamalarda kullanılan ana formülleri gösterin.

Uygun sonuçları çizin.

Tüm görevler, gerekli tüm şekiller, grafikler, formüller ve kısa açıklamalar ile bir rapor şeklinde sunulmalıdır.

Not: Grafiklerin yapısı şekiller ve kısa açıklamalarla açıklanmalıdır.

Rastgele bir değişkenin dağılımı, bu değişkenin değerlerinin yayılmasının bir ölçüsüdür. Küçük varyans, değerlerin birbirine yakın kümelenmesi anlamına gelir. Büyük bir varyans, güçlü bir değer dağılımını gösterir. Rastgele bir değişkenin dağılımı kavramı istatistikte kullanılır. Örneğin, iki niceliğin değerlerinin varyansını karşılaştırırsanız (erkek ve kadın hastaların gözlem sonuçları gibi), bazı değişkenlerin anlamlılığını test edebilirsiniz. Varyans, istatistiksel modeller oluştururken de kullanılır, çünkü küçük varyans, değerlere fazla uyduğunuzun bir işareti olabilir.

adımlar

Örnek Varyans Hesaplaması

  1. Örnek değerleri kaydedin.Çoğu durumda, istatistikçiler için yalnızca belirli popülasyonların örnekleri mevcuttur. Örneğin, kural olarak, istatistikçiler Rusya'daki tüm arabaların popülasyonunu korumanın maliyetini analiz etmezler - birkaç bin arabanın rastgele bir örneğini analiz ederler. Böyle bir örnek, araba başına ortalama maliyeti belirlemeye yardımcı olacaktır, ancak büyük olasılıkla ortaya çıkan değer gerçek değerden uzak olacaktır.

    • Örneğin, bir kafede 6 günde satılan, rastgele alınan çörek sayısını inceleyelim. Örnek şu şekildedir: 17, 15, 23, 7, 9, 13. Bu bir popülasyon değil, bir örnektir, çünkü kafenin açık olduğu her gün için satılan çörekler hakkında verimiz yok.
    • Size bir değer örneği değil de bir popülasyon verilmişse, bir sonraki bölüme geçin.
  2. Örnek varyansını hesaplamak için formülü yazın. Dağılım, bir miktar değerlerin yayılmasının bir ölçüsüdür. Dağılım değeri sıfıra ne kadar yakınsa, değerler o kadar yakın gruplanır. Bir değer örneğiyle çalışırken, varyansı hesaplamak için aşağıdaki formülü kullanın:

    • s 2 (\displaystyle s^(2)) = ∑[(x ben (\displaystyle x_(i))-x) 2 (\görüntüleme stili ^(2))] / (n - 1)
    • s 2 (\displaystyle s^(2)) dispersiyondur. Dağılım kare birimlerle ölçülür.
    • x ben (\displaystyle x_(i))- örnekteki her bir değer.
    • x ben (\displaystyle x_(i)) x̅'yi çıkarmanız, karesini almanız ve ardından sonuçları eklemeniz gerekir.
    • x̅ – örnek ortalama (örnek ortalama).
    • n, örnekteki değerlerin sayısıdır.
  3. Örnek ortalamasını hesaplayın. x̅ olarak gösterilir. Numune ortalaması normal bir aritmetik ortalama gibi hesaplanır: numunedeki tüm değerleri toplayın ve ardından sonucu numunedeki değerlerin sayısına bölün.

    • Örneğimizde örnekteki değerleri ekleyin: 15 + 17 + 23 + 7 + 9 + 13 = 84
      Şimdi sonucu örnekteki değer sayısına bölün (örneğimizde 6 tane var): 84 ÷ 6 = 14.
      Örnek ortalama x̅ = 14.
    • Numune ortalaması, numunedeki değerlerin etrafında dağıtıldığı merkezi değerdir. Numune etrafındaki numune kümesindeki değerler ortalama ise varyans küçüktür; aksi halde dağılım büyüktür.
  4. Örnekteki her bir değerden örnek ortalamasını çıkarın.şimdi farkı hesapla x ben (\displaystyle x_(i))- x̅, nerede x ben (\displaystyle x_(i))- örnekteki her bir değer. Elde edilen her sonuç, belirli bir değerin numune ortalamasından ne kadar saptığını, yani bu değerin numune ortalamasından ne kadar uzak olduğunu gösterir.

    • Örneğimizde:
      x 1 (\displaystyle x_(1))- x̅ = 17 - 14 = 3
      x 2 (\displaystyle x_(2))- x̅ = 15 - 14 = 1
      x 3 (\displaystyle x_(3))- x̅ = 23 - 14 = 9
      x 4 (\displaystyle x_(4))- x̅ = 7 - 14 = -7
      x 5 (\displaystyle x_(5))- x̅ = 9 - 14 = -5
      x 6 (\displaystyle x_(6))- x̅ = 13 - 14 = -1
    • Toplamlarının sıfıra eşit olması gerektiğinden, elde edilen sonuçların doğruluğunu doğrulamak kolaydır. Bu, ortalama değerin belirlenmesi ile ilgilidir, çünkü negatif değerler (ortalama değerden daha küçük değerlere olan mesafeler) pozitif değerlerle (ortalama değerden daha büyük değerlere olan mesafeler) tamamen dengelenir.
  5. Yukarıda belirtildiği gibi, farklılıkların toplamı x ben (\displaystyle x_(i))- x̅ sıfıra eşit olmalıdır. Bu, ortalama varyansın her zaman sıfır olduğu anlamına gelir, bu da bazı miktarların değerlerinin yayılması hakkında herhangi bir fikir vermez. Bu sorunu çözmek için, her bir farkın karesini alın x ben (\displaystyle x_(i))- x. Bu, yalnızca birlikte eklendiğinde hiçbir zaman 0'a ulaşmayacak pozitif sayılar elde etmenize neden olur.

    • Örneğimizde:
      (x 1 (\displaystyle x_(1))-x) 2 = 3 2 = 9 (\displaystyle ^(2)=3^(2)=9)
      (x 2 (\displaystyle (x_(2))-x) 2 = 1 2 = 1 (\displaystyle ^(2)=1^(2)=1)
      9 2 = 81
      (-7) 2 = 49
      (-5) 2 = 25
      (-1) 2 = 1
    • Farkın karesini buldunuz - x̅) 2 (\görüntüleme stili ^(2))örnekteki her bir değer için
  6. Farkların karelerinin toplamını hesaplayın. Yani, formülün şu şekilde yazılmış kısmını bulun: ∑[( x ben (\displaystyle x_(i))-x) 2 (\görüntüleme stili ^(2))]. Burada Σ işareti, her değer için kare farklarının toplamı anlamına gelir. x ben (\displaystyle x_(i))örnekte. Kare farkları zaten buldunuz (x ben (\displaystyle (x_(i))-x) 2 (\görüntüleme stili ^(2)) her değer için x ben (\displaystyle x_(i))örnekte; şimdi sadece bu kareleri ekleyin.

    • Örneğimizde: 9 + 1 + 81 + 49 + 25 + 1 = 166 .
  7. Sonucu n - 1'e bölün, burada n, örnekteki değerlerin sayısıdır. Bir süre önce, örneklem varyansını hesaplamak için istatistikçiler sonucu basitçe n'ye böldüler; bu durumda, belirli bir örneğin varyansını tanımlamak için ideal olan kare varyansın ortalamasını alırsınız. Ancak, herhangi bir örneğin, genel değerler popülasyonunun yalnızca küçük bir parçası olduğunu unutmayın. Farklı bir örnek alıp aynı hesaplamaları yaparsanız, farklı bir sonuç alırsınız. Görünen o ki, n - 1'e bölmek (sadece n yerine) popülasyon varyansı hakkında daha iyi bir tahmin verir, bu da peşinde olduğunuz şeydir. N - 1'e bölme yaygın hale geldi, bu nedenle örnek varyansını hesaplama formülüne dahil edildi.

    • Örneğimizde örnek 6 değer içerir, yani n = 6.
      Örnek varyans = s 2 = 166 6 − 1 = (\displaystyle s^(2)=(\frac (166)(6-1))=) 33,2
  8. Varyans ve standart sapma arasındaki fark. Formülün bir üs içerdiğine dikkat edin, bu nedenle varyans, analiz edilen değerin kare birimlerinde ölçülür. Bazen böyle bir değeri çalıştırmak oldukça zordur; bu gibi durumlarda, varyansın kareköküne eşit olan standart sapma kullanılır. Bu nedenle örnek varyansı şu şekilde ifade edilir: s 2 (\displaystyle s^(2)), ve örnek standart sapması olarak s (\görüntüleme stili s).

    • Örneğimizde, örnek standart sapma: s = √33.2 = 5.76.

    Nüfus varyansı hesaplaması

    1. Bazı değerleri analiz edin. Set, dikkate alınan miktarın tüm değerlerini içerir. Örneğin, Leningrad bölgesinin sakinlerinin yaşını okuyorsanız, nüfus bu bölgenin tüm sakinlerinin yaşını içerir. Bir agrega ile çalışılması durumunda, bir tablo oluşturmanız ve agreganın değerlerini buna girmeniz önerilir. Aşağıdaki örneği göz önünde bulundurun:

      • Belirli bir odada 6 akvaryum var. Her akvaryumda aşağıdaki sayıda balık bulunur:
        x 1 = 5 (\displaystyle x_(1)=5)
        x 2 = 5 (\displaystyle x_(2)=5)
        x 3 = 8 (\displaystyle x_(3)=8)
        x 4 = 12 (\displaystyle x_(4)=12)
        x 5 = 15 (\displaystyle x_(5)=15)
        x 6 = 18 (\displaystyle x_(6)=18)
    2. Popülasyon varyansını hesaplamak için formülü yazın. Popülasyon belirli bir niceliğin tüm değerlerini içerdiğinden, aşağıdaki formül popülasyonun varyansının tam değerini elde etmenizi sağlar. Nüfus varyansını örnek varyansından ayırt etmek için (ki bu yalnızca bir tahmindir), istatistikçiler çeşitli değişkenler kullanır:

      • σ 2 (\görüntüleme stili ^(2)) = (∑(x ben (\displaystyle x_(i)) - μ) 2 (\görüntüleme stili ^(2))) / n
      • σ 2 (\görüntüleme stili ^(2))- popülasyon varyansı ("sigma karesi" olarak okunur). Dağılım kare birimlerle ölçülür.
      • x ben (\displaystyle x_(i))- toplamdaki her değer.
      • Σ toplamın işaretidir. Yani her değer için x ben (\displaystyle x_(i))μ çıkarın, karesini alın ve sonuçları ekleyin.
      • μ popülasyon ortalamasıdır.
      • n, genel popülasyondaki değerlerin sayısıdır.
    3. Popülasyon ortalamasını hesaplayın. Genel nüfusla çalışırken, ortalama değeri μ (mu) olarak gösterilir. Popülasyon ortalaması, olağan aritmetik ortalama olarak hesaplanır: popülasyondaki tüm değerleri toplayın ve ardından sonucu popülasyondaki değerlerin sayısına bölün.

      • Ortalamaların her zaman aritmetik ortalama olarak hesaplanmadığını unutmayın.
      • Örneğimizde popülasyonun anlamı: μ = 5 + 5 + 8 + 12 + 15 + 18 6 (\displaystyle (\frac (5+5+8+12+15+18)(6))) = 10,5
    4. Popülasyondaki her bir değerden popülasyon ortalamasını çıkarın. Fark değeri sıfıra ne kadar yakınsa, belirli değer popülasyon ortalamasına o kadar yakındır. Popülasyondaki her bir değer ile ortalaması arasındaki farkı bulun ve ilk olarak değerlerin dağılımına bir göz atın.

      • Örneğimizde:
        x 1 (\displaystyle x_(1))- μ = 5 - 10.5 = -5.5
        x 2 (\displaystyle x_(2))- μ = 5 - 10.5 = -5.5
        x 3 (\displaystyle x_(3))- μ = 8 - 10,5 = -2,5
        x 4 (\displaystyle x_(4))- μ = 12 - 10.5 = 1.5
        x 5 (\displaystyle x_(5))- μ = 15 - 10,5 = 4,5
        x 6 (\displaystyle x_(6))- μ = 18 - 10,5 = 7,5
    5. Aldığınız her sonucun karesini alın. Fark değerleri hem pozitif hem de negatif olacaktır; bu değerleri bir sayı doğrusuna koyarsanız, popülasyon ortalamasının sağında ve solunda yer alacaktır. Pozitif ve negatif sayılar birbirini iptal ettiğinden bu, varyansı hesaplamak için iyi değildir. Bu nedenle, yalnızca pozitif sayılar elde etmek için her bir farkın karesini alın.

      • Örneğimizde:
        (x ben (\displaystyle x_(i)) - μ) 2 (\görüntüleme stili ^(2)) her popülasyon değeri için (i = 1'den i = 6'ya):
        (-5,5)2 (\görüntüleme stili ^(2)) = 30,25
        (-5,5)2 (\görüntüleme stili ^(2)), nerede x n (\displaystyle x_(n)) popülasyondaki son değerdir.
      • Elde edilen sonuçların ortalama değerini hesaplamak için toplamlarını bulmanız ve n'ye bölmeniz gerekir: (( x 1 (\displaystyle x_(1)) - μ) 2 (\görüntüleme stili ^(2)) + (x 2 (\displaystyle x_(2)) - μ) 2 (\görüntüleme stili ^(2)) + ... + (x n (\displaystyle x_(n)) - μ) 2 (\görüntüleme stili ^(2))) / n
      • Şimdi yukarıdaki açıklamayı değişkenleri kullanarak yazalım: (∑( x ben (\displaystyle x_(i)) - μ) 2 (\görüntüleme stili ^(2))) / n ve popülasyon varyansını hesaplamak için bir formül elde edin.

Dağılım, veri değerleri ile ortalama arasındaki nispi sapmayı tanımlayan bir dağılım ölçüsüdür. Her bir veri değerinin ortalamadan sapmasının karesi alınarak toplanarak hesaplanan, istatistikte en yaygın kullanılan dağılım ölçüsüdür. Varyansı hesaplamak için formül aşağıda gösterilmiştir:

s 2 - örnek varyansı;

x cf örneğin ortalama değeridir;

nörneklem büyüklüğü (veri değerlerinin sayısı),

(x i – x cf) veri setinin her bir değeri için ortalama değerden sapmadır.

Formülü daha iyi anlamak için bir örneğe bakalım. Yemek yapmayı gerçekten sevmiyorum, bu yüzden nadiren yaparım. Ancak açlıktan ölmemek için zaman zaman vücudumu proteinler, yağlar ve karbonhidratlarla doyurma planını uygulamak için sobaya gitmem gerekiyor. Aşağıdaki veri seti, Renat'ın her ay kaç kez yemek pişirdiğini gösterir:

Varyansı hesaplamanın ilk adımı, örneğimizde ayda 7,8 kez olan örnek ortalamasını belirlemektir. Kalan hesaplamalar aşağıdaki tablo yardımıyla kolaylaştırılabilir.

Varyansı hesaplamanın son aşaması şöyle görünür:

Tüm hesaplamaları tek seferde yapmayı sevenler için denklem şöyle görünecektir:

Ham sayım yöntemini kullanma (pişirme örneği)

Varyansı hesaplamanın "ham sayma" yöntemi olarak bilinen daha etkili bir yolu vardır. İlk bakışta denklem oldukça hantal görünse de, aslında o kadar korkutucu değil. Bunu doğrulayabilir ve ardından en çok hangi yöntemi sevdiğinize karar verebilirsiniz.

kare aldıktan sonra her bir veri değerinin toplamıdır,

tüm veri değerlerinin toplamının karesidir.

Hemen aklını kaybetme. Hepsini bir tablo şeklinde koyalım ve sonra burada bir önceki örneğe göre daha az hesaplama olduğunu göreceksiniz.

Gördüğünüz gibi, sonuç önceki yöntemi kullanırken olduğu gibidir. Bu yöntemin avantajları, örneklem büyüklüğü (n) büyüdükçe ortaya çıkmaktadır.

Excel'de varyans hesaplama

Muhtemelen tahmin ettiğiniz gibi, Excel'in varyansı hesaplamanıza izin veren bir formülü vardır. Ayrıca, Excel 2010'dan başlayarak 4 çeşit dağılım formülü bulabilirsiniz:

1) VAR.V - Örneğin varyansını döndürür. Boole değerleri ve metin yok sayılır.

2) VAR.G - Popülasyon varyansını döndürür. Boole değerleri ve metin yok sayılır.

3) VASP - Boole ve metin değerlerini dikkate alarak örnek varyansını döndürür.

4) VARP - Mantıksal ve metin değerlerini dikkate alarak popülasyonun varyansını döndürür.

İlk olarak, bir örneklem ile bir popülasyon arasındaki farka bakalım. Tanımlayıcı istatistiklerin amacı, verileri hızlı bir şekilde büyük bir resim, deyim yerindeyse genel bir bakış elde edecek şekilde özetlemek veya görüntülemektir. İstatistiksel çıkarım, bu popülasyondan bir veri örneğine dayalı olarak bir popülasyon hakkında çıkarımlar yapmanızı sağlar. Popülasyon, bizi ilgilendiren tüm olası sonuçları veya ölçümleri temsil eder. Örnek, bir popülasyonun alt kümesidir.

Örneğin, Rus üniversitelerinden birinden bir grup öğrencinin toplamı ile ilgileniyoruz ve grubun ortalama puanını belirlememiz gerekiyor. Öğrencilerin ortalama performansını hesaplayabiliriz ve sonra ortaya çıkan rakam bir parametre olacaktır, çünkü tüm popülasyon hesaplamalarımıza dahil olacaktır. Ancak ülkemizdeki tüm öğrencilerin genel not ortalamasını hesaplamak istersek bu grup örneklemimiz olacaktır.

Örneklem ve popülasyon arasındaki varyansı hesaplama formülündeki fark paydadadır. Numune için (n-1) ve genel popülasyon için sadece n'ye eşit olacağı yerde.

Şimdi sonlarla varyansı hesaplama işlevleriyle ilgilenelim ANCAK, açıklamasında, hesaplamanın metin ve mantıksal değerleri dikkate aldığı söylenir. Bu durumda, sayısal olmayan değerlerin oluştuğu belirli bir veri kümesinin varyansını hesaplarken Excel, metin ve yanlış booleanları 0, gerçek booleanları 1 olarak yorumlayacaktır.

Bu nedenle, bir dizi veriye sahipseniz, yukarıda listelenen Excel işlevlerinden birini kullanarak varyansını hesaplamak zor olmayacaktır.

Genellikle istatistikte, bir fenomeni veya süreci analiz ederken, yalnızca incelenen göstergelerin ortalama seviyeleri hakkındaki bilgileri değil, aynı zamanda bireysel birimlerin değerlerinde dağılım veya değişiklik , incelenen popülasyonun önemli bir özelliğidir.

Hisse senedi fiyatları, arz ve talep hacimleri, farklı zaman dilimlerinde ve farklı yerlerdeki faiz oranları en büyük değişime tabidir.

Varyasyonu karakterize eden ana göstergeler , aralık, varyans, standart sapma ve varyasyon katsayısıdır.

Açıklık varyasyonu özniteliğin maksimum ve minimum değerleri arasındaki farktır: R = Xmaks – Xmin. Bu göstergenin dezavantajı, yalnızca özellik varyasyonunun sınırlarını değerlendirmesi ve bu sınırlar içindeki dalgalanmasını yansıtmamasıdır.

Dağılım bu eksiklikten yoksun. Öznitelik değerlerinin ortalama değerlerinden sapmalarının ortalama karesi olarak hesaplanır:

Varyansı hesaplamanın basitleştirilmiş yolu aşağıdaki formüller kullanılarak gerçekleştirilir (basit ve ağırlıklı):

Bu formüllerin uygulama örnekleri görev 1 ve 2'de sunulmuştur.

Pratikte yaygın olarak kullanılan bir gösterge, standart sapma :

Standart sapma, varyansın karekökü olarak tanımlanır ve incelenen özellik ile aynı boyuta sahiptir.

Dikkate alınan göstergeler, varyasyonun mutlak değerini elde etmeyi mümkün kılar, yani. incelenen özelliğin ölçü birimlerinde değerlendirin. Onlardan farklı olarak, varyasyon katsayısı dalgalanmayı göreceli terimlerle ölçer - çoğu durumda tercih edilen ortalama düzeye göre.

Varyasyon katsayısını hesaplama formülü.

"İstatistikte varyasyon göstergeleri" konusundaki problem çözme örnekleri

Görev 1 . Reklamın ilçe bankalarındaki ortalama aylık mevduat büyüklüğü üzerindeki etkisi incelenirken 2 banka incelenmiştir. Aşağıdaki sonuçlar elde edilir:

Tanımlamak:
1) her banka için: a) ortalama aylık mevduat; b) katkının dağılımı;
2) iki bankanın birlikte ortalama aylık mevduatı;
3) 2 banka için mevduatın reklama göre dağılımı;
4) Mevduatın 2 banka için reklam hariç tüm faktörlere göre dağılımı;
5) Toplam varyans, toplama kuralı kullanılarak;
6) Belirleme katsayısı;
7) Korelasyon ilişkisi.

Çözüm

1) Reklamlı bir banka için hesaplama tablosu yapalım . Ortalama aylık mevduatı belirlemek için aralıkların orta noktalarını buluyoruz. Bu durumda, açık aralığın değeri (birincisi) koşullu olarak ona bitişik aralığın değerine (ikincisi) eşittir.

Ağırlıklı aritmetik ortalama formülünü kullanarak katkının ortalama boyutunu buluyoruz:

29.000/50 = 580 ruble

Katkının dağılımı şu formülle bulunur:

23 400/50 = 468

Benzer eylemler gerçekleştireceğiz reklamsız bir banka için :

2) İki bankanın ortalama mevduatını birlikte bulun. Xav \u003d (580 × 50 + 542.8 × 50) / 100 \u003d 561.4 ruble.

3) Mevduatın varyansı, reklama bağlı olarak, iki banka için, şu formülle bulacağız: σ 2 =pq (alternatif bir işaretin varyansının formülü). Burada p=0,5 reklama bağlı faktörlerin oranıdır; q=1-0.5, sonra σ 2 =0.5*0.5=0.25.

4) Diğer faktörlerin payı 0,5 olduğundan, reklam dışındaki tüm faktörlere bağlı olan iki banka için mevduatın varyansı da 0,25'tir.

5) Toplam varyansı toplama kuralını kullanarak belirleyin.

= (468*50+636,16*50)/100=552,08

= [(580-561,4)250+(542,8-561,4)250] / 100= 34 596/ 100=345,96

σ 2 \u003d σ 2 gerçek + σ 2 dinlenme \u003d 552.08 + 345.96 \u003d 898.04

6) Belirleme katsayısı η 2 = σ 2 gerçek / σ 2 = 345.96/898.04 = 0.39 = %39 - katkının büyüklüğü %39 oranında reklama bağlıdır.

7) Ampirik korelasyon oranı η = √η 2 = √0.39 = 0.62 - ilişki oldukça yakındır.

Görev 2 . Pazarlanabilir ürünlerin değerine göre bir grup işletme vardır:

Belirleyin: 1) pazarlanabilir ürünlerin değerinin dağılımı; 2) standart sapma; 3) varyasyon katsayısı.

Çözüm

1) Koşul olarak, bir aralık dağılım serisi sunulur. Ayrık olarak ifade edilmelidir, yani (x ") aralığının ortasını bulun. Kapalı aralık gruplarında, ortayı basit bir aritmetik ortalama ile buluruz. Üst sınırı olan gruplarda, bu üst sınır arasındaki fark olarak ve onu takip eden aralığın yarısı kadardır (200-(400 -200):2=100).

Alt limitli gruplarda - bu alt limitin toplamı ve önceki aralığın yarısı (800+(800-600):2=900).

Pazarlanabilir ürünlerin ortalama değerinin hesaplanması aşağıdaki formüle göre yapılır:

Хср = k×((Σ((x"-a):k)×f):Σf)+a. Burada a=500 en yüksek frekanstaki varyantın boyutudur, k=600-400=200 aralığın en yüksek frekansta boyutu Sonucu bir tabloya koyalım:

Dolayısıyla, bir bütün olarak incelenen dönem için pazarlanabilir çıktının ortalama değeri Xav = (-5:37) × 200 + 500 = 472.97 bin ruble.

2) Aşağıdaki formülü kullanarak dağılımı buluruz:

σ 2 \u003d (33/37) * 2002-(472.97-500) 2 \u003d 35.675.67-730.62 \u003d 34.945.05

3) standart sapma: σ = ±√σ 2 = ±√34 945.05 ≈ ±186.94 bin ruble.

4) varyasyon katsayısı: V \u003d (σ / Xav) * 100 \u003d (186.94 / 472.97) * 100 \u003d %39.52

Ancak, bu özellik tek başına rastgele bir değişkenin incelenmesi için henüz yeterli değildir. Bir hedefe ateş eden iki atıcı düşünün. Biri isabetli atış yapıyor ve merkeze yakın vuruyor, diğeri ... sadece eğleniyor ve nişan almıyor bile. Ama komik olan şu ki ortalama sonuç ilk atıcıyla tamamen aynı olacak! Bu durum, aşağıdaki rastgele değişkenlerle koşullu olarak gösterilmiştir:

"Keskin nişancı" matematiksel beklentisi, ancak "ilginç kişi" için eşittir: - ayrıca sıfırdır!

Bu nedenle, ne kadar uzak olduğunu ölçmek için bir ihtiyaç vardır. dağınık hedefin merkezine (beklenti) göre madde işaretleri (rastgele bir değişkenin değerleri). iyi ve saçılma Latince'den sadece şu şekilde çevrilmiştir: dağılım .

Bu sayısal özelliğin dersin 1. bölümünün örneklerinden birinde nasıl belirlendiğini görelim:

Orada bu oyunun hayal kırıklığı yaratan bir matematiksel beklentisini bulduk ve şimdi varyansını hesaplamamız gerekiyor. belirtilen vasıtasıyla .

Kazançların/kayıpların ortalama değere göre ne kadar "dağıldığını" bulalım. Açıkçası, bunun için hesaplamamız gerekiyor farklılıklar arasında rastgele bir değişkenin değerleri ve onun matematiksel beklenti:

–5 – (–0,5) = –4,5
2,5 – (–0,5) = 3
10 – (–0,5) = 10,5

Şimdi sonuçları özetlemek gerekiyor gibi görünüyor, ancak bu yol iyi değil - çünkü sola salınımlar sağa salınımlarla birbirini iptal edecek. Yani, örneğin, "amatör" atıcı (yukarıdaki örnek) farklılıklar olacak , ve eklendiğinde sıfır verecekler, bu yüzden atışının saçılması hakkında herhangi bir tahmin almayacağız.

Bu sıkıntıyı aşmak için düşünün modüller farklılıklar, ancak teknik nedenlerle, yaklaşım, kareleri alındığında kök salmıştır. Çözümü bir tabloda düzenlemek daha uygundur:

Ve burada hesaplamak için yalvarıyor ağırlıklı ortalama kare sapmaların değeri. Bu ne? Bu onların beklenen değer, saçılma ölçüsü olan:

tanım dağılım. Tanımdan hemen anlaşılıyor ki varyans negatif olamaz- uygulama için not alın!

Beklentiyi nasıl bulacağımızı hatırlayalım. Kare farkları karşılık gelen olasılıklarla çarpın (Tablonun devamı):
- mecazi olarak konuşursak, bu "çekiş gücü",
ve sonuçları özetleyin:

Kazançların arka planına karşı sonucun çok büyük olduğunu düşünmüyor musunuz? Bu doğru - kare alıyorduk ve oyunumuzun boyutuna geri dönmek için karekök almamız gerekiyor. Bu değer denir standart sapma ve Yunanca "sigma" harfi ile gösterilir:

Bazen bu anlam denir standart sapma .

anlamı nedir? Matematiksel beklentiden standart sapma ile sola ve sağa saparsak:

– o zaman rastgele değişkenin en olası değerleri bu aralıkta “konsantre” olacaktır. Aslında gördüğümüz:

Bununla birlikte, öyle oldu ki, saçılma analizinde hemen hemen her zaman dağılma kavramı ile çalışır. Oyunlarla ilgili olarak ne anlama geldiğini görelim. Atıcılar söz konusu olduğunda, hedefin merkezine göre isabetlerin "doğruluğundan" bahsediyorsak, o zaman burada dağılım iki şeyi karakterize eder:

İlk olarak, oranlar arttıkça varyansın da arttığı açıktır. Yani, örneğin, 10 kat arttırırsak, matematiksel beklenti 10 kat, varyans 100 kat artacaktır. (ikinci dereceden bir değer olduğu anda). Ancak oyunun kurallarının değişmediğini unutmayın! Sadece oranlar değişti, kabaca konuşursak, eskiden 10 ruble, şimdi 100 bahse girerdik.

İkinci, daha ilginç olan nokta, varyansın oyun stilini karakterize etmesidir. Oyun oranlarını zihinsel olarak düzeltin belli bir seviyede, ve burada ne olduğunu görün:

Düşük varyanslı bir oyun temkinli bir oyundur. Oyuncu, bir seferde çok fazla kaybetmediği/kazanmadığı en güvenilir şemaları seçme eğilimindedir. Örneğin rulette kırmızı/siyah sistemi (makalenin 4. Örneğine bakın) rastgele değişkenler) .

Yüksek varyans oyunu. O sık sık denir dağılım oyun. Bu, oyuncunun "adrenalin" şemalarını seçtiği maceracı veya agresif bir oyun tarzıdır. En azından hatırlayalım "Martingal", söz konusu meblağlar, önceki paragrafın "sessiz" oyunundan daha büyük büyüklük sıraları.

Pokerdeki durum gösterge niteliğindedir: sözde var sıkı temkinli olma ve oyun fonlarını "sallama" eğiliminde olan oyuncular (banko). Şaşırtıcı olmayan bir şekilde, paraları fazla dalgalanmaz (düşük varyans). Tersine, bir oyuncunun yüksek varyansı varsa, o zaman saldırgandır. Sık sık risk alır, büyük bahisler yapar ve hem büyük bir bankayı kırabilir hem de parçalara ayrılabilir.

Aynı şey Forex'te de olur ve benzerleri - birçok örnek var.

Üstelik, her durumda, oyunun bir kuruş için mi yoksa binlerce dolar için mi olduğu önemli değil. Her seviyenin düşük ve yüksek varyanslı oyuncuları vardır. Eh, ortalama galibiyet için, hatırladığımız gibi, "sorumlu" beklenen değer.

Farkı bulmanın uzun ve zahmetli bir süreç olduğunu muhtemelen fark etmişsinizdir. Ama matematik cömerttir:

Varyansı bulmak için formül

Bu formül doğrudan varyans tanımından türetilmiştir ve hemen dolaşıma sokarız. Plakayı yukarıdan oyunumuzla kopyalayacağım:

ve bulunan beklenti .

Varyansı ikinci şekilde hesaplıyoruz. İlk olarak, matematiksel beklentiyi bulalım - rastgele değişkenin karesi. İle matematiksel beklentinin tanımı:

Bu durumda:

Böylece, formüle göre:

Dedikleri gibi, farkı hissedin. Ve pratikte elbette formülü uygulamak daha iyidir (şart aksini gerektirmedikçe).

Çözme ve tasarlama tekniğinde ustalaşıyoruz:

Örnek 6

Matematiksel beklentisini, varyansını ve standart sapmasını bulun.

Bu görev her yerde bulunur ve kural olarak anlamlı bir anlamı yoktur.
Belirli olasılıklarla bir tımarhanede yanan sayılara sahip birkaç ampul hayal edebilirsiniz :)

Çözüm: Ana hesaplamaları bir tabloda özetlemek uygundur. İlk olarak, ilk verileri ilk iki satıra yazıyoruz. Sonra ürünleri hesaplarız, ardından sağ sütundaki toplamları hesaplarız:

Aslında, neredeyse her şey hazır. Üçüncü satırda, hazır bir matematiksel beklenti çizilmiştir: .

Dağılım aşağıdaki formülle hesaplanır:

Ve son olarak, standart sapma:
- kişisel olarak, genellikle 2 ondalık basamağa yuvarlarım.

Tüm hesaplamalar bir hesap makinesinde yapılabilir ve daha da iyisi - Excel'de:

Burada hata yapmak zor :)

Cevap:

Dileyen hayatlarını daha da sadeleştirebilir ve benim imkanlarımdan faydalanabilir. hesap makinesi (demo), bu sorunu yalnızca anında çözmekle kalmaz, aynı zamanda tematik grafikler (yakında gel). Program kütüphaneden indir- en az bir çalışma materyali indirdiyseniz veya diğer yol. Projeyi desteklediğiniz için teşekkürler!

Bağımsız çözüm için birkaç görev:

Örnek 7

Tanıma göre önceki örneğin rastgele değişkeninin varyansını hesaplayın.

Ve benzer bir örnek:

Örnek 8

Ayrık bir rastgele değişken, kendi dağıtım yasası tarafından verilir:

Evet, rastgele değişkenin değerleri oldukça büyük olabilir. (gerçek işten örnek), ve burada mümkünse Excel'i kullanın. Bu arada, Örnek 7'de olduğu gibi - daha hızlı, daha güvenilir ve daha keyifli.

Çözümler ve cevaplar sayfanın altında.

Dersin 2. bölümünün sonunda, tipik bir görevi daha analiz edeceğiz, hatta küçük bir bilmece bile diyebiliriz:

Örnek 9

Ayrık bir rastgele değişken yalnızca iki değer alabilir: ve , ve . Olasılık, matematiksel beklenti ve varyans bilinmektedir.

Çözüm: Bilinmeyen bir olasılıkla başlayalım. Rastgele bir değişken sadece iki değer alabildiğinden, karşılık gelen olayların olasılıklarının toplamı:

ve o zamandan beri .

Bulmak için kalır ..., söylemesi kolay :) Ama oh iyi, başladı. Matematiksel beklentinin tanımına göre:
- bilinen değerleri değiştirin:

- ve bu denklemden, normal yönde yeniden yazabilmeniz dışında başka bir şey çıkarılamaz:

veya:

Diğer eylemler hakkında, tahmin edebileceğinizi düşünüyorum. Sistemi oluşturalım ve çözelim:

Ondalık sayılar elbette tam bir rezalettir; her iki denklemi de 10 ile çarpın:

ve 2'ye bölün:

Bu çok daha iyi. 1. denklemden şunu ifade ederiz:
(bu daha kolay yol)- 2. denklemde yerine:


inşa ediyoruz kare ve basitleştirmeler yapın:

ile çarpıyoruz:

Sonuç olarak, ikinci dereceden denklem, diskriminantını bulun:
- mükemmel!

ve iki çözüm elde ederiz:

1) eğer , sonra ;

2) eğer , sonra .

İlk değer çifti koşulu karşılar. Yüksek bir olasılıkla her şey doğrudur, ancak yine de dağıtım yasasını yazıyoruz:

ve bir kontrol yapın, yani beklentiyi bulun: