Varyans nedir? Mutlak varyasyonlar

İstatistiklerde dağılım karakteristiğin bireysel değerlerinin karesi olarak bulunur. Başlangıç ​​verilerine bağlı olarak basit ve ağırlıklı varyans formülleri kullanılarak belirlenir:

1. (gruplandırılmamış veriler için) aşağıdaki formül kullanılarak hesaplanır:

2. Ağırlıklı varyans (varyasyon serileri için):

burada n frekanstır (X faktörünün tekrarlanabilirliği)

Varyansı bulma örneği

Bu sayfada varyans bulmanın standart bir örneği açıklanmaktadır; bunu bulmak için diğer problemlere de bakabilirsiniz.

Örnek 1. Aşağıdaki veriler 20 yazışma öğrencisinden oluşan bir grup için mevcuttur. Karakteristiğin dağılımına ilişkin bir aralık serisi oluşturmak, özelliğin ortalama değerini hesaplamak ve dağılımını incelemek gerekir.

Bir aralık gruplaması oluşturalım. Aşağıdaki formülü kullanarak aralığın aralığını belirleyelim:

burada Xmax, gruplandırma karakteristiğinin maksimum değeridir;
X min – gruplandırma karakteristiğinin minimum değeri;
n – aralık sayısı:

n=5 kabul ediyoruz. Adım: h = (192 - 159)/ 5 = 6,6

Bir aralık gruplaması oluşturalım

Daha fazla hesaplama için yardımcı bir tablo oluşturacağız:

X'i aralığın ortasıdır. (örneğin 159 – 165,6 aralığının ortası = 162,3)

Ağırlıklı aritmetik ortalama formülünü kullanarak öğrencilerin ortalama boyunu belirleriz:

Aşağıdaki formülü kullanarak varyansı belirleyelim:

Dispersiyon formülü aşağıdaki gibi dönüştürülebilir:

Bu formülden şu sonuç çıkıyor varyans eşittir seçeneklerin karelerinin ortalaması ile kare ve ortalama arasındaki fark.

Varyasyon serisindeki dağılım Momentler yöntemini kullanarak eşit aralıklarla, ikinci dağılım özelliği kullanılarak (tüm seçeneklerin aralığın değerine bölünmesiyle) aşağıdaki şekilde hesaplanabilir. Varyansın belirlenmesi Momentler yöntemi kullanılarak hesaplanan aşağıdaki formülü kullanmak daha az zahmetlidir:

burada i aralığın değeridir;
A, aralığın ortasını en yüksek frekansla kullanmanın uygun olduğu geleneksel bir sıfırdır;
m1 birinci dereceden momentin karesidir;
m2 - ikinci derecenin anı

(istatistiksel bir popülasyonda bir özellik yalnızca iki birbirini dışlayan seçenek olacak şekilde değişirse, bu tür değişkenliğe alternatif denir) aşağıdaki formül kullanılarak hesaplanabilir:

Bu dağılım formülünde q = 1-p'yi yerine koyarsak şunu elde ederiz:

Varyans türleri

Toplam varyans Bir özelliğin, bu varyasyona neden olan tüm faktörlerin etkisi altında popülasyonun tamamındaki değişimini bir bütün olarak ölçer. Bir x karakteristiğinin bireysel değerlerinin, x'in genel ortalama değerinden sapmalarının ortalama karesine eşittir ve basit varyans veya ağırlıklı varyans olarak tanımlanabilir.

rastgele değişimi karakterize eder, yani Değişimin hesaba katılmayan faktörlerin etkisinden kaynaklanan ve grubun temelini oluşturan faktör özelliğine bağlı olmayan kısmı. Bu tür bir dağılım, X grubu içindeki özelliğin bireysel değerlerinin grubun aritmetik ortalamasından sapmalarının ortalama karesine eşittir ve basit dağılım veya ağırlıklı dağılım olarak hesaplanabilir.

Böylece, grup içi varyans ölçümleri Bir grup içindeki bir özelliğin varyasyonu aşağıdaki formülle belirlenir:

burada xi grup ortalamasıdır;
ni gruptaki birimlerin sayısıdır.

Örneğin, bir atölyede işçilerin niteliklerinin işgücü üretkenliği düzeyi üzerindeki etkisini inceleme görevinde belirlenmesi gereken grup içi farklılıklar, her gruptaki çıktıda tüm olası faktörlerin (ekipmanın teknik durumu, ekipmanın mevcudiyeti) neden olduğu değişiklikleri gösterir. araç ve gereçler, işçilerin yaşı, emek yoğunluğu vb.), nitelik kategorisindeki farklılıklar hariç (bir grup içindeki tüm işçiler aynı niteliklere sahiptir).

Grup içi varyansların ortalaması, rastgeleliği, yani varyasyonun gruplandırma faktörü haricindeki tüm diğer faktörlerin etkisi altında meydana gelen kısmını yansıtır. Aşağıdaki formül kullanılarak hesaplanır:

Grubun temelini oluşturan faktör işaretinin etkisinden kaynaklanan, ortaya çıkan özelliğin sistematik varyasyonunu karakterize eder. Grup ortalamalarının genel ortalamadan sapmalarının ortalama karesine eşittir. Gruplar arası varyans aşağıdaki formül kullanılarak hesaplanır:

İstatistiklere varyans ekleme kuralı

Buna göre varyans ekleme kuralı toplam varyans, grup içi ve gruplar arası varyansların ortalamasının toplamına eşittir:

Bu kuralın anlamı tüm faktörlerin etkisi altında ortaya çıkan toplam varyansın, diğer tüm faktörlerin etkisi altında ortaya çıkan varyanslar ile gruplama faktöründen dolayı ortaya çıkan varyansın toplamına eşit olmasıdır.

Varyans ekleme formülünü kullanarak, bilinen iki varyanstan üçüncü bilinmeyen varyansı belirleyebilir ve ayrıca gruplandırma özelliğinin etkisinin gücünü değerlendirebilirsiniz.

Dispersiyon özellikleri

1. Bir özelliğin tüm değerleri aynı sabit miktarda azaltılırsa (artırılırsa) dağılım değişmeyecektir.
2. Bir özelliğin tüm değerleri aynı sayıda n kadar azaltılırsa (artırılırsa), varyans buna karşılık olarak n^2 kat azalacak (artacaktır).

Popülasyon incelenen özelliğe göre gruplara ayrılırsa, bu popülasyon için aşağıdaki varyans türleri hesaplanabilir: toplam, grup (grup içi), grup ortalaması (grup içi ortalama), gruplar arası.

Başlangıçta, incelenen özelliğin toplam varyasyonunun ne kadarının gruplar arası varyasyon olduğunu gösteren belirleme katsayısını hesaplar; gruplandırma özelliğinden dolayı:

Ampirik korelasyon ilişkisi, gruplama (faktöriyel) ile performans özellikleri arasındaki bağlantının yakınlığını karakterize eder.

Ampirik korelasyon oranı 0'dan 1'e kadar değerler alabilir.

Ampirik korelasyon oranına dayalı olarak bağlantının yakınlığını değerlendirmek için Chaddock ilişkilerini kullanabilirsiniz:

Örnek 4.Çeşitli mülkiyet biçimlerine sahip tasarım ve araştırma kuruluşlarının iş performansına ilişkin aşağıdaki veriler mevcuttur:

Tanımlamak:

1) toplam varyans;

2) grup farklılıkları;

3) grup varyanslarının ortalaması;

4) gruplar arası varyans;

5) varyansların eklenmesi kuralına dayalı toplam varyans;


6) belirleme katsayısı ve ampirik korelasyon oranı.

Sonuca varmak.

Çözüm:

1. İki tür mülkiyete sahip işletmelerin gerçekleştirdiği ortalama iş hacmini belirleyelim:

Toplam varyansı hesaplayalım:

2. Grup ortalamalarını belirleyin:

milyon ruble;

milyon ruble

Grup farklılıkları:

;

3. Grup varyanslarının ortalamasını hesaplayın:

4. Gruplar arası varyansı belirleyelim:

5. Varyans ekleme kuralına göre toplam varyansı hesaplayın:

6. Belirleme katsayısını belirleyelim:

.

Böylece tasarım ve etüt kuruluşlarının gerçekleştirdiği iş hacmi %22 oranında işletmelerin mülkiyet şekline bağlıdır.

Ampirik korelasyon oranı aşağıdaki formül kullanılarak hesaplanır

.

Hesaplanan göstergenin değeri, iş hacminin işletmenin mülkiyet biçimine bağımlılığının küçük olduğunu gösterir.

Örnek 5.Üretim alanlarının teknolojik disiplini üzerine yapılan araştırma sonucunda aşağıdaki veriler elde edildi:

Belirleme katsayısını belirleyin

İstatistiklerde genellikle bir olguyu veya süreci analiz ederken, yalnızca incelenen göstergelerin ortalama seviyeleri hakkındaki bilgileri değil, aynı zamanda bireysel birimlerin değerlerinde dağılım veya değişiklik Bu, incelenen popülasyonun önemli bir özelliğidir.

En çok değişime maruz kalanlar hisse senedi fiyatları, arz ve talep ile farklı zaman dilimlerinde ve farklı yerlerdeki faiz oranlarıdır.

Değişimi karakterize eden ana göstergeler aralık, dağılım, standart sapma ve değişim katsayısıdır.

Varyasyon aralığı karakteristiğin maksimum ve minimum değerleri arasındaki farkı temsil eder: R = Xmax – Xmin. Bu göstergenin dezavantajı, bir özelliğin yalnızca varyasyonunun sınırlarını değerlendirmesi ve bu sınırlar içindeki değişkenliğini yansıtmamasıdır.

Dağılım bu eksiklikten yoksundur. Karakteristik değerlerin ortalama değerlerinden sapmalarının ortalama karesi olarak hesaplanır:

Varyansı hesaplamanın basitleştirilmiş bir yolu aşağıdaki formüller kullanılarak gerçekleştirilir (basit ve ağırlıklı):

Bu formüllerin uygulama örnekleri görev 1 ve 2'de sunulmaktadır.

Uygulamada yaygın olarak kullanılan bir gösterge standart sapma :

Standart sapma, varyansın karekökü olarak tanımlanır ve incelenen karakteristikle aynı boyuta sahiptir.

Dikkate alınan göstergeler, varyasyonun mutlak değerini elde etmemizi sağlar; incelenen özelliğin ölçüm birimlerinde değerlendirin. Onlardan farklı olarak varyasyon katsayısı değişkenliği göreceli terimlerle (birçok durumda tercih edilen ortalama seviyeye göre) ölçer.

Değişim katsayısının hesaplanmasına yönelik formül.

“İstatistiklerdeki varyasyon göstergeleri” konusundaki problemlerin çözümüne örnekler

Sorun 1 . Bölgedeki bankaların aylık ortalama mevduat büyüklüğüne reklamların etkisi araştırılırken 2 banka incelendi. Aşağıdaki sonuçlar elde edildi:

Tanımlamak:
1) her banka için: a) aylık ortalama mevduat; b) katkı dağılımı;
2) iki bankanın birlikte ortalama aylık mevduatı;
3) Reklama bağlı olarak 2 banka için mevduat farkı;
4) Reklam dışındaki tüm faktörlere bağlı olarak 2 banka için mevduat farkı;
5) Toplama kuralı kullanılarak toplam varyans;
6) Belirleme katsayısı;
7) Korelasyon ilişkisi.

Çözüm

1) Reklamlı bir banka için hesaplama tablosu oluşturalım . Ortalama aylık depozitoyu belirlemek için aralıkların orta noktalarını bulacağız. Bu durumda, açık aralığın değeri (birincisi) koşullu olarak ona bitişik aralığın (ikincisi) değerine eşitlenir.

Ağırlıklı aritmetik ortalama formülünü kullanarak ortalama mevduat boyutunu bulacağız:

29.000/50 = 580 ovmak.

Aşağıdaki formülü kullanarak katkının varyansını buluruz:

23 400/50 = 468

Benzer eylemleri gerçekleştireceğiz reklamsız bir banka için :

2) İki bankanın ortalama mevduat büyüklüğünü birlikte bulalım. Хср =(580×50+542,8×50)/100 = 561,4 ovma.

3) İki banka için mevduatın varyansını reklama bağlı olarak şu formülü kullanarak bulacağız: σ 2 =pq (alternatif bir özelliğin varyansı için formül). Burada p=0,5 reklama bağlı faktörlerin oranıdır; q=1-0,5, sonra σ 2 =0,5*0,5=0,25.

4) Diğer faktörlerin payı 0,5 olduğundan, reklam dışındaki tüm faktörlere bağlı olarak mevduatın iki banka için varyansı da 0,25 olur.

5) Toplama kuralını kullanarak toplam varyansı belirleyin.

= (468*50+636,16*50)/100=552,08

= [(580-561,4)250+(542,8-561,4)250] / 100= 34 596/ 100=345,96

σ 2 = σ 2 gerçek + σ 2 geri kalan = 552,08+345,96 = 898,04

6) Belirleme katsayısı η 2 = σ 2 gerçek / σ 2 = 345,96/898,04 = 0,39 = %39 - katkının büyüklüğü %39 oranında reklama bağlıdır.

7) Ampirik korelasyon oranı η = √η 2 = √0,39 = 0,62 – ilişki oldukça yakındır.

Sorun 2 . Pazarlanabilir ürünlerin büyüklüğüne göre işletmelerin bir gruplaması vardır:

Aşağıdakileri belirleyin: 1) pazarlanabilir ürünlerin değerinin dağılımı; 2) standart sapma; 3) varyasyon katsayısı.

Çözüm

1) Koşula göre bir aralık dağılım serisi sunulur. Ayrı olarak ifade edilmelidir, yani aralığın ortasını bulun (x"). Kapalı aralık gruplarında ortayı basit aritmetik ortalama kullanarak buluruz. Üst sınırı olan gruplarda - bu üst sınır arasındaki fark olarak ve sonraki aralığın yarısı boyutunda (200-(400 -200):2=100).

Alt sınırı olan gruplarda - bu alt sınırın toplamı ve önceki aralığın yarısı kadardır (800+(800-600):2=900).

Pazarlanabilir ürünlerin ortalama değerini aşağıdaki formülü kullanarak hesaplıyoruz:

Хср = k×((Σ((x"-a):k)×f):Σf)+a. Burada a=500 seçeneğin en yüksek frekanstaki boyutu, k=600-400=200 ise seçeneğin boyutudur. En yüksek frekanstaki aralığın boyutunu tabloya koyalım:

Dolayısıyla, incelenen dönem için ticari çıktının ortalama değeri genellikle Хср = (-5:37)×200+500=472,97 bin rubleye eşittir.

2) Aşağıdaki formülü kullanarak varyansı buluyoruz:

σ 2 = (33/37)*2002-(472,97-500)2 = 35,675,67-730,62 = 34,945,05

3) standart sapma: σ = ±√σ 2 = ±√34.945,05 ≈ ±186,94 bin ruble.

4) Değişim katsayısı: V = (σ /Хср)*100 = (186,94 / 472,97)*100 = %39,52

Bir bütün olarak popülasyon boyunca bir özelliğin varyasyonunu incelemenin yanı sıra, gruplar arasında olduğu kadar popülasyonun bölündüğü gruplar arasında da karakteristikteki niceliksel değişikliklerin izini sürmek genellikle gereklidir. Bu varyasyon çalışması, farklı varyans türlerinin hesaplanması ve analiz edilmesiyle gerçekleştirilir.
Toplam, gruplar arası ve grup içi varyanslar vardır.
Toplam varyans σ 2 Bir özelliğin tüm popülasyondaki varyasyonunu, bu varyasyona neden olan tüm faktörlerin etkisi altında ölçer.

Gruplar arası varyans (δ) sistematik varyasyonu karakterize eder, yani. Grubun temelini oluşturan faktör özelliğinin etkisi altında ortaya çıkan, incelenen özelliğin değerindeki farklılıklar. Aşağıdaki formül kullanılarak hesaplanır:
.

Grup içi varyans (σ) rastgele değişimi yansıtır, yani hesaba katılmayan faktörlerin etkisi altında ortaya çıkan ve grubun temelini oluşturan faktör özelliğine bağlı olmayan varyasyonun bir kısmı. Aşağıdaki formülle hesaplanır:
.

Grup içi varyansların ortalaması: .

3 çeşit dağılımı birbirine bağlayan bir yasa vardır. Toplam varyans, grup içi ve gruplar arası varyansın ortalamasının toplamına eşittir: .
Bu orana denir varyans ekleme kuralı.

Analizde yaygın olarak kullanılan bir gösterge, gruplar arası varyansın toplam varyansa oranıdır. Buna denir ampirik belirleme katsayısı (η 2): .
Ampirik belirleme katsayısının kareköküne denir ampirik korelasyon oranı (η):
.
Grubun temelini oluşturan özelliğin, ortaya çıkan özelliğin değişimi üzerindeki etkisini karakterize eder. Ampirik korelasyon oranı 0 ile 1 arasında değişir.
Aşağıdaki örneği kullanarak pratik kullanımını gösterelim (Tablo 1).

Örnek No.1. Tablo 1 - NPO "Cyclone" atölyelerinden birinde iki işçi grubunun emek verimliliği

Genel ve grup ortalamalarını ve varyanslarını hesaplayalım:




Grup içi ve gruplar arası varyansın ortalamasını hesaplamak için ilk veriler tabloda sunulmaktadır. 2.
Tablo 2
İki işçi grubu için hesaplama ve δ 2.


İşçi grupları
İşçi sayısı, kişi Ortalama, çocuk/vardiya Dağılım

Teknik eğitim tamamlandı

5 95 42,0

Teknik eğitimi tamamlamamış olanlar

5 81 231,2

Tüm işçiler

10 88 185,6
Göstergeleri hesaplayalım. Grup içi varyansların ortalaması:
.
Gruplararası varyans

Toplam varyans:
Böylece ampirik korelasyon oranı: .

Niceliksel özelliklerdeki çeşitliliğin yanı sıra niteliksel özelliklerde de farklılıklar gözlemlenebilmektedir. Bu varyasyon çalışması, aşağıdaki varyans türlerinin hesaplanmasıyla gerçekleştirilir:

Payın grup içi dağılımı aşağıdaki formülle belirlenir:

Nerede n ben– ayrı gruplardaki birimlerin sayısı.
Çalışılan özelliğin tüm popülasyondaki payı aşağıdaki formülle belirlenir:
Üç varyans türü birbiriyle aşağıdaki şekilde ilişkilidir:
.

Bu varyans ilişkisine özellik payının varyanslarının eklenmesi teoremi denir.

İstatistiklerdeki çeşitliliğin ana genelleştirici göstergeleri dağılımlar ve standart sapmalardır.

Dağılım bu aritmetik ortalama her bir karakteristik değerin genel ortalamadan sapmalarının karesi. Varyansa genellikle sapmaların ortalama karesi denir ve  2 ile gösterilir. Kaynak verilere bağlı olarak varyans, basit veya ağırlıklı aritmetik ortalama kullanılarak hesaplanabilir:

 ağırlıklandırılmamış (basit) varyans;

 varyans ağırlıklı.

Standart sapma bu mutlak boyutların genelleştirici bir özelliğidir varyasyonlar toplu olarak işaretler. Nitelik ile aynı ölçü birimleriyle (metre, ton, yüzde, hektar vb.) ifade edilir.

Standart sapma, varyansın kareköküdür ve  ile gösterilir:

 ağırlıklandırılmamış standart sapma;

 ağırlıklı standart sapma.

Standart sapma ortalamanın güvenilirliğinin bir ölçüsüdür. Standart sapma ne kadar küçük olursa, aritmetik ortalama temsil edilen popülasyonun tamamını o kadar iyi yansıtır.

Standart sapmanın hesaplanmasından önce varyansın hesaplanması gerekir.

Ağırlıklı varyansın hesaplanmasına ilişkin prosedür aşağıdaki gibidir:

1) ağırlıklı aritmetik ortalamayı belirleyin:

2) seçeneklerin ortalamadan sapmalarını hesaplayın:

3) her seçeneğin ortalamadan sapmasının karesi:

4) sapmaların karelerini ağırlıklarla (frekanslar) çarpın:

5) ortaya çıkan ürünleri özetleyin:

6) Ortaya çıkan miktar, ağırlıkların toplamına bölünür:

Örnek 2.1

Ağırlıklı aritmetik ortalamayı hesaplayalım:

Ortalamadan sapmaların değerleri ve kareleri tabloda sunulmaktadır. Varyansı tanımlayalım:

Standart sapma şuna eşit olacaktır:

Kaynak veriler aralık şeklinde sunuluyorsa dağıtım serisi , daha sonra önce özelliğin ayrık değerini belirlemeniz ve ardından açıklanan yöntemi uygulamanız gerekir.

Örnek 2.2

Kolektif bir çiftliğin ekili alanının buğday verimine göre dağılımına ilişkin verileri kullanarak aralık serisi için varyans hesaplamasını gösterelim.

Aritmetik ortalama:

Varyansı hesaplayalım:

6.3. Bireysel verilere dayalı bir formül kullanarak varyansın hesaplanması

Hesaplama tekniği farklılıklar karmaşıktır ve büyük seçenek ve frekans değerleriyle hantal olabilir. Hesaplamalar dağılım özellikleri kullanılarak basitleştirilebilir.

Dispersiyon aşağıdaki özelliklere sahiptir.

1. Değişen bir özelliğin ağırlıklarının (frekanslarının) belirli sayıda azaltılması veya arttırılması, dağılımı değiştirmez.

2. Bir özelliğin her değerini aynı sabit miktarda azaltın veya artırın A dağılımını değiştirmez.

3. Bir özelliğin her değerini belirli sayıda azaltın veya artırın k varyansı sırasıyla azaltır veya artırır. k 2 kez standart sapma  içinde k bir kere.

4. Bir özelliğin rastgele bir değere göre dağılımı, ortalama ve isteğe bağlı değerler arasındaki farkın kare başına aritmetik ortalamasına göre dağılımdan her zaman daha büyüktür:

Eğer A 0 ise aşağıdaki eşitliğe ulaşırız:

yani özelliğin varyansı, karakteristik değerlerin ortalama karesi ile ortalamanın karesi arasındaki farka eşittir.

Varyans hesaplanırken her özellik bağımsız olarak veya diğerleriyle birlikte kullanılabilir.

Varyansı hesaplama prosedürü basittir:

1) belirlemek aritmetik ortalama :

2) aritmetik ortalamanın karesi:

3) serinin her bir varyantının sapmasının karesi:

X Ben 2 .

4) seçeneklerin karelerinin toplamını bulun:

5) seçeneklerin karelerinin toplamını sayılarına bölün, yani. ortalama kareyi belirleyin:

6) Karakteristiğin ortalama karesi ile ortalamanın karesi arasındaki farkı belirleyin:

Örnek 3.1İşçi verimliliğine ilişkin aşağıdaki veriler mevcuttur:

Aşağıdaki hesaplamaları yapalım: