Fark değeri. Varyans ve standart sapma

İstatistikte kullanılan birçok gösterge arasında varyans hesaplamasını vurgulamak gerekir. Bu hesaplamayı manuel olarak yapmanın oldukça sıkıcı bir iş olduğunu belirtmekte fayda var. Neyse ki Excel'de hesaplama prosedürünü otomatikleştirmenize olanak tanıyan işlevler vardır. Bu araçlarla çalışmanın algoritmasını bulalım.

Dağılım, matematiksel beklentiden sapmaların ortalama karesi olan varyasyonun bir göstergesidir. Böylece sayıların ortalamaya göre dağılımını ifade eder. Dağılımın hesaplanması hem genel popülasyon hem de numune için yapılabilir.

Yöntem 1: genel nüfusa göre hesaplama

Genel nüfus için Excel'de bu göstergeyi hesaplamak için işlev kullanılır DISP.G. Bu ifadenin sözdizimi aşağıdaki gibidir:

DISP.G(Sayı1;Sayı2;…)

Toplamda 1 ila 255 arasında bağımsız değişken uygulanabilir. Bağımsız değişkenler hem sayısal değerler hem de içerdikleri hücrelere referanslar olabilir.

Bir dizi sayısal veri için bu değerin nasıl hesaplanacağını görelim.


Yöntem 2: örnek hesaplama

Örneklem hesaplamasında, genel nüfusa ilişkin değer hesaplamasından farklı olarak, payda sayıların toplamı değil, bir eksiğidir. Bu, hatayı düzeltmek için yapılır. Excel, bu tür hesaplamalar için tasarlanmış özel bir işlevde bu nüansı dikkate alır - DISP.V. Sözdizimi aşağıdaki formülle temsil edilir:

VAR.B(Sayı1;Sayı2;…)

Önceki fonksiyonda olduğu gibi argüman sayısı da 1 ile 255 arasında değişebilir.


Gördüğünüz gibi Excel programı varyansın hesaplanmasını büyük ölçüde kolaylaştırabilmektedir. Bu istatistik uygulama tarafından hem evren hem de örneklem için hesaplanabilmektedir. Bu durumda, tüm kullanıcı eylemleri aslında yalnızca işlenecek sayı aralığının belirlenmesine indirgenir ve asıl işi Excel kendisi yapar. Elbette bu, kullanıcılara önemli miktarda zaman kazandıracak.

İstatistiklerde dağılım karesinde özelliğin bireysel değerleri olarak bulunur. Başlangıç ​​verilerine bağlı olarak basit ve ağırlıklı varyans formülleri ile belirlenir:

1. (gruplandırılmamış veriler için) aşağıdaki formülle hesaplanır:

2. Ağırlıklı varyans (bir varyasyon serisi için):

burada n frekanstır (tekrarlanabilirlik faktörü X)

Varyansı bulmaya bir örnek

Bu sayfada varyansı bulmanın standart bir örneği açıklanmaktadır; bunu bulmak için diğer görevlere de bakabilirsiniz.

Örnek 1. 20 yazışmalı öğrenciden oluşan bir grup için aşağıdaki verilere sahibiz. Özellik dağılımının bir aralık serisini oluşturmak, özelliğin ortalama değerini hesaplamak ve varyansını incelemek gerekir.

Bir aralık gruplaması oluşturalım. Aralığın aralığını aşağıdaki formülle belirleyelim:

burada Xmax, gruplandırma özelliğinin maksimum değeridir;
X min, gruplama özelliğinin minimum değeridir;
n aralıkların sayısıdır:

n=5 kabul ediyoruz. Adım şu şekildedir: h \u003d (192 - 159) / 5 \u003d 6,6

Aralıklı gruplama yapalım

Daha fazla hesaplama için yardımcı bir tablo oluşturacağız:

X'i aralığın ortasıdır. (örneğin 159 - 165,6 = 162,3 aralığının ortası)

Öğrencilerin ortalama büyümesi aritmetik ağırlıklı ortalamanın formülü ile belirlenir:

Dağılımı aşağıdaki formülle belirleriz:

Varyans formülü aşağıdaki gibi dönüştürülebilir:

Bu formülden şu sonuç çıkıyor varyans seçeneklerin karelerinin ortalaması ile kareleri ve ortalaması arasındaki fark.

Varyasyon serisindeki varyans Momentler yöntemine göre eşit aralıklarla, ikinci dağılım özelliği kullanılarak (tüm seçeneklerin aralığın değerine bölünmesiyle) aşağıdaki şekilde hesaplanabilir. varyansın tanımı Momentler yöntemiyle hesaplanan aşağıdaki formüle göre daha az zaman alır:

burada i aralığın değeridir;
A - aralığın ortasını en yüksek frekansla kullanmaya uygun olan koşullu sıfır;
m1 birinci dereceden momentin karesidir;
m2 - ikinci derecenin anı

(istatistiksel popülasyonda özellik yalnızca iki birbirini dışlayan seçenek olacak şekilde değişirse, bu tür değişkenliğe alternatif denir) aşağıdaki formülle hesaplanabilir:

Bu dağılım formülünü q = 1- p yerine koyarsak şunu elde ederiz:

Dağılım türleri

Toplam varyans Bir özelliğin, bu varyasyona neden olan tüm faktörlerin etkisi altında bir bütün olarak popülasyonun tamamındaki varyasyonunu ölçer. x niteliğinin bireysel değerlerinin toplam ortalama x değerinden sapmalarının ortalama karesine eşittir ve basit varyans veya ağırlıklı varyans olarak tanımlanabilir.

rastgele değişimi karakterize eder, yani Açıklanmayan faktörlerin etkisinden kaynaklanan ve gruplandırmanın altında yatan işaret faktörüne bağlı olmayan varyasyonun bir kısmı. Bu varyans, X grubu içindeki özniteliğin bireysel değerlerinin grubun aritmetik ortalamasından sapmalarının ortalama karesine eşittir ve basit varyans veya ağırlıklı varyans olarak hesaplanabilir.

Böylece, grup içi varyans ölçümleri Bir grup içindeki bir özelliğin varyasyonu aşağıdaki formülle belirlenir:

burada xi - grup ortalaması;
ni gruptaki birimlerin sayısıdır.

Örneğin, bir atölyede işçilerin niteliklerinin işgücü üretkenliği düzeyi üzerindeki etkisini incelemek görevinde belirlenmesi gereken grup içi farklılıklar, her gruptaki çıktıda tüm olası faktörlerden (ekipmanın teknik durumu, ekipman durumu) kaynaklanan farklılıklar gösterir. araç ve malzemelerin mevcudiyeti, işçilerin yaşı, iş yoğunluğu vb.), yeterlilik kategorisindeki farklılıklar hariç (grup içinde tüm çalışanlar aynı yeterliliğe sahiptir).

Grup içi varyansların ortalaması, rastgeleyi, yani varyasyonun gruplandırma faktörü haricindeki tüm diğer faktörlerin etkisi altında meydana gelen kısmını yansıtır. Aşağıdaki formülle hesaplanır:

Gruplandırmanın altında yatan özellik faktörünün etkisinden kaynaklanan, ortaya çıkan özelliğin sistematik varyasyonunu karakterize eder. Grup ortalamalarının genel ortalamadan sapmalarının ortalama karesine eşittir. Gruplar arası varyans aşağıdaki formülle hesaplanır:

İstatistiklerde varyans toplama kuralı

Buna göre varyans toplama kuralı toplam varyans, grup içi ve gruplar arası varyansların ortalamasının toplamına eşittir:

Bu kuralın anlamı tüm faktörlerin etkisiyle oluşan toplam varyansın, diğer tüm faktörlerin etkisi altında ortaya çıkan varyanslar ile gruplama faktöründen dolayı ortaya çıkan varyansın toplamına eşit olmasıdır.

Varyansları ekleme formülünü kullanarak, bilinen iki varyanstan üçüncü bilinmeyeni belirlemek ve ayrıca gruplandırma özelliğinin etkisinin gücünü yargılamak mümkündür.

Dispersiyon Özellikleri

1. Özelliğin tüm değerleri aynı sabit değer kadar azaltılırsa (arttırılırsa), o zaman bundan varyans değişmeyecektir.
2. Eğer özelliğin tüm değerleri aynı sayıda n kadar azaltılırsa (artırılırsa), varyans buna göre n^2 kat azalacaktır (artacaktır).

İstatistiklerde dağılım, bir özelliğin bireysel değerlerinin aritmetik ortalamadan karesinin standart sapması olarak tanımlanır. Seçeneklerin ortalamadan sapmalarının karesini hesaplamanın ve ardından ortalamasını almanın yaygın bir yolu.

Ekonomik ve istatistiksel analizde, bir özelliğin değişimini çoğunlukla varyansın karekökü olan standart sapmayı kullanarak değerlendirmek gelenekseldir.

(3)

Değişken niteliğinin değerlerinin mutlak dalgalanmasını karakterize eder ve değişkenlerle aynı birimlerle ifade edilir. İstatistiklerde çoğu zaman çeşitli özelliklerin varyasyonlarını karşılaştırmak gerekli hale gelir. Bu tür karşılaştırmalar için göreceli bir değişim göstergesi olan değişim katsayısı kullanılır.

Dispersiyon özellikleri:

1) Tüm seçeneklerden herhangi bir sayıyı çıkarırsanız varyans değişmeyecektir;

2) eğer varyantın tüm değerleri bir b sayısına bölünürse, varyans b^2 kat azalacaktır, yani.

3) Eşit olmayan bir aritmetik ortalamaya sahip herhangi bir sayıdan sapmaların ortalama karesini hesaplarsanız, bu, varyanstan daha büyük olacaktır. Bu durumda, pozun ortalama değeri arasındaki farkın kare başına değeri iyi tanımlanmış.

Varyans, ortalamanın karesi ile ortalamanın karesi arasındaki fark olarak tanımlanabilir.

17. Grup ve gruplar arası farklılıklar. Varyans ekleme kuralı

İstatistiksel popülasyon, incelenen özelliğe göre gruplara veya parçalara ayrılırsa, böyle bir popülasyon için aşağıdaki dağılım türleri hesaplanabilir: grup (özel), grup ortalaması (özel) ve gruplar arası.

Toplam varyans- belirli bir istatistiksel popülasyonda geçerli olan tüm koşullar ve nedenlere bağlı olarak bir özelliğin varyasyonunu yansıtır.

Grup varyansı- grup içindeki özelliğin bireysel değerlerinin, grup ortalaması olarak adlandırılan bu grubun aritmetik ortalamasından sapmalarının ortalama karesine eşittir. Bu durumda grup ortalaması tüm nüfusun toplam ortalaması ile örtüşmemektedir.

Grup varyansı, bir özelliğin yalnızca grup içinde geçerli olan koşullar ve nedenlere bağlı olarak değişmesini yansıtır.

Ortalama grup varyansları- Grup dağılımlarının ağırlıklı aritmetik ortalaması olarak tanımlanır; ağırlıklar grupların hacimleridir.

Gruplararası varyans- grup ortalamalarının toplam ortalamadan sapmalarının ortalama karesine eşittir.

Gruplar arası varyans, gruplama özelliğine bağlı olarak ortaya çıkan özelliğin değişimini karakterize eder.

Dikkate alınan dağılım türleri arasında belirli bir ilişki vardır: toplam dağılım, ortalama grup ve gruplar arası dağılımın toplamına eşittir.

Bu ilişkiye varyans toplama kuralı denir.

18. Dinamik seriler ve onu oluşturan unsurlar. Dinamik seri türleri.

İstatistiklerdeki seriler- bunlar, bir olgunun zaman veya mekandaki değişimini gösteren ve olayların hem zaman içindeki gelişim sürecinde hem de çeşitli biçim ve süreç türlerinde istatistiksel olarak karşılaştırılmasını mümkün kılan dijital verilerdir. Bu sayede fenomenlerin karşılıklı bağımlılığını tespit etmek mümkündür.

İstatistikte sosyal olayların zaman içindeki hareketinin gelişme sürecine genellikle dinamik denir. Dinamikleri görüntülemek için, kronolojik sıraya göre düzenlenmiş istatistiksel bir göstergenin (örneğin, 10 yıl içindeki hükümlü sayısı) zamanla değişen değerleri dizisi olan bir dizi dinamik (kronolojik, zamansal) oluşturulur. Bunları oluşturan unsurlar, belirli bir göstergenin sayısal değerleri ve atıfta bulundukları zaman dilimleri veya noktalarıdır.

Zaman serilerinin en önemli özelliği- belirli bir süre veya belirli bir anda elde edilen şu veya bu olgunun büyüklüğü (hacmi, değeri). Buna göre dinamikler dizisinin terimlerinin büyüklüğü onun düzeyidir. Ayırt etmek Dinamik serinin başlangıç, orta ve son seviyeleri. İlk seviye serinin ilk, son - son üyesinin değerini gösterir. Ortalama seviye ortalama kronolojik değişim aralığını temsil eder ve zaman serisinin aralıklı mı yoksa anlık mı olduğuna bağlı olarak hesaplanır.

Dinamik serinin bir diğer önemli özelliği- İlk gözlemden son gözleme kadar geçen süre veya bu tür gözlemlerin sayısı.

Zaman serilerinin çeşitli türleri vardır ve bunlar aşağıdaki kriterlere göre sınıflandırılabilir.

1) Seviyelerin ifade edilme biçimine bağlı olarak dinamikler serisi, mutlak ve türetilmiş göstergeler (göreceli ve ortalama değerler) serisine ayrılır.

2) Serinin düzeyleri, olgunun belirli zaman noktalarındaki (ay başı, çeyrek, yıl vb. başında) durumunu veya belirli zaman aralıklarındaki değerini (örneğin, günlük, günlük) nasıl ifade ettiğine bağlı olarak ay, yıl, vb.) n.), sırasıyla dinamiklerin moment ve aralık serilerini ayırt eder. Kolluk kuvvetlerinin analitik çalışmalarında an serileri nispeten nadiren kullanılmaktadır.

İstatistik teorisinde dinamikler ayrıca bir dizi başka sınıflandırma özelliğine göre de ayırt edilir: seviyeler arasındaki mesafeye bağlı olarak - eşit mesafeli seviyeler ve zaman içinde eşit olmayan seviyelerle; incelenen sürecin ana eğiliminin varlığına bağlı olarak - durağan ve durağan olmayan. Dinamik serileri analiz ederken serinin aşağıdaki seviyeleri bileşenler olarak sunulur:

Y t \u003d TP + E (t)

TR, zaman içindeki genel değişim eğilimini veya bir eğilimi belirleyen deterministik bir bileşendir.

E(t), seviye dalgalanmalarına neden olan rastgele bir bileşendir.

Bu sayfada varyansı bulmanın standart bir örneği açıklanmaktadır; bunu bulmak için diğer görevlere de bakabilirsiniz.

Örnek 1. Grup, grup ortalaması, gruplar arası ve toplam varyansın belirlenmesi

Örnek 2. Gruplandırma tablosunda varyansı ve varyasyon katsayısını bulma

Örnek 3. Ayrık bir seride varyansın bulunması

Örnek 4. 20 yazışmalı öğrenciden oluşan bir grup için aşağıdaki verilere sahibiz. Özellik dağılımının bir aralık serisini oluşturmak, özelliğin ortalama değerini hesaplamak ve varyansını incelemek gerekir.

Bir aralık gruplaması oluşturalım. Aralığın aralığını aşağıdaki formülle belirleyelim:

burada Xmax, gruplandırma özelliğinin maksimum değeridir;
X min, gruplama özelliğinin minimum değeridir;
n aralıkların sayısıdır:

n=5 kabul ediyoruz. Adım şu şekildedir: h \u003d (192 - 159) / 5 \u003d 6,6

Aralıklı gruplama yapalım

Daha fazla hesaplama için yardımcı bir tablo oluşturacağız:

X "i - aralığın ortası. (örneğin, 159 - 165,6 \u003d 162,3 aralığının ortası)

Öğrencilerin ortalama büyümesi aritmetik ağırlıklı ortalamanın formülü ile belirlenir:

Dağılımı aşağıdaki formülle belirleriz:

Formül şu şekilde dönüştürülebilir:

Bu formülden şu sonuç çıkıyor varyans seçeneklerin karelerinin ortalaması ile kareleri ve ortalaması arasındaki fark.

Varyasyon serisindeki varyans Momentler yöntemine göre eşit aralıklarla, ikinci dağılım özelliği kullanılarak (tüm seçeneklerin aralığın değerine bölünmesiyle) aşağıdaki şekilde hesaplanabilir. varyansın tanımı Momentler yöntemiyle hesaplanan aşağıdaki formüle göre daha az zaman alır:

burada i aralığın değeridir;
A - aralığın ortasını en yüksek frekansla kullanmaya uygun olan koşullu sıfır;
m1 birinci dereceden momentin karesidir;
m2 - ikinci derecenin anı

Özellik farkı (istatistiksel popülasyonda özellik yalnızca iki birbirini dışlayan seçenek olacak şekilde değişirse, bu tür değişkenliğe alternatif denir) aşağıdaki formülle hesaplanabilir:

Bu dağılım formülünü q = 1- p yerine koyarsak şunu elde ederiz:

Dağılım türleri

Toplam varyans Bir özelliğin, bu varyasyona neden olan tüm faktörlerin etkisi altında bir bütün olarak popülasyonun tamamındaki varyasyonunu ölçer. x niteliğinin bireysel değerlerinin toplam ortalama x değerinden sapmalarının ortalama karesine eşittir ve basit varyans veya ağırlıklı varyans olarak tanımlanabilir.

Grup içi varyans rastgele değişimi karakterize eder, yani Açıklanmayan faktörlerin etkisinden kaynaklanan ve gruplandırmanın altında yatan işaret faktörüne bağlı olmayan varyasyonun bir kısmı. Bu varyans, X grubu içindeki özniteliğin bireysel değerlerinin grubun aritmetik ortalamasından sapmalarının ortalama karesine eşittir ve basit varyans veya ağırlıklı varyans olarak hesaplanabilir.



Böylece, grup içi varyans ölçümleri Bir grup içindeki bir özelliğin varyasyonu aşağıdaki formülle belirlenir:

burada xi - grup ortalaması;
ni gruptaki birimlerin sayısıdır.

Örneğin, bir atölyede işçilerin niteliklerinin işgücü üretkenliği düzeyi üzerindeki etkisini incelemek görevinde belirlenmesi gereken grup içi farklılıklar, her gruptaki çıktıda tüm olası faktörlerden (ekipmanın teknik durumu, ekipman durumu) kaynaklanan farklılıklar gösterir. araç ve malzemelerin mevcudiyeti, işçilerin yaşı, iş yoğunluğu vb.), yeterlilik kategorisindeki farklılıklar hariç (grup içinde tüm çalışanlar aynı yeterliliğe sahiptir).

Dağılım, veri değerleri ile ortalama arasındaki göreceli sapmayı tanımlayan bir dağılım ölçüsüdür. İstatistiklerde en sık kullanılan dağılım ölçüsüdür ve her veri değerinin ortalamadan sapmasının karesi alınarak hesaplanır. Varyansın hesaplanmasına ilişkin formül aşağıda gösterilmiştir:

s 2 - örnek varyans;

x cf numunenin ortalama değeridir;

Nörneklem büyüklüğü (veri değerlerinin sayısı),

(x i – x cf), veri setinin her bir değeri için ortalama değerden sapmadır.

Formülü daha iyi anlamak için bir örneğe bakalım. Yemek yapmayı gerçekten sevmiyorum, bu yüzden nadiren yapıyorum. Ancak açlıktan ölmemek için ara sıra sobanın yanına gidip vücudumu protein, yağ ve karbonhidratla doyurma planını uygulamak zorunda kalıyorum. Aşağıdaki veri seti Renat'ın her ay kaç kez yemek pişirdiğini göstermektedir:

Varyansı hesaplamanın ilk adımı, örneğimizde ayda 7,8 kez olan örnek ortalamasını belirlemektir. Geri kalan hesaplamalar aşağıdaki tablonun yardımıyla kolaylaştırılabilir.

Varyansı hesaplamanın son aşaması şuna benzer:

Tüm hesaplamaları tek seferde yapmayı sevenler için denklem şu şekilde görünecektir:

Ham sayım yöntemini kullanma (yemek pişirme örneği)

Varyansı hesaplamanın "ham sayma" yöntemi olarak bilinen daha etkili bir yolu vardır. Denklem ilk bakışta oldukça hantal görünse de aslında o kadar da korkutucu değil. Bunu doğrulayabilir ve ardından hangi yöntemi en çok beğendiğinize karar verebilirsiniz.

karesi alındıktan sonra her veri değerinin toplamıdır,

tüm veri değerlerinin toplamının karesidir.

Hemen aklınızı kaybetmeyin. Hepsini bir tablo haline getirelim ve burada önceki örneğe göre daha az hesaplama olduğunu göreceksiniz.

Gördüğünüz gibi sonuç, önceki yöntemi kullanırken elde edilen sonuçla aynıdır. Bu yöntemin avantajları örneklem büyüklüğü (n) büyüdükçe ortaya çıkar.

Excel'de varyansı hesaplama

Muhtemelen zaten tahmin ettiğiniz gibi, Excel'in varyansı hesaplamanıza olanak tanıyan bir formülü vardır. Ayrıca Excel 2010'dan itibaren dağılım formülünün 4 çeşidini bulabilirsiniz:

1) VAR.V - Örneğin varyansını döndürür. Boole değerleri ve metin dikkate alınmaz.

2) VAR.G - Popülasyon varyansını döndürür. Boole değerleri ve metin dikkate alınmaz.

3) VASP - Boolean ve metin değerlerini dikkate alarak örnek varyansını döndürür.

4) VARP - Mantıksal ve metinsel değerleri dikkate alarak popülasyonun varyansını döndürür.

Öncelikle örnek ve popülasyon arasındaki farka bakalım. Tanımlayıcı istatistiklerin amacı, verileri hızlı bir şekilde büyük bir resim, tabiri caizse bir genel bakış elde edecek şekilde özetlemek veya görüntülemektir. İstatistiksel çıkarım, bu popülasyondan alınan bir veri örneğine dayanarak bir popülasyon hakkında çıkarımlar yapmanızı sağlar. Nüfus bizi ilgilendiren tüm olası sonuçları veya ölçümleri temsil eder. Örnek, bir popülasyonun alt kümesidir.

Örneğin, Rusya'daki bir üniversitedeki bir grup öğrencinin tamamıyla ilgileniyoruz ve grubun ortalama puanını belirlememiz gerekiyor. Öğrencilerin ortalama performansını hesaplayabiliriz ve hesaplamalarımıza tüm nüfus dahil olacağından ortaya çıkan rakam bir parametre olacaktır. Ancak ülkemizdeki tüm öğrencilerin genel not ortalamasını hesaplamak istersek o zaman bu grup bizim örneklemimiz olacaktır.

Örneklem ile popülasyon arasındaki varyansın hesaplanmasına yönelik formüldeki fark paydadadır. Örneklem için (n-1)'e eşit olacaktır ve genel nüfus için yalnızca n'ye eşit olacaktır.

Şimdi sonlarla varyansı hesaplamanın fonksiyonlarıyla ilgilenelim A, açıklamasında hesaplamanın metin ve mantıksal değerleri dikkate aldığı söyleniyor. Bu durumda, sayısal olmayan değerlerin oluştuğu belirli bir veri kümesinin varyansı hesaplanırken Excel, metin ve yanlış boole değerlerini 0, gerçek boole değerlerini ise 1 olarak yorumlayacaktır.

Dolayısıyla, bir dizi veriye sahipseniz yukarıda listelenen Excel işlevlerinden birini kullanarak varyansını hesaplamak zor olmayacaktır.