Sürekli niceliksel veriler için aralık değişim serilerinin oluşturulması. Ayrık bir varyasyon serisinin oluşturulması

Gruplandırma- Bu, bir nüfusun bazı özelliklere göre homojen olan gruplara bölünmesidir.

Hizmetin amacı. Çevrimiçi hesap makinesini kullanarak şunları yapabilirsiniz:

  • bir varyasyon serisi oluşturun, bir histogram ve çokgen oluşturun;
  • varyasyon göstergelerini bulun (ortalama, mod (grafiksel dahil), medyan, varyasyon aralığı, çeyrekler, ondalıklar, çeyrek farklılaşma katsayısı, varyasyon katsayısı ve diğer göstergeler);

Talimatlar. Bir seriyi gruplandırmak için, elde edilen varyasyon serisinin türünü (ayrık veya aralıklı) seçmeli ve veri miktarını (satır sayısı) belirtmelisiniz. Ortaya çıkan çözüm bir Word dosyasına kaydedilir (istatistiksel verilerin gruplandırılması örneğine bakın).

Giriş verisi sayısı
",0);">

Gruplandırma zaten yapılmışsa ve ayrık varyasyon serisi veya aralık serisi, o zaman çevrimiçi hesaplayıcı Varyasyon Endekslerini kullanmanız gerekir. Dağıtım türüne ilişkin hipotezin test edilmesi Dağıtım formunun incelenmesi hizmeti kullanılarak gerçekleştirilir.

İstatistiksel gruplama türleri

Varyasyon serisi. Ayrık bir rastgele değişkenin gözlemlenmesi durumunda aynı değerle birkaç kez karşılaşılabilir. Rastgele bir değişkenin bu değerleri x i, n gözlemde kaç kez göründüğünü belirterek kaydedilir, bu, bu değerin frekansıdır.
Sürekli bir rastgele değişken olması durumunda pratikte gruplandırma kullanılır.
  1. Tipolojik gruplama- bu, incelenen niteliksel olarak heterojen nüfusun sınıflara, sosyo-ekonomik türlere, homojen birim gruplarına bölünmesidir. Bu gruplamayı oluşturmak için Ayrı varyasyon serisi parametresini kullanın.
  2. Bir gruplamaya yapısal denir Homojen bir popülasyonun, yapısını değişen bazı karakteristiklere göre karakterize eden gruplara bölündüğü. Bu gruplamayı oluşturmak için Aralık serisi parametresini kullanın.
  3. İncelenen fenomenler ile özellikleri arasındaki ilişkileri ortaya koyan bir gruplamaya denir. analitik grup(bkz. serilerin analitik gruplandırılması).

İstatistiksel gruplamaların oluşturulmasına ilişkin ilkeler

Artan sırada sıralanan bir dizi gözleme varyasyon serisi denir.. Gruplandırma özelliği bir popülasyonun ayrı gruplara bölünmesini sağlayan bir özelliktir. Grubun temeli denir. Gruplandırma hem niceliksel hem de niteliksel özelliklere dayanabilir.
Gruplamanın temeli belirlendikten sonra, incelenen popülasyonun kaç gruba bölünmesi gerektiği sorusuna karar verilmelidir.

İstatistiksel verileri işlemek için kişisel bilgisayarlar kullanıldığında, nesne birimlerinin gruplandırılması standart prosedürler kullanılarak gerçekleştirilir.
Böyle bir prosedür, optimum grup sayısını belirlemek için Sturgess formülünün kullanımına dayanmaktadır:

k = 1+3,322*log(N)

Burada k grup sayısı, N ise popülasyon birimi sayısıdır.

Kısmi aralıkların uzunluğu h=(x max -x min)/k olarak hesaplanır

Daha sonra bu aralıklara düşen gözlemlerin sayısı sayılır ve bunlar n i frekansları olarak alınır. Değerleri 5'ten küçük olan birkaç frekans (n ​​i< 5), следует объединить. в этом случае надо объединить и соответствующие интервалы.
x i =(c i-1 +c i)/2 aralıklarının orta değerleri yeni değerler olarak alınır.

1 numaralı laboratuvar çalışması

Matematiksel istatistiklere göre

Konu: Deneysel verilerin birincil işlenmesi

3. Puan kazanın. 1

5. Test soruları.. 2

6. Laboratuvar çalışmasını gerçekleştirme metodolojisi.. 3

İşin amacı

Matematiksel istatistik yöntemlerini kullanarak ampirik verilerin birincil işlenmesinde beceri kazanmak.

Deneysel verilerin toplamına dayanarak aşağıdaki görevleri tamamlayın:

1. Egzersiz. Bir aralık varyasyon dağılım serisi oluşturun.

Görev 2. Bir aralık değişim serisinin frekanslarının histogramını oluşturun.

Görev 3. Ampirik bir dağılım fonksiyonu oluşturun ve bir grafik çizin.

a) mod ve medyan;

b) koşullu başlangıç ​​momentleri;

c) numune ortalaması;

d) örneklem varyansı, düzeltilmiş popülasyon varyansı, düzeltilmiş standart sapma;

e) varyasyon katsayısı;

f) asimetri;

g) basıklık;

Görev 5. Belirli bir güvenilirlikle incelenen rastgele değişkenin sayısal özelliklerinin gerçek değerlerinin sınırlarını belirleyin.

Görev 6. Birincil işleme sonuçlarının görev koşullarına göre içeriğe dayalı yorumlanması.

Puan olarak puan

Görevler 1-56 puan

Görev 62 puan

Laboratuvar çalışmasının savunulması(test soruları ve laboratuvar çalışması üzerine sözlü görüşme) - 2 puan

Çalışma A4 sayfalarında yazılı olarak sunulmalı ve şunları içermelidir:

1) Başlık sayfası (Ek 1)

2) Başlangıç ​​verileri.

3) İşin belirtilen örneğe göre teslim edilmesi.

4) Hesaplama sonuçları (manüel olarak ve/veya MS Excel kullanılarak yapılır) belirtilen sıraya göre yapılır.

5) Sonuçlar - birincil işleme sonuçlarının sorunun koşullarına göre anlamlı yorumlanması.

6) İş ve kontrol soruları üzerine sözlü görüşme.



5. Test soruları


Laboratuvar çalışmasını gerçekleştirme metodolojisi

Görev 1. Aralıklı bir varyasyonel dağılım serisi oluşturun

İstatistiksel verileri eşit aralıklı seçeneklerle bir varyasyon serisi biçiminde sunmak için aşağıdakiler gereklidir:

1.Orijinal veri tablosunda en küçük ve en büyük değerleri bulun.

2. Tanımla çeşitlilik aralığı :

3. Örnek 1000'e kadar veri içeriyorsa h aralığının uzunluğunu belirleyin, aşağıdaki formülü kullanın: n – örneklem büyüklüğü – örneklemdeki veri miktarı; hesaplamalar için lgn alın).

Hesaplanan oran yuvarlanır uygun tamsayı değeri .

4. Çift sayıda aralık için ilk aralığın başlangıcını belirlemek için, değerin alınması önerilir; ve tek sayıda aralık için.

5. Gruplandırma aralıklarını yazın ve bunları artan sınırlara göre düzenleyin

, ,………., ,

ilk aralığın alt sınırı nerede. 'den büyük olmayan uygun bir sayı alınır, son aralığın üst sınırı 'dan az olmamalıdır. Aralıkların rastgele değişkenin başlangıç ​​değerlerini içermesi ve aralıklardan ayrılması önerilir. 5 ila 20 aralıklar.

6. Gruplama aralıklarına ilişkin ilk verileri yazın; Belirtilen aralıklara düşen rastgele değişken değerlerinin sayısını hesaplamak için kaynak tabloyu kullanın. Bazı değerler aralıkların sınırlarıyla çakışıyorsa, daha sonra ya yalnızca önceki aralığa ya da yalnızca sonraki aralığa atfedilirler.

Not 1. Aralıkların eşit uzunlukta olması gerekmez. Değerlerin daha yoğun olduğu bölgelerde daha küçük, kısa aralıkların alınması, daha az sıklıkta aralıkların olduğu yerlerde ise daha büyük aralıkların alınması daha uygundur.

Not 2.Bazı değerler için “sıfır” veya küçük frekans değerleri elde edilirse, aralıkları genişleterek (adımı artırarak) verileri yeniden gruplandırmak gerekir.

Laboratuvar çalışması No. 1. İstatistiksel verilerin birincil işlenmesi

Dağıtım serisinin inşaatı

Nüfus birimlerinin herhangi bir özelliğe göre gruplara düzenli dağılımına denir. yakın dağıtım . Bu durumda, karakteristik niceliksel olabilir, o zaman seriye denir varyasyonel ve niteliksel ise seri denir niteliksel . Dolayısıyla, örneğin bir şehrin nüfusu, bir varyasyon serisindeki yaş gruplarına göre veya bir nitelik serisindeki mesleki bağlılığa göre dağıtılabilir (tabii ki, dağıtım serisini oluşturmak için daha birçok niteliksel ve niceliksel özellik önerilebilir; karakteristik istatistiksel araştırma görevi tarafından belirlenir).

Herhangi bir dağıtım serisi iki unsurla karakterize edilir:

- seçenek(x ben) – bunlar örnek popülasyondaki birimlerin karakteristiğinin bireysel değerleridir. Varyasyon serileri için bu seçenek sayısal değerler alır; niteliksel seriler için ise niteliksel (örneğin, x = “memur”);

- sıklık(N Ben) – belirli bir nitelik değerinin kaç kez oluştuğunu gösteren bir sayı. Sıklık göreceli bir sayı olarak ifade edilirse (yani popülasyonun toplam hacmindeki seçeneklerin belirli bir değerine karşılık gelen popülasyondaki öğelerin oranı), o zaman buna denir. göreceli frekans veya sıklık.

Varyasyon serisi şunlar olabilir:

- ayrık, incelenen karakteristik belirli bir sayıyla (genellikle bir tam sayı) karakterize edildiğinde.

- aralık Sürekli değişen bir özellik için “başlangıç” ve “bitiş” sınırları tanımlandığında. Ayrı ayrı değişen bir özelliğin değer kümesi büyükse, bir aralık serisi de oluşturulur.

İstatistiksel çalışmanın koşulları gerektiriyorsa, hem eşit uzunlukta aralıklarla (eşit aralıklı seriler) hem de eşit olmayan aralıklarla bir aralık serisi oluşturulabilir. Örneğin aşağıdaki aralıklara sahip bir dizi gelir dağılımı düşünülebilir:<5тыс р., 5-10 тыс р., 10-20 тыс.р., 20-50 тыс р., и т.д. Если цель исследования не определяет способ построения интервального ряда, то строится равноинтервальный ряд, число интервалов в котором определяется по формуле Стерджесса:



burada k aralık sayısıdır, n ise örneklem büyüklüğüdür. (Elbette formül genellikle kesirli bir sayı verir ve aralık sayısı olarak ortaya çıkan sayıya en yakın tam sayı seçilir.) Bu durumda aralığın uzunluğu formülle belirlenir.

.

Grafiksel olarak varyasyon serileri şu şekilde sunulabilir: histogramlar(aralık serisinin her aralığının üstünde, bu aralıktaki frekansa karşılık gelen yükseklikte bir "sütun" oluşturulur), dağıtım poligonu(noktaları birleştiren kesik çizgi ( x ben;n ben) veya biriken(birikmiş frekanslar üzerine kuruludur, yani her bir özellik değeri için, verilenden daha düşük bir özellik değerine sahip bir dizi nesnede meydana gelme sıklığı alınır).

Excel'de çalışırken varyasyon serileri oluşturmak için aşağıdaki işlevler kullanılabilir:

KONTROL ETMEK( veri dizisi) – numune boyutunu belirlemek için. Bağımsız değişken, örnek verilerin bulunduğu hücre aralığıdır.

EĞERSAY( menzil; kriter) – bir nitelik veya değişken seri oluşturmak için kullanılabilir. Bağımsız değişkenler, niteliğin ve kriterin örnek değerleri dizisinin aralığıdır - niteliğin sayısal veya metin değeri veya içinde bulunduğu hücrenin numarası. Sonuç, bu değerin numunede görülme sıklığıdır.

SIKLIK( veri dizisi; aralık dizisi) – bir varyasyon serisi oluşturmak için. Bağımsız değişkenler, örnek veri dizisinin aralığı ve aralık sütunudur. Ayrı bir seri oluşturmanız gerekiyorsa, seçeneklerin değerleri burada belirtilir; eğer bir aralık serisi ise, aralıkların üst sınırları (bunlara "cepler" de denir). Sonuç bir frekans sütunu olduğundan, CTRL+SHIFT+ENTER tuşlarına basarak işlev girişini tamamlamanız gerekir. Bir işlevi tanıtırken bir aralık dizisi belirlerken, içindeki son değeri belirtmeniz gerekmediğini unutmayın; önceki "ceplere" dahil olmayan tüm değerler, karşılık gelen "cebe" yerleştirilecektir. Bu bazen en büyük örnek değerini otomatik olarak son cebe yerleştirmeme hatasını önlemeye yardımcı olabilir.

Ayrıca karmaşık gruplamalar için (çeşitli özelliklere dayalı olarak) "pivot tablolar" aracını kullanın. Ayrıca nitelik ve varyasyon serileri oluşturmak için de kullanılabilirler ancak bu, görevi gereksiz yere karmaşık hale getirir. Ayrıca bir varyasyon serisi ve histogram oluşturmak için “Analiz Paketi” eklentisinden bir “histogram” prosedürü vardır (Excel'de eklentileri kullanmak için önce bunları indirmelisiniz; varsayılan olarak kurulmazlar)

Birincil veri işleme sürecini aşağıdaki örneklerle açıklayalım.

Örnek 1.1. 60 ailenin niceliksel bileşimine ilişkin veriler bulunmaktadır.

Bir varyasyon serisi ve dağıtım poligonu oluşturun

Çözüm.

Excel tablolarını açalım. Veri dizisini A1:L5 aralığına girelim. Elektronik biçimde (örneğin Word biçiminde) bir belge üzerinde çalışıyorsanız, bunu yapmak için, verilerin bulunduğu tabloyu seçip panoya kopyalamanız, ardından A1 hücresini seçip verileri yapıştırmanız yeterlidir; bunlar otomatik olarak uygun aralık. Örnek hacmini n - örnek veri sayısını hesaplayalım; bunu yapmak için B7 hücresine =COUNT(A1:L5) formülünü girin. İstenilen aralığı formüle girmek için klavyeden tanımının girilmesine gerek olmadığını, seçilmesinin yeterli olduğunu unutmayın. B8 hücresine =MIN(A1:L5) ve B9 hücresine =MAX(A1:L5) formülünü girerek örnekteki minimum ve maksimum değerleri belirleyelim.

Şekil 1.1 Örnek 1. Excel tablolarında istatistiksel verilerin birincil işlenmesi

Daha sonra aralık sütunu (varyant değerleri) ve frekans sütununun adlarını girerek bir varyasyon serisi oluşturmak için bir tablo hazırlayacağız. Aralık sütununa, B12:B17 aralığını kaplayan minimum (1) ile maksimum (6) arasındaki karakteristik değerleri girin. Frekans sütununu seçin, =FREKANS(A1:L5,B12:B17) formülünü girin ve CTRL+SHIFT+ENTER tuş kombinasyonuna basın

Şekil 1.2 Örnek 1. Bir varyasyon serisinin oluşturulması

Kontrol etmek için, SUM işlevini ("Ana Sayfa" sekmesindeki "Düzenleme" grubundaki S işlev simgesi) kullanarak frekansların toplamını hesaplayalım, hesaplanan toplam, B7 hücresinde önceden hesaplanan örnek hacmiyle örtüşmelidir.

Şimdi bir çokgen oluşturalım: Ortaya çıkan frekans aralığını seçtikten sonra "Ekle" sekmesinde "Grafik" komutunu seçin. Varsayılan olarak, yatay eksendeki değerler sıra sayıları olacaktır - bizim durumumuzda 1'den 6'ya kadar, bu da seçeneklerin değerleriyle (tarife kategorilerinin sayısı) örtüşür.

Grafik serisinin adı "seri 1", "Tasarım" sekmesindeki aynı "veri seç" seçeneği kullanılarak değiştirilebilir veya basitçe silinebilir.

Şekil 1.3. Örnek 1. Frekans poligonunun oluşturulması

Örnek 1.2. 50 kaynaktan gelen kirletici emisyonlarına ilişkin veriler bulunmaktadır:

10,4 18,6 10,3 26,0 45,0 18,2 17,3 19,2 25,8 18,7
28,2 25,2 18,4 17,5 41,8 14,6 10,0 37,8 10,5 16,0
18,1 16,8 38,5 37,7 17,9 29,0 10,1 28,0 12,0 14,0
14,2 20,8 13,5 42,4 15,5 17,9 19, 10,8 12,1 12,4
12,9 12,6 16,8 19,7 18,3 36,8 15,0 37,0 13,0 19,5

Eşit aralıklı bir seri oluşturun, histogram oluşturun

Çözüm

Veri dizisini bir Excel sayfasına girelim, A1:J5 aralığını kaplayacak. Bir önceki görevde olduğu gibi örnek boyutunu n, örnekteki minimum ve maksimum değerleri belirleyeceğiz. Artık ayrık bir seriye değil, aralıklı bir seriye ihtiyacımız olduğundan ve problemdeki aralık sayısı belirtilmediğinden, k aralık sayısını Sturgess formülünü kullanarak hesaplıyoruz. Bunu yapmak için B10 hücresine =1+3.322*LOG10(B7) formülünü girin.

Şekil 1.4. Örnek 2. Eşit aralıklı bir serinin oluşturulması

Ortaya çıkan değer bir tam sayı değil, yaklaşık 6,64'tür. k=7'de aralıkların uzunluğu tamsayı olarak ifade edileceğinden (k=6'dan farklı olarak), bu değeri C10 hücresine girerek k=7'yi seçeriz. =(B9-B8)/C10 formülünü girerek B11 hücresindeki d aralığının uzunluğunu hesaplıyoruz.

7 aralığın her biri için üst sınırı belirten bir aralık dizisi tanımlayalım. Bunu yapmak için E8 hücresine =B8+B11 formülünü girerek ilk aralığın üst sınırını hesaplıyoruz; E9 hücresine =E8+B11 formülünü girerek ikinci aralığın üst sınırını girin. Aralıkların üst sınırlarının kalan değerlerini hesaplamak için, girilen formüldeki B11 hücresinin sayısını $ işareti kullanarak sabitliyoruz, böylece E9 hücresindeki formül =E8+B$11 formunu alıyor ve kopyalıyoruz. E9 hücresinin içeriği E10-E14 hücrelerine. Elde edilen son değer, daha önce B9 hücresinde hesaplanan örnekteki maksimum değere eşittir.

Şekil 1.5. Örnek 2. Eşit aralıklı bir serinin oluşturulması


Şimdi örnek 1'de yapıldığı gibi FREQUENCY fonksiyonunu kullanarak "cepler" dizisini dolduralım.

Şekil 1.6. Örnek 2. Eşit aralıklı bir serinin oluşturulması

Ortaya çıkan varyasyon serisini kullanarak bir histogram oluşturacağız: frekans sütununu seçin ve "Ekle" sekmesinde "Histogram"ı seçin. Histogramı aldıktan sonra içindeki yatay eksenin etiketlerini aralık aralığındaki değerlere değiştirelim, bunun için “Tasarımcı” sekmesinin “Veri seç” seçeneğini seçin. Açılan pencerede “Yatay Eksen Etiketleri” bölümü için “Değiştir” komutunu seçin ve fareyle seçerek seçenekler için değer aralığını girin.

Şekil 1.7. Örnek 2. Histogram oluşturma

Şekil 1.8. Örnek 2. Histogram oluşturma

Ayrık özellikler için ayrık bir varyasyon serisi oluşturulmuştur.

Ayrı bir varyasyon serisi oluşturmak için aşağıdaki adımları uygulamanız gerekir: 1) gözlem birimlerini, özelliğin incelenen değerine göre artan sırada düzenleyin,

2) x i niteliğinin tüm olası değerlerini belirleyin, bunları artan sırada düzenleyin,

özelliğin değeri, Ben .

özellik değerinin sıklığı ve belirtmek F Ben . Bir serinin tüm frekanslarının toplamı, incelenen popülasyondaki elementlerin sayısına eşittir.

örnek 1 .

Öğrencilerin sınavlarda aldığı notların listesi: 3; 4; 3; 5; 4; 2; 2; 4; 4; 3; 5; 2; 4; 5; 4; 3; 4; 3; 3; 4; 4; 2; 2; 5; 5; 4; 5; 2; 3; 4; 4; 3; 4; 5; 2; 5; 5; 4; 3; 3; 4; 2; 4; 4; 5; 4; 3; 5; 3; 5; 4; 4; 5; 4; 4; 5; 4; 5; 5; 5.

İşte numara X - seviyeayrık bir rastgele değişkendir ve sonuçta ortaya çıkan tahmin listesi şu şekildedir:istatistiksel (gözlenebilir) veriler .

    Gözlem birimlerini incelenen karakteristik değere göre artan sırada düzenleyin:

2; 2; 2; 2; 2; 2; 2; 2; 3; 3; 3; 3; 3; 3; 3; 3; 3; 3; 3; 3; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5.

2) x i özelliğinin tüm olası değerlerini belirleyin, bunları artan sırada sıralayın:

Bu örnekte tüm tahminler aşağıdaki değerlere sahip dört gruba ayrılabilir: 2; 3; 4; 5.

Belirli bir gözlemlenen veri grubuna karşılık gelen rastgele değişkenin değerine denir. özelliğin değeri, seçenek (seçenek) ve x'i belirtin Ben .

Bir özelliğin karşılık gelen değerinin birkaç gözlemde kaç kez oluştuğunu gösteren sayıya denir. özellik değerinin sıklığı ve belirtmek F Ben .

Örneğimiz için

puan 2 oluşur - 8 kez,

puan 3 oluşur - 12 kez,

puan 4 oluşur - 23 kez,

puan 5 oluşur - 17 kez.

Toplamda 60 derecelendirme var.

4) alınan verileri iki satırdan (sütunlardan) oluşan bir tabloya yazın - x i ve f i.

Bu verilere dayanarak ayrı bir varyasyon serisi oluşturmak mümkündür.

Ayrık varyasyon serisi – incelenen özelliğin ortaya çıkan değerlerinin artan sırada bireysel değerler ve bunların frekansları olarak gösterildiği bir tablodur

  1. Bir aralık varyasyon serisinin oluşturulması

Ayrık varyasyon serilerine ek olarak, aralıklı varyasyon serileri gibi verileri gruplandırma yöntemine sıklıkla rastlanır.

Aşağıdaki durumlarda bir aralık serisi oluşturulur:

    burcun sürekli bir değişim doğası vardır;

    Çok sayıda ayrı değer vardı (10'dan fazla)

    ayrık değerlerin frekansları çok küçüktür (nispeten çok sayıda gözlem birimiyle 1-3'ü geçmeyin);

    bir özelliğin aynı frekanslara sahip birçok ayrık değeri.

Aralık varyasyon serisi, verileri iki sütunlu bir tablo biçiminde gruplamanın bir yoludur (bir değer aralığı biçimindeki karakteristik değerleri ve her aralığın sıklığı).

Ayrık bir serinin aksine, bir aralık serisinin karakteristiğinin değerleri, bireysel değerlerle değil, bir değer aralığıyla ("başlangıçtan -e") temsil edilir.

Seçilen her aralığa kaç gözlem biriminin düştüğünü gösteren sayıya ne denir? özellik değerinin sıklığı ve belirtmek F Ben . Bir serinin tüm frekanslarının toplamı, incelenen popülasyondaki öğelerin (gözlem birimleri) sayısına eşittir.

Bir birimin karakteristik değeri aralığın üst sınırına eşitse bir sonraki aralığa atanmalıdır.

Örneğin boyu 100 cm olan bir çocuk birinci aralığa değil 2. aralığa düşecektir; ve boyu 130 cm olan bir çocuk üçüncü aralığa değil son aralığa düşecektir.

Bu verilere dayanarak bir aralık değişim serisi oluşturulabilir.

Her aralığın bir alt sınırı (xn), bir üst sınırı (xw) ve bir aralık genişliği ( Ben).

Aralık sınırı, iki aralığın sınırında yer alan özelliğin değeridir.

çocukların boyu (cm)

çocukların boyu (cm)

çocuk miktarı

130'dan fazla

Bir aralığın bir üst ve alt sınırı varsa buna denir. kapalı aralık. Bir aralığın yalnızca alt veya yalnızca üst sınırı varsa, o zaman - açık aralık. Yalnızca en ilk veya en son aralık açık olabilir. Yukarıdaki örnekte son aralık açıktır.

Aralık genişliği (Ben) – üst ve alt limitler arasındaki fark.

Ben = x n - x içinde

Açık aralığın genişliğinin bitişik kapalı aralığın genişliğiyle aynı olduğu varsayılmaktadır.

çocukların boyu (cm)

çocuk miktarı

Aralık genişliği (i)

hesaplamalar için 130+20=150

20 (çünkü bitişik kapalı aralığın genişliği 20'dir)

Tüm aralık serileri, eşit aralıklı aralık serileri ve eşit olmayan aralıklı aralık serileri olarak ikiye ayrılır. . Eşit aralıklarla aralıklı sıralarda tüm aralıkların genişliği aynıdır. Aralıkları eşit olmayan aralık serilerinde aralıkların genişliği farklıdır.

Söz konusu örnekte - eşit olmayan aralıklara sahip bir aralık serisi.

Çoğu durumda, istatistiksel bir popülasyon büyük veya daha da önemlisi sonsuz sayıda varyant içerdiğinde, ki bu çoğunlukla sürekli varyasyonla ortaya çıkar, her varyant için bir birim grubu oluşturmak pratik olarak imkansız ve pratik değildir. Bu gibi durumlarda istatistiksel birimlerin gruplar halinde birleştirilmesi yalnızca bir aralık temelinde mümkündür; değişen bir özelliğin değerleri için belirli sınırları olan bir grup. Bu limitler her grubun üst ve alt limitlerini gösteren iki rakamla gösterilmektedir. Aralıkların kullanılması bir aralık dağılım serisinin oluşmasına yol açar.

Aralık aralığı varyantları aralıklar şeklinde sunulan bir varyasyon serisidir.

Eşit ve eşit olmayan aralıklarla bir aralık serisi oluşturulabilirken, bu seriyi oluşturma ilkesinin seçimi esas olarak istatistiksel popülasyonun temsil edilebilirlik derecesine ve uygunluğuna bağlıdır. Popülasyon birim sayısı bakımından yeterince büyükse (temsili) ve bileşimi tamamen homojense, o zaman aralık serisinin oluşumunu aralıkların eşitliğine dayandırmak tavsiye edilir. Genellikle bu prensibi kullanarak, varyasyon aralığının nispeten küçük olduğu popülasyonlar için bir aralık serisi oluşturulur; maksimum ve minimum seçenekler genellikle birbirinden birkaç kez farklılık gösterir. Bu durumda, eşit aralıkların değeri, bir özelliğin değişim aralığının belirli sayıda oluşturulmuş aralığa oranıyla hesaplanır. Eşitliği belirlemek için Ve aralıkta Sturgess formülü kullanılabilir (genellikle aralık özelliklerinde küçük bir değişiklik ve istatistiksel popülasyonda çok sayıda birim ile):

nerede x ben - eşit aralık değeri; X max, X min - istatistiksel bir toplamdaki maksimum ve minimum seçenekler; N . - toplamdaki birim sayısı.

Örnek. İlk (minimum) seçeneğin I km / km 2, son ( maksimum) - 65 ki/km 2. Formül 5.1'i kullanma. şunu elde ederiz:

Sonuç olarak, sezyum kirliliğinin yoğunluğu - Krasnopolsky bölgesindeki 137 yerleşim - açısından eşit aralıklarla bir aralık serisi oluşturmak için, eşit aralığın boyutu 8 ki/km 2 olabilir.

Eşit olmayan dağıtım koşulları altında, yani. Maksimum ve minimum seçenekler yüzlerce kez olduğunda, bir aralık serisi oluştururken prensibi uygulayabilirsiniz. eşit olmayan aralıklar. Karakteristiğin daha büyük değerlerine doğru ilerledikçe eşit olmayan aralıklar genellikle artar.

Aralıkların şekli kapalı veya açık olabilir. Kapalı Hem alt hem de üst sınırları olan aralıkları çağırmak gelenekseldir. Açık aralıkların yalnızca bir sınırı vardır: ilk aralıkta bir üst sınır vardır, sonuncuda ise bir alt sınır vardır.

Özellikle eşit olmayan aralıklarla aralık serilerinin değerlendirilmesi tavsiye edilir. dağıtım yoğunluğu, Yerel frekansın (veya frekansın) aralığın boyutuna oranının hangisi olduğunu hesaplamanın en basit yolu.

Pratik olarak bir aralık serisi oluşturmak için tablo düzenini kullanabilirsiniz. 5.3.

Tablo 5.3. Sezyum –137 ile radyoaktif kirlenmenin yoğunluğuna göre Krasnopolsky bölgesinde bir dizi yerleşim yeri oluşturma prosedürü

Aralık serilerinin temel avantajı maksimumdur. kompaktlık. aynı zamanda aralık dağılım serisinde, özelliğin bireysel değişkenleri karşılık gelen aralıklarda gizlenir

Dikdörtgen koordinat sisteminde bir aralık serisini grafiksel olarak gösterirken, aralıkların üst sınırları apsis ekseninde, serinin yerel frekansları ise ordinat ekseninde çizilir. Bir aralık serisinin grafiksel yapısı, her aralığın alt ve üst sınırlarına sahip olması ve iki apsisin bir ordinat değerine karşılık gelmesi açısından bir dağıtım çokgeninin yapısından farklıdır. Bu nedenle, bir aralık serisinin grafiğinde, çokgende olduğu gibi bir nokta değil, iki noktayı birleştiren bir çizgi işaretlenir. Bu yatay çizgiler birbirine dikey çizgilerle bağlanarak halk arasında basamaklı çokgen adı verilen basamaklı çokgen şekli elde edilir. histogram dağıtım (Şekil 5.3).

Yeterince büyük bir istatistiksel popülasyon için bir aralık serisini grafiksel olarak oluştururken, histogram şuna yaklaşır: simetrik dağıtım şekli. İstatistiksel popülasyonun küçük olduğu durumlarda, kural olarak, asimetrik grafik çubuğu.

Bazı durumlarda, bir dizi birikmiş frekans oluşturulması tavsiye edilir; Kümülatif sıra. Kümülatif bir seri, kesikli veya aralıklı bir dağılım serisi temelinde oluşturulabilir. Dikdörtgen koordinat sisteminde kümülatif bir seriyi grafiksel olarak gösterirken, değişkenler apsis ekseninde, birikmiş frekanslar (frekanslar) ordinat ekseninde çizilir. Ortaya çıkan eğri çizgiye genellikle denir Kümülatif dağıtım (Şekil 5.4).

Çeşitli varyasyon serilerinin oluşumu ve grafiksel gösterimi, konu 6'da ayrıntılı olarak tartışılan ana istatistiksel özelliklerin basitleştirilmiş bir şekilde hesaplanmasına katkıda bulunur ve istatistiksel popülasyonun dağılım yasalarının özünün daha iyi anlaşılmasına yardımcı olur. Bir varyasyon serisinin analizi, seçenekler ve frekanslar (frekanslar) arasındaki ilişkinin tanımlanması ve izlenmesinin gerekli olduğu durumlarda özellikle önem kazanır. Bu bağımlılık, seçenek başına vaka sayısının belirli bir şekilde bu seçeneğin büyüklüğüyle ilişkili olmasıyla ortaya çıkar; değişen karakteristik değerlerinin artmasıyla birlikte, bu değerlerin frekansları (frekansları) belirli, sistematik değişiklikler yaşar. Bu, frekans (frekans) sütunundaki sayıların düzensiz bir şekilde dalgalanmadığı, belirli bir yönde, belirli bir düzen ve sırayla değiştiği anlamına gelir.

Eğer frekanslar değişimlerinde belli bir sistematiklik gösteriyorsa bu bir kalıp belirleme yolunda olduğumuz anlamına gelir. Frekanslardaki değişimlerin sistemi, düzeni, sırası, genel nedenlerin, tüm popülasyonun karakteristik genel koşullarının bir yansımasıdır.

Dağıtım modelinin her zaman hazır biçimde verildiği varsayılmamalıdır. Frekansların tuhaf bir şekilde sıçradığı, bazen arttığı, bazen azaldığı oldukça fazla varyasyon serisi var. Bu gibi durumlarda, araştırmacının ne tür bir dağılımla uğraştığını bulmak tavsiye edilir: ya bu dağılımın kendine özgü bir modeli yoktur ya da doğası henüz açıklanmamıştır: İlk durum nadirdir, ancak ikincisi vaka oldukça yaygın ve çok yaygın bir olgudur.

Dolayısıyla bir aralık serisi oluştururken istatistiksel birimlerin toplam sayısı küçük olabilir ve her aralık az sayıda değişken içerir (örneğin 1-3 birim). Bu gibi durumlarda herhangi bir modelin tezahürüne güvenilemez. Rastgele gözlemlere dayalı olarak doğal bir sonuç elde edilebilmesi için büyük sayılar kanununun yürürlüğe girmesi gerekmektedir. böylece her aralık için birkaç değil, onlarca ve yüzlerce istatistiksel birim olacaktır. Bunun için mümkün olduğu kadar gözlem sayısını artırmaya çalışmalıyız. Bu, kitlesel süreçlerdeki kalıpları tespit etmenin en kesin yoludur. Gözlem sayısını artırmak için gerçek bir fırsat yoksa, dağılım serisindeki aralıkların sayısı azaltılarak bir modelin belirlenmesi sağlanabilir. Bir varyasyon serisindeki aralıkların sayısı azaltıldığında her aralıktaki frekansların sayısı artar. Bu, her istatistiksel birimin rastgele dalgalanmalarının üst üste bindirildiği, "düzeltildiği" ve bir modele dönüştüğü anlamına gelir.

Varyasyon serilerinin oluşumu ve inşası, istatistiksel popülasyonun dağılımının yalnızca genel, yaklaşık bir resmini elde etmemizi sağlar. Örneğin, yalnızca kaba formdaki bir histogram, bir özelliğin değerleri ile frekansları (frekansları) arasındaki ilişkiyi ifade eder. Bu nedenle, varyasyon serileri esasen sadece statik iç düzenliliğin daha derinlemesine incelenmesi için temel oluşturur. dağıtım.

KONU 5 İÇİN TEST SORULARI

1. Varyasyon nedir? İstatistiksel bir popülasyonda bir özellikteki varyasyona ne sebep olur?

2. İstatistiklerde ne tür değişken özellikler ortaya çıkabilir?

3. Varyasyon serisi nedir? Ne tür varyasyon serileri olabilir?

4. Sıralı seri nedir? Avantajları ve dezavantajları nelerdir?

5. Ayrık seri nedir, avantajları ve dezavantajları nelerdir?

6. Aralık serisi oluşturma prosedürü nedir, avantajları ve dezavantajları nelerdir?

7. Sıralanmış, ayrık, aralıklı dağılım serisinin grafiksel gösterimi nedir?

8. Dağıtım kümülasyonu nedir ve neyi karakterize eder?