Varians berwajaran. Serakan pembolehubah rawak diskret

Penyerakanpembolehubah rawak- ukuran serakan sesuatu yang diberikan pembolehubah rawak, iaitu dia penyelewengan daripada jangkaan matematik. Dalam statistik, tatatanda (sigma kuasa dua) sering digunakan untuk menunjukkan varians. Punca kuasa dua varians dipanggil sisihan piawai atau sebaran standard. Sisihan piawai diukur dalam unit yang sama dengan pembolehubah rawak itu sendiri, dan varians diukur dalam kuasa dua unit itu.

Walaupun sangat mudah untuk menggunakan hanya satu nilai (seperti min atau mod dan median) untuk menganggarkan keseluruhan sampel, pendekatan ini boleh membawa kepada kesimpulan yang salah dengan mudah. Sebab bagi keadaan ini bukan terletak pada nilai itu sendiri, tetapi pada hakikat bahawa satu nilai tidak sama sekali mencerminkan penyebaran nilai data.

Sebagai contoh, dalam sampel:

purata ialah 5.

Walau bagaimanapun, tiada unsur dalam sampel itu sendiri dengan nilai 5. Anda mungkin perlu mengetahui sejauh mana hampir setiap elemen sampel dengan nilai minnya. Atau, dengan kata lain, anda perlu mengetahui varians nilai. Mengetahui sejauh mana data telah berubah, anda boleh mentafsir dengan lebih baik bermakna, median dan fesyen. Tahap perubahan dalam nilai sampel ditentukan dengan mengira varians dan sisihan piawai mereka.



Varians dan punca kuasa dua varians, dipanggil sisihan piawai, mencirikan sisihan min daripada min sampel. Antara dua kuantiti ini, yang paling penting ialah sisihan piawai. Nilai ini boleh diwakili sebagai jarak purata di mana unsur-unsur adalah dari unsur tengah sampel.

Penyerakan sukar untuk ditafsirkan secara bermakna. Walau bagaimanapun, punca kuasa dua nilai ini ialah sisihan piawai dan sesuai untuk tafsiran.

Sisihan piawai dikira dengan terlebih dahulu menentukan varians dan kemudian mengira punca kuasa dua varians.

Sebagai contoh, untuk tatasusunan data yang ditunjukkan dalam rajah, nilai berikut akan diperoleh:

Gambar 1

Di sini, min bagi perbezaan kuasa dua ialah 717.43. Untuk mendapatkan sisihan piawai, ia kekal hanya untuk mengambil punca kuasa dua nombor ini.

Hasilnya ialah kira-kira 26.78.

Perlu diingat bahawa sisihan piawai ditafsirkan sebagai jarak purata di mana unsur-unsur adalah daripada min sampel.

Sisihan piawai menunjukkan seberapa baik min menggambarkan keseluruhan sampel.

Katakan anda adalah ketua jabatan pengeluaran untuk memasang PC. Laporan suku tahunan mengatakan bahawa output untuk suku terakhir ialah 2500 PC. Adakah ia buruk atau baik? Anda meminta (atau sudah ada lajur ini dalam laporan) untuk memaparkan sisihan piawai untuk data ini dalam laporan. Nombor sisihan piawai, sebagai contoh, ialah 2000. Menjadi jelas kepada anda, sebagai ketua jabatan, bahawa barisan pengeluaran memerlukan kawalan yang lebih baik (sisihan terlalu besar dalam bilangan PC yang dipasang).

Ingat bahawa apabila sisihan piawai adalah besar, data bertaburan secara meluas di sekitar min, dan apabila sisihan piawai kecil, ia berkumpul hampir dengan min.

Empat fungsi statistik VAR(), VAR(), STDEV() dan STDEV() direka untuk mengira varians dan sisihan piawai nombor dalam julat sel. Sebelum anda boleh mengira varians dan sisihan piawai bagi set data, anda perlu menentukan sama ada data tersebut mewakili populasi atau sampel populasi. Dalam kes sampel daripada populasi umum, fungsi VARP() dan STDEV() hendaklah digunakan, dan dalam kes populasi umum, fungsi VARP() dan STDEV() hendaklah digunakan:

Penduduk Fungsi

VARP()

STDLONG()
Sampel

VARI()

STDEV()

Serakan (serta sisihan piawai), seperti yang kami nyatakan, menunjukkan sejauh mana nilai yang disertakan dalam set data bertaburan di sekitar min aritmetik.

Nilai kecil varians atau sisihan piawai menunjukkan bahawa semua data tertumpu di sekitar min aritmetik, dan nilai yang besar bagi nilai ini menunjukkan bahawa data bertaburan pada julat nilai yang luas.

Varians agak sukar untuk ditafsirkan secara bermakna (apa maksud nilai kecil, nilai besar?). Prestasi Tugasan 3 akan membolehkan anda secara visual, pada graf, menunjukkan maksud varians untuk set data.

Tugasan

· Latihan 1.

· 2.1. Berikan konsep: varians dan sisihan piawai; penunjukan simbolik mereka dalam pemprosesan data statistik.

· 2.2. Lukiskan lembaran kerja mengikut Rajah 1 dan buat pengiraan yang diperlukan.

· 2.3. Berikan formula asas yang digunakan dalam pengiraan

· 2.4. Terangkan semua tatatanda ( , , )

· 2.5. Terangkan maksud amali bagi konsep varians dan sisihan piawai.

Tugasan 2.

1.1. Berikan konsep: populasi umum dan sampel; jangkaan matematik dan min aritmetik bagi penunjukan simbolik mereka dalam pemprosesan data statistik.

1.2. Selaras dengan Rajah 2, lukis lembaran kerja dan buat pengiraan.

1.3. Berikan formula asas yang digunakan dalam pengiraan (untuk populasi umum dan sampel).

Rajah 2

1.4. Terangkan mengapa adalah mungkin untuk mendapatkan nilai cara aritmetik dalam sampel seperti 46.43 dan 48.78 (lihat Lampiran fail). Buat kesimpulan.

Tugasan 3.

Terdapat dua sampel dengan set data yang berbeza, tetapi purata bagi mereka adalah sama:

Rajah 3

3.1. Lukiskan lembaran kerja mengikut Rajah 3 dan buat pengiraan yang diperlukan.

3.2. Berikan formula pengiraan asas.

3.3. Bina graf mengikut rajah 4, 5.

3.4. Terangkan kebergantungan yang terhasil.

3.5. Lakukan pengiraan yang serupa untuk kedua-dua sampel ini.

Sampel awal 11119999

Pilih nilai sampel kedua supaya min aritmetik untuk sampel kedua adalah sama, contohnya:

Pilih sendiri nilai untuk sampel kedua. Susun pengiraan dan plot seperti rajah 3, 4, 5. Tunjukkan formula utama yang digunakan dalam pengiraan.

Buat kesimpulan yang sesuai.

Semua tugas hendaklah dibentangkan dalam bentuk laporan dengan semua angka, graf, formula dan penjelasan ringkas yang diperlukan.

Nota: pembinaan graf mesti dijelaskan dengan angka dan penerangan ringkas.

Penyerakan pembolehubah rawak adalah ukuran penyebaran nilai pembolehubah ini. Varians kecil bermakna nilai-nilai dikelompokkan rapat antara satu sama lain. Varians yang besar menunjukkan taburan nilai yang kuat. Konsep serakan pembolehubah rawak digunakan dalam statistik. Sebagai contoh, jika anda membandingkan varians nilai dua kuantiti (seperti hasil pemerhatian pesakit lelaki dan wanita), anda boleh menguji kepentingan beberapa pembolehubah. Varians juga digunakan semasa membina model statistik, kerana varians yang kecil boleh menjadi petanda bahawa anda telah melakukan overfitting nilai.

Langkah-langkah

Pengiraan Varians Contoh

  1. Catatkan nilai sampel. Dalam kebanyakan kes, hanya sampel populasi tertentu tersedia untuk ahli statistik. Sebagai contoh, sebagai peraturan, ahli statistik tidak menganalisis kos mengekalkan populasi semua kereta di Rusia - mereka menganalisis sampel rawak beberapa ribu kereta. Sampel sedemikian akan membantu menentukan kos purata bagi setiap kereta, tetapi kemungkinan besar, nilai yang terhasil akan jauh daripada yang sebenar.

    • Sebagai contoh, mari kita analisa bilangan roti yang dijual di kafe dalam 6 hari, diambil secara rawak. Sampel mempunyai bentuk berikut: 17, 15, 23, 7, 9, 13. Ini adalah sampel, bukan populasi, kerana kami tidak mempunyai data tentang roti yang dijual untuk setiap hari kafe dibuka.
    • Jika anda diberi populasi dan bukan sampel nilai, langkau ke bahagian seterusnya.
  2. Tuliskan formula untuk mengira varians sampel. Serakan ialah ukuran sebaran nilai sesuatu kuantiti. Semakin hampir nilai serakan kepada sifar, semakin hampir nilai-nilai itu dikumpulkan bersama. Apabila bekerja dengan sampel nilai, gunakan formula berikut untuk mengira varians:

    • s 2 (\displaystyle s^(2)) = ∑[(x i (\displaystyle x_(i))-x̅) 2 (\displaystyle ^(2))] / (n - 1)
    • s 2 (\displaystyle s^(2)) ialah serakan. Serakan diukur dalam unit persegi.
    • x i (\displaystyle x_(i))- setiap nilai dalam sampel.
    • x i (\displaystyle x_(i)) anda perlu menolak xᅳ, kuasa dua, dan kemudian tambah hasilnya.
    • x̅ – min sampel (min sampel).
    • n ialah bilangan nilai dalam sampel.
  3. Kirakan min sampel. Ia dilambangkan sebagai xᅳ. Min sampel dikira seperti min aritmetik biasa: tambah semua nilai dalam sampel, dan kemudian bahagikan hasilnya dengan bilangan nilai dalam sampel.

    • Dalam contoh kami, tambahkan nilai dalam sampel: 15 + 17 + 23 + 7 + 9 + 13 = 84
      Sekarang bahagikan hasilnya dengan bilangan nilai dalam sampel (dalam contoh kami terdapat 6): 84 ÷ 6 = 14.
      Sampel min xᅳ = 14.
    • Purata sampel ialah nilai pusat di mana nilai dalam sampel diedarkan. Jika nilai dalam kelompok sampel di sekeliling sampel bermakna, maka varians adalah kecil; jika tidak, serakan adalah besar.
  4. Tolak min sampel daripada setiap nilai dalam sampel. Sekarang hitung perbezaannya x i (\displaystyle x_(i))- xᅳ, di mana x i (\displaystyle x_(i))- setiap nilai dalam sampel. Setiap keputusan menunjukkan tahap sisihan nilai tertentu daripada min sampel, iaitu, sejauh mana nilai ini daripada min sampel.

    • Dalam contoh kami:
      x 1 (\displaystyle x_(1))- xᅳ = 17 - 14 = 3
      x 2 (\displaystyle x_(2))- xᅳ = 15 - 14 = 1
      x 3 (\displaystyle x_(3))- xᅳ = 23 - 14 = 9
      x 4 (\displaystyle x_(4))- xᅳ = 7 - 14 = -7
      x 5 (\displaystyle x_(5))- xᅳ = 9 - 14 = -5
      x 6 (\displaystyle x_(6))- xᅳ = 13 - 14 = -1
    • Ketepatan keputusan yang diperoleh adalah mudah untuk disahkan, kerana jumlahnya mestilah sama dengan sifar. Ini berkaitan dengan penentuan nilai purata, kerana nilai negatif (jarak dari nilai purata ke nilai yang lebih kecil) sepenuhnya diimbangi oleh nilai positif (jarak dari nilai purata ke nilai yang lebih besar).
  5. Seperti yang dinyatakan di atas, jumlah perbezaan x i (\displaystyle x_(i))- xᅳ mestilah sama dengan sifar. Ini bermakna varians min sentiasa sifar, yang tidak memberikan sebarang idea tentang penyebaran nilai beberapa kuantiti. Untuk menyelesaikan masalah ini, kuasa duakan setiap perbezaan x i (\displaystyle x_(i))- x̅. Ini akan menyebabkan anda hanya mendapat nombor positif yang, apabila ditambah bersama, tidak akan ditambah sehingga 0.

    • Dalam contoh kami:
      (x 1 (\displaystyle x_(1))-x̅) 2 = 3 2 = 9 (\displaystyle ^(2)=3^(2)=9)
      (x 2 (\displaystyle (x_(2)))-x̅) 2 = 1 2 = 1 (\displaystyle ^(2)=1^(2)=1)
      9 2 = 81
      (-7) 2 = 49
      (-5) 2 = 25
      (-1) 2 = 1
    • Anda telah menemui kuasa dua beza - x̅) 2 (\displaystyle ^(2)) bagi setiap nilai dalam sampel.
  6. Kira jumlah perbezaan kuasa dua. Iaitu, cari bahagian formula yang ditulis seperti ini: ∑[( x i (\displaystyle x_(i))-x̅) 2 (\displaystyle ^(2))]. Di sini tanda Σ bermaksud jumlah perbezaan kuasa dua untuk setiap nilai x i (\displaystyle x_(i)) dalam sampel. Anda telah menemui perbezaan kuasa dua (x i (\displaystyle (x_(i)))-x̅) 2 (\displaystyle ^(2)) bagi setiap nilai x i (\displaystyle x_(i)) dalam sampel; sekarang hanya tambah petak ini.

    • Dalam contoh kami: 9 + 1 + 81 + 49 + 25 + 1 = 166 .
  7. Bahagikan hasilnya dengan n - 1, dengan n ialah bilangan nilai dalam sampel. Beberapa ketika dahulu, untuk mengira varians sampel, ahli statistik hanya membahagikan hasilnya dengan n; dalam kes ini, anda akan mendapat min varians kuasa dua, yang sesuai untuk menerangkan varians sampel yang diberikan. Tetapi ingat bahawa mana-mana sampel hanyalah sebahagian kecil daripada populasi umum nilai. Jika anda mengambil sampel yang berbeza dan melakukan pengiraan yang sama, anda akan mendapat hasil yang berbeza. Ternyata, membahagikan dengan n - 1 (bukan hanya n) memberikan anggaran varians populasi yang lebih baik, iaitu perkara yang anda cari. Membahagi dengan n - 1 telah menjadi perkara biasa, jadi ia termasuk dalam formula untuk mengira varians sampel.

    • Dalam contoh kami, sampel termasuk 6 nilai, iaitu, n = 6.
      Varians sampel = s 2 = 166 6 − 1 = (\gaya paparan s^(2)=(\frac (166)(6-1))=) 33,2
  8. Perbezaan antara varians dan sisihan piawai. Ambil perhatian bahawa formula mengandungi eksponen, jadi varians diukur dalam unit kuasa dua nilai yang dianalisis. Kadangkala nilai sedemikian agak sukar untuk dikendalikan; dalam kes sedemikian, sisihan piawai digunakan, yang sama dengan punca kuasa dua varians. Itulah sebabnya varians sampel ditandakan sebagai s 2 (\displaystyle s^(2)), dan sisihan piawai sampel sebagai s (\displaystyle s).

    • Dalam contoh kami, sisihan piawai sampel ialah: s = √33.2 = 5.76.

    Pengiraan varians populasi

    1. Menganalisis beberapa set nilai. Set termasuk semua nilai kuantiti yang sedang dipertimbangkan. Sebagai contoh, jika anda mengkaji umur penduduk wilayah Leningrad, maka populasi termasuk umur semua penduduk wilayah ini. Dalam kes bekerja dengan agregat, adalah disyorkan untuk membuat jadual dan masukkan nilai agregat ke dalamnya. Pertimbangkan contoh berikut:

      • Terdapat 6 akuarium di dalam bilik tertentu. Setiap akuarium mengandungi bilangan ikan berikut:
        x 1 = 5 (\displaystyle x_(1)=5)
        x 2 = 5 (\displaystyle x_(2)=5)
        x 3 = 8 (\displaystyle x_(3)=8)
        x 4 = 12 (\displaystyle x_(4)=12)
        x 5 = 15 (\displaystyle x_(5)=15)
        x 6 = 18 (\displaystyle x_(6)=18)
    2. Tuliskan formula untuk mengira varians populasi. Oleh kerana populasi merangkumi semua nilai kuantiti tertentu, formula berikut membolehkan anda mendapatkan nilai tepat varians populasi. Untuk membezakan varians populasi daripada varians sampel (yang hanya anggaran), ahli statistik menggunakan pelbagai pembolehubah:

      • σ 2 (\displaystyle ^(2)) = (∑(x i (\displaystyle x_(i)) - μ) 2 (\displaystyle ^(2))) / n
      • σ 2 (\displaystyle ^(2))- varians populasi (dibaca sebagai "sigma kuasa dua"). Serakan diukur dalam unit persegi.
      • x i (\displaystyle x_(i))- setiap nilai dalam agregat.
      • Σ ialah tanda jumlah. Iaitu, untuk setiap nilai x i (\displaystyle x_(i)) tolak μ, kuasa dua, dan kemudian tambah hasilnya.
      • μ ialah min populasi.
      • n ialah bilangan nilai dalam populasi umum.
    3. Kirakan min populasi. Apabila bekerja dengan populasi umum, nilai puratanya dilambangkan sebagai μ (mu). Purata populasi dikira sebagai purata aritmetik biasa: tambah semua nilai dalam populasi, dan kemudian bahagikan hasilnya dengan bilangan nilai dalam populasi.

      • Perlu diingat bahawa purata tidak selalu dikira sebagai min aritmetik.
      • Dalam contoh kami, populasi bermakna: μ = 5 + 5 + 8 + 12 + 15 + 18 6 (\displaystyle (\frac (5+5+8+12+15+18)(6))) = 10,5
    4. Kurangkan min populasi daripada setiap nilai dalam populasi. Semakin hampir nilai perbezaan kepada sifar, semakin hampir nilai tertentu dengan min populasi. Cari perbezaan antara setiap nilai dalam populasi dan minnya, dan anda akan mendapat pandangan pertama pada taburan nilai tersebut.

      • Dalam contoh kami:
        x 1 (\displaystyle x_(1))- μ = 5 - 10.5 = -5.5
        x 2 (\displaystyle x_(2))- μ = 5 - 10.5 = -5.5
        x 3 (\displaystyle x_(3))- μ = 8 - 10.5 = -2.5
        x 4 (\displaystyle x_(4))- μ = 12 - 10.5 = 1.5
        x 5 (\displaystyle x_(5))- μ = 15 - 10.5 = 4.5
        x 6 (\displaystyle x_(6))- μ = 18 - 10.5 = 7.5
    5. Square setiap hasil yang anda dapat. Nilai perbezaan akan menjadi positif dan negatif; jika anda meletakkan nilai ini pada garis nombor, maka ia akan terletak di sebelah kanan dan kiri min populasi. Ini tidak baik untuk mengira varians, kerana nombor positif dan negatif membatalkan satu sama lain. Oleh itu, kuasai setiap perbezaan untuk mendapatkan nombor positif secara eksklusif.

      • Dalam contoh kami:
        (x i (\displaystyle x_(i)) - μ) 2 (\displaystyle ^(2)) untuk setiap nilai populasi (dari i = 1 hingga i = 6):
        (-5,5)2 (\displaystyle ^(2)) = 30,25
        (-5,5)2 (\displaystyle ^(2)), di mana x n (\displaystyle x_(n)) ialah nilai terakhir dalam populasi.
      • Untuk mengira nilai purata keputusan yang diperoleh, anda perlu mencari jumlahnya dan membahagikannya dengan n: (( x 1 (\displaystyle x_(1)) - μ) 2 (\displaystyle ^(2)) + (x 2 (\displaystyle x_(2)) - μ) 2 (\displaystyle ^(2)) + ... + (x n (\displaystyle x_(n)) - μ) 2 (\displaystyle ^(2))) / n
      • Sekarang mari kita tulis penjelasan di atas menggunakan pembolehubah: (∑( x i (\displaystyle x_(i)) - μ) 2 (\displaystyle ^(2))) / n dan dapatkan formula untuk mengira varians populasi.

Serakan ialah ukuran serakan yang menerangkan sisihan relatif antara nilai data dan min. Ia ialah ukuran serakan yang paling biasa digunakan dalam statistik, dikira dengan menjumlahkan, kuasa dua, sisihan setiap nilai data daripada min. Formula untuk mengira varians ditunjukkan di bawah:

s 2 - varians sampel;

x cf ialah nilai min sampel;

n saiz sampel (bilangan nilai data),

(x i – x cf) ialah sisihan daripada nilai min bagi setiap nilai set data.

Untuk lebih memahami formula, mari lihat contoh. Saya tidak begitu suka memasak, jadi saya jarang melakukannya. Namun, untuk tidak mati kelaparan, dari semasa ke semasa saya perlu pergi ke dapur untuk melaksanakan rancangan untuk mengenyangkan badan saya dengan protein, lemak dan karbohidrat. Set data di bawah menunjukkan kekerapan Renat memasak makanan setiap bulan:

Langkah pertama dalam mengira varians adalah untuk menentukan min sampel, yang dalam contoh kita ialah 7.8 kali sebulan. Pengiraan yang selebihnya boleh dipermudahkan dengan bantuan jadual berikut.

Fasa terakhir pengiraan varians kelihatan seperti ini:

Bagi mereka yang suka melakukan semua pengiraan sekali gus, persamaan akan kelihatan seperti ini:

Menggunakan kaedah kiraan mentah (contoh masakan)

Terdapat cara yang lebih cekap untuk mengira varians, yang dikenali sebagai kaedah "pengiraan mentah". Walaupun pada pandangan pertama persamaan mungkin kelihatan agak rumit, sebenarnya ia tidak begitu menakutkan. Anda boleh mengesahkan ini, dan kemudian memutuskan kaedah yang paling anda sukai.

ialah jumlah setiap nilai data selepas kuasa dua,

ialah kuasa dua jumlah semua nilai data.

Jangan hilang akal sekarang. Mari letakkan semuanya dalam bentuk jadual, dan kemudian anda akan melihat bahawa terdapat lebih sedikit pengiraan di sini berbanding contoh sebelumnya.

Seperti yang anda lihat, hasilnya adalah sama seperti semasa menggunakan kaedah sebelumnya. Kelebihan kaedah ini menjadi ketara apabila saiz sampel (n) bertambah.

Mengira varians dalam Excel

Seperti yang anda mungkin sudah meneka, Excel mempunyai formula yang membolehkan anda mengira varians. Selain itu, bermula dari Excel 2010, anda boleh menemui 4 jenis formula penyebaran:

1) VAR.V - Mengembalikan varians sampel. Nilai dan teks Boolean diabaikan.

2) VAR.G - Mengembalikan varians populasi. Nilai dan teks Boolean diabaikan.

3) VASP - Mengembalikan varians sampel, dengan mengambil kira nilai boolean dan teks.

4) VARP - Mengembalikan varians populasi, dengan mengambil kira nilai logik dan teks.

Pertama, mari kita lihat perbezaan antara sampel dan populasi. Tujuan statistik deskriptif adalah untuk meringkaskan atau memaparkan data sedemikian rupa untuk mendapatkan gambaran yang besar, boleh dikatakan, gambaran keseluruhan. Inferens statistik membolehkan anda membuat inferens tentang populasi berdasarkan sampel data daripada populasi ini. Populasi mewakili semua kemungkinan hasil atau ukuran yang menarik minat kita. Sampel ialah subset populasi.

Sebagai contoh, kami berminat dengan jumlah keseluruhan sekumpulan pelajar dari salah sebuah universiti Rusia dan kami perlu menentukan skor purata kumpulan itu. Kami boleh mengira prestasi purata pelajar, dan kemudian angka yang terhasil akan menjadi parameter, kerana seluruh populasi akan terlibat dalam pengiraan kami. Namun, jika kita ingin mengira GPA semua pelajar di negara kita, maka kumpulan ini akan menjadi sampel kita.

Perbezaan dalam formula untuk mengira varians antara sampel dan populasi adalah dalam penyebut. Di mana untuk sampel ia akan sama dengan (n-1), dan untuk populasi umum sahaja n.

Sekarang mari kita berurusan dengan fungsi mengira varians dengan pengakhiran A, dalam huraian yang dikatakan bahawa pengiraan mengambil kira teks dan nilai logik. Dalam kes ini, apabila mengira varians set data tertentu di mana nilai bukan angka berlaku, Excel akan mentafsirkan teks dan boolean palsu sebagai 0, dan boolean benar sebagai 1.

Jadi, jika anda mempunyai tatasusunan data, tidak sukar untuk mengira variansnya menggunakan salah satu fungsi Excel yang disenaraikan di atas.

Selalunya dalam statistik, apabila menganalisis fenomena atau proses, perlu mengambil kira bukan sahaja maklumat tentang tahap purata penunjuk yang dikaji, tetapi juga serakan atau variasi dalam nilai unit individu , yang merupakan ciri penting populasi yang dikaji.

Harga saham, volum penawaran dan permintaan, kadar faedah dalam tempoh masa yang berbeza dan di tempat yang berbeza tertakluk kepada variasi yang paling besar.

Penunjuk utama yang mencirikan variasi , ialah julat, varians, sisihan piawai dan pekali variasi.

Variasi rentang ialah perbezaan antara nilai maksimum dan minimum atribut: R = Xmax – Xmin. Kelemahan penunjuk ini ialah ia menilai hanya sempadan variasi sifat dan tidak menggambarkan turun naiknya dalam sempadan ini.

Penyerakan tanpa kekurangan ini. Ia dikira sebagai kuasa dua purata sisihan nilai atribut daripada nilai puratanya:

Cara mudah untuk mengira varians dijalankan menggunakan formula berikut (mudah dan berwajaran):

Contoh penggunaan formula ini dibentangkan dalam tugasan 1 dan 2.

Penunjuk yang digunakan secara meluas dalam amalan ialah sisihan piawai :

Sisihan piawai ditakrifkan sebagai punca kuasa dua varians dan mempunyai dimensi yang sama dengan sifat yang dikaji.

Penunjuk yang dipertimbangkan memungkinkan untuk mendapatkan nilai mutlak variasi, i.e. nilaikannya dalam unit ukuran sifat yang dikaji. Berbeza dengan mereka, pekali variasi mengukur turun naik dari segi relatif - berbanding dengan tahap purata, yang dalam banyak kes adalah lebih baik.

Formula untuk mengira pekali variasi.

Contoh penyelesaian masalah pada topik "Penunjuk variasi dalam statistik"

Tugasan 1 . Apabila mengkaji pengaruh pengiklanan pada saiz purata deposit bulanan di bank di rantau ini, 2 bank telah diperiksa. Keputusan berikut diperoleh:

takrifkan:
1) bagi setiap bank: a) purata deposit bulanan; b) penyebaran sumbangan;
2) purata deposit bulanan untuk dua bank bersama;
3) Penyebaran deposit untuk 2 bank, bergantung kepada pengiklanan;
4) Penyebaran deposit untuk 2 bank, bergantung kepada semua faktor kecuali pengiklanan;
5) Jumlah varians menggunakan peraturan penambahan;
6) Pekali penentuan;
7) Hubungan korelasi.

Penyelesaian

1) Mari buat jadual pengiraan untuk bank dengan pengiklanan . Untuk menentukan purata deposit bulanan, kami mencari titik tengah selang. Dalam kes ini, nilai selang terbuka (yang pertama) secara bersyarat disamakan dengan nilai selang yang bersebelahan dengannya (yang kedua).

Kami mencari saiz purata sumbangan menggunakan formula min aritmetik berwajaran:

29,000/50 = 580 rubel

Serakan sumbangan didapati dengan formula:

23 400/50 = 468

Kami akan melakukan tindakan serupa untuk bank tanpa iklan :

2) Cari purata deposit untuk dua bank bersama-sama. Xav \u003d (580 × 50 + 542.8 × 50) / 100 \u003d 561.4 rubel.

3) Varians deposit, untuk dua bank, bergantung pada pengiklanan, kita akan dapati dengan formula: σ 2 =pq (formula varians tanda alternatif). Di sini p=0.5 ialah perkadaran faktor yang bergantung pada pengiklanan; q=1-0.5, kemudian σ 2 =0.5*0.5=0.25.

4) Oleh kerana bahagian faktor lain ialah 0.5, maka varians deposit untuk dua bank, yang bergantung kepada semua faktor kecuali pengiklanan, juga 0.25.

5) Tentukan jumlah varians menggunakan peraturan penambahan.

= (468*50+636,16*50)/100=552,08

= [(580-561,4)250+(542,8-561,4)250] / 100= 34 596/ 100=345,96

σ 2 \u003d σ 2 fakta + σ 2 rehat \u003d 552.08 + 345.96 \u003d 898.04

6) Pekali penentuan η 2 = σ 2 sebenar / σ 2 = 345.96/898.04 = 0.39 = 39% - saiz sumbangan adalah 39% bergantung kepada pengiklanan.

7) Nisbah korelasi empirikal η = √η 2 = √0.39 = 0.62 - hubungannya agak rapat.

Tugasan 2 . Terdapat kumpulan perusahaan mengikut nilai produk yang boleh dipasarkan:

Tentukan: 1) penyebaran nilai produk yang boleh dipasarkan; 2) sisihan piawai; 3) pekali variasi.

Penyelesaian

1) Mengikut syarat, siri taburan selang dibentangkan. Ia mesti dinyatakan secara diskret, iaitu, cari tengah selang (x "). Dalam kumpulan selang tertutup, kita cari tengah dengan min aritmetik mudah. ​​Dalam kumpulan dengan had atas, sebagai perbezaan antara had atas ini dan separuh saiz selang yang mengikutinya (200-(400 -200):2=100).

Dalam kumpulan dengan had yang lebih rendah - jumlah had bawah ini dan separuh saiz selang sebelumnya (800+(800-600):2=900).

Pengiraan nilai purata produk yang boleh dipasarkan dilakukan mengikut formula:

Хср = k×((Σ((x"-a):k)×f):Σf)+a. Di sini a=500 ialah saiz varian pada frekuensi tertinggi, k=600-400=200 ialah saiz selang pada frekuensi tertinggi Mari letakkan keputusan dalam jadual:

Jadi, nilai purata output boleh dipasarkan untuk tempoh yang dikaji secara keseluruhan ialah Xav = (-5:37) × 200 + 500 = 472.97 ribu rubel.

2) Kami mencari penyebaran menggunakan formula berikut:

σ 2 \u003d (33/37) * 2002-(472.97-500) 2 \u003d 35,675.67-730.62 \u003d 34,945.05

3) sisihan piawai: σ = ±√σ 2 = ±√34 945.05 ≈ ±186.94 ribu rubel.

4) pekali variasi: V \u003d (σ / Xav) * 100 \u003d (186.94 / 472.97) * 100 \u003d 39.52%

Walau bagaimanapun, ciri ini sahaja belum mencukupi untuk kajian pembolehubah rawak. Bayangkan dua penembak yang menembak sasaran. Satu menembak dengan tepat dan terkena dekat dengan tengah, dan satu lagi ... hanya berseronok dan tidak membidik. Tapi yang kelakarnya purata hasilnya akan sama seperti penembak pertama! Keadaan ini digambarkan secara bersyarat oleh pembolehubah rawak berikut:

Jangkaan matematik "penembak tepat" adalah sama dengan , walau bagaimanapun, untuk "orang yang menarik": - ia juga sifar!

Oleh itu, terdapat keperluan untuk mengukur sejauh mana bertaburan peluru (nilai pembolehubah rawak) berbanding dengan pusat sasaran (jangkaan). dan berselerak diterjemahkan daripada bahasa Latin sahaja sebagai penyebaran .

Mari lihat bagaimana ciri berangka ini ditentukan dalam salah satu contoh bahagian pertama pelajaran:

Di sana kami mendapati jangkaan matematik yang mengecewakan untuk permainan ini, dan kini kami perlu mengira variansnya, yang dilambangkan seberang.

Mari kita ketahui sejauh mana kemenangan/kerugian "tersebar" berbanding dengan nilai purata. Jelas sekali, untuk ini kita perlu mengira perbezaan antara nilai pembolehubah rawak dan dia jangkaan matematik:

–5 – (–0,5) = –4,5
2,5 – (–0,5) = 3
10 – (–0,5) = 10,5

Sekarang nampaknya perlu untuk merumuskan keputusan, tetapi cara ini tidak baik - atas sebab ayunan ke kiri akan membatalkan satu sama lain dengan ayunan ke kanan. Jadi, sebagai contoh, penembak "amatur". (contoh di atas) perbezaan akan menjadi , dan apabila ditambah mereka akan memberikan sifar, jadi kami tidak akan mendapat sebarang anggaran taburan penembakannya.

Untuk mengatasi gangguan ini, pertimbangkan modul perbezaan, tetapi atas sebab teknikal, pendekatan telah berakar umbi apabila ia diduakan. Lebih mudah untuk mengatur penyelesaian dalam jadual:

Dan di sini ia memohon untuk mengira purata wajaran nilai sisihan kuasa dua. Apa itu? Ia milik mereka nilai yang dijangkakan, iaitu ukuran serakan:

takrifan penyebaran. Ia serta-merta jelas daripada definisi bahawa varians tidak boleh negatif- ambil perhatian untuk latihan!

Mari kita ingat bagaimana untuk mencari jangkaan. Darabkan perbezaan kuasa dua dengan kebarangkalian yang sepadan (Sambungan jadual):
- secara kiasan, ini adalah "daya tarikan",
dan meringkaskan keputusan:

Tidakkah anda berfikir bahawa dengan latar belakang kemenangan, hasilnya ternyata terlalu besar? Betul - kami mengkuadangkan, dan untuk kembali ke dimensi permainan kami, kami perlu mengambil punca kuasa dua. Nilai ini dipanggil sisihan piawai dan dilambangkan dengan huruf Yunani "sigma":

Kadang-kadang makna ini dipanggil sisihan piawai .

Apakah maksudnya? Jika kita menyimpang dari jangkaan matematik ke kiri dan ke kanan dengan sisihan piawai:

– maka nilai yang paling berkemungkinan bagi pembolehubah rawak akan "tertumpu" pada selang ini. Apa yang sebenarnya kita lihat:

Walau bagaimanapun, ia berlaku bahawa dalam analisis penyebaran hampir selalu beroperasi dengan konsep penyebaran. Mari lihat apa maksudnya berkaitan dengan permainan. Jika dalam kes penembak kita bercakap tentang "ketepatan" pukulan berbanding dengan pusat sasaran, maka di sini penyebaran mencirikan dua perkara:

Pertama, adalah jelas bahawa apabila kadar meningkat, varians juga meningkat. Jadi, sebagai contoh, jika kita meningkat sebanyak 10 kali, maka jangkaan matematik akan meningkat sebanyak 10 kali, dan varians akan meningkat sebanyak 100 kali. (sebaik sahaja ia adalah nilai kuadratik). Tetapi ambil perhatian bahawa peraturan permainan tidak berubah! Hanya kadar yang telah berubah, secara kasarnya, kami pernah bertaruh 10 rubel, kini 100.

Perkara kedua yang lebih menarik ialah varians mencirikan gaya permainan. Betulkan secara mental kadar permainan pada tahap tertentu, dan lihat apa yang ada di sini:

Permainan varians rendah ialah permainan berhati-hati. Pemain cenderung untuk memilih skim yang paling boleh dipercayai, di mana dia tidak kalah/menang terlalu banyak pada satu masa. Contohnya, sistem merah/hitam dalam rolet (lihat Contoh 4 artikel pembolehubah rawak) .

Permainan varians tinggi. Dia sering dipanggil penyebaran permainan. Ini ialah gaya permainan yang mencabar atau agresif di mana pemain memilih skim "adrenalin". Sekurang-kurangnya kita ingat "Martingale", di mana jumlah yang dipertaruhkan adalah susunan magnitud yang lebih besar daripada permainan "tenang" perenggan sebelumnya.

Keadaan dalam poker adalah petunjuk: ada yang dipanggil ketat pemain yang cenderung berhati-hati dan "goyang" dengan dana permainan mereka (bankroll). Tidak hairanlah, bankroll mereka tidak banyak turun naik (variance rendah). Sebaliknya, jika pemain mempunyai varians yang tinggi, maka ia adalah penceroboh. Dia sering mengambil risiko, membuat pertaruhan besar dan boleh memecahkan bank besar dan berkecai.

Perkara yang sama berlaku dalam Forex, dan seterusnya - terdapat banyak contoh.

Lebih-lebih lagi, dalam semua kes tidak kira sama ada permainan itu untuk satu sen atau untuk beribu-ribu dolar. Setiap peringkat mempunyai pemain varians rendah dan tinggi. Nah, untuk kemenangan purata, seperti yang kita ingat, "bertanggungjawab" nilai yang dijangkakan.

Anda mungkin perasan bahawa mencari varians adalah proses yang panjang dan teliti. Tetapi matematik adalah murah hati:

Formula untuk mencari varians

Formula ini diperolehi terus daripada takrifan varians, dan kami segera memasukkannya ke dalam edaran. Saya akan menyalin plat dengan permainan kami dari atas:

dan jangkaan yang ditemui.

Kami mengira varians dengan cara kedua. Mula-mula, mari kita cari jangkaan matematik - kuasa dua pembolehubah rawak . Oleh definisi jangkaan matematik:

Dalam kes ini:

Oleh itu, mengikut formula:

Seperti yang mereka katakan, rasai perbezaannya. Dan dalam praktiknya, tentu saja, lebih baik menggunakan formula (kecuali syaratnya memerlukan sebaliknya).

Kami menguasai teknik menyelesaikan dan mereka bentuk:

Contoh 6

Cari jangkaan matematiknya, varians dan sisihan piawai.

Tugas ini ditemui di mana-mana, dan, sebagai peraturan, pergi tanpa makna yang bermakna.
Anda boleh bayangkan beberapa mentol lampu dengan nombor yang menyala di rumah gila dengan kebarangkalian tertentu :)

Penyelesaian: Adalah mudah untuk meringkaskan pengiraan utama dalam jadual. Pertama, kami menulis data awal dalam dua baris teratas. Kemudian kami mengira produk, kemudian dan akhirnya jumlah dalam lajur kanan:

Sebenarnya, hampir semuanya sudah siap. Di baris ketiga, jangkaan matematik siap dibuat telah dilukis: .

Penyerakan dikira dengan formula:

Dan akhirnya, sisihan piawai:
- secara peribadi, saya biasanya membundarkan kepada 2 tempat perpuluhan.

Semua pengiraan boleh dilakukan pada kalkulator, dan lebih baik lagi - dalam Excel:

Sukar untuk tersilap di sini :)

Jawab:

Mereka yang berhajat boleh memudahkan lagi kehidupan mereka dan mengambil kesempatan daripada saya kalkulator (demo), yang bukan sahaja menyelesaikan masalah ini dengan serta-merta, tetapi juga membina grafik tematik (datang segera). Program boleh muat turun di perpustakaan– jika anda telah memuat turun sekurang-kurangnya satu bahan kajian, atau menerima cara lain. Terima kasih kerana menyokong projek ini!

Beberapa tugas untuk penyelesaian bebas:

Contoh 7

Kira varians pembolehubah rawak contoh sebelumnya mengikut takrifan.

Dan contoh serupa:

Contoh 8

Pembolehubah rawak diskret diberikan oleh undang-undang taburannya sendiri:

Ya, nilai pembolehubah rawak boleh agak besar (contoh dari kerja sebenar), dan di sini, jika boleh, gunakan Excel. Sebagai, dengan cara ini, dalam Contoh 7 - ia lebih pantas, lebih dipercayai dan lebih menyenangkan.

Penyelesaian dan jawapan di bahagian bawah halaman.

Sebagai kesimpulan bahagian ke-2 pelajaran, kami akan menganalisis satu lagi tugasan biasa, seseorang mungkin mengatakan rebus kecil:

Contoh 9

Pembolehubah rawak diskret boleh mengambil hanya dua nilai: dan , dan . Kebarangkalian, jangkaan matematik dan varians diketahui.

Penyelesaian: Mari kita mulakan dengan kebarangkalian yang tidak diketahui. Oleh kerana pembolehubah rawak boleh mengambil hanya dua nilai, maka jumlah kebarangkalian kejadian yang sepadan:

dan sejak , kemudian .

Ia kekal untuk mencari ..., mudah untuk mengatakan :) Tetapi oh well, ia bermula. Mengikut definisi jangkaan matematik:
- gantikan nilai yang diketahui:

- dan tiada lagi yang boleh dikeluarkan daripada persamaan ini, kecuali anda boleh menulis semula dalam arah biasa:

atau:

Mengenai tindakan selanjutnya, saya rasa anda boleh meneka. Mari buat dan selesaikan sistem:

Perpuluhan, sudah tentu, satu kehinaan yang lengkap; darab kedua-dua persamaan dengan 10:

dan bahagikan dengan 2:

Itu lebih baik. Daripada persamaan 1 kita nyatakan:
(ini adalah cara yang lebih mudah)- gantikan dalam persamaan ke-2:


Kami sedang membina kuasa dua dan buat penyederhanaan:

Kami mendarab dengan:

Akibatnya, persamaan kuadratik, cari diskriminasinya:
- sempurna!

dan kami mendapat dua penyelesaian:

1) jika , kemudian ;

2) jika , kemudian .

Pasangan nilai pertama memenuhi syarat. Dengan kebarangkalian yang tinggi, semuanya betul, tetapi, bagaimanapun, kami menulis undang-undang pengedaran:

dan lakukan semakan, iaitu, cari jangkaan: