Вредност на варијанса. Варијанса и стандардна девијација

Меѓу многуте индикатори што се користат во статистиката, неопходно е да се истакне пресметката на варијансата. Треба да се напомене дека рачно извршување на оваа пресметка е прилично мачна задача. За среќа, постојат функции во Excel кои ви дозволуваат да ја автоматизирате процедурата за пресметка. Ајде да го дознаеме алгоритмот за работа со овие алатки.

Дисперзијата е индикатор за варијација, што е просечен квадрат на отстапувања од математичкото очекување. Така, го изразува ширењето на бројките за средната вредност. Пресметката на дисперзијата може да се изврши и за општата популација и за примерокот.

Метод 1: пресметка на општата популација

За да се пресмета овој индикатор во Excel за општата популација, се користи функцијата ДИСП.Г. Синтаксата за овој израз е како што следува:

DISP.G (Број 1; Број 2;…)

Вкупно може да се применат од 1 до 255 аргументи. Аргументите можат да бидат и нумерички вредности и референци на ќелиите во кои се содржани.

Ајде да видиме како да ја пресметаме оваа вредност за опсег на нумерички податоци.


Метод 2: пресметка на примерокот

За разлика од пресметката на вредноста за општата популација, при пресметката за примерокот, именителот не е вкупниот број на броеви, туку еден помалку. Ова е направено со цел да се поправи грешката. Excel ја зема предвид оваа нијанса во посебна функција која е наменета за овој тип на пресметка - DISP.V. Неговата синтакса е претставена со следнава формула:

VAR.B (Број 1; Број 2;…)

Бројот на аргументи, како и во претходната функција, исто така може да се движи од 1 до 255.


Како што можете да видите, програмата Excel може во голема мера да го олесни пресметувањето на варијансата. Оваа статистика може да се пресмета со апликацијата и за популацијата и за примерокот. Во овој случај, сите дејства на корисникот всушност се сведуваат само на одредување на опсегот на броеви што треба да се обработат, а Excel сам ја врши главната работа. Се разбира, ова ќе заштеди значително време за корисниците.

Дисперзија во статистикатасе наоѓа како поединечни вредности на карактеристиката во квадратот на . Во зависност од првичните податоци, се одредува со едноставни и пондерирани формули за варијанса:

1. (за негрупирани податоци) се пресметува со формулата:

2. Пондерирана варијанса (за серија на варијации):

каде n е фреквенцијата (фактор на повторливост X)

Пример за наоѓање на варијансата

Оваа страница опишува стандарден пример за пронаоѓање на варијансата, исто така можете да погледнете и други задачи за да ја пронајдете

Пример 1. Ги имаме следните податоци за група од 20 студенти дописни. Потребно е да се изгради интервална серија на распределбата на карактеристиките, да се пресмета средната вредност на карактеристиката и да се проучи нејзината варијанса

Ајде да изградиме интервална групација. Ајде да го одредиме опсегот на интервалот со формулата:

каде што X max е максималната вредност на карактеристиката за групирање;
X min е минималната вредност на карактеристиката за групирање;
n е бројот на интервали:

Прифаќаме n=5. Чекорот е: h \u003d (192 - 159) / 5 \u003d 6,6

Ајде да направиме интервално групирање

За понатамошни пресметки, ќе изградиме помошна табела:

X'i е средината на интервалот. (на пример, средината на интервалот 159 - 165,6 = 162,3)

Просечниот раст на учениците се одредува со формулата на аритметички пондериран просек:

Дисперзијата ја одредуваме со формулата:

Формулата за варијанса може да се конвертира на следниов начин:

Од оваа формула произлегува дека варијансата е разликата помеѓу средната вредност на квадратите на опциите и квадратот и средната вредност.

Варијанси во сериите на варијациисо еднакви интервали според методот на моменти може да се пресмета на следниот начин користејќи го второто својство на дисперзијата (поделувајќи ги сите опции со вредноста на интервалот). Дефиниција на варијанса, пресметано со методот на моменти, според следнава формула одзема помалку време:

каде што i е вредноста на интервалот;
А - условна нула, што е погодно да се користи средината на интервалот со најголема фреквенција;
m1 е квадратот на моментот од првиот ред;
m2 - момент на втор ред

(ако во статистичката популација атрибутот се менува на таков начин што има само две меѓусебно исклучувачки опции, тогаш таквата варијабилност се нарекува алтернативна) може да се пресмета со формулата:

Заменувајќи ја оваа формула за дисперзија q = 1- p, добиваме:

Видови на дисперзија

Вкупна варијансаја мери варијацијата на некоја особина врз целата популација како целина под влијание на сите фактори кои ја предизвикуваат оваа варијација. Тоа е еднакво на средниот квадрат на отстапувањата на поединечните вредности на карактеристиката x од вкупната средна вредност x и може да се дефинира како едноставна варијанса или пондерирана варијанса.

ја карактеризира случајната варијација, т.е. дел од варијацијата, која се должи на влијанието на неоткриени фактори и не зависи од знакот-фактор кој лежи во основата на групирањето. Оваа варијанса е еднаква на средниот квадрат на отстапувањата на поединечните вредности на атрибутот во рамките на групата X од аритметичката средина на групата и може да се пресмета како едноставна варијанса или како пондерирана варијанса.

На овој начин, мерки за варијанса во рамките на групатаваријација на особина во група и се одредува со формулата:

каде xi - просек на групата;
ni е бројот на единици во групата.

На пример, варијансите во рамките на групата што треба да се утврдат во задачата за проучување на влијанието на квалификациите на работниците врз нивото на продуктивноста на трудот во продавница, покажуваат варијации во производството во секоја група предизвикани од сите можни фактори (техничка состојба на опремата, достапност на алатки и материјали, возраст на работниците, интензитет на трудот, итн.), освен разликите во категоријата на квалификации (во групата, сите работници имаат иста квалификација).

Просекот на варијансите во рамките на групата го одразува случајниот, т.е. оној дел од варијацијата што настанал под влијание на сите други фактори, со исклучок на факторот за групирање. Се пресметува со формулата:

Ја карактеризира систематската варијација на добиената особина, која се должи на влијанието на факторот на особина што лежи во основата на групирањето. Тоа е еднакво на средниот квадрат на отстапувањата на групните средини од вкупната средина. Варијансата меѓу групите се пресметува со формулата:

Правило за собирање варијанса во статистиката

Според правило за собирање на варијансавкупната варијанса е еднаква на збирот на просекот на интергрупните и меѓугрупните варијанси:

Значењето на ова правилое дека вкупната варијанса што се јавува под влијание на сите фактори е еднаква на збирот на варијансите што произлегуваат под влијание на сите други фактори и варијансата што настанува поради факторот на групирање.

Користејќи ја формулата за додавање варијанси, можно е да се одреди третата непозната од две познати варијанси, а исто така да се суди за јачината на влијанието на атрибутот за групирање.

Својства на дисперзија

1. Ако сите вредности на атрибутот се намалат (зголемат) за истата константна вредност, тогаш варијансата нема да се промени од ова.
2. Ако сите вредности на атрибутот се намалат (зголемат) за ист број пати n, тогаш варијансата соодветно ќе се намали (зголеми) за n^2 пати.

Дисперзијата во статистиката се дефинира како стандардно отстапување на поединечните вредности на особина на квадрат од аритметичката средина. Вообичаен начин да се пресметаат квадратните отстапувања на опциите од средната вредност и потоа да се просечат.

Во економската и статистичка анализа, вообичаено е да се процени варијацијата на карактеристиката најчесто користејќи ја стандардната девијација, што е квадратен корен на варијансата.

(3)

Ја карактеризира апсолутната флуктуација на вредностите на атрибутот на променливата и се изразува во истите единици како и варијантите. Во статистиката, често станува неопходно да се споредат варијациите на различни карактеристики. За такви споредби, се користи релативен индикатор за варијација, коефициентот на варијација.

Карактеристики на дисперзија:

1) ако одземете кој било број од сите опции, тогаш варијансата нема да се промени;

2) ако сите вредности на варијантата се поделат со некој број b, тогаш варијансата ќе се намали за b^2 пати, т.е.

3) ако го пресметате просечниот квадрат на отстапувања од кој било број со нееднаква аритметичка средина, тогаш тој ќе биде поголем од варијансата. Во овој случај, со добро дефинирана вредност по квадрат на разликата помеѓу просечната вредност на pos.

Варијансата може да се дефинира како разлика помеѓу средниот квадрат и средниот квадрат.

17. Групни и меѓугрупни варијации. Правило за собирање варијанса

Ако статистичката популација е поделена на групи или делови според карактеристиката што се проучува, тогаш за таква популација може да се пресметаат следните видови дисперзија: групна (приватна), групна просечна (приватна) и меѓугрупна.

Вкупна варијанса- ја одразува варијацијата на особина поради сите услови и причини кои функционираат во дадена статистичка популација.

Групна варијанса- е еднаков на средниот квадрат на отстапувањата на поединечните вредности на атрибутот во групата од аритметичката средина на оваа група, наречена групна средина. Во овој случај, групниот просек не се совпаѓа со вкупниот просек за целото население.

Групната варијанса ја одразува варијацијата на особина само поради условите и причините кои функционираат во групата.

Просечни групни варијанси- се дефинира како пондерирана аритметичка средина на групните дисперзии, при што тежините се волумените на групите.

Интергрупна варијанса- е еднаков на средниот квадрат на отстапувањата на групните средини од вкупната средина.

Интергрупна варијанса ја карактеризира варијацијата на резултантниот атрибут поради атрибутот за групирање.

Постои одредена врска помеѓу разгледуваните типови на варијанси: вкупната варијанса е еднаква на збирот на просечната група и интергрупна варијанса.

Оваа врска се нарекува правило за собирање варијанса.

18. Динамичка серија и нејзините составни елементи. Видови динамички серии.

Серии во статистика- ова се дигитални податоци кои ја покажуваат промената на некоја појава во времето или просторот и овозможуваат да се направи статистичка споредба на појавите како во процесот на нивниот развој во времето, така и во различни форми и видови процеси. Благодарение на ова, можно е да се открие меѓусебната зависност на појавите.

Процесот на развој на движењето на општествените појави во времето во статистиката обично се нарекува динамика. За да се прикаже динамиката, се градат серии динамики (хронолошки, временски), кои се низи временски променливи вредности на статистички индикатор (на пример, број на осуденици над 10 години), распоредени по хронолошки редослед. Нивните составни елементи се нумеричките вредности на даден индикатор и периодите или временските точки на кои тие се однесуваат.

Најважната карактеристика на временските серии- нивната големина (волумен, вредност) на овој или оној феномен, постигнат во одреден период или до одреден момент. Соодветно на тоа, вредноста на термините од серијата динамика е нејзиното ниво. Разликувајтепочетни, средни и завршни нивоа на динамичната серија. Прво нивоја покажува вредноста на првиот, конечниот - вредноста на последниот член од серијата. Просечно нивого претставува просечниот хронолошки опсег на варијации и се пресметува во зависност од тоа дали временската серија е интервална или инстант.

Друга важна карактеристика на динамичната серија- времето поминато од првичното до последното набљудување или бројот на такви набљудувања.

Постојат различни видови временски серии, тие можат да се класифицираат според следните критериуми.

1) Во зависност од начинот на изразување нивоа, сериите на динамиката се делат на низи апсолутни и изведени показатели (релативни и просечни вредности).

2) Во зависност од тоа како нивоата на серијата ја изразуваат состојбата на феноменот во одредени временски моменти (на почетокот на месецот, кварталот, годината итн.) или неговата вредност за одредени временски интервали (на пример, на ден, месец, година, итн.) итн.), се разликуваат моментални и интервални серии на динамика, соодветно. Сериите на моменти во аналитичката работа на агенциите за спроведување на законот се користат релативно ретко.

Во теоријата на статистиката, динамиката се издвојува и според низа други класификациски карактеристики: во зависност од растојанието помеѓу нивоата - со еднакви нивоа и нееднакви нивоа во времето; во зависност од присуството на главниот тренд на процесот што се проучува - стационарен и нестационарен. Кога се анализираат динамичните серии, нивоата на серијата се претставени како компоненти како што следува:

Y t \u003d TP + E (t)

каде TR е детерминистичка компонента која го одредува општиот тренд на промена со текот на времето или тренд.

E (t) е случајна компонента која предизвикува флуктуации на нивото.

Оваа страница опишува стандарден пример за пронаоѓање на варијансата, исто така можете да погледнете и други задачи за да ја пронајдете

Пример 1. Определување група, просек на група, меѓу-група и вкупна варијанса

Пример 2. Наоѓање на варијансата и коефициентот на варијација во табела за групирање

Пример 3. Наоѓање на варијансата во дискретна серија

Пример 4. Ги имаме следните податоци за група од 20 студенти дописни. Потребно е да се изгради интервална серија на распределбата на карактеристиките, да се пресмета средната вредност на карактеристиката и да се проучи нејзината варијанса

Ајде да изградиме интервална групација. Ајде да го одредиме опсегот на интервалот со формулата:

каде што X max е максималната вредност на карактеристиката за групирање;
X min е минималната вредност на карактеристиката за групирање;
n е бројот на интервали:

Прифаќаме n=5. Чекорот е: h \u003d (192 - 159) / 5 \u003d 6,6

Ајде да направиме интервално групирање

За понатамошни пресметки, ќе изградиме помошна табела:

X "i - средината на интервалот. (на пример, средината на интервалот 159 - 165,6 \u003d 162,3)

Просечниот раст на учениците се одредува со формулата на аритметички пондериран просек:

Дисперзијата ја одредуваме со формулата:

Формулата може да се конвертира вака:

Од оваа формула произлегува дека варијансата е разликата помеѓу средната вредност на квадратите на опциите и квадратот и средната вредност.

Варијанси во сериите на варијациисо еднакви интервали според методот на моменти може да се пресмета на следниот начин користејќи го второто својство на дисперзијата (поделувајќи ги сите опции со вредноста на интервалот). Дефиниција на варијанса, пресметано со методот на моменти, според следнава формула одзема помалку време:

каде што i е вредноста на интервалот;
А - условна нула, што е погодно да се користи средината на интервалот со најголема фреквенција;
m1 е квадратот на моментот од првиот ред;
m2 - момент на втор ред

Варијанса на карактеристики (ако во статистичката популација атрибутот се менува на таков начин што има само две меѓусебно исклучувачки опции, тогаш таквата варијабилност се нарекува алтернативна) може да се пресмета со формулата:

Заменувајќи ја оваа формула за дисперзија q = 1- p, добиваме:

Видови на дисперзија

Вкупна варијансаја мери варијацијата на некоја особина врз целата популација како целина под влијание на сите фактори кои ја предизвикуваат оваа варијација. Тоа е еднакво на средниот квадрат на отстапувањата на поединечните вредности на карактеристиката x од вкупната средна вредност x и може да се дефинира како едноставна варијанса или пондерирана варијанса.

Интрагрупна варијанса ја карактеризира случајната варијација, т.е. дел од варијацијата, која се должи на влијанието на неоткриени фактори и не зависи од знакот-фактор кој лежи во основата на групирањето. Оваа варијанса е еднаква на средниот квадрат на отстапувањата на поединечните вредности на атрибутот во рамките на групата X од аритметичката средина на групата и може да се пресмета како едноставна варијанса или како пондерирана варијанса.



На овој начин, мерки за варијанса во рамките на групатаваријација на особина во група и се одредува со формулата:

каде xi - просек на групата;
ni е бројот на единици во групата.

На пример, варијансите во рамките на групата што треба да се утврдат во задачата за проучување на влијанието на квалификациите на работниците врз нивото на продуктивноста на трудот во продавница, покажуваат варијации во производството во секоја група предизвикани од сите можни фактори (техничка состојба на опремата, достапност на алатки и материјали, возраст на работниците, интензитет на трудот, итн.), освен разликите во категоријата на квалификации (во групата, сите работници имаат иста квалификација).

Дисперзијата е мерка за дисперзија која го опишува релативното отстапување помеѓу вредностите на податоците и средната вредност. Тоа е најчесто користената мерка за дисперзија во статистиката, пресметана со собирање, квадрат, отстапување на секоја вредност на податоците од средната вредност. Формулата за пресметување на варијансата е прикажана подолу:

s 2 - варијанса на примерокот;

x cf е средната вредност на примерокот;

nголемина на примерокот (број на вредности на податоци),

(x i – x cf) е отстапување од средната вредност за секоја вредност на множеството податоци.

За подобро да ја разбереме формулата, да погледнеме пример. Јас навистина не сакам да готвам, па затоа ретко го правам тоа. Меѓутоа, за да не умрам од глад, одвреме-навреме морам да одам до шпоретот за да го спроведам планот за заситување на телото со протеини, масти и јаглехидрати. Податоците подолу покажуваат колку пати Ренат готви храна секој месец:

Првиот чекор во пресметувањето на варијансата е да се одреди средната вредност на примерокот, која во нашиот пример е 7,8 пати месечно. Останатите пресметки може да се олеснат со помош на следната табела.

Последната фаза на пресметување на варијансата изгледа вака:

За оние кои сакаат да ги прават сите пресметки во едно движење, равенката ќе изгледа вака:

Користење на методот на сирово броење (пример за готвење)

Постои поефикасен начин за пресметување на варијансата, познат како метод на „сурово броење“. Иако на прв поглед равенката може да изгледа прилично незгодна, всушност тоа не е толку страшно. Можете да го потврдите ова, а потоа да одлучите кој метод ви се допаѓа најдобро.

е збирот на секоја податочна вредност по квадратурата,

е квадратот на збирот на сите вредности на податоци.

Не го губете умот во моментов. Ајде да го ставиме сето тоа во форма на табела, а потоа ќе видите дека овде има помалку пресметки отколку во претходниот пример.

Како што можете да видите, резултатот е ист како и при користење на претходниот метод. Предностите на овој метод стануваат очигледни како што расте големината на примерокот (n).

Пресметување варијанса во Excel

Како што можеби претпоставувате, постои формула во Excel што ви овозможува да ја пресметате варијансата. Покрај тоа, почнувајќи од Excel 2010, можете да најдете 4 варијанти на формулата за дисперзија:

1) VAR.V - Ја враќа варијансата на примерокот. Буловите вредности и текстот се игнорираат.

2) VAR.G - Ја враќа варијансата на популацијата. Буловите вредности и текстот се игнорираат.

3) VASP - Ја враќа варијансата на примерокот, земајќи ги предвид буловите и текстуалните вредности.

4) VARP - Ја враќа варијансата на популацијата, земајќи ги предвид логичките и текстуалните вредности.

Прво, да ја погледнеме разликата помеѓу примерокот и популацијата. Целта на описната статистика е да се сумираат или прикажуваат податоци на таков начин што брзо ќе се добие голема слика, така да се каже, преглед. Статистичките заклучоци ви овозможуваат да направите заклучоци за популација врз основа на примерок од податоци од оваа популација. Популацијата ги претставува сите можни исходи или мерења кои се од нас. Примерокот е подмножество од популација.

На пример, ние сме заинтересирани за севкупноста на група студенти од еден од руските универзитети и треба да го одредиме просечниот резултат на групата. Можеме да го пресметаме просечниот учинок на учениците, а потоа добиената бројка ќе биде параметар, бидејќи целата популација ќе биде вклучена во нашите пресметки. Меѓутоа, ако сакаме да го пресметаме успехот на сите студенти во нашата земја, тогаш оваа група ќе биде нашиот примерок.

Разликата во формулата за пресметување на варијансата помеѓу примерокот и популацијата е во именителот. Каде што за примерокот ќе биде еднаков на (n-1), а за општата популација само n.

Сега да се занимаваме со функциите на пресметување на варијансата со завршетоци НО,во чиј опис се вели дека при пресметката се земаат предвид текстуални и логички вредности. Во овој случај, при пресметување на варијансата на одредено множество податоци каде што се појавуваат ненумерички вредности, Excel ќе ги толкува текстот и лажните булови како 0, а вистинските булови како 1.

Значи, ако имате низа податоци, нема да биде тешко да се пресмета нејзината варијанса користејќи една од функциите на Excel наведени погоре.