Variasjonskoeffisient i statistikk. Hva er variasjonskoeffisienten for?

Relative indikatorer for variasjon - seksjon Økonomi, Data om aktivitetene til banker i en av regionene i Den russiske føderasjonen 1. Variasjonskoeffisient (Vσ) - Relativ ...

Settet anses som kvalitativt homogent hvis variasjonskoeffisienten ikke overstiger 0,33 (eller 33%).

Tabell 5.1.3.

Befolkningshomogenitetsskala

I dette tilfellet kan gjennomsnittsverdien av egenskapen som studeres betraktes som en typisk, pålitelig egenskap for den statistiske populasjonen.

Hvis variasjonskoeffisienten mer enn 0,33 (eller 33 %) så derfor variasjonen av egenskapen som studeres flott, og det funnet gjennomsnittet representerer dårlig hele den statistiske populasjonen, er ikke dens typiske, pålitelige egenskap, og selve befolkningen er heterogen når det gjelder funksjonen som vurderes.

Tilsvarende beregnes variasjonskoeffisienten andre relative mål for variasjon, som sjelden brukes i statistisk praksis:

2. Oscillasjonsindeks: ; (5.1.12.)

3. Lineær variasjonskoeffisient: . (5.1.13)

La oss beregne variasjonsindikatorene for det tverrgående problemet:

Tabell 5.1.4.

Beregningstabell for å finne egenskapene til fordelingsserien

Grupper av banker etter volum av kredittinvesteringer, millioner rubler X	Intervall midtpunkt	Antall banker	Produkt av varianter etter frekvenser
			gruppe 4= gruppe 2*gruppe 3		gr.6= gr.5*gr.5	gr.7= gr.6*gr.3
375,00 - 459,00	=417		417*4=	417-585= -168	=	28224*4=
459,00 - 543,00			?	?	?	?
543,00 - 627,00			?	?	?	?
627,00 - 711,00			?	?	?	?
711,00 - 795,00			?	?	?	?
Total			?	X	X	?

Beregning av det aritmetiske vektede gjennomsnittet:

Avviksberegning:

σ2=

Beregning av standardavvik:

Beregning av variasjonskoeffisienten:

Konklusjon. En analyse av de oppnådde verdiene av indikatorer og σ antyder at gjennomsnittlig volum av banklån er _______?mln. rub., er avviket fra gjennomsnittlig volum i en eller annen retning i gjennomsnitt _________?millioner. gni. (eller ______?%), de mest karakteristiske verdiene for volumet av kredittinvesteringer varierer fra ______________? mln. gni. opptil _______________? mln. gni. (område) (Se tabell 3.2.5 -_____? banker eller ______?% er inkludert i dette intervallet).

V σ verdi = ______?% _____? overstiger 33%, derfor er variasjonen av kredittinvesteringer i det studerte settet av banker ubetydelig, og settet på dette grunnlaget er kvalitativt homogent. Avviket mellom verdiene til , Mo og Me er ubetydelig (=585 millioner rubler, Mo=593,40 millioner rubler, Me=588,818 millioner rubler), noe som bekrefter konklusjonen om homogeniteten til aggregatet av banker. Dermed funnet gjennomsnittsverdien av volumet av kredittinvesteringer av banker (585 millioner rubler) ______? er en typisk, pålitelig egenskap for den studerte populasjonen av banker.

Slutt på arbeidet -

Dette emnet tilhører:

Data om aktivitetene til banker i en av regionene i Den russiske føderasjonen

Tverrgående oppgavedata.. tabell.. data om aktivitetene til banker i en av regionene i den russiske føderasjonen banknummer kredittinvesteringer millioner rubler fortjeneste..

Hvis du trenger ytterligere materiale om dette emnet, eller du ikke fant det du lette etter, anbefaler vi å bruke søket i vår database over verk:

Hva skal vi gjøre med det mottatte materialet:

Hvis dette materialet viste seg å være nyttig for deg, kan du lagre det på siden din på sosiale nettverk:

Alle emner i denne delen:

Statistikk emne, metode og oppgaver
1.1. Emne, metoder, statistikkens oppgaver Begrepet "statistikk" kommer fra det latinske "status", som kom i bruk i Tyskland på midten av 1700-tallet. For første gang ble det undervist i statistikk

Individuelle objekter eller fenomener som danner en statistisk populasjon kalles populasjonsenheter
For eksempel, i en telling av kommersielt utstyr, er observasjonsenheten handelsbedriften, og befolkningsenheten er utstyret deres (disker, kjøleenheter, etc.).

Et tegn er en karakteristisk egenskap ved fenomenet som studeres som skiller det fra andre fenomener.
I ulike grener av statistikk studeres ulike funksjoner. Så for eksempel er studieobjektet en bedrift, og dens funksjoner er type produkt, produksjonsvolum, antall ansatte, etc. Eller ob

Konseptet med stat. observasjoner. Krav til innsamlet informasjon
Statistisk observasjon er den innledende fasen av økonomisk og statistisk observasjon. Det er et vitenskapelig organisatorisk arbeid med å samle inn masse

Hovedtyper, former og metoder for observasjon
Spesielt organisert statistisk observasjon er innsamling av informasjon gjennom folketellinger, engangsregistreringer og undersøkelser. Et eksempel på en spesielt organisert statistikk

Overvåkingsnøyaktighet og overvåkingsdatakontroll
Enhver statistisk observasjon setter oppgaven med å skaffe slike data som mer nøyaktig reflekterer virkeligheten. Avvik eller forskjeller mellom beregnede indikatorer og faktiske (sant

Absolutte og relative verdier
For å karakterisere massefenomener bruker statistikken statistiske størrelser (indikatorer). De er delt inn i absolutt, relativ og

Hver valgt gruppe er preget av AVERAGE-verdien (verdiene) til det effektive attributtet
Tabell 3.2.3. Analytisk gruppering av avhengighet av kredittinvesteringer og overskudd til banker Gruppenummer Grupper av banker etter mengden kredittinvesteringer

Etter volum av kredittinvesteringer
For å konstruere en intervallvariasjonsserie som karakteriserer fordelingen av banker etter volumet av kredittinvesteringer, er det nødvendig å beregne verdien og grensene for seriens intervaller.

En statistisk distribusjonsserie er en ordnet fordeling av befolkningsenheter i grupper i henhold til egenskapen som studeres.
Avhengig av typen egenskap som anses som en grupperingsserie, kan de være variasjonsmessige (kvantitative) og attributive (kvalitative).

Tabellform og grafisk presentasjon av statistiske data
Statistiske tabeller er en slags statistisk setning som består av et statistisk subjekt og et statistisk predikat. Statistiske tabeller - f.eks

Eller 15 16 17
4. mangelen på data kan skyldes ulike årsaker og dette bør gjenspeiles i tabellene på ulike måter: a) hvis denne egenskapen ikke skal fylles ut i det hele tatt, så

Grafisk fremstilling av statistiske data
Bruken av grafer i statistikk har mer enn to hundre års historie. Grunnleggeren av den grafiske metoden i bedriftsstatistikk er den engelske økonomen W. Playfair

Frekvensfordelingspolygon
Basert på dataene i tabell. 3.4.3. konstruer en polygon av frekvenser Tabell 3.4.3. Fordeling av skostørrelser blant mannlige respondenter på undersøkelsen Antall størrelse Antall

Histogrammer
Et histogram brukes til å vise en intervallfordelingsserie. Når du konstruerer den, er verdiene til intervallene plottet på abscisse-aksen (

Kumuler
For å vise distribusjonsserien brukes en kumulativ kurve (sumkurve). Når du konstruerer kumulasjonen av intervallvariasjonsserien, plottes variantene av serien langs abscisseaksen (

Essensen av gjennomsnitt. To former for gjennomsnitt
Gjennomsnittsverdien er en indikator som gir en generaliserende karakteristikk av et varierende trekk ved en homogen populasjon. Egenskaper for gjennomsnittsverdien: 1. Gjennomsnittet preger hele scoopet

Gjennomsnittlig harmonisk
Overtoner - likhet, konsonans, harmonisk middelverdi er nær det aritmetiske gjennomsnitt Harmonisk gjennomsnitt brukes i tilfeller hvor statistisk informasjon

Konseptet med variasjon. Hovedindikatorer på variasjon
Variasjon er forskjellene i de individuelle verdiene til en egenskap blant enhetene i den studerte befolkningen. Behovet for å studere variasjon skyldes at

Andre uoppdagede faktorer
Denne indikatoren beregnes med formelen (5.2.1.) hvor yi

Volumet av kredittinvesteringer (faktortegn - x)
Indikatoren beregnes av formelen

Andre uoppdagede faktorer
(5.2.9.) Gjennomsnittet av variasjonene innen gruppe (

Kurven er formet som en bjelle
2. Siden normalfordelingsfunksjonen er partall, det vil si f (-t) \u003d f (t), så er normalfordelingskurven symmetrisk med hensyn til den maksimale ordinaten lik

Derfor er asymmetrien venstresidig
Den mest nøyaktige skjevhetskoeffisienten er koeffisienten beregnet ved å bruke det sentrale momentet for fordelingen av tredje orden.

Forstå prøvetaking og prøvetakingsfeil
Et utvalg er en slik ikke-kontinuerlig observasjon, der tegn registreres i individuelle enheter av den studerte statistiske populasjonen, valgt ved hjelp av

Gjennomsnittlige og marginale prøvetakingsfeil
Bruken av prøvetakingsmetoden for observasjon er alltid forbundet med å etablere graden av pålitelighet av estimater av indikatorer for den generelle befolkningen oppnådd på grunnlag av verdiene så langt

Bestemmelse av prøvetakingsfeilen for gjennomsnittlig volum av kredittinvesteringer til banker og grensene som det generelle gjennomsnittet vil ligge innenfor
I henhold til tilstanden til ende-til-ende-oppgaven inkluderer utvalgspopulasjonen 30 banker, utvalget er 20 % mekanisk, derfor inkluderer populasjonen (______?)=________? banker.

Andelen av samplingsenheter som har en eller annen gitt egenskap uttrykkes med formelen
, (6.3.4.) hvor m er antall befolkningsenheter som har s

Bestemmelse av den nødvendige prøvestørrelsen med en gitt verdi av den tillatte marginale prøvetakingsfeilen lik 10 millioner rubler
For riktig tilfeldig og mekanisk prøvetaking med en ikke-repeterende utvalgsmetode, beregnes den nødvendige prøvestørrelsen for den gjennomsnittlige kvantitative attributten ved hjelp av formelen:

Konseptet med korrelasjon. Typer og former for korrelasjoner
Blant de mange formene for relasjoner som er kvantitative av natur og studert med kvantitative metoder, er en spesiell plass okkupert av faktorrelasjoner, for studiet av hvilke metoder for korrelasjon som brukes.

Funksjonelle lenker
Forholdet mellom den resulterende egenskapen Y og faktortrekket X kalles funksjonell hvis hver mulig verdi xi av egenskapen X

Hvis modellen tar hensyn til funksjonen Ys avhengighet av en rekke faktorer, så har modellen formen
(7.1.5.) Et karakteristisk trekk ved stokastiske relasjoner er

Visuelt kan man anta eksistensen av en korrelasjon
3. Korrelasjonstabellen er en kombinasjon av to distribusjonsserier. Radene i tabellen tilsvarer grupperingen av befolkningsenheter i henhold til faktorattributtet

Analytisk grupperingsmetode
Ved bruk av metoden for analytisk gruppering konstrueres en intervallserie med fordeling av enheter av populasjonen i henhold til faktorattributtet X, og for hver j-te gruppe i serien bestemmes gjennomsnittsgruppen.

Regresjonsmetode for relasjonsanalyse
Linjen som jevner ut den empiriske stiplede linjen kalles den teoretiske Y-on-X regresjonslinjen eller ganske enkelt regresjonslinjen. Denne linjen fra

Måte å uttrykke serienivåer på
Tabell 8.1.2 Antall leiligheter bygget av foretak og organisasjoner av alle former for eierskap og deres gjennomsnittlige størrelse i Russlands føderasjonsindikatorer

Gjennomsnittlige indikatorer i tidsserier
I tabellen. 8.2.1. dataene som karakteriserer dynamikken til endringer i nivåene i serien for separate tidsperioder presenteres. For en generell vurdering av endringer i seriens nivåer over hele den aktuelle perioden

Prognose salgsvolum ved å bruke gjennomsnittlig vekstrate
Forutsigelse av nivået til en serie med dynamikk ved bruk av gjennomsnittlig vekstrate (koeffisient) utføres i henhold til følgende formel:

Metoder for å oppdage sesongsvingninger
I en rekke tilfeller gjentar seg naturlig nok forskjeller i seriens nivåer avhengig av årstiden. Utfordringen er å måle slike forskjeller slik at de ikke er tilfeldige.

Metoder for å analysere hovedtrenden i tidsserier
En trend er den viktigste ganske stabile trenden i utviklingen av et fenomen i en serie av dynamikk, med andre ord en jevn og stabil endring i nivåer (y) over tid. På T

Kornproduksjon i Russland, millioner tonn
År t produksjon, millioner tonn y 3-års gjennomsnitt 5-års glidende gjennomsnitt, 5-års glidende gjennomsnitt, beregnet

Individuelle og generelle indekser. Problemer med sammenligning av indekserte verdier i samlede indekser
Individuell indeks - karakteriserer dynamikken til nivået på fenomenet som studeres i tid for to sammenlignede perioder eller uttrykker forholdet mellom individuelle elementer i befolkningen.

Paasche-formelen foretrekkes når prisindeksen vurderes i et system med handelsindeks og volumindeks
Eksempel 9.2.2. Tabell 9.2.3. Data om salg av produkter i butikken "Zvezdochka" Produktenhet. rev. Grunnperiode O

Indekser er gjennomsnitt fra individ
Gjennomsnittsindeksen er en indeks beregnet som gjennomsnittet av individuelle indekser. Disse indeksene brukes når det ikke er data i kildeinformasjonen.

Handelsomsetningsindeksen er produktet av prisindeksen (ifølge Paasche) og det fysiske volumet
, la oss sjekke det ut:

Indekser med konstant og variabel sammensetning. Faste strukturindekser
Når du studerer kvalitative indikatorer, er det ofte nødvendig å vurdere endringen i tid (eller rom) av GJENNOMSNITTLIG verdi av indeksen

Indeks over strukturelle skift
Alle indeksene omtalt ovenfor ble beregnet for flere varer solgt på ett sted. La oss nå vurdere tilfellet når ETT produkt selges flere steder. Eksempel 9.5.1.

Praktisk leksjon
Oppgave 01 Beregn de analytiske og gjennomsnittlige indikatorene for årlige endringer i nivåene i serien, trekk passende konklusjoner. Tabell 1. Salgsvolum etter utgave

Gjennomsnittlig vekstrate -
År (t) Salgsvolum, tusen tonn. Absolutt vekst, tusen tonn Veksthastighet, % Veksthastighet, % Absolutt verdi

Ofte i statistikk, når man analyserer et fenomen eller en prosess, er det nødvendig å ta hensyn til ikke bare informasjon om gjennomsnittsnivåene til de studerte indikatorene, men også spredning eller variasjon i verdiene til individuelle enheter , som er en viktig egenskap ved den studerte befolkningen.

Aksjekurser, volum av tilbud og etterspørsel, renter i ulike tidsperioder og på ulike steder er gjenstand for størst variasjon.

De viktigste indikatorene som karakteriserer variasjonen , er området, variansen, standardavviket og variasjonskoeffisienten.

Spennvariasjon er forskjellen mellom maksimums- og minimumsverdiene for attributtet: R = Xmax – Xmin. Ulempen med denne indikatoren er at den kun evaluerer grensene for egenskapsvariasjonen og ikke reflekterer svingningene innenfor disse grensene.

Spredning uten denne mangelen. Det beregnes som gjennomsnittlig kvadrat av avvik for attributtverdiene fra deres gjennomsnittsverdi:

Forenklet måte å beregne varians på utføres ved hjelp av følgende formler (enkle og vektet):

Eksempler på bruken av disse formlene er presentert i oppgave 1 og 2.

En mye brukt indikator i praksis er standardavvik :

Standardavviket er definert som kvadratroten av variansen og har samme dimensjon som egenskapen som studeres.

De vurderte indikatorene gjør det mulig å få den absolutte verdien av variasjonen, dvs. vurdere det i måleenheter for egenskapen som studeres. I motsetning til dem, variasjonskoeffisienten måler fluktuasjon i relative termer - i forhold til gjennomsnittsnivået, som i mange tilfeller er å foretrekke.

Formel for beregning av variasjonskoeffisienten.

Eksempler på å løse problemer om emnet "Indikatorer for variasjon i statistikk"

Oppgave 1 . Ved å studere påvirkningen av reklame på størrelsen på det gjennomsnittlige månedlige innskuddet i distriktets banker, ble 2 banker undersøkt. Følgende resultater oppnås:

Definere:
1) for hver bank: a) gjennomsnittlig månedlig innskudd; b) spredning av bidraget;
2) gjennomsnittlig månedlig innskudd for to banker sammen;
3) Spredning av innskuddet for 2 banker, avhengig av reklame;
4) Spredning av innskuddet for 2 banker, avhengig av alle faktorer unntatt reklame;
5) Total varians ved bruk av addisjonsregelen;
6) Bestemmelseskoeffisient;
7) Korrelasjonsrelasjon.

Beslutning

1) La oss lage en beregningstabell for en bank med reklame . For å bestemme gjennomsnittlig månedlig innskudd finner vi midtpunktene til intervallene. I dette tilfellet blir verdien av det åpne intervallet (det første) betinget likestilt med verdien av intervallet ved siden av det (det andre).

Vi finner den gjennomsnittlige størrelsen på bidraget ved å bruke den vektede aritmetiske gjennomsnittsformelen:

29 000/50 = 580 rubler

Spredningen av bidraget er funnet ved formelen:

23 400/50 = 468

Vi vil utføre lignende handlinger for en bank uten annonser :

2) Finn gjennomsnittlig innskudd for to banker sammen. Xav \u003d (580 × 50 + 542,8 × 50) / 100 \u003d 561,4 rubler.

3) Variansen til innskuddet, for to banker, avhengig av reklame, finner vi ved formelen: σ 2 =pq (formel for variansen til et alternativt attributt). Her er p=0,5 andelen faktorer som er avhengig av reklame; q=1-0,5, deretter σ2 =0,5*0,5=0,25.

4) Siden andelen av andre faktorer er 0,5, så er variansen til innskuddet for to banker, som avhenger av alle faktorer unntatt reklame, også 0,25.

5) Bestem den totale variansen ved å bruke addisjonsregelen.

= (468*50+636,16*50)/100=552,08

= [(580-561,4)250+(542,8-561,4)250] / 100= 34 596/ 100=345,96

σ 2 \u003d σ 2 fakta + σ 2 hvile \u003d 552,08 + 345,96 \u003d 898,04

6) Bestemmelseskoeffisient η 2 = σ 2 fakta / σ 2 = 345,96/898,04 = 0,39 = 39 % - størrelsen på bidraget avhenger av annonsering med 39 %.

7) Empirisk korrelasjonsforhold η = √η 2 = √0,39 = 0,62 - forholdet er ganske nært.

Oppgave 2 . Det er en gruppering av foretak i henhold til verdien av salgbare produkter:

Bestem: 1) spredningen av verdien av salgbare produkter; 2) standardavvik; 3) variasjonskoeffisient.

Beslutning

1) Etter betingelse presenteres en intervallfordelingsserie. Det må uttrykkes diskret, det vil si finne midten av intervallet (x "). I grupper med lukkede intervaller finner vi midten ved et enkelt aritmetisk gjennomsnitt. I grupper med øvre grense, som forskjellen mellom denne øvre grensen og halvparten av intervallet etter det (200-(400 -200):2=100).

I grupper med en nedre grense - summen av denne nedre grensen og halvparten av størrelsen på forrige intervall (800+(800-600):2=900).

Beregningen av gjennomsnittsverdien av salgbare produkter gjøres i henhold til formelen:

Хср = k×((Σ((x"-a):k)×f):Σf)+a. Her er a=500 størrelsen på varianten ved høyeste frekvens, k=600-400=200 er størrelsen på intervallet ved den høyeste frekvensen La oss sette resultatet i en tabell:

Så gjennomsnittsverdien av salgbar produksjon for perioden som studeres som helhet er Xav = (-5:37) × 200 + 500 = 472,97 tusen rubler.

2) Vi finner dispersjonen ved å bruke følgende formel:

σ 2 \u003d (33/37) * 2002-(472,97-500) 2 \u003d 35,675,67-730,62 \u003d 34,945,05

3) standardavvik: σ = ±√σ 2 = ±√34 945,05 ≈ ±186,94 tusen rubler.

4) variasjonskoeffisient: V \u003d (σ / Xav) * 100 \u003d (186,94 / 472,97) * 100 \u003d 39,52%

Variasjonsindikatorer

Konseptet med variasjon

Variasjon- dette er tilstedeværelsen av forskjeller i individuelle enheter av befolkningen på ethvert grunnlag.

Denne kategorien har en spesiell plass i statistisk vitenskap, fordi det er tilstedeværelsen av variasjon i enhetene i befolkningen som forhåndsbestemmer behovet for statistikk. Hvis de individuelle enhetene i befolkningen hadde samme verdier av attributter (for eksempel høyde, alder for alle levende mennesker ville være den samme), så for å studere denne populasjonen i henhold til disse egenskapene, ville det være nok å studere bare en enhet av befolkningen. Imidlertid svinger verdiene til tegn ofte, endres når de flyttes fra en enhet til en annen. Som regel er variasjon et produkt av følgende årsaker:

Det særegne ved forholdene der utviklingen av individuelle enheter av befolkningen finner sted;

Ujevn utvikling av enkeltenheter.

For eksempel er årsaken til variasjonen i vekst hos individuelle mennesker den genetiske egenskapen til hver organisme (hovedårsaken), ernæringsmessige egenskaper, miljøforhold, etc.; avlingsvariasjon kan være forårsaket av klima, jordegenskaper i vekstsonen, vanningsregime og muligheter, kvalitet på plantemateriale, etc.

Variasjon eksisterer i tid og rom.

Under variasjon i rommet refererer til fluktuasjonen av verdiene til egenskapen i visse territorier (hveteutbytte i forskjellige regioner).

Under variasjon i tid innebærer en objektiv endring i verdiene til attributtet i forskjellige perioder (eller øyeblikk). For eksempel endres gjennomsnittlig levealder, lønnsomheten til industribedrifter, nivået på folks behov osv. over tid.

Studiet av variasjon er viktig, siden variasjon kjennetegner graden av homogenitet i befolkningen. Homogeniteten i befolkningen er en nødvendig betingelse for beregning av de fleste statistiske indikatorer, spesielt gjennomsnitt.

Variasjonsindikatorer

Variasjonsindikatorer er et nødvendig tillegg til beregningen av gjennomsnitt, da de bestemmer graden av homogenitet i befolkningen.

System variasjonsindikatorer inkluderer følgende:

Spenn av variasjon;

Standardavvik;

Spredning;

Variasjonskoeffisienten.

Verdien av variasjonsindikatorene:

Dimensjonene til egenskapsvariasjonen er karakterisert;

Variasjonsindikatorer utfyller systemet med gjennomsnitt, der individuelle forskjeller er skjult;

Variasjonsindikatorer gjør det mulig å karakterisere graden av homogenitet i befolkningen;

Ved hjelp av variasjonsindikatorer, ved å sammenligne variasjonen av individuelle (ulike) egenskaper, er det mulig å måle sammenhengen mellom disse egenskapene.

Den første indikatoren, den såkalte variasjonsspekter,- den enkleste av indikatorene, karakteriserer den absolutte størrelsen på endringen i attributtet og er definert som forskjellen mellom maksimums- og minimumsverdiene for attributtet:

Til tross for enkelheten i beregningen, har denne indikatoren en viktig ulempe - den tar bare hensyn til to grenseverdier. Hvis en eller to grenseverdier er unormale, kan det forvrenge den faktiske populasjonsvariasjonen.

For å bli kvitt denne mangelen beregnes avviket for hver enkelt verdi fra gjennomsnittet av befolkningen. Dermed er verdien av hver enhet av befolkningen tatt i betraktning. For å karakterisere dette avviket med et enkelt tall, beregnes gjennomsnittet av disse verdiene. Denne indikatoren kalles bety absolutt (lineært) avvik og er definert som følger:

Enkelt utseende;

- vektet visning (for grupperte data);

hvor d(L)- gjennomsnittlig absolutt (lineært) avvik;

X- individuell verdi av en funksjon (variant);

Gjennomsnitt av de karakteristiske verdiene;

P- Befolkningsstørrelse;

f- Frekvens.

Gjennomsnittlig lineært avvik karakteriserer den gjennomsnittlige størrelsen på avvikene til de individuelle verdiene av egenskapen fra gjennomsnittsverdien. Dermed karakteriserer den de absolutte dimensjonene til variasjonen, har de samme måleenhetene som funksjonen, hvis variasjon kjennetegner.

Feil: på grunn av at modulen brukes, er det vanskelig å utføre matematiske operasjoner. Derfor brukes den sjelden.

For å bli kvitt mangelen på den forrige indikatoren, kvadrerer vi forskjellen mellom den individuelle verdien og gjennomsnittet og trekker deretter ut kvadratroten av den resulterende gjennomsnittsverdien. Resultatet vil bli kalt standardavvik:

– enkelt.

- vektet.

Det spiller samme rolle som det gjennomsnittlige absolutte avviket, men det har en fordel fremfor det, nemlig at det er lettere å utføre matematiske operasjoner med det. I lys av dette brukes denne indikatoren i 90 av 100 tilfeller.

En enda mer praktisk indikator på variasjon for matematiske transformasjoner er spredning, som er standardavviket i annen:

- enkelt,

- vektet.

Ved hjelp av varians og standardavvik måles sammenhenger mellom ulike funksjoner. I tillegg kan disse indikatorene brukes til å sammenligne aggregater i betydningen deres homogenitet når det gjelder de samme egenskapene.

Konklusjonen om homogeniteten til befolkningen lar oss gjøre variasjonskoeffisienten, som kan beregnes på flere måter avhengig av den første informasjonen:

Det karakteriserer den gjennomsnittlige prosentandelen av avvik av individuelle verdier for en egenskap fra gjennomsnittsverdien.

hvor V- variasjonskoeffisienten;

σ er standardavviket;

d(L) - gjennomsnittlig lineært avvik;

X MO - mote (strukturelt gjennomsnitt);

X IE - median (strukturelt gjennomsnitt).

Variasjonskoeffisienten er av stor betydning. Den lar deg sammenligne variasjonsnivået for ulike egenskaper og brukes til å karakterisere homogeniteten til befolkningen. Hvis variasjonskoeffisienten er mindre enn 33 %, er populasjonen homogen.

Eksempel på beregning av variasjonsindikatorer.

Fordelingen av universitetsstudenter etter alder er preget av følgende data (tabell 1):

Tabell 1

Regn ut indikatorene som karakteriserer variasjonen i alderen til elevene for hvert skjema

læring. Sammenlign resultatene dine.

Beregn variasjonsindikatorene som karakteriserer totalen av deltidsstudenter

læring.

1. Variasjonsområde:

R \u003d x maks - x min \u003d 31 - 18,5 \u003d 12,5 (år)

2. Aritmetisk gjennomsnitt:

3. Gjennomsnittlig lineært avvik:

Alderen til en enkelt elev avviker fra gjennomsnittet for totalalderen - 27 år - med 3 år. Det vil si at det kan hevdes at alderen til det største antallet elever ikke vil gå utover intervallets grenser: fra 24,3 til 30,4 år.

27,36 - 3,07 < 27,36 < 27,36+ 3,07.

Standardavvik:

Standardavviket karakteriserer også den absolutte verdien av avviket til en individuell verdi fra gjennomsnittet. Som regel er verdien av standardavviket større enn det gjennomsnittlige lineære avviket.

Spredning:

=13,899

Den karakteriserer kvadratet av avvik for en individuell verdi fra gjennomsnittsverdien. Variasjonskoeffisienten:

Den gjennomsnittlige prosentandelen av avvik av individuelle verdier fra gjennomsnittsverdien er 13,6%. Helheten er homogen. La oss gjøre lignende beregninger for det totale antallet heltidsstudenter. Vi får følgende resultater:

d(L) = 3,40

V= 21,9%

Basert på beregningene ovenfor kan det konkluderes med at settet med studenter ved deltidsavdelingen er mer homogent.

Beregningen av variasjonsindikatorer er en ganske arbeidskrevende prosess. I noen tilfeller, når det er en serie indikatorer med likt fordelte tidspunkter eller en lik intervallfordelingsserie, kan beregningen forenkles. Reduserte metoder for beregning av varians er basert på kunnskap om egenskapene til variansen. Dispersjonsegenskaper:

Hvis fra alle verdier alternativene X trekke fra (legge til) et konstant tall MEN, da vil ikke variansen endres;

Hvis hver verdi av opsjonene er delt (multiplisert) med en konstant verdi til, da vil variansen avta (øke) i til 2 en gang.

Forkortede måter å beregne varians på:

2. Metode for momenter - brukes kun ved like intervaller.

INTRODUKSJON

Retningslinjer for gjennomføring av praktisk og laboratoriearbeid med statistikk inneholder krav til gjennomføring, prosedyre for manuell beregning og bruk av MS Excel, Statistica PPP.

Del II av retningslinjene karakteriserer beregningen av variasjonsindikatorer: variasjonsområdet, kvartiler og kvartilavvik, gjennomsnittlig lineært avvik, dispersjon og standardavvik, oscillasjonskoeffisienter, variasjon, asymmetri, kurtose og andre.

Beregningen av variasjonsindekser, sammen med konstruksjon av intervall og diskrete variasjonsserier og beregning av gjennomsnittsverdier, presentert i del I av retningslinjene, er av stor betydning for analysen av distribusjonsserier.

BEREGNING AV VARIASJONSINDIKATORER

Hensikten med arbeidet: å oppnå praktiske ferdigheter i beregning av ulike indikatorer (mål) på variasjon avhengig av oppgavene satt av studiet.

Arbeidsordre:

Bestem typen og formen (enkel eller vektet) til variasjonsindikatorene.

Formuler konklusjoner.

Et eksempel på beregning av variasjonsindikatorer

Fastsettelse av type og form for variasjonsindikatorer.

Variasjonsindikatorer er delt inn i to grupper: absolutt og relativ. De absolutte inkluderer: variasjonsområdet, kvartilavvik, gjennomsnittlig lineært avvik, varians og standardavvik. Relative indikatorer er oscillasjonskoeffisienter, variasjoner, relativt lineært avvik osv.

Variasjonsområdet (R) er det enkleste målet på variasjonen til en egenskap og bestemmes av følgende formel:

hvor er den største verdien av variabelfunksjonen;

Den minste verdien av variabelattributtet.

Kvartilavvik (Q) - brukes til å karakterisere variasjonen av en egenskap i aggregatet. Kan brukes i stedet for variasjonsspekteret for å unngå ulempene ved å bruke ekstremer.

Kvartiler er verdiene til en funksjon i en rangert distribusjonsserie, valgt på en slik måte at 25 % av populasjonsenhetene vil være mindre i størrelse; 25 % enheter vil være innelukket mellom og; 25 % av enhetene vil være innelukket mellom og og de resterende 25 % er overlegne.

hvor er den nedre grensen for intervallet der den første kvartilen befinner seg;

Summen av de akkumulerte frekvensene til intervallene før intervallet der den første kvartilen befinner seg;

Frekvensen til intervallet som inneholder den første kvartilen.

hvor Me er medianen i serien;

konvensjonene er de samme som for kvantumet.

I symmetriske eller moderat asymmetriske Q2/3-fordelinger. Siden kvartilavviket ikke påvirkes av avvikene til alle attributtverdier, bør bruken begrenses til tilfeller der bestemmelsen av standardavviket er vanskelig eller umulig.

Det gjennomsnittlige lineære avviket () er gjennomsnittet av de absolutte avvikene til egenskapsalternativene fra deres gjennomsnitt. Den kan beregnes ved å bruke den aritmetiske gjennomsnittsformelen, både uvektet og vektet, avhengig av fravær eller tilstedeværelse av frekvenser i distribusjonsserien.

(6) - uvektet gjennomsnittlig lineært avvik,

(7) - vektet gjennomsnittlig lineært avvik.

Dispersjon () - det gjennomsnittlige kvadratet av avvikene til de individuelle verdiene av egenskapen fra deres gjennomsnittsverdi. Variansen beregnes ved å bruke de enkle uveide og vektede formlene.

(8) - uvektet,

(9) - vektet.

Standardavviket () - den vanligste indikatoren på variasjon, er kvadratroten av variansverdien.

Variasjonsområdet, kvartilavvik, gjennomsnittlige lineære og kvadratiske avvik er navngitte størrelser, de har dimensjonen til et gjennomsnittstrekk.

For å sammenligne fluktuasjonen av ulike egenskaper i samme populasjon, eller ved sammenligning av fluktuasjonen til samme egenskap i flere populasjoner, beregnes relative variasjonsindikatorer. Grunnlaget for sammenligning er det aritmetiske gjennomsnittet. Oftest er relative indikatorer uttrykt i prosent og karakteriserer ikke bare en komparativ vurdering av variasjon, men karakteriserer også homogeniteten til befolkningen.

Oscillasjonskoeffisienten beregnes med formelen:

Relativt lineært avvik (lineær variasjonskoeffisient):

(13) eller (14)

Variasjonskoeffisienten:

Den mest brukte indikatoren på relativ volatilitet i statistikk er variasjonskoeffisienten. Det brukes ikke bare for en komparativ vurdering av variasjon, men også som et kjennetegn på homogeniteten i befolkningen. Settet anses som homogent dersom variasjonskoeffisienten ikke overstiger 33 % (Efimova M.R., Ryabtsev V.M. General theory of statistics: Textbook M .: Finance and statistics, 1991, s. 105).

For å få en omtrentlig idé om formen på fordelingen, bygges distribusjonsgrafer (polygon og histogram).

I praksisen med statistisk forskning må man møte en rekke fordelinger. Når vi studerer homogene populasjoner, har vi som regel å gjøre med unimodale fordelinger. Multi-vertex indikerer heterogeniteten til den studerte befolkningen, utseendet til to eller flere toppunkter indikerer behovet for å omgruppere dataene for å identifisere mer homogene grupper. Å finne ut den generelle karakteren av fordelingen innebærer å vurdere graden av homogenitet, samt å beregne indikatorene for asymmetri og kurtosis. symmetrisk er en fordeling der frekvensene til to varianter med lik avstand på begge sider av distribusjonssenteret er like. For symmetriske fordelinger er det aritmetiske gjennomsnittet, modusen og medianen like. Av denne grunn er det enkleste tiltaket asymmetrier er basert på forholdet mellom indikatorer for distribusjonssenteret: jo større forskjellen mellom middelene er, desto større er asymmetrien til serien.

For en komparativ analyse av graden av asymmetri for flere fordelinger, beregnes den relative indikatoren As:

As-verdien kan være positiv eller negativ. En positiv verdi på indikatoren indikerer tilstedeværelsen av høyresidig asymmetri (den høyre grenen er mer utvidet i forhold til den maksimale ordinaten enn den venstre). Med høyresidig asymmetri er det en sammenheng mellom distribusjonssentralens indikatorer: . Det negative tegnet på asymmetriindeksen indikerer tilstedeværelsen av venstresidig asymmetri (figur 1). I dette tilfellet er det følgende forhold mellom distribusjonssenterets indikatorer: .

Figur 1. Fordeling: 1 - med høyresidig asymmetri; 2 - med venstresidig asymmetri.

En annen indikator, foreslått av den svenske matematikeren Lindberg, beregnes med formelen:

hvor P er prosentandelen av disse attributtverdiene som overstiger det aritmetiske gjennomsnittet i verdi.

Den mest nøyaktige og vanlige er indikatoren basert på bestemmelsen av det sentrale øyeblikket av tredje orden (i en symmetrisk fordeling er verdien null):

hvor er det sentrale øyeblikket i tredje orden:

(19) - for ugrupperte data;

(20) - for grupperte data.

y er standardavviket.

Bruken av denne indikatoren gjør det mulig ikke bare å bestemme mengden av asymmetri, men også å svare på spørsmålet om tilstedeværelse eller fravær av asymmetri i fordelingen av en egenskap i den generelle befolkningen. Vurderingen av graden av betydning for denne indikatoren er gitt ved å bruke den gjennomsnittlige kvadratfeilen, som avhenger av volumet av observasjoner n og beregnes med formelen:

Hvis forholdet er signifikant, er asymmetrien signifikant, og fordelingen av egenskapen i populasjonen er ikke symmetrisk. Hvis relasjonen, asymmetri er ubetydelig, kan dens tilstedeværelse forklares av påvirkningen av forskjellige tilfeldige omstendigheter.

For symmetriske fordelinger beregnes indikatoren kurtosis(spiss). Lindberg foreslo følgende indikator for vurdering av kurtosis:

hvor P er andelen (%) av antall alternativer som ligger i intervallet lik halvparten av standardavviket i en eller annen retning fra det aritmetiske gjennomsnittet.

Den mest nøyaktige er indikatoren som bruker det sentrale øyeblikket i fjerde orden:

hvor er det sentrale øyeblikket i det fjerde øyeblikket;

(24) - for ugrupperte data;

(25) - for grupperte data.

Figur 2 viser to fordelinger: den ene er toppet (verdien av kurtosis er positiv), den andre er flattoppet (verdien av kurtosis er negativ). Kurtosis er et fall av toppen av den empiriske fordelingen opp eller ned fra toppen av normalfordelingskurven. I en normalfordeling er forholdet

Figur 2. Fordeling: 1,4 - normal; 2 - spiss; 3 - flat topp

Rotmiddelkvadratfeilen til kurtosis beregnes med formelen:

hvor n er antall observasjoner.

Hvis, så er kurtosen betydelig; hvis, så er den ubetydelig.

En vurdering av betydningen av skjevhets- og kurtoseindikatorene lar oss konkludere om denne empiriske studien kan tilskrives typen normalfordelingskurver.

Vurder metoden for å beregne variasjonsindikatorene.

Tabell 1. Data om volumet av salg av utenlandsk valuta fra flere filialer av sentralbanken.

Bestem gjennomsnittlig volum av valutasalg for totalen av filialer, beregn de absolutte og relative variasjonsindikatorene.

La oss beregne variasjonsområdet:

R = = 24,3 - 10,2 = 14,1 millioner rubler

variasjon varians oscillasjon variasjon skjevhet kurtosis

For å bestemme avvikene til attributtverdiene fra gjennomsnittet og deres kvadrater, bygger vi en hjelpetabell:

Tabell 2. Beregningstabell

Vi finner gjennomsnittsverdien ved å bruke den enkle aritmetiske gjennomsnittsformelen:

Gjennomsnittlig lineært avvik:

Spredning:

Oscillasjonsfaktor:

Variasjonskoeffisienten:

For å beregne indikatorene til distribusjonsskjemaet bygger vi en hjelpetabell:

Tabell 3. Beregningstabell

Tabell 4. Data om omsetningen til foretak i en av næringene.

Bestem gjennomsnittlig handelsvolum, strukturelle gjennomsnitt, absolutte og relative variasjonsindikatorer, og hvordan den faktiske fordelingen er konsistent med normalen (i henhold til indikatorene for distribusjonsformen).

For å beregne indikatorene vil vi konstruere en hjelpetabell.

Tabell 5. Beregningstabell

Variasjonsområde:

Gjennomsnittsverdien er funnet ved formelen til det aritmetiske vektede gjennomsnittet:

I intervallfordelingsserien bestemmes modusen av formelen:

I vårt tilfelle vil modusen være lik:

I intervallvariasjonsserien bestemmes medianen av formelen:

I vårt tilfelle vil medianen være:

Kvartilavvik:

hvor og er henholdsvis første og tredje kvartil av fordelingen.

Kvartiler bestemmes av formlene:

Gjennomsnittlig lineært avvik:

Spredning:

Standardavvik:

La oss beregne relative variasjonsindikatorer.

Oscillasjonsfaktor:

Relativt lineært avvik:

Relativ indikator for kvartilvariasjon:

Variasjonskoeffisienten:

La oss definere indikatorene for distribusjonsskjemaet:

Formulering av konklusjoner.

La oss formulere konklusjoner på de beregnede indikatorene for variasjonen i eksempel 2, som presenterer intervallserien for fordelingen av foretak etter handelsvolumet, millioner rubler.

Variasjonsområdet indikerer at forskjellen mellom maksimums- og minimumsverdiene er 40 millioner rubler. Gjennomsnittlig handelsvolum er 30 millioner rubler. Den vanligste verdien av handelsvolumet i det betraktede settet med foretak er 31,4 millioner rubler, og 50% (40 foretak) har et handelsvolum på mindre enn 30,5 millioner rubler, og 50% mer.

Et kvartilavvik på 5 indikerer en moderat distribusjonsskjevhet, som i symmetriske eller moderat skjeve distribusjoner (i dette eksemplet).

De gjennomsnittlige lineære og gjennomsnittlige kvadratiske avvikene viser hvor mye verdien av attributten svinger i gjennomsnitt i enhetene til populasjonen som studeres. Dermed er gjennomsnittsverdien av svingningene i volumet av handelsomsetningen til bedrifter i næringer: i henhold til gjennomsnittlig lineært avvik - 6,5 millioner rubler. (absolutt avvik); i henhold til standardavviket - 8,1 millioner rubler. Kvadraten av avvik av individuelle verdier av en egenskap fra deres gjennomsnittsverdi er 65.

Forskjellen mellom ekstremverdiene til attributtet er 33,3 % høyere enn gjennomsnittsverdien (= 133,3 %).

Det relative lineære avviket (= 21,7 %) og den relative indikatoren for kvartilvariasjon (= 16,4 %) karakteriserer homogeniteten til studiepopulasjonen, noe som bekrefter den beregnede variasjonskoeffisienten lik 27 % (V = 27 % mindre enn 33 %) .

Basert på de beregnede indikatorene for skjevhet og kurtose, kan vi konkludere med at fordelingen er flattopp (eks.< 0) и наблюдается левосторонняя асимметрия (As < 0). Асимметрия и эксцесс являются несущественными.

I statistikk forstås variasjonen i verdiene til en eller annen indikator i aggregatet som forskjellen i nivåene i visse enheter av den analyserte sammensetningen i samme periode eller øyeblikk av studien. I tilfelle når det gjøres en analyse av forskjeller i verdiene til en indikator for samme emne, for samme enhet av befolkningen i forskjellige perioder eller tidspunkter, vil dette ikke lenger kalles variasjon, men fluktuasjoner eller endringer over en viss periode.

Lagt ut på www.side

For å studere slike svingninger brukes deres egne analysemetoder, som skiller seg fra metodene for analyse av variasjon. En objektiv faktor i fremveksten av fenomenet variasjon er forskjellen i aktivitetsforholdene til visse studerte objekter i befolkningen. For eksempel påvirker nivået av konkurranse, skatter, bruk av avanserte teknologier i deres aktiviteter, tilstanden til utstyr, etc. arbeidet til en handelsbedrift. Fluktuasjoner er karakteristisk for nesten alle naturfenomener og fasetter av det sosiale livet. Imidlertid er det også ikke-variable indikatorer som dannes når det gjelder å fikse visse fenomener i rettsakter. For eksempel kan antallet daglige styremedlemmer i et foretak ikke varieres, i henhold til loven må det være én. Slike ikke-variable objekter er som regel ikke gjenstand for eller gjenstand for statistisk forskning. I livet vårt er fluktuasjonen av tegn en viktig faktor som påvirker det. Hvis du for eksempel endrer utvalget av standardstørrelser på deler, kan du skape et optimalt sortiment, men samtidig indikerer et høyt nivå av variasjon innenfor en standardstørrelse et høyt nivå av avvisninger og behovet for å implementere passende tiltak. Et betydelig nivå av variasjon i omsetning eller priser kan indikere markedsmonopolisering eller dårlig lagerstyring og kreve passende tiltak osv. Det foregående tillater oss å hevde at i det offentlige liv, som fra et statistikksynspunkt fungerer som et masseaggregat, er det objektivt sett variasjonen til forskjellige funksjoner og elementer, som dikterer relevansen av å studere dette fenomenet ved å bruke spesielle indikatorer for å danne optimale metoder for å håndtere det. Variasjonskoeffisienten er en slik indikator. Samtidig tilhører den gruppen av relative variasjonsindikatorer. Koeffisienten som vurderes er en relativ indikator som karakteriserer forholdet mellom standardavviket og gjennomsnittsverdien av egenskapen som studeres, og uttrykkes vanligvis i prosent. Dette kriteriet gjenspeiler forholdet mellom nivået av påvirkning av faktorer som fører til forekomsten av volatilitet, og de generelle forholdene til alle elementer i befolkningen som genererer den typiske verdien av attributten - dens gjennomsnittsverdi. Variasjonskoeffisienten brukes til å studere graden av variasjon av ulike trekk ved samme populasjon og variasjon i ulike populasjoner som har ulike middelverdier.