Hva skal variasjonskoeffisienten være. Hva er variasjonskoeffisienten for?

Variasjonsindikatorer

Konseptet med variasjon

Variasjon- dette er tilstedeværelsen av forskjeller i individuelle enheter av befolkningen på ethvert grunnlag.

Denne kategorien har en spesiell plass i statistisk vitenskap, fordi det er tilstedeværelsen av variasjon i enhetene i befolkningen som forhåndsbestemmer behovet for statistikk. Hvis de individuelle enhetene i befolkningen hadde samme verdier av attributter (for eksempel høyde, alder for alle levende mennesker ville være den samme), så for å studere denne populasjonen i henhold til disse egenskapene, ville det være nok å studere bare en enhet av befolkningen. Imidlertid svinger verdiene til tegn ofte, endres når de flyttes fra en enhet til en annen. Som regel er variasjon et produkt av følgende årsaker:

Det særegne ved forholdene der utviklingen av individuelle enheter av befolkningen finner sted;

Ujevn utvikling av enkeltenheter.

For eksempel er årsaken til variasjonen i vekst hos individuelle mennesker den genetiske egenskapen til hver organisme (hovedårsaken), ernæringsmessige egenskaper, miljøforhold, etc.; avlingsvariasjon kan være forårsaket av klima, jordegenskaper i vekstsonen, vanningsregime og muligheter, kvalitet på plantemateriale, etc.

Variasjon eksisterer i tid og rom.

Under variasjon i rommet refererer til fluktuasjonen av verdiene til egenskapen i visse territorier (hveteutbytte i forskjellige regioner).

Under variasjon i tid innebærer en objektiv endring i verdiene til attributtet i forskjellige perioder (eller øyeblikk). For eksempel endres gjennomsnittlig levealder, lønnsomheten til industribedrifter, nivået på folks behov osv. over tid.

Studiet av variasjon er viktig, siden variasjon kjennetegner graden av homogenitet i befolkningen. Homogeniteten i befolkningen er en nødvendig betingelse for beregning av de fleste statistiske indikatorer, spesielt gjennomsnitt.

Variasjonsindikatorer

Variasjonsindikatorer er et nødvendig tillegg til beregningen av gjennomsnitt, da de bestemmer graden av homogenitet i befolkningen.

System variasjonsindikatorer inkluderer følgende:

Spenn av variasjon;

Standardavvik;

Spredning;

Variasjonskoeffisienten.

Verdien av variasjonsindikatorene:

Dimensjonene til egenskapsvariasjonen er karakterisert;

Variasjonsindikatorer utfyller systemet med gjennomsnitt, der individuelle forskjeller er skjult;

Variasjonsindikatorer gjør det mulig å karakterisere graden av homogenitet i befolkningen;

Ved hjelp av variasjonsindikatorer, ved å sammenligne variasjonen av individuelle (ulike) egenskaper, er det mulig å måle sammenhengen mellom disse egenskapene.

Den første indikatoren, den såkalte variasjonsspekter,- den enkleste av indikatorene, karakteriserer den absolutte størrelsen på endringen i attributtet og er definert som forskjellen mellom maksimums- og minimumsverdiene for attributtet:

Til tross for enkelheten i beregningen, har denne indikatoren en viktig ulempe - den tar bare hensyn til to grenseverdier. Hvis en eller to grenseverdier er unormale, kan det forvrenge den faktiske populasjonsvariasjonen.

For å bli kvitt denne mangelen beregnes avviket for hver enkelt verdi fra gjennomsnittet av befolkningen. Dermed er verdien av hver enhet av befolkningen tatt i betraktning. For å karakterisere dette avviket med et enkelt tall, beregnes gjennomsnittet av disse verdiene. Denne indikatoren kalles bety absolutt (lineært) avvik og er definert som følger:

Enkelt utseende;

- vektet visning (for grupperte data);

hvor d(L)- gjennomsnittlig absolutt (lineært) avvik;

X- individuell verdi av en funksjon (variant);

Gjennomsnitt av de karakteristiske verdiene;

P- Befolkningsstørrelse;

f- Frekvens.

Gjennomsnittlig lineært avvik karakteriserer den gjennomsnittlige størrelsen på avvikene til de individuelle verdiene av egenskapen fra gjennomsnittsverdien. Dermed karakteriserer den de absolutte dimensjonene til variasjonen, har de samme måleenhetene som funksjonen, hvis variasjon kjennetegner.

Feil: på grunn av at modulen brukes, er det vanskelig å utføre matematiske operasjoner. Derfor brukes den sjelden.

For å bli kvitt mangelen på den forrige indikatoren, kvadrerer vi forskjellen mellom den individuelle verdien og gjennomsnittet og trekker deretter ut kvadratroten av den resulterende gjennomsnittsverdien. Resultatet vil bli kalt standardavvik:

- enkelt.

- vektet.

Det spiller samme rolle som det gjennomsnittlige absolutte avviket, men det har en fordel fremfor det, nemlig at det er lettere å utføre matematiske operasjoner med det. I lys av dette brukes denne indikatoren i 90 av 100 tilfeller.

En enda mer praktisk indikator på variasjon for matematiske transformasjoner er spredning, som er standardavviket i annen:

- enkelt,

- vektet.

Ved hjelp av varians og standardavvik måles sammenhenger mellom ulike funksjoner. I tillegg kan disse indikatorene brukes til å sammenligne aggregater i betydningen deres homogenitet når det gjelder de samme egenskapene.

Konklusjonen om homogeniteten til befolkningen lar oss gjøre variasjonskoeffisienten, som kan beregnes på flere måter avhengig av den første informasjonen:

Det karakteriserer den gjennomsnittlige prosentandelen av avvik av individuelle verdier for en egenskap fra gjennomsnittsverdien.

,

,

,

hvor V- variasjonskoeffisienten;

σ er standardavviket;

d(L) - gjennomsnittlig lineært avvik;

X MO - mote (strukturelt gjennomsnitt);

X IE - median (strukturelt gjennomsnitt).

Variasjonskoeffisienten er av stor betydning. Den lar deg sammenligne variasjonsnivået for ulike egenskaper og brukes til å karakterisere homogeniteten til befolkningen. Hvis variasjonskoeffisienten er mindre enn 33 %, er populasjonen homogen.

Eksempel på beregning av variasjonsindikatorer.

Fordelingen av universitetsstudenter etter alder er preget av følgende data (tabell 1):

Tabell 1

Regn ut indikatorene som karakteriserer variasjonen i alderen til elevene for hvert skjema



læring. Sammenlign resultatene dine.

Beregn variasjonsindikatorene som karakteriserer totalen av deltidsstudenter

læring.

1. Variasjonsområde:

R \u003d x maks - x min \u003d 31 - 18,5 \u003d 12,5 (år)

2. Aritmetisk gjennomsnitt:

3. Gjennomsnittlig lineært avvik:

Alderen til en enkelt elev avviker fra gjennomsnittet for totalalderen - 27 år - med 3 år. Det vil si at det kan hevdes at alderen til det største antallet elever ikke vil gå utover intervallets grenser: fra 24,3 til 30,4 år.

27,36 - 3,07 < 27,36 < 27,36+ 3,07.

Standardavvik:

Standardavviket karakteriserer også den absolutte verdien av avviket til en individuell verdi fra gjennomsnittet. Som regel er verdien av standardavviket større enn det gjennomsnittlige lineære avviket.

Spredning:

=13,899

Den karakteriserer kvadratet av avvik for en individuell verdi fra gjennomsnittsverdien. Variasjonskoeffisienten:

Den gjennomsnittlige prosentandelen av avvik av individuelle verdier fra gjennomsnittsverdien er 13,6%. Helheten er homogen. La oss gjøre lignende beregninger for det totale antallet heltidsstudenter. Vi får følgende resultater:

d(L) = 3,40

V= 21,9%

Basert på beregningene ovenfor kan det konkluderes med at settet med studenter ved deltidsavdelingen er mer homogent.

Beregningen av variasjonsindikatorer er en ganske arbeidskrevende prosess. I noen tilfeller, når det er en serie indikatorer med likt fordelte tidspunkter eller en lik intervallfordelingsserie, kan beregningen forenkles. Reduserte metoder for beregning av varians er basert på kunnskap om egenskapene til variansen. Dispersjonsegenskaper:

Hvis fra alle verdier alternativene X trekke fra (legge til) et konstant tall EN, da vil ikke variansen endres;

Hvis hver verdi av opsjonene er delt (multiplisert) med en konstant verdi Til, da vil variansen avta (øke) i til 2 en gang.

Forkortede måter å beregne varians på:

2. Metode for momenter - brukes kun ved like intervaller.

I følge utvalgsundersøkelsen ble innskytere gruppert etter størrelsen på innskuddet i byens Sberbank:

Definere:

1) variasjonsområde;

2) gjennomsnittlig innskuddsbeløp;

3) gjennomsnittlig lineært avvik;

4) dispersjon;

5) standardavvik;

6) variasjonskoeffisient for bidrag.

Løsning:

Denne distribusjonsserien inneholder åpne intervaller. I slike serier er verdien av intervallet til den første gruppen konvensjonelt antatt å være lik verdien av intervallet til den neste, og verdien av intervallet til den siste gruppen er lik verdien av intervallet til den forrige. en.

Intervallverdien til den andre gruppen er 200, derfor er verdien til den første gruppen også 200. Intervallverdien til den nest siste gruppen er 200, noe som betyr at det siste intervallet også vil ha en verdi lik 200.

1) Definer variasjonsområdet som forskjellen mellom den største og minste verdien av funksjonen:

Variasjonen i størrelsen på bidraget er 1000 rubler.

2) Den gjennomsnittlige størrelsen på bidraget bestemmes av formelen til det aritmetiske vektede gjennomsnittet.

La oss foreløpig bestemme den diskrete verdien av attributtet i hvert intervall. For å gjøre dette, ved å bruke den enkle aritmetiske middelverdiformelen, finner vi midtpunktene til intervallene.

Gjennomsnittsverdien av det første intervallet vil være lik:

den andre - 500, etc.

La oss legge resultatene av beregningene i tabellen:

Innskuddsbeløp, gni.Antall bidragsytere, fMidten av intervallet, xxf
200-400 32 300 9600
400-600 56 500 28000
600-800 120 700 84000
800-1000 104 900 93600
1000-1200 88 1100 96800
Total 400 - 312000

Gjennomsnittlig innskudd i byens Sberbank vil være 780 rubler:

3) Det gjennomsnittlige lineære avviket er det aritmetiske gjennomsnittet av de absolutte avvikene til de individuelle verdiene av attributtet fra det totale gjennomsnittet:

Prosedyren for å beregne gjennomsnittlig lineært avvik i intervallfordelingsserien er som følger:

1. Det aritmetiske vektede gjennomsnittet beregnes, som vist i avsnitt 2).

2. Variantens absolutte avvik fra gjennomsnittet bestemmes:

3. De oppnådde avvikene multipliseres med frekvensene:

4. Summen av vektede avvik er funnet uten å ta hensyn til tegnet:

5. Summen av de vektede avvikene deles på summen av frekvensene:

Det er praktisk å bruke tabellen med beregnede data:

Innskuddsbeløp, gni.Antall bidragsytere, fMidten av intervallet, x
200-400 32 300 -480 480 15360
400-600 56 500 -280 280 15680
600-800 120 700 -80 80 9600
800-1000 104 900 120 120 12480
1000-1200 88 1100 320 320 28160
Total 400 - - - 81280

Det gjennomsnittlige lineære avviket i størrelsen på innskuddet til Sberbank-kunder er 203,2 rubler.

4) Dispersjon er det aritmetiske gjennomsnittet av de kvadrerte avvikene for hver funksjonsverdi fra det aritmetiske gjennomsnittet.

Beregning av varians i intervallfordelingsserien utføres i henhold til formelen:

Prosedyren for å beregne variansen i dette tilfellet er som følger:

1. Bestem det aritmetiske vektede gjennomsnittet, som vist i avsnitt 2).

2. Finn avvik fra gjennomsnittet:

3. Kvadring av avviket for hvert alternativ fra gjennomsnittet:

4. Multipliser kvadrerte avvik med vekter (frekvenser):

5. Oppsummer de mottatte arbeidene:

6. Den resulterende mengden deles på summen av vektene (frekvensene):

La oss sette beregningene i en tabell:

Innskuddsbeløp, gni.Antall bidragsytere, fMidten av intervallet, x
200-400 32 300 -480 230400 7372800
400-600 56 500 -280 78400 4390400
600-800 120 700 -80 6400 768000
800-1000 104 900 120 14400 1497600
1000-1200 88 1100 320 102400 9011200
Total 400 - - - 23040000

Relative indikatorer for variasjon - seksjon Økonomi, Data om aktivitetene til banker i en av regionene i Den russiske føderasjonen 1. Variasjonskoeffisient (Vσ) - Relativ ...

Settet anses som kvalitativt homogent hvis variasjonskoeffisienten ikke overstiger 0,33 (eller 33%).

Tabell 5.1.3.

Befolkningshomogenitetsskala

I dette tilfellet kan gjennomsnittsverdien av egenskapen som studeres betraktes som en typisk, pålitelig egenskap for den statistiske populasjonen.

Hvis variasjonskoeffisienten mer enn 0,33 (eller 33 %) så derfor variasjonen av egenskapen som studeres flott, og det funnet gjennomsnittet representerer dårlig hele den statistiske populasjonen, er ikke dens typiske, pålitelige egenskap, og selve befolkningen er heterogen når det gjelder funksjonen som vurderes.

Tilsvarende beregnes variasjonskoeffisienten andre relative mål for variasjon, som sjelden brukes i statistisk praksis:

2. Oscillasjonsindeks: ; (5.1.12.)

3. Lineær variasjonskoeffisient: . (5.1.13)


La oss beregne variasjonsindikatorene for det tverrgående problemet:

Tabell 5.1.4.

Beregningstabell for å finne egenskapene til fordelingsserien

Grupper av banker etter volum av kredittinvesteringer, millioner rubler X Intervall midtpunkt Antall banker Produkt av varianter etter frekvenser
gruppe 4= gruppe 2*gruppe 3 gr.6= gr.5*gr.5 gr.7= gr.6*gr.3
375,00 - 459,00 =417 417*4= 417-585= -168 = 28224*4=
459,00 - 543,00 ? ? ? ?
543,00 - 627,00 ? ? ? ?
627,00 - 711,00 ? ? ? ?
711,00 - 795,00 ? ? ? ?
Total ? X X ?

Beregning av det aritmetiske vektede gjennomsnittet:

Avviksberegning:

σ2=

Beregning av standardavvik:


Beregning av variasjonskoeffisienten:

Konklusjon. En analyse av de oppnådde verdiene av indikatorer og σ antyder at gjennomsnittlig volum av banklån er _______?mln. rub., er avviket fra gjennomsnittlig volum i en eller annen retning i gjennomsnitt _________?millioner. gni. (eller ______?%), de mest karakteristiske verdiene for volumet av kredittinvesteringer varierer fra ______________? mln. gni. opptil _______________? mln. gni. (område) (Se tabell 3.2.5 -_____? banker eller ______?% er inkludert i dette intervallet).

V σ verdi = ______?% _____? overstiger 33%, derfor er variasjonen av kredittinvesteringer i det studerte settet av banker ubetydelig, og settet på dette grunnlaget er kvalitativt homogent. Avviket mellom verdiene til , Mo og Me er ubetydelig (=585 millioner rubler, Mo=593,40 millioner rubler, Me=588,818 millioner rubler), noe som bekrefter konklusjonen om homogeniteten til aggregatet av banker. Dermed funnet gjennomsnittsverdien av volumet av kredittinvesteringer av banker (585 millioner rubler) ______? er en typisk, pålitelig egenskap for den studerte populasjonen av banker.

Slutt på arbeidet -

Dette emnet tilhører:

Data om aktivitetene til banker i en av regionene i Den russiske føderasjonen

Tverrgående oppgavedata.. tabell.. data om aktivitetene til banker i en av regionene i den russiske føderasjonen banknummer kredittinvesteringer millioner rubler fortjeneste..

Hvis du trenger ytterligere materiale om dette emnet, eller du ikke fant det du lette etter, anbefaler vi å bruke søket i vår database over verk:

Hva skal vi gjøre med det mottatte materialet:

Hvis dette materialet viste seg å være nyttig for deg, kan du lagre det på siden din på sosiale nettverk:

Alle emner i denne delen:

Statistikk emne, metode og oppgaver
1.1. Emne, metoder, statistikkens oppgaver Begrepet "statistikk" kommer fra det latinske "status", som kom i bruk i Tyskland på midten av 1700-tallet. For første gang ble det undervist i statistikk

Individuelle objekter eller fenomener som danner en statistisk populasjon kalles populasjonsenheter
For eksempel, når det gjennomføres en telling av kommersielt utstyr, er observasjonsenheten handelsbedriften, og befolkningsenheten er utstyret deres (disker, kjøleenheter, etc.).

Et tegn er en karakteristisk egenskap ved fenomenet som studeres som skiller det fra andre fenomener.
I ulike grener av statistikk studeres ulike funksjoner. Så for eksempel er studieobjektet en bedrift, og dens funksjoner er type produkt, produksjonsvolum, antall ansatte, etc. Eller ob

Konseptet med stat. observasjoner. Krav til innsamlet informasjon
Statistisk observasjon er den innledende fasen av økonomisk og statistisk observasjon. Det er et vitenskapelig organisatorisk arbeid med å samle inn masse

Hovedtyper, former og metoder for observasjon
Spesielt organisert statistisk observasjon er innsamling av informasjon gjennom folketellinger, engangsregistreringer og undersøkelser. Et eksempel på en spesielt organisert statistikk

Overvåkingsnøyaktighet og overvåkingsdatakontroll
Enhver statistisk observasjon setter oppgaven med å skaffe slike data som mer nøyaktig reflekterer virkeligheten. Avvik eller forskjeller mellom beregnede indikatorer og faktiske (sant

Absolutte og relative verdier
For å karakterisere massefenomener bruker statistikken statistiske størrelser (indikatorer). De er delt inn i absolutt, relativ og

Hver valgt gruppe er preget av AVERAGE-verdien (verdiene) til det effektive attributtet
Tabell 3.2.3. Analytisk gruppering av avhengighet av kredittinvesteringer og overskudd til banker Gruppenummer Grupper av banker etter mengden kredittinvesteringer

Etter volum av kredittinvesteringer
For å konstruere en intervallvariasjonsserie som karakteriserer fordelingen av banker etter volumet av kredittinvesteringer, er det nødvendig å beregne verdien og grensene for seriens intervaller.

En statistisk distribusjonsserie er en ordnet fordeling av befolkningsenheter i grupper i henhold til egenskapen som studeres.
Avhengig av typen egenskap som anses som en grupperingsserie, kan de være variasjonsmessige (kvantitative) og attributive (kvalitative).

Tabellform og grafisk presentasjon av statistiske data
Statistiske tabeller er en slags statistisk setning som består av et statistisk subjekt og et statistisk predikat. Statistiske tabeller - f.eks

Eller 15 16 17
4. mangelen på data kan skyldes ulike årsaker og dette bør gjenspeiles i tabellene på ulike måter: a) hvis denne egenskapen ikke skal fylles ut i det hele tatt, så

Grafisk fremstilling av statistiske data
Bruken av grafer i statistikk har mer enn to hundre års historie. Grunnleggeren av den grafiske metoden i bedriftsstatistikk er den engelske økonomen W. Playfair

Frekvensfordelingspolygon
Basert på dataene i tabell. 3.4.3. konstruer en polygon av frekvenser Tabell 3.4.3. Fordeling av skostørrelser blant mannlige respondenter på undersøkelsen Antall størrelse Antall

Histogrammer
Et histogram brukes til å vise en intervallfordelingsserie. Når du konstruerer den, er verdiene til intervallene plottet på abscisse-aksen (

Kumuler
For å vise distribusjonsserien brukes en kumulativ kurve (sumkurve). Når du konstruerer kumulasjonen av intervallvariasjonsserien, plottes variantene av serien langs abscisseaksen (

Essensen av gjennomsnitt. To former for gjennomsnitt
Gjennomsnittsverdien er en indikator som gir en generaliserende karakteristikk av et varierende trekk ved en homogen populasjon. Egenskaper for gjennomsnittsverdien: 1. Gjennomsnittet preger hele scoopet

Gjennomsnittlig harmonisk
Overtoner - likhet, konsonans, harmonisk middelverdi er nær det aritmetiske gjennomsnitt Harmonisk gjennomsnitt brukes i tilfeller hvor statistisk informasjon

Konseptet med variasjon. Hovedindikatorer på variasjon
Variasjon er forskjellene i de individuelle verdiene til en egenskap blant enhetene i den studerte befolkningen. Behovet for å studere variasjon skyldes at

Andre uoppdagede faktorer
Denne indikatoren beregnes med formelen (5.2.1.) hvor yi

Volumet av kredittinvesteringer (faktortegn - x)
Indikatoren beregnes av formelen

Andre uoppdagede faktorer
(5.2.9.) Gjennomsnittet av variasjonene innen gruppe (

Kurven er formet som en bjelle
2. Siden normalfordelingsfunksjonen er partall, det vil si f (-t) \u003d f (t), så er normalfordelingskurven symmetrisk med hensyn til den maksimale ordinaten lik

Derfor er asymmetrien venstresidig
Den mest nøyaktige skjevhetskoeffisienten er koeffisienten beregnet ved å bruke det sentrale momentet for fordelingen av tredje orden.

Forstå prøvetaking og prøvetakingsfeil
Et utvalg er en slik ikke-kontinuerlig observasjon, der tegn registreres i individuelle enheter av den studerte statistiske populasjonen, valgt ved hjelp av

Gjennomsnittlige og marginale prøvetakingsfeil
Bruken av prøvetakingsmetoden for observasjon er alltid forbundet med å etablere graden av pålitelighet av estimater av indikatorer for den generelle befolkningen oppnådd på grunnlag av verdiene så langt

Bestemmelse av prøvetakingsfeilen for gjennomsnittlig volum av kredittinvesteringer til banker og grensene som det generelle gjennomsnittet vil ligge innenfor
I henhold til tilstanden til ende-til-ende-oppgaven inkluderer utvalgspopulasjonen 30 banker, utvalget er 20 % mekanisk, derfor inkluderer populasjonen (______?)=________? banker.

Andelen av samplingsenheter som har en eller annen gitt egenskap uttrykkes med formelen
, (6.3.4.) hvor m er antall befolkningsenheter som har s

Bestemmelse av den nødvendige prøvestørrelsen med en gitt verdi av den tillatte marginale prøvetakingsfeilen lik 10 millioner rubler
For riktig tilfeldig og mekanisk prøvetaking med en ikke-repeterende utvalgsmetode, beregnes den nødvendige prøvestørrelsen for den gjennomsnittlige kvantitative attributten ved hjelp av formelen:

Konseptet med korrelasjon. Typer og former for korrelasjoner
Blant de mange formene for relasjoner som er kvantitative av natur og studert med kvantitative metoder, er en spesiell plass okkupert av faktorforhold, for studiet av hvilke korrigeringsmetoder som brukes.

Funksjonelle lenker
Forholdet mellom den resulterende egenskapen Y og faktortrekket X kalles funksjonell hvis hver mulig verdi xi av egenskapen X

Hvis modellen tar hensyn til funksjonen Ys avhengighet av en rekke faktorer, så har modellen formen
(7.1.5.) Et karakteristisk trekk ved stokastiske relasjoner er

Visuelt kan man anta eksistensen av en korrelasjon
3. Korrelasjonstabellen er en kombinasjon av to distribusjonsserier. Radene i tabellen tilsvarer grupperingen av befolkningsenheter i henhold til faktorattributtet

Analytisk grupperingsmetode
Ved bruk av metoden for analytisk gruppering konstrueres en intervallserie med fordeling av enheter av populasjonen i henhold til faktorattributtet X, og for hver j-te gruppe i serien bestemmes gjennomsnittsgruppen.

Regresjonsmetode for relasjonsanalyse
Linjen som jevner ut den empiriske stiplede linjen kalles den teoretiske Y-on-X regresjonslinjen eller ganske enkelt regresjonslinjen. Denne linjen fra

Måte å uttrykke serienivåer på
Tabell 8.1.2 Antall leiligheter bygget av foretak og organisasjoner av alle former for eierskap og deres gjennomsnittlige størrelse i Russlands føderasjonsindikatorer

Gjennomsnittlige indikatorer i tidsserier
I tabellen. 8.2.1. dataene som karakteriserer dynamikken til endringer i nivåene i serien for separate tidsperioder presenteres. For en generell vurdering av endringer i seriens nivåer over hele den aktuelle perioden

Prognose salgsvolum ved å bruke gjennomsnittlig vekstrate
Forutsigelse av nivået til en serie med dynamikk ved bruk av gjennomsnittlig vekstrate (koeffisient) utføres i henhold til følgende formel:

Metoder for å oppdage sesongsvingninger
I en rekke tilfeller gjentar seg naturlig nok forskjeller i seriens nivåer avhengig av årstiden. Utfordringen er å måle slike forskjeller slik at de ikke er tilfeldige.

Metoder for å analysere hovedtrenden i tidsserier
En trend er den viktigste ganske stabile trenden i utviklingen av et fenomen i en serie av dynamikk, med andre ord en jevn og stabil endring i nivåer (y) over tid. På T

Kornproduksjon i Russland, millioner tonn
År t produksjon, millioner tonn y 3-års gjennomsnitt 5-års glidende gjennomsnitt, 5-års glidende gjennomsnitt, beregnet

Individuelle og generelle indekser. Problemer med sammenligning av indekserte verdier i samlede indekser
Individuell indeks - karakteriserer dynamikken til nivået på fenomenet som studeres i tid for to sammenlignede perioder eller uttrykker forholdet mellom individuelle elementer i befolkningen.

Paasche-formelen foretrekkes når prisindeksen vurderes i et system med handelsindeks og volumindeks
Eksempel 9.2.2. Tabell 9.2.3. Data om salg av produkter i butikken "Zvezdochka" Produktenhet. rev. Grunnperiode O

Indekser er gjennomsnitt fra individ
Gjennomsnittsindeksen er en indeks beregnet som gjennomsnittet av individuelle indekser. Disse indeksene brukes når det ikke er data i kildeinformasjonen.

Handelsomsetningsindeksen er produktet av prisindeksen (ifølge Paasche) og det fysiske volumet
, la oss sjekke det ut:

Indekser med konstant og variabel sammensetning. Faste strukturindekser
Når du studerer kvalitative indikatorer, er det ofte nødvendig å vurdere endringen i tid (eller rom) av GJENNOMSNITTLIG verdi av indeksen

Indeks over strukturelle skift
Alle indeksene omtalt ovenfor ble beregnet for flere varer solgt på ett sted. La oss nå vurdere tilfellet når ETT produkt selges flere steder. Eksempel 9.5.1.

Praktisk leksjon
Oppgave 01 Beregn de analytiske og gjennomsnittlige indikatorene for årlige endringer i nivåene i serien, trekk passende konklusjoner. Tabell 1. Salgsvolum etter utgave

Gjennomsnittlig vekstrate -
År (t) Salgsvolum, tusen tonn. Absolutt vekst, tusen tonn Veksthastighet, % Veksthastighet, % Absolutt verdi

Enhver statistisk populasjon består av enheter hvis karakteristiske verdier varierer. For å bedømme homogeniteten til befolkningen og typiskheten til gjennomsnittsverdien til egenskapen som studeres, bør analysen suppleres med beregning av variasjonsindikatorer.

Variasjon er fluktuasjonen, mangfoldet, variasjonen av verdien av en egenskap i individuelle enheter av befolkningen.

De absolutte variasjonsindikatorene inkluderer: variasjonsområdet, gjennomsnittlig lineært avvik, varians og standardavvik.

Variasjonsområdet er en karakteristikk av grensene for variasjonen til den studerte egenskapen. Viser hvor stor forskjellen er mellom populasjonsenhetene som har den minste og den største verdien av attributtet, er basert på ekstremverdiene til den varierende attributten og reflekterer ikke avvikene til alle variantene i serien. Bestemt av formelen:

R=Xmax-Xmin, (5,4)

hvor Xmax er maksimumsverdien til variasjonsserien;

Xmin - minimum.

Det gjennomsnittlige lineære avviket viser hvor mye egenskapen i den studerte populasjonen avviker fra gjennomsnittsverdien til egenskapen. Det finnes i henhold til formelen:

hvor - individuelle verdier av den variable egenskapen (alternativer); - frekvenser, vekter; - gjennomsnittsverdien av variabelattributtet;

Dispersjon - gjennomsnittlig kvadrat for avviket til individuelle verdier av en egenskap fra gjennomsnittsverdien. Beregnet ved hjelp av følgende formler.

Den første måten å bestemme variansen på:

Den andre måten å bestemme variansen (ved aritmetisk gjennomsnitt):

hvor er gjennomsnittet av kvadratene til individuelle verdier; er kvadratet av den gjennomsnittlige verdien av funksjonen.

Standardavviket er en generaliserende karakteristikk av størrelsen på variasjonen til et trekk i aggregatet. Viser hvor mye gjennomsnittsverdien av attributtet avviker fra standardverdien, bestemmes av formelen:

Jo mindre verdien av variansen og standardavviket er, jo mer homogen (kvantitativt) blir populasjonen og jo mer typisk vil gjennomsnittsverdien være.

Vi beregner variasjonsindikatorene for grupperingen av transportorganisasjoner etter omsetningen av veitransport (tabell 5.1).

Finn variasjonsområdet (i henhold til formel 5.4):

Spredningen i verdiene på godsomsetningen til kollektivtransport er ganske høy.

Beregn gjennomsnittlig lineært avvik (i henhold til formel 5.5):


Verdiene av godsomsetningen til veitransport skilte seg fra gjennomsnittsverdien med 508,8 millioner tonn km.

Vi beregner spredningen på to måter (i henhold til formlene 5.6 - 5.7). Første vei:



Regn ut standardavviket (i henhold til formel 5.8):

Det betyr at kollektivtrafikkens omsetning i gjennomsnitt skiller seg fra normverdien med 23,68 millioner t.km.

La oss finne variasjonsindikatorene for å gruppere arealene til boliglokaler (tabell 5.3), ved å bruke formlene 5.4 - 5.8

La oss beregne variasjonsområdet:

Variasjonsspekteret på 3,1 m2 viser oss at spekteret av boligområdeverdier ikke er særlig høyt.

Beregn gjennomsnittlig lineært avvik:

Dermed avviker verdiene til arealene til boliglokaler i den studerte befolkningen fra gjennomsnittsverdien med 1,19 m2.

Vi beregner variansen på to måter.

Første vei:


Den andre måten (ved aritmetisk middelverdi):

Regn ut standardavviket:

Den viser at verdiene på arealet til boliglokaler i gjennomsnitt avviker fra standardverdien med 1,3 m2.

Variasjonskoeffisienter

Variasjon måles ved hjelp av relative verdier kalt variasjonskoeffisienter og definert som forholdet mellom gjennomsnittlig avvik og gjennomsnittet. Variasjonskoeffisienten brukes ikke bare for en komparativ vurdering av variasjonen av populasjonsenheter, men også som et kjennetegn på populasjonshomogenitet. Verdiene til variasjonskoeffisienten varierer fra 0 til 100%, og jo nærmere den er null, jo mer typisk er gjennomsnittsverdien funnet for den statistiske populasjonen som studeres, og derfor velges de statistiske dataene bedre. Settet anses som kvantitativt homogent dersom variasjonskoeffisienten ikke overstiger 33 % (for fordelinger nær normalen). Det er følgende relative variasjonsindikatorer:

Variasjonskoeffisienten:

hvor er standardavviket, er det aritmetiske gjennomsnittet.

Lineær variasjonskoeffisient:

hvor er det gjennomsnittlige lineære avviket.

Oscillasjonsfaktor:

hvor er variasjonsområdet.

Vi beregner variasjonskoeffisientene for en gruppe organisasjoner når det gjelder godsomsetning på veitransport (tabell 5.1) ved å bruke formlene 5.9, 5.10, 5.11

Variasjonskoeffisienten vil være lik: , som overstiger 33%, derfor er befolkningen heterogen.

La oss beregne den lineære variasjonskoeffisienten: . Derfor er andelen av gjennomsnittsverdien av organisasjoners absolutte avvik fra gjennomsnittsverdien 30,7 %

La oss finne oscillasjonskoeffisienten: . Det følger av dette at forskjellen mellom maksimums- og minimumsverdiene til organisasjoner overstiger gjennomsnittsverdien med nesten 1.078 ganger.

La oss bestemme variasjonskoeffisientene for gruppering av arealene til boliger (i gjennomsnitt per innbygger) (tabell 5.3).

La oss beregne variasjonskoeffisienten ved å bruke formelen (5.9):

Dette betyr at variasjonskoeffisienten ikke overstiger 33%, derfor er befolkningen homogen.

La oss beregne den lineære variasjonskoeffisienten i henhold til formelen (5.10):

Dette betyr at andelen av gjennomsnittsverdien av de absolutte avvikene til arealene til boliger fra gjennomsnittsverdien er 5,56 %.

La oss finne oscillasjonskoeffisienten ved formelen (5.11):

Forskjellen mellom maksimums- og minimumsverdier for boliglokaler overstiger ikke gjennomsnittsverdien.

Variasjonskoeffisienten er en av de mest brukte statistiske koeffisientene i finanssektoren. Vi vil fortelle deg hvordan du beregner variasjonskoeffisienten og hvordan den kan være nyttig for en finansdirektør.

Hva er variasjonskoeffisienten og hvorfor er det nødvendig

Variasjonskoeffisienten (CV) er et mål på den relative spredningen til en tilfeldig variabel. Den viser hvor stor andel som er gjennomsnittlig spredning av en tilfeldig variabel fra gjennomsnittsverdien til denne variabelen.

Generelt brukes variasjonskoeffisienten til å bestemme spredningen av verdier uten referanse til skalaen til den målte verdien og måleenhetene. Variasjonskoeffisienten er inkludert i gruppen av relative statistikkmetoder, den måles i prosent og derfor kan den brukes til å sammenligne variasjonen til flere urelaterte prosesser og fenomener.

Bruke variasjonskoeffisienten i finansiell modellering

Variasjonskoeffisienten er ledende blant de variasjonsstatistiske metodene som brukes av finans- og investeringsanalytikere.

Analytikere bruker forholdet:

  1. For å bestemme stabiliteten til den prediktive modellen.
  2. Å sammenligne flere prediktive modeller (for det meste investeringsmodeller) med forskjellige absolutte nivåer av avkastning og risiko.
  3. For XYZ-analyse.

Formelen for å beregne variasjonskoeffisienten

Variasjonskoeffisienten beregnes med formelen:

der CV er variasjonskoeffisienten,

σ er standardavviket til en tilfeldig variabel,

tav er gjennomsnittsverdien av en tilfeldig variabel.

Variasjonskoeffisientformel forr:

hvor NPV er netto nåverdi.

Formelen for variasjonskoeffisienten for investeringer i verdipapirer:

hvor: % år - avkastningen på verdipapiret i % per år.

Variasjonskoeffisient i Excel

=SDVPA(verdiområde)/AVERAGE(verdiområde)

Eller ved å bruke den innebygde "Data Analysis"-pakken.

Analyse av variasjonskoeffisienten

Variasjonskoeffisienten er mer allsidig enn spredning og standardavvik, fordi den lar deg sammenligne risikoen og avkastningen til to eller flere eiendeler, som kan variere betydelig. Riktignok har metoden for å vurdere avkastning/risiko-paret ved å bruke variasjonskoeffisienten begrensninger. Hvis forventet avkastning har en tendens til null, har verdien av variasjonskoeffisienten en tendens til uendelig. Og selv en liten endring i den forventede lønnsomheten til et prosjekt (eller et verdipapir) fører til en betydelig endring i koeffisienten, som må tas i betraktning når man rettferdiggjør investeringsbeslutninger.

  • mindre enn 10 %, da er graden av risiko for prosjektet ubetydelig,
  • fra 10 % til 20 % - middels,
  • mer enn 20 % - betydelig,
  • hvis verdien av variasjonskoeffisienten er mer enn 33 %, anses den finansielle modellen for å være heterogen, ustabil. Det er umulig å ta objektive investeringsbeslutninger på det.

Eksempler på beregning av variasjonskoeffisient i Excel

Eksempel 1

Den første er åpningen av et nettverk av utsalgssteder for handel med smykker i Moskva og St. Petersburg.

Den andre er åpningen av et nettverk av utsalgssteder i hele Russland i flere millioner byer.

En finansanalytiker for bedrifter kompilerte økonomiske modeller for begge prosjektene i Excel og utførte 5000 Monte Carlo-kjøringer for NPV i hvert prosjekt (se også, hvordan lage en visuell finansmodell i excel ). Videre, ved å bruke "Data Analysis"-analysepakken, fikk jeg følgende statistiske indikatorer (se tabell 1 og 2).

Tabell 1. Prosjektindikatorer 1

Gjennomsnittlig estimert NPV fra Prosjekt 1 vil være 14,05 tusen dollar, vil variansen (det er også standardavviket) være lik 1,72 tusen dollar.

Variasjonskoeffisienten for det første prosjektet er:

CV = 1,72/14,05 = 12 %

Prosjektet er anerkjent som middels risiko.

Den gjennomsnittlige estimerte NPV fra prosjekt 2 vil være $25,23 tusen, variansen vil være $6,30 tusen.

Variasjonskoeffisienten for det andre prosjektet vil være:

CV = 6,30/25,23 = 24,97 %

Prosjektet er anerkjent som høyrisiko.

Hvis vi sammenligner prosjekt 1 og 2 med variasjonskoeffisienten, bør prosjekt 1 velges, siden det har et bedre inntekts/risikoforhold.

Eksempel 2

Selskapet "Sigma" utfører XYZ-analyse av produktutvalget når det gjelder salgsvolatilitet. Selskapets produktlinje er representert av fem produkter: A, B, C, D og E.

Det er månedlig salgsstatistikk for det siste året for hvert produkt (se figur). I praksis er det bedre å ha statistikk for en periode på mer enn tre år /

Tegning. Salgsstatistikk for det siste året for hvert produkt

Finansanalytikeren til selskapet beregnet variasjonskoeffisienten for hvert produkt

CVa = STDVA(B2:B13)/GJENNOMSNITT(B2:B13) = 30 %

Selskapet har følgende intervaller for XYZ-grupper:

Z - 31–100 %.

Dette betyr at varer B og D tilhører kategori X. Etterspørselen etter dem er konstant, lagre på lagre for dem må overvåkes nøye og hele tiden etterfylles.

Varene A og C tilhører kategori Y. Etterspørselen etter dem avviker med 30 % fra måned til måned. Kanskje det er en sesongmessig etterspørsel. Det er nødvendig å analysere salgsstatistikken dypere og utvikle en optimal policy for lagerbalanser for denne gruppen.

Produkt E har den mest flyktige etterspørselen, salg for det utføres uregelmessig, så det kan være fornuftig å bytte til forhåndsbestillingsarbeid med det.

konklusjoner

Det bør huskes at variasjonskoeffisienten ikke er den eneste måten å evaluere effektiviteten til en investering på, siden den ikke tar hensyn til flere viktige faktorer:

  1. Volumer av innledende investering.
  2. Mulig asymmetrisk fordeling. Ved beregning av variasjonskoeffisienten antas det at spredningen av verdiene til en tilfeldig variabel er lokalisert symmetrisk til gjennomsnittet (ofte langs en normalfordeling). Men dette er ikke alltid sant. For eksempel, for alternativer, hvis utbytte ikke kan være lavere enn null, er det en distribusjonsasymmetri, og det er nødvendig å analysere variasjonskoeffisienten for dem med tanke på andre metoder for statistisk analyse.
  3. Investeringspolitikk for investeringsobjektet.
  4. Andre ikke-numeriske faktorer.

Metoden for å estimere statistiske, inkludert økonomiske, data ved å beregne variasjonskoeffisienten er fortjent anerkjent som en av de mest effektive komparative metodene for statistikk.