Lag en intervalltabell. Oppsummering og gruppering av statistikk

Hva er en gruppering av statistiske data, og hvordan er det relatert til distribusjonsserier, ble diskutert i dette foredraget, hvor du også kan lære om hva en diskret og variasjonsfordelingsserie er.

Distribusjonsserier er en av variantene av statistiske serier (i tillegg til dem brukes dynamikkserier i statistikk), de brukes til å analysere data om fenomener det offentlige liv. Å konstruere variantserier er en ganske gjennomførbar oppgave for alle. Det er imidlertid regler som må huskes.

Hvordan konstruere en diskret variasjonsfordelingsserie

Eksempel 1. Det finnes data om antall barn i 20 undersøkte familier. Konstruer en diskret variantserie familiefordeling etter antall barn.

0 1 2 3 1
2 1 2 1 0
4 3 2 1 1
1 0 1 0 2

Løsning:

  1. La oss starte med et tabelloppsett, som vi så legger inn data i. Siden distribusjonsradene har to elementer, vil tabellen bestå av to kolonner. Den første kolonnen er alltid et alternativ - det vi studerer - vi tar navnet fra oppgaven (slutten av setningen med oppgaven i betingelsene) - etter antall barn– Dette betyr at vårt valg er antall barn.

Den andre kolonnen er frekvens - hvor ofte vår variant forekommer i fenomenet som studeres - vi tar også navnet på kolonnen fra oppgaven - familiefordeling – dette betyr at vår frekvens er antall familier med tilsvarende antall barn.

  1. Nå fra kildedataene velger vi de verdiene som forekommer minst én gang. I vårt tilfelle er det det

Og la oss ordne disse dataene i den første kolonnen i tabellen vår i logisk rekkefølge, i dette tilfellet økende fra 0 til 4. Vi får

Og til slutt, la oss telle hvor mange ganger hver verdi av varianten vises.

0 1 2 3 1

2 1 2 1 0

4 3 2 1 1

1 0 1 0 2

Som et resultat får vi en utfylt tabell eller den nødvendige raden med fordeling av familier etter antall barn.

Øvelse . Det er data om tariffkategoriene på 30 arbeidere ved bedriften. Konstruer en diskret variasjonsserie for fordeling av arbeidere etter tariffkategori. 2 3 2 4 4 5 5 4 6 3

1 4 4 5 5 6 4 3 2 3

4 5 4 5 5 6 6 3 3 4

Hvordan konstruere enie

La oss konstruere en intervallfordelingsserie og se hvordan dens konstruksjon skiller seg fra diskrete serier.

Eksempel 2. Det er data om mengden fortjeneste mottatt av 16 bedrifter, millioner rubler. — 23 48 57 12 118 9 16 22 27 48 56 87 45 98 88 63. Konstruer en intervallvariasjonsserie av fordelingen av foretak etter resultatvolum, og identifiser 3 grupper med med like intervaller.

Det generelle prinsippet for å konstruere serien vil selvfølgelig forbli de samme to kolonnene, de samme alternativene og frekvensen, men i dette tilfellet vil alternativene være plassert i intervallet og frekvensene telles annerledes.

Løsning:

  1. La oss starte på samme måte som den forrige oppgaven ved å bygge et tabelloppsett, som vi deretter legger inn data i. Siden distribusjonsradene har to elementer, vil tabellen bestå av to kolonner. Den første kolonnen er alltid et alternativ - det vi studerer - vi tar navnet fra oppgaven (slutten av setningen med oppgaven i vilkårene) - etter mengden fortjeneste - som betyr at alternativet vårt er mengden fortjeneste mottatt .

Den andre kolonnen er frekvensen - hvor ofte vår variant forekommer i fenomenet som studeres - vi tar også navnet på kolonnen fra oppgaven - fordelingen av foretak - som betyr at vår frekvens er antall foretak med tilsvarende fortjeneste, i denne saken faller inn i intervallet.

Som et resultat vil tabelloppsettet vårt se slik ut:

der i er verdien eller lengden på intervallet,

Xmax og Xmin – maksimums- og minimumsverdi for attributtet,

n er det nødvendige antallet grupper i henhold til betingelsene for problemet.

La oss beregne størrelsen på intervallet for vårt eksempel. For å gjøre dette, blant de første dataene vil vi finne den største og minste

23 48 57 12 118 9 16 22 27 48 56 87 45 98 88 63 – maksimumsverdien er 118 millioner rubler, og minimum er 9 millioner rubler. La oss utføre beregningen ved å bruke formelen.

I regnestykket fikk vi tallet 36, (3) tre i perioden, i slike situasjoner må verdien av intervallet rundes opp slik at etter beregningene ikke går tapt for maksimal data, og det er derfor i beregningen verdien av intervallet er 36,4 millioner rubler.

  1. La oss nå konstruere intervaller - våre alternativer i dette problemet. Det første intervallet begynner å bygges fra minimumsverdien, verdien av intervallet legges til det og den øvre grensen for det første intervallet oppnås. Deretter blir den øvre grensen for det første intervallet den nedre grensen for det andre intervallet, verdien av intervallet legges til den og det andre intervallet oppnås. Og så videre så mange ganger som nødvendig for å konstruere intervaller i henhold til tilstanden.

La oss være oppmerksomme hvis vi ikke hadde rundet verdien av intervallet til 36,4, men latt det være 36,3, da siste verdi vi ville få 117,9. Det er for å unngå tap av data at det er nødvendig å avrunde intervallverdien til en større verdi.

  1. La oss telle antall foretak som faller inn i hvert spesifikt intervall. Ved behandling av data må du huske at den øvre verdien av intervallet i et gitt intervall ikke tas med i betraktning (er ikke inkludert i dette intervallet), men tas med i neste intervall (intervallets nedre grense er inkludert i dette intervallet, og det øvre er ikke inkludert), med unntak av det siste intervallet.

Når du utfører databehandling, er det best å angi de valgte dataene med symboler eller farger for å forenkle behandlingen.

23 48 57 12 118 9 16 22

27 48 56 87 45 98 88 63

Vi betegner det første intervallet gul- og bestemme hvor mye data som faller inn i intervallet fra 9 til 45,4, mens denne 45,4 vil bli tatt med i det andre intervallet (forutsatt at det er i dataene) - til slutt får vi 7 bedrifter i det første intervallet. Og så videre gjennom alle intervaller.

  1. (ekstra tiltak) La oss beregne den totale fortjenesten mottatt av bedrifter for hvert intervall og generelt. For å gjøre dette, legg sammen dataene som er merket forskjellige farger og få den totale fortjenesteverdien.

For det første intervallet - 23 + 12 + 9 + 16 + 22 + 27 + 45 = 154 millioner rubler.

For det andre intervallet - 48 + 57 + 48 + 56 + 63 = 272 millioner rubler.

For det tredje intervallet - 118 + 87 + 98 + 88 = 391 millioner rubler.

Øvelse . Det er data om mengden innskudd i banken til 30 innskytere, tusen rubler. 150, 120, 300, 650, 1500, 900, 450, 500, 380, 440,

600, 80, 150, 180, 250, 350, 90, 470, 1100, 800,

500, 520, 480, 630, 650, 670, 220, 140, 680, 320

Bygge intervallvariasjonsserier fordeling av innskytere, i henhold til størrelsen på innskuddet, som identifiserer 4 grupper med like intervaller. Tell for hver gruppe total størrelse innskudd.

Betingelse:

Det er data om alderssammensetningen til arbeidere (år): 18, 38, 28, 29, 26, 38, 34, 22, 28, 30, 22, 23, 35, 33, 27, 24, 30, 32, 28 , 25, 29, 26, 31, 24, 29, 27, 32, 25, 29, 29.

    1. Konstruer en intervallfordelingsserie.
    2. Konstruer en grafisk representasjon av serien.
    3. Bestem grafisk modus og median.

Løsning:

1) I følge Sturgess-formelen skal populasjonen deles inn i 1 + 3,322 lg 30 = 6 grupper.

Maksimal alder - 38 år, minimum - 18 år.

Intervallbredde Siden endene på intervallene må være heltall deler vi populasjonen inn i 5 grupper. Intervallbredde - 4.

For å gjøre beregningene enklere, vil vi ordne dataene i stigende rekkefølge: 18, 22, 22, 23, 24, 24, 25, 25, 26, 26, 27, 27, 28, 28, 28, 29, 29, 29, 29, 29, 30, 30, 31, 32, 32, 33, 34, 35, 38, 38.

Aldersfordeling av arbeidere

Grafisk kan en serie avbildes som et histogram eller polygon. Histogram - stolpediagram. Basen av kolonnen er bredden på intervallet. Høyden på søylen er lik frekvensen.

Polygon (eller distribusjonspolygon) - frekvensgraf. For å bygge den ved hjelp av et histogram, kobler vi midtpunktene til de øvre sidene av rektanglene. Vi lukker polygonet på Ox-aksen i avstander lik halve intervallet fra de ekstreme x-verdiene.

Modus (Mo) er verdien av karakteristikken som studeres, som forekommer hyppigst i en gitt populasjon.

For å bestemme modusen fra et histogram, må du velge det høyeste rektangelet, tegne en linje fra høyre toppunkt i dette rektangelet til øvre høyre hjørne av forrige rektangel, og fra venstre toppunkt i det modale rektangelet tegne en linje til venstre toppunkt for det påfølgende rektangelet. Fra skjæringspunktet mellom disse linjene, tegn en vinkelrett på x-aksen. Abscissen vil være mote. Mo ≈ 27,5. Dette betyr at den vanligste alderen i denne populasjonen er 27-28 år.

Median (Meg) er verdien av karakteristikken som studeres, som er midt i det ordnede variasjonsserie.

Vi finner medianen ved å bruke kumuleringen. Kumulerer - en graf over akkumulerte frekvenser. Abscisser er varianter av en serie. Ordinater er akkumulerte frekvenser.

For å bestemme medianen over kumulatet finner vi et punkt langs ordinataksen som tilsvarer 50 % av de akkumulerte frekvensene (i vårt tilfelle 15), trekker en rett linje gjennom den, parallelt med Ox-aksen, og fra punktet til dens skjæringspunkt med kumulatet, tegn en vinkelrett på x-aksen. Abscissen er medianen. Meg ≈ 25,9. Dette betyr at halvparten av arbeiderne i denne befolkningen er under 26 år.

Gruppering- dette er inndelingen av en befolkning i grupper som er homogene i henhold til en eller annen egenskap.

Formålet med tjenesten. Ved å bruke den elektroniske kalkulatoren kan du:

  • bygge en variantserie, bygg et histogram og polygon;
  • finne variasjonsindikatorer (gjennomsnitt, modus (inkludert grafisk), median, variasjonsområde, kvartiler, desiler,nt, variasjonskoeffisient og andre indikatorer);

Instruksjoner. For å gruppere en serie må du velge typen variasjonsserie som er oppnådd (diskret eller intervall) og angi mengden data (antall rader). Den resulterende løsningen lagres i Word-fil(se eksempel på statistisk datagruppering).

Antall inndata
",0);">

Hvis grupperingen allerede er utført og diskrete variasjonsserier eller intervallserie, så må du bruke den elektroniske kalkulatoren Variation Indices. Teste hypotesen om type distribusjon utføres ved hjelp av tjenesten Studere distribusjonsskjemaet.

Typer statistiske grupperinger

Variasjonsserie. Ved observasjoner av diskrete tilfeldig variabel samme betydning kan finnes flere ganger. Slike verdier x i av en tilfeldig variabel er registrert som indikerer n i antall ganger den vises i n observasjoner, dette er frekvensen til denne verdien.
Ved en kontinuerlig stokastisk variabel brukes gruppering i praksis.
  1. Typologisk gruppering- dette er inndelingen av den kvalitativt heterogene befolkningen som studeres i klasser, sosioøkonomiske typer, homogene grupper av enheter. For å bygge denne grupperingen, bruk parameteren Diskret variantserie.
  2. En gruppering kalles strukturell, der en homogen populasjon er delt inn i grupper som karakteriserer dens struktur i henhold til noen varierende karakteristikk. For å bygge denne grupperingen, bruk parameteren Interval series.
  3. En gruppering som avslører sammenhengene mellom fenomenene som studeres og deres egenskaper kalles analytisk gruppe(se analytisk gruppering av serier).

Prinsipper for å konstruere statistiske grupperinger

En serie observasjoner ordnet i stigende rekkefølge kalles variasjonsserie . Grupperingsfunksjon er en egenskap som gjør at en populasjon er delt inn i separate grupper. Det kalles grunnlaget for gruppen. Grupperingen kan baseres på både kvantitative og kvalitative egenskaper.
Etter å ha bestemt grunnlaget for grupperingen, bør spørsmålet om antall grupper som befolkningen under utredning skal deles inn i, avgjøres.

Ved bruk av personlige datamaskiner for å behandle statistiske data, utføres gruppering av objektenheter ved bruk av standardprosedyrer.
En slik prosedyre er basert på bruken av Sturgess-formelen for å bestemme optimalt antall grupper:

k = 1+3,322*log(N)

Der k er antall grupper, N er antall befolkningsenheter.

Lengden på delintervaller beregnes som h=(x maks -x min)/k

Deretter telles antallet observasjoner som faller inn i disse intervallene, som tas som frekvenser n i . Få frekvenser, hvis verdier er mindre enn 5 (n i< 5), следует объединить. в этом случае надо объединить и соответствующие интервалы.
De midterste verdiene av intervallene x i =(c i-1 +c i)/2 tas som nye verdier.

Det er enkelt å sende inn det gode arbeidet ditt til kunnskapsbasen. Bruk skjemaet nedenfor

god jobb til nettstedet">

Studenter, hovedfagsstudenter, unge forskere som bruker kunnskapsbasen i studiene og arbeidet vil være veldig takknemlige for deg.

Lagt ut på http://www.allbest.ru/

OPPGAVE1

Følgende informasjon er tilgjengelig om lønn ansatte ved bedriften:

Tabell 1.1

Lønnsbeløpet i konvensjonelle termer. hi. enheter

Det kreves å konstruere en intervallfordelingsserie for å finne;

1) gjennomsnittslønn;

2) gjennomsnittlig lineært avvik;

4) standardavvik;

5) variasjonsområde;

6) oscillasjonskoeffisient;

7) lineær koeffisient variasjoner;

8) enkel variasjonskoeffisient;

10) median;

11) asymmetrikoeffisient;

12) Pearson asymmetriindeks;

13) kurtosis koeffisient.

Løsning

Som du vet, er alternativene (anerkjente verdier) ordnet i stigende rekkefølge diskrete variasjonsserier. Med et stort antall alternativ (mer enn 10), selv ved diskret variasjon, konstrueres intervallserier.

Hvis en intervallserie er kompilert med jevne intervaller, deles variasjonsområdet på det angitte antallet intervaller. Videre, hvis den resulterende verdien er heltall og entydig (noe som er sjelden), antas lengden på intervallet å være lik dette tallet. I andre tilfeller produsert avrunding Nødvendigvis V side øke, til det siste sifferet igjen var partall. Når lengden på intervallet øker, vil åpenbart variasjonsområde med en mengde som er lik produktet av antall intervaller: med forskjellen mellom den beregnede og opprinnelige lengden av intervallet

EN) Hvis størrelsen på utvidelsen av variasjonsområdet er ubetydelig, legges den enten til den største eller trekkes fra den minste verdien av karakteristikken;

b) Hvis størrelsen på utvidelsen av variasjonsområdet er merkbar, for å unngå forvirring av sentrum av området, blir den omtrent delt i to ved samtidig å legge til den største og trekke fra de minste verdiene av karakteristikken.

Hvis en intervallserie med ulik intervall kompileres, forenkles prosessen, men likevel må lengden på intervallene uttrykkes som et tall med siste partall, noe som i stor grad forenkler etterfølgende beregninger av numeriske egenskaper.

30 er prøvestørrelsen.

La oss lage en intervallfordelingsserie ved å bruke Sturges-formelen:

K = 1 + 3,32*log n,

K - antall grupper;

K = 1 + 3,32*lg 30 = 5,91=6

Vi finner rekkevidden av attributtet - lønn til arbeidere i bedriften - (x) ved å bruke formelen

R= xmax - xmin og del med 6; R = 195-112 = 83

Da blir lengden på intervallet l bane=83:6=13,83

Begynnelsen av det første intervallet vil være 112. Legger til 112 l ras = 13,83, får vi dens endelige verdi 125,83, som også er begynnelsen på det andre intervallet osv. slutten av det femte intervallet - 195.

Når du finner frekvenser, bør du bli veiledet av regelen: "hvis verdien av en funksjon faller sammen med grensen til det interne intervallet, bør den tilskrives det forrige intervallet."

Vi får en intervallserie av frekvenser og kumulative frekvenser.

Tabell 1.2

Derfor har 3 ansatte lønn. gebyr fra 112 til 125,83 konvensjonelle pengeenheter. Høyeste lønn gebyr fra 181,15 til 195 konvensjonelle pengeenheter. kun 6 ansatte.

For å beregne numeriske egenskaper transformerer vi intervallserien til en diskret serie, og tar midten av intervallene som et alternativ:

Tabell 1.3

14131,83

Ved å bruke den vektede aritmetiske gjennomsnittsformelen

konvensjonelle pengeenheter

Gjennomsnittlig lineært avvik:

der xi er verdien av karakteristikken som studeres for den i-te enheten av populasjonen,

Gjennomsnittlig verdi av den studerte egenskapen.

Lagt ut på http://www.allbest.ru/

LLagt ut på http://www.allbest.ru/

Konvensjonelle pengeenheter

Standardavvik:

Spredning:

Relativt variasjonsområde (oscillasjonskoeffisient): c= R:,

Relativt lineært avvik: q = L:

Variasjonskoeffisient: V = y:

Oscillasjonskoeffisienten viser den relative fluktuasjonen av ekstremverdiene til en karakteristikk rundt det aritmetiske gjennomsnittet, og variasjonskoeffisienten karakteriserer graden og homogeniteten til populasjonen.

c= R: = 83 / 159,485*100 % = 52,043 %

Dermed er forskjellen mellom ekstremverdiene 5,16% (=94,84%-100%) mindre enn gjennomsnittslønnen til ansatte i bedriften.

q = L: = 17,765/ 159,485*100 % = 11,139 %

V = y: = 21,704/159,485*100 % = 13,609 %

Variasjonskoeffisienten er mindre enn 33 %, noe som indikerer en svak variasjon i lønnen til arbeiderne ved bedriften, dvs. at gjennomsnittsverdien er en typisk egenskap for arbeidernes lønn (befolkningen er homogen).

I intervallfordelingsserier mote bestemt av formelen -

Frekvensen av det modale intervallet, dvs. intervallet som inneholder største antall alternativ;

Frekvensen av intervallet før modalen;

Frekvensen av intervallet etter modalen;

Modal intervalllengde;

Den nedre grensen for det modale intervallet.

Å bestemme medianer i intervallserien bruker vi formelen

hvor er den kumulative (akkumulerte) frekvensen til intervallet før medianen;

Nedre grense for medianintervallet;

Median intervallfrekvens;

Lengden på medianintervallet.

Median intervall- et intervall hvis akkumulerte frekvens (=3+3+5+7) overstiger halvparten av summen av frekvenser - (153,49; 167,32).

La oss beregne asymmetri og kurtosis, som vi vil lage et nytt regneark for:

Tabell 1.4

Faktiske data

Beregnede data

La oss beregne tredje ordens øyeblikk

Derfor er asymmetrien lik

Siden 0,3553 0,25 anses asymmetrien som betydelig.

La oss beregne det fjerde ordensmomentet

Derfor er kurtosis lik

Fordi< 0, то эксцесс является плосковершинным.

Graden av asymmetri kan bestemmes ved å bruke Pearsons asymmetrikoeffisient (As): svingningsprøveverdiomsetning

hvor er det aritmetiske gjennomsnittet av distribusjonsserien; -- mote; -- standardavvik.

Med en symmetrisk (normal) fordeling = Mo, derfor asymmetrikoeffisienten lik null. Hvis As > 0, så er det mer modus, derfor er det en høyrehendt asymmetri.

Hvis As< 0, то mindre mote, derfor er det venstresidig asymmetri. Asymmetrikoeffisienten kan variere fra -3 til +3.

Fordelingen er ikke symmetrisk, men har venstresidig asymmetri.

OPPGAVE 2

Hva bør utvalgsstørrelsen være slik at med sannsynlighet 0,954 overstiger ikke prøvetakingsfeilen 0,04 dersom variansen, basert på tidligere undersøkelser, er kjent for å være 0,24?

Løsning

Prøvestørrelsen for ikke-repeterende prøvetaking beregnes ved å bruke formelen:

t - konfidensskoeffisient (med en sannsynlighet på 0,954 er den lik 2,0; bestemt fra tabeller med sannsynlighetsintegraler),

y2=0,24 - standardavvik;

10 000 mennesker - prøvestørrelse;

Dx =0,04 - maksimal feil for prøvegjennomsnittet.

Med en sannsynlighet på 95,4 % kan det angis at utvalgsstørrelsen, som sikrer en relativ feil på ikke mer enn 0,04, bør være minst 566 familier.

OPPGAVE3

Følgende data er tilgjengelige om inntekt fra hovedaktivitetene til bedriften, millioner rubler.

For å analysere en serie dynamikk, bestemme følgende indikatorer:

1) kjede og grunnleggende:

Absolutte økninger;

Veksthastighet;

Veksthastighet;

2) gjennomsnitt

Dynamikk radnivå;

Absolutt økning;

Veksthastighet;

Økningsrate;

3) absolutt verdi på 1 % økning.

Løsning

1. Absolutt økning (Dy)- dette er forskjellen mellom neste nivå i serien og det forrige (eller grunnleggende):

kjede: DN = yi - yi-1,

grunnleggende: DN = yi - y0,

уi - radnivå,

i - radnivånummer,

y0 - basisårsnivå.

2. Veksthastighet (tu) er forholdet mellom det påfølgende nivået i serien og det forrige (eller basisåret 2001):

kjede: Tu = ;

grunnleggende: Tu =

3. Veksthastighet (TD) – Dette er en holdning absolutt vekst til forrige nivå, uttrykt i %.

kjede: Tu = ;

grunnleggende: Tu =

4. Absolutt verdi på 1 % økning (A)- dette er forholdet mellom kjedens absolutte vekst og vekstraten, uttrykt i %.

EN =

Gjennomsnittlig radnivå beregnes ved å bruke den aritmetiske middelformelen.

Gjennomsnittlig inntektsnivå fra kjernevirksomhet i 4 år:

Gjennomsnittlig absolutt økning beregnet med formelen:

hvor n er antall nivåer i serien.

I gjennomsnitt for året økte inntektene fra kjerneaktiviteter med 3,333 millioner rubler.

Gjennomsnittlig årlig vekstrate beregnet ved hjelp av den geometriske gjennomsnittsformelen:

уn er det siste nivået i raden,

y0 er startnivået i serien.

Tu = 100 % = 102,174 %

Gjennomsnittlig årlig vekstrate beregnet med formelen:

T? = Tu - 100 % = 102,74 % - 100 % = 2,74 %.

I gjennomsnitt over året økte inntektene fra hovedvirksomheten til foretaket med 2,74 %.

OPPGAVEREN4

Kalkulere:

1. Individuelle prisindekser;

2. Generell handelsomsetningsindeks;

3. Samlet prisindeks;

4. Samlet indeks over det fysiske volumet av salg av varer;

5. Bryt ned den absolutte økningen i verdien av handelsomsetningen etter faktorer (på grunn av endringer i priser og antall solgte varer);

6. Lag korte konklusjoner for alle innhentede indikatorer.

Løsning

1. I henhold til betingelsen, individuelle indekser prisene for produktene A, B, C utgjorde -

ipA=1,20; iрБ=1,15; iрВ=1,00.

2. Vi vil beregne den generelle handelsomsetningsindeksen ved å bruke formelen:

I w = = 1470/1045*100 % = 140,67 %

Handelsomsetningen økte med 40,67 % (140,67 %-100 %).

I gjennomsnitt økte råvareprisene med 10,24 %.

Mengden ekstrakostnader for kjøpere fra prisøkninger:

w(p) = ? p1q1 - ? p0q1 = 1470 - 1333,478 = 136,522 millioner rubler.

Som et resultat av stigende priser måtte kjøpere bruke ytterligere 136,522 millioner rubler.

4. Generell indeks for fysisk volum av handelsomsetning:

Det fysiske volumet av omsetningen økte med 27,61 %.

5. La oss definere generell endring omsetning i andre periode sammenlignet med første periode:

w = 1470-1045 = 425 millioner rubler.

på grunn av prisendringer:

W(p) = 1470 - 1333.478 = 136.522 millioner rubler.

på grunn av endringer i fysisk volum:

w(q) = 1333.478 - 1045 = 288.478 millioner rubler.

Vareomsetningen økte med 40,67 %. Prisene i gjennomsnitt for 3 varer økte med 10,24 %. Det fysiske volumet av omsetningen økte med 27,61 %.

Generelt økte salgsvolumet med 425 millioner rubler, inkludert på grunn av stigende priser, økte det med 136,522 millioner rubler, og på grunn av en økning i salgsvolum - med 288,478 millioner rubler.

OPPGAVE5

Følgende data er tilgjengelig for 10 fabrikker i en bransje.

Anleggsnummer

Produktutgang, tusen stk. (X)

Basert på gitte data:

I) for å bekrefte bestemmelsene for logisk analyse om tilstedeværelsen av en lineær korrelasjon mellom faktorkarakteristikken (produktvolum) og den resulterende karakteristikken (elektrisitetsforbruk), plott de første dataene på grafen til korrelasjonsfeltet og trekk konklusjoner om formen av forholdet, angi formelen;

2) bestemme parametrene til forbindelsesligningen og plott den resulterende teoretiske linjen på grafen til korrelasjonsfeltet;

3) beregne den lineære korrelasjonskoeffisienten,

4) forklare betydningen av indikatorene oppnådd i avsnitt 2) og 3);

5) ved å bruke den resulterende modellen, lag en prognose om mulig energiforbruk ved et anlegg med et produksjonsvolum på 4,5 tusen enheter.

Løsning

Dataene til attributtet - produksjonsvolumet (faktor), vil bli betegnet med xi; skilt - strømforbruk (resultat) gjennom уi; punkter med koordinater (x, y) er plottet på korrelasjonsfeltet OXY.

Punktene til korrelasjonsfeltet er plassert langs en viss rett linje. Derfor er forholdet lineært vil vi se etter en regresjonsligning i form av en rett linje Уx=ax+b. For å finne det bruker vi systemet med normale ligninger:

La oss lage en beregningstabell.

Ved å bruke de funnet gjennomsnittene, komponerer vi et system og løser det med hensyn til parameterne a og b:

Så vi får regresjonsligningen for y på x: = 3,57692 x + 3,19231

Vi bygger en regresjonslinje på korrelasjonsfeltet.

Ved å erstatte x-verdiene fra kolonne 2 inn i regresjonsligningen, får vi de beregnede (kolonne 7) og sammenligner dem med y-dataene, som gjenspeiles i kolonne 8. For øvrig bekreftes riktigheten av beregningene av sammenfallet av gjennomsnittsverdiene av y og.

Koeffisientlineær korrelasjon vurderer nærheten til forholdet mellom egenskapene x og y og beregnes ved hjelp av formelen

Vinkelkoeffisienten for direkte regresjon a (ved x) karakteriserer retningen til den identifiserteavhengighetertegn: for a>0 er de like, for a<0- противоположны. Det er absolutt verdi - et mål på endring i den resulterende karakteristikken når faktorkarakteristikken endres med en måleenhet.

Den frie termen for den direkte regresjonen avslører retningen, og dens absolutte verdi er et kvantitativt mål på påvirkningen av alle andre faktorer på det resulterende tegnet.

Hvis< 0, så brukes ressursen til faktoren som er karakteristisk for et individuelt objekt med mindre, og når>0 Medstørre effektivitet enn gjennomsnittet for hele settet med objekter.

La oss gjennomføre en post-regresjonsanalyse.

Koeffisienten ved x av den direkte regresjonen er lik 3,57692 >0, derfor, med en økning (reduksjon) i produksjonsproduksjonen, øker (minker) elektrisitetsforbruket. Økning i produksjonsproduksjon med 1 tusen enheter. gir en gjennomsnittlig økning i strømforbruket med 3,57692 tusen kWh.

2. Fritiden for den direkte regresjonen er lik 3.19231, derfor øker påvirkningen av andre faktorer effekten av produktproduksjon på elektrisitetsforbruket i absolutte termer med 3.19231 tusen kWh.

3. Korrelasjonskoeffisienten på 0,8235 avslører en svært nær avhengighet av elektrisitetsforbruk på produktproduksjon.

Det er enkelt å lage spådommer ved å bruke regresjonsmodellligningen. For å gjøre dette erstattes verdiene av x - produksjonsvolumet - inn i regresjonsligningen, og elektrisitetsforbruk forutses. I dette tilfellet kan verdiene til x tas ikke bare innenfor et gitt område, men også utenfor det.

La oss lage en prognose om mulig energiforbruk ved et anlegg med et produksjonsvolum på 4,5 tusen enheter.

3,57692*4,5 + 3,19231= 19,288 45 tusen kWh.

LISTE OVER BRUKT KILDER

1. Zakharenkov S.N. Samfunnsøkonomisk statistikk: Lærebok og praktisk veiledning. -Mn.: BSEU, 2002.

2. Efimova M.R., Petrova E.V., Rumyantsev V.N. Generell teori statistikk. - M.: INFRA - M., 2000.

3. Eliseeva I.I. Statistikk. - M.: Prospekt, 2002.

4. Generell teori om statistikk / Under generelt. utg. O.E. Bashina, A.A. Spirina. - M.: Finans og statistikk, 2000.

5. Samfunnsøkonomisk statistikk: Pedagogisk og praktisk. godtgjørelse / Zakharenkov S.N. og andre - Mn.: Yerevan State University, 2004.

6. Samfunnsøkonomisk statistikk: Lærebok. godtgjørelse. / Red. Nesterovich S.R. - Mn.: BSEU, 2003.

7. Teslyuk I.E., Tarlovskaya V.A., Terlizhenko N. Statistics - Minsk, 2000.

8. Kharchenko L.P. Statistikk. - M.: INFRA - M, 2002.

9. Kharchenko L.P., Dolzhenkova V.G., Ionin V.G. Statistikk. - M.: INFRA - M, 1999.

10. Økonomisk statistikk / Utg. Yu.N. Ivanova - M., 2000.

Skrevet på Allbest.ru

...

Lignende dokumenter

    Beregning av det aritmetiske gjennomsnittet for en intervallfordelingsserie. Definisjon generell indeks fysisk volum av handelsomsetning. Analyse av den absolutte endringen i de totale produksjonskostnadene på grunn av endringer i fysisk volum. Beregning av variasjonskoeffisienten.

    test, lagt til 19.07.2010

    Essensen av engros, detaljhandel og offentlig handel. Formler for beregning av individuelle og aggregerte omsetningsindekser. Beregning av karakteristikker for en intervallfordelingsserie - aritmetisk gjennomsnitt, modus og median, variasjonskoeffisient.

    kursarbeid, lagt til 05.10.2013

    Beregning av planlagt og faktisk salgsvolum, prosentandel av planoppfyllelse, absolutt endring i omsetning. Fastsettelse av absolutt vekst, gjennomsnittlig vekstrater og økning i kontantinntekter. Beregning av strukturelle gjennomsnitt: moduser, medianer, kvartiler.

    test, lagt til 24.02.2012

    Intervallserie for fordeling av banker etter overskuddsvolum. Finne modusen og medianen til den resulterende intervallfordelingsserien ved hjelp av en grafisk metode og ved beregninger. Beregning av karakteristikker for intervallfordelingsserier. Beregning av det aritmetiske gjennomsnittet.

    test, lagt til 15.12.2010

    Formler for å bestemme gjennomsnittsverdiene for en intervallserie - moduser, medianer, spredning. Beregning av analytiske indikatorer for dynamikkserier ved hjelp av kjede- og grunnleggende skjemaer, vekstrater og inkrementer. Konseptet med en konsolidert indeks over kostnader, priser, utgifter og omsetning.

    kursarbeid, lagt til 27.02.2011

    Konsept og formål, rekkefølge og regler for å konstruere en variasjonsserie. Analyse av datahomogenitet i grupper. Indikatorer for variasjon (fluktuasjon) av en egenskap. Bestemmelse av lineært gjennomsnitt og kvadratavvik, oscillasjonskoeffisient og variasjon.

    test, lagt til 26.04.2010

    Konseptet med modus og median som typiske egenskaper, rekkefølgen og kriteriene for deres bestemmelse. Finne modus og median i diskrete og intervallvariasjonsserier. Kvartiler og desiler som tilleggsegenskaper for variasjon statistiske serier.

    test, lagt til 09.11.2010

    Konstruksjon av en intervallfordelingsserie basert på grupperingsegenskaper. Kjennetegn på avviket i frekvensfordelingen fra en symmetrisk form, beregning av kurtose og asymmetriindikatorer. Analyse av indikatorer balanse eller resultatregnskap.

    test, lagt til 19.10.2014

    Konvertering av empiriske serier til diskrete serier og intervallserier. Bestemmelse av gjennomsnittsverdien for en diskret serie ved bruk av dens egenskaper. Beregning ved hjelp av en diskret serie av modus, median, variasjonsindikatorer (spredning, avvik, oscillasjonskoeffisient).

    test, lagt til 17.04.2011

    Konstruksjon av en statistisk serie av distribusjon av organisasjoner. Grafisk bestemmelse av modus og medianverdier. Korrelasjonens nærhet ved bruk av bestemmelseskoeffisienten. Definisjon av prøvetakingsfeil gjennomsnittlig antall arbeidere.

Hvis den tilfeldige variabelen som studeres er kontinuerlig, tillater rangering og gruppering av observerte verdier ofte ikke identifisering karakteristiske trekkå variere verdiene. Dette forklares av det faktum at individuelle verdier av en tilfeldig variabel kan avvike fra hverandre så lite som ønsket, og derfor kan identiske verdier av en mengde sjelden forekomme i totalen av observerte data, og frekvensene til varianter skiller seg lite fra hverandre.

Det er også upraktisk å konstruere en diskret serie for en diskret tilfeldig variabel, hvor antallet mulige verdier er stort. I slike tilfeller bør du bygge intervallvariasjonsserier distribusjoner.

For å konstruere en slik serie, er hele variasjonsintervallet til de observerte verdiene til en tilfeldig variabel delt inn i en serie delintervaller og telle frekvensen av forekomsten av verdiverdiene i hvert delintervall.

Intervallvariasjonsserie kall et ordnet sett med intervaller med varierende verdier av en tilfeldig variabel med tilsvarende frekvenser eller relative frekvenser av verdier til variabelen som faller inn i hver av dem.

For å bygge en intervallserie trenger du:

  1. definere størrelse delintervaller;
  2. definere bredde intervaller;
  3. angi det for hvert intervall topp Og nedre grense ;
  4. grupper observasjonsresultatene.

1 . Spørsmålet om å velge antall og bredde på grupperingsintervaller må løses i hver konkret tilfelle basert på mål forske, volum prøver og grad av variasjon karakteristisk i prøven.

Omtrent antall intervaller k kan kun estimeres basert på utvalgsstørrelse n en av følgende metoder:

  • i henhold til formelen Sturges : k = 1 + 3,32 log n ;
  • ved hjelp av tabell 1.

Tabell 1

2 . Områder med lik bredde er generelt foretrukket. For å bestemme bredden på intervaller h kalkulere:

  • variasjonsspekter R - eksempelverdier: R = x maks - x min ,

Hvor xmax Og xmin - maksimum og minimum prøvetakingsalternativer;

  • bredden på hvert intervall h bestemt av følgende formel: h = R/k .

3 . Nedre grense første intervall x h1 er valgt slik at minimumsprøvealternativet xmin falt omtrent midt i dette intervallet: x h1 = x min - 0,5 t .

Mellomintervaller oppnås ved å legge til lengden på delintervallet til slutten av forrige intervall h :

x hei = x hi-1 +h.

Konstruksjonen av en intervallskala basert på beregning av intervallgrenser fortsetter inntil verdien x hei tilfredsstiller forholdet:

x hei< x max + 0,5·h .

4 . I samsvar med intervallskalaen er de karakteristiske verdiene gruppert - for hvert delintervall beregnes summen av frekvenser n i alternativ inkludert i jeg intervall. I dette tilfellet inkluderer intervallet verdier av den tilfeldige variabelen større enn eller lik den nedre grensen og mindre enn øvre grense intervall.

Polygon og histogram

For klarhetens skyld er det konstruert ulike statistiske distribusjonsgrafer.

Basert på data fra en diskret variasjonsserie konstruerer de polygon frekvenser eller relative frekvenser.

Frekvens polygon x 1 ; n 1 ), (x 2 ; n 2 ), ..., (x k ; n k ). For å konstruere en frekvenspolygon, plottes alternativer på abscisseaksen. x i , og på ordinaten - de tilsvarende frekvensene n i . Poeng ( x i ; n i ) er forbundet med rette segmenter og en frekvenspolygon oppnås (fig. 1).

Polygon med relative frekvenser kalt en brutt linje hvis segmenter forbinder punkter ( x 1 ; W 1 ), (x 2 ; W 2 ), ..., (x k ; Wk ). For å konstruere en polygon med relative frekvenser, plottes alternativer på abscisseaksen x i , og på ordinaten - de tilsvarende relative frekvensene W i . Poeng ( x i ; W i ) er forbundet med rette segmenter og en polygon med relative frekvenser oppnås.

I tilfelle kontinuerlig tegn det er lurt å bygge histogram .

Frekvenshistogram kalt en trinnformet figur som består av rektangler, hvis basis er delvis lengdeintervaller h , og høydene er lik forholdet NIH (frekvenstetthet).

For å konstruere et frekvenshistogram legges delintervaller ut på abscisseaksen, og segmenter parallelle med abscisseaksen tegnes over dem på avstand NIH .