Statistische distributiereeks. Laten we een statistische reeks van distributie bouwen

groepering- dit is de verdeling van de bevolking in groepen die op de een of andere manier homogeen zijn.

Dienstopdracht. Met de online rekenmachine kunt u:

  • een variatiereeks bouwen, bouw een histogram en een veelhoek;
  • indicatoren van variatie vinden (gemiddelde, modus (inclusief grafisch), mediaan, variatiebereik, kwartielen, decielen, kwartielcoëfficiënt van differentiatie, variatiecoëfficiënt en andere indicatoren);

Instructie. Om een ​​reeks te groeperen, moet u het type van de resulterende variatiereeks selecteren (discreet of interval) en de hoeveelheid gegevens specificeren (aantal rijen). De resulterende oplossing wordt opgeslagen in een Word-bestand (zie het voorbeeld van het groeperen van statistische gegevens).

Aantal invoergegevens
",0);">

Als de groepering al is gedaan en de discrete variatiereeks of interval serie, dan moet u de online rekenmachine Variatie-indicatoren gebruiken. Het testen van de hypothese over het type verdeling geproduceerd met behulp van de dienst Studie van de vorm van distributie.

Soorten statistische groeperingen

Variatie serie. Bij waarnemingen van een discrete willekeurige variabele kan dezelfde waarde meerdere keren worden aangetroffen. Dergelijke waarden van een willekeurige variabele x i worden geregistreerd en geven het aantal keren aan dat het in n waarnemingen voorkomt, dit is de frequentie van deze waarde.
In het geval van een continue stochastische variabele wordt in de praktijk gegroepeerd.
  1. typologische groepering- dit is de verdeling van de bestudeerde kwalitatief heterogene populatie in klassen, socio-economische types, homogene groepen van eenheden. Gebruik de parameter Discrete variatiereeksen om deze groepering op te bouwen.
  2. Structurele groepering heet, waarin een homogene populatie is verdeeld in groepen die de structuur kenmerken volgens een variërend kenmerk. Gebruik de parameter Intervalreeks om deze groepering op te bouwen.
  3. Een groepering die de relatie tussen de bestudeerde verschijnselen en hun kenmerken onthult, wordt genoemd analytische groep(zie analytische groepering van reeksen).

Principes voor het maken van statistische groeperingen

Een reeks waarnemingen in oplopende volgorde wordt een variatiereeks genoemd. groeperingsteken is het teken waarmee de bevolking in afzonderlijke groepen wordt verdeeld. Het wordt de basis van de groep genoemd. Groepering kan gebaseerd zijn op zowel kwantitatieve als kwalitatieve kenmerken.
Na het bepalen van de basis van de groepering, moet worden beslist over het aantal groepen waarin de onderzoekspopulatie moet worden verdeeld.

Bij het gebruik van personal computers voor het verwerken van statistische gegevens, wordt de groepering van eenheden van een object uitgevoerd met behulp van standaardprocedures.
Een dergelijke procedure is gebaseerd op het gebruik van de Sturgess-formule om het optimale aantal groepen te bepalen:

k = 1+3.322*lg(N)

Waar k het aantal groepen is, is N het aantal bevolkingseenheden.

De lengte van de partiële intervallen wordt berekend als h=(x max -x min)/k

Tel vervolgens het aantal treffers van waarnemingen in deze intervallen, die als frequenties ni worden genomen. Weinig frequenties waarvan de waarden kleiner zijn dan 5 (n i< 5), следует объединить. в этом случае надо объединить и соответствующие интервалы.
De middelpunten van de intervallen x i =(c i-1 +c i)/2 worden als nieuwe waarden genomen.

Ze worden gepresenteerd in de vorm van distributiereeksen en zijn opgemaakt als .

Een distributiereeks is een type groepering.

Distributiebereik:- vertegenwoordigt een geordende verdeling van eenheden van de bestudeerde populatie in groepen volgens een bepaald variërend kenmerk.

Afhankelijk van de eigenschap die ten grondslag ligt aan de vorming van een distributiereeks, zijn er: attributief en variatief distributie rangen:

  • attributief- noem de distributiereeksen gebouwd op kwalitatieve gronden.
  • Distributiereeksen die zijn opgebouwd in oplopende of aflopende volgorde van waarden van een kwantitatief kenmerk worden genoemd variabel.
De variatiereeks van de verdeling bestaat uit twee kolommen:

De eerste kolom bevat de kwantitatieve waarden van het variabele kenmerk, die worden genoemd opties en zijn gemarkeerd. Discrete variant - uitgedrukt als een geheel getal. De intervaloptie ligt in het bereik van en tot. Afhankelijk van het type varianten is het mogelijk om een ​​discrete of intervalvariatiereeks te construeren.
De tweede kolom bevat aantal specifieke optie, uitgedrukt in frequenties of frequenties:

Frequenties- dit zijn absolute getallen die aangeven hoe vaak de gegeven waarde van het kenmerk in totaal voorkomt, wat aangeeft . De som van alle frequenties moet gelijk zijn aan het aantal eenheden van de gehele populatie.

Frequenties() zijn de frequenties uitgedrukt als een percentage van het totaal. De som van alle frequenties uitgedrukt als een percentage moet gelijk zijn aan 100% in fracties van één.

Grafische weergave van distributiereeksen

De distributiereeksen worden gevisualiseerd met behulp van grafische afbeeldingen.

De distributiereeksen worden weergegeven als:
  • Veelhoek
  • Histogrammen
  • cumuleert
  • ogives

Veelhoek

Bij het construeren van een veelhoek worden op de horizontale as (abscis) de waarden van het variabele attribuut uitgezet en op de verticale as (ordinaat) - frequenties of frequenties.

De veelhoek in afb. 6.1 werd gebouwd volgens de micro-telling van de bevolking van Rusland in 1994.

6.1. Verdeling van huishoudens naar grootte

Voorwaarde: Gegevens worden gegeven over de verdeling van 25 werknemers van een van de ondernemingen per tariefklasse:
4; 2; 4; 6; 5; 6; 4; 1; 3; 1; 2; 5; 2; 6; 3; 1; 2; 3; 4; 5; 4; 6; 2; 3; 4
Een taak: Bouw een discrete variatiereeks en geef deze grafisch weer als een distributiepolygoon.
Oplossing:
In dit voorbeeld zijn de opties de looncategorie van de werknemer. Om de frequenties te bepalen, is het noodzakelijk om het aantal werknemers met de juiste looncategorie te berekenen.

De veelhoek wordt gebruikt voor discrete variatiereeksen.

Om een ​​distributiepolygoon (Fig. 1) te bouwen, langs de abscis (X), plotten we de kwantitatieve waarden van de variërende eigenschap - varianten, en langs de ordinaat - frequenties of frequenties.

Als de karakteristieke waarden worden uitgedrukt als intervallen, dan wordt zo'n reeks een intervalreeks genoemd.
interval serie verdelingen worden grafisch weergegeven als een histogram, cumulatief of ogive.

Statistische tabel

Voorwaarde: Gegevens over de omvang van deposito's van 20 personen in één bank (duizend roebel) 60; 25; 12; tien; 68; 35; 2; 17; 51; 9; 3; 130; 24; 85; 100; 152; 6; achttien; 7; 42.
Een taak: Bouw een intervalvariatiereeks met gelijke intervallen.
Oplossing:

  1. De initiële populatie bestaat uit 20 eenheden (N = 20).
  2. Met behulp van de Sturgess-formule bepalen we het benodigde aantal gebruikte groepen: n=1+3.322*lg20=5
  3. Laten we de waarde van het gelijke interval berekenen: i=(152 - 2) /5 = 30 duizend roebel
  4. We verdelen de initiële populatie in 5 groepen met een interval van 30 duizend roebel.
  5. De groepsresultaten worden weergegeven in de tabel:

Bij een dergelijke opname van een continu kenmerk, wanneer dezelfde waarde twee keer voorkomt (als de bovengrens van het ene interval en de ondergrens van een ander interval), dan behoort deze waarde tot de groep waar deze waarde als bovengrens fungeert.

staafdiagram

Om een ​​histogram langs de abscis te construeren, geeft u de waarden van de grenzen van de intervallen aan en construeert u op basis daarvan rechthoeken waarvan de hoogte evenredig is met de frequenties (of frequenties).

Op afb. 6.2. het histogram van de verdeling van de bevolking van Rusland in 1997 naar leeftijdsgroepen wordt getoond.

Rijst. 6.2. Verdeling van de bevolking van Rusland naar leeftijdsgroepen

Voorwaarde: De verdeling van 30 werknemers van het bedrijf volgens de grootte van het maandsalaris wordt gegeven

Een taak: Geef de intervalvariatiereeksen grafisch weer als een histogram en cumuleer.
Oplossing:

  1. De onbekende grens van het open (eerste) interval wordt bepaald door de waarde van het tweede interval: 7000 - 5000 = 2000 roebel. Met dezelfde waarde vinden we de ondergrens van het eerste interval: 5000 - 2000 = 3000 roebel.
  2. Om een ​​histogram te construeren in een rechthoekig coördinatensysteem, langs de as van de abscis, zetten we segmenten opzij waarvan de waarden overeenkomen met de intervallen van de variantrij.
    Deze segmenten dienen als de onderste basis en de corresponderende frequentie (frequentie) dient als de hoogte van de gevormde rechthoeken.
  3. Laten we een histogram maken:

Om het cumulatief te construeren, is het noodzakelijk om de geaccumuleerde frequenties (frequenties) te berekenen. Ze worden bepaald door opeenvolgende sommatie van de frequenties (frequenties) van de voorgaande intervallen en worden aangeduid met S. De geaccumuleerde frequenties geven aan hoeveel eenheden van de populatie een kenmerkwaarde hebben die niet groter is dan die in kwestie.

cumuleren

De verdeling van een eigenschap in een variatiereeks volgens de geaccumuleerde frequenties (frequenties) wordt weergegeven met behulp van de cumulate.

cumuleren of de cumulatieve curve, in tegenstelling tot de veelhoek, is gebouwd op de geaccumuleerde frequenties of frequenties. Tegelijkertijd worden de waarden van het kenmerk op de as van de abscis geplaatst en worden de geaccumuleerde frequenties of frequenties op de ordinaat-as geplaatst (Fig. 6.3).

Rijst. 6.3. Cumulatieve verdeling van huishoudens naar grootte

4. Bereken de geaccumuleerde frequenties:
De kniefrequentie van het eerste interval wordt als volgt berekend: 0 + 4 = 4, voor het tweede: 4 + 12 = 16; voor de derde: 4 + 12 + 8 = 24, enz.

Bij het construeren van het cumulatief wordt de geaccumuleerde frequentie (frequentie) van het overeenkomstige interval toegewezen aan de bovengrens:

Ogiva

Ogiva is op dezelfde manier geconstrueerd als cumuleren met het enige verschil dat de geaccumuleerde frequenties op de as van de abscis worden geplaatst en de kenmerkwaarden op de ordinaat-as.

Een variatie van het cumulatieve is de concentratiecurve of Lorenzplot. Om de concentratiecurve uit te zetten, worden beide assen van het rechthoekige coördinatensysteem geschaald als een percentage van 0 tot 100. In dit geval geven de abscis-assen de geaccumuleerde frequenties aan en de ordinaat-assen de geaccumuleerde waarden van het aandeel (in procent) door het volume van de functie.

De uniforme verdeling van het teken komt overeen met de diagonaal van het vierkant in de grafiek (Fig. 6.4). Bij ongelijkmatige verdeling is de grafiek een concave curve, afhankelijk van het concentratieniveau van de eigenschap.

6.4. concentratiecurve

2. Het concept van distributiereeksen. Discrete en intervalverdelingsreeksen

distributierijen Er worden groeperingen van een speciaal type genoemd, waarin voor elk attribuut, attributengroep of attributenklasse het aantal eenheden in de groep of het aandeel van dit aantal in het totaal bekend is. Die. distributie serie– een geordende set attribuutwaarden gerangschikt in oplopende of aflopende volgorde met hun bijbehorende gewichten. Distributiereeksen kunnen worden opgebouwd op basis van kwantitatief of attribuut.

Distributiereeksen die op kwantitatieve basis zijn gebouwd, worden variatiereeksen genoemd. Zij zijn discreet en interval. Een distributiereeks kan worden gebouwd op een continu variërende feature (wanneer een feature binnen een interval willekeurige waarden kan aannemen) en op een discreet variërende feature (neemt strikt gedefinieerde integer-waarden in).

discreet de variabele distributiereeks is een reeks van varianten met hun corresponderende frequenties of bijzonderheden. Varianten van een discrete reeks zijn discreet discontinu veranderende waarden van een teken, meestal is dit het resultaat van een telling.

Discreet

variatiereeksen worden meestal gebouwd als de waarden van de eigenschap die wordt bestudeerd, op zijn minst een eindige waarde van elkaar kunnen verschillen. In discrete series worden puntwaarden van een feature gespecificeerd. Voorbeeld : Verdeling van herenpakken verkocht door winkels per maand naar maat.

interval

een variatiereeks is een geordende reeks variatieintervallen van de waarden van een willekeurige variabele met de bijbehorende frequenties of frequenties van de waarden van de hoeveelheid die in elk van hen valt. Intervalseries zijn ontworpen om de verdeling van een continu veranderende functie te analyseren, waarvan de waarde meestal wordt vastgelegd door meting of weging. Varianten van zo'n rij is een groepering.

Voorbeeld : Verdeling van de aankopen in de supermarkt naar bedrag.

Als in discrete variatiereeksen de frequentierespons direct verwijst naar de variant van de reeks, dan in intervalreeksen naar de groep varianten.

Het is handig om de distributiereeksen te analyseren met behulp van hun grafische weergave, wat het mogelijk maakt om zowel de vorm van de distributie als de patronen te beoordelen. Een discrete reeks wordt op de kaart weergegeven als een onderbroken lijn - verspreidingsgebied. Om het in een rechthoekig coördinatensysteem te bouwen, worden de gerangschikte (geordende) waarden van het variërende attribuut op dezelfde schaal op de abscis uitgezet en de schaal voor het uitdrukken van frequenties langs de ordinaat.

Intervalreeksen worden weergegeven als: distributiehistogrammen(d.w.z. staafdiagrammen).

Bij het construeren van een histogram worden de waarden van de intervallen uitgezet op de as van de abscis en worden de frequenties weergegeven door rechthoeken die zijn gebouwd op de overeenkomstige intervallen. De hoogte van de kolommen bij gelijke intervallen dient evenredig te zijn met de frequenties.

Elk histogram kan worden omgezet in een veelhoek van verdelingen; hiervoor is het noodzakelijk om de hoekpunten van zijn rechthoeken te verbinden met rechte segmenten.

2. Indexmethode voor het analyseren van de impact van gemiddelde output en gemiddeld personeelsbestand op veranderingen in output

Indexmethode wordt gebruikt om de dynamiek te analyseren en algemene indicatoren te vergelijken, evenals factoren die van invloed zijn op de verandering in de niveaus van deze indicatoren. Met behulp van indices is het mogelijk om de invloed van de gemiddelde output en de gemiddelde personeelsbezetting op veranderingen in het productievolume zichtbaar te maken. Dit probleem wordt opgelost door een systeem van analytische indices te construeren.

De index van het productievolume met de index van het gemiddeld aantal werknemers en de index van de gemiddelde output is op dezelfde manier gerelateerd als het productievolume (Q) is gerelateerd aan de output ( w) en nummer ( r) .

We kunnen concluderen dat het productievolume gelijk zal zijn aan het product van de gemiddelde output en het gemiddelde personeelsbestand:

Q = w r, waarbij Q het productievolume is,

w - gemiddelde output,

r is het gemiddelde personeelsbestand.

Zoals je kunt zien, hebben we het over de relatie van verschijnselen in statica: het product van twee factoren geeft het totale volume van het resulterende fenomeen. Het is ook duidelijk dat deze verbinding functioneel is, daarom wordt de dynamiek van deze verbinding bestudeerd met behulp van indices. Voor het gegeven voorbeeld is dit het volgende systeem:

J w × J r = J wr .

De index van het productievolume Jwr, als index van een resulterend fenomeen, kan bijvoorbeeld worden ontleed in twee indexfactoren: de index van de gemiddelde productie (Jw) en de index van het gemiddelde personeelsbestand (Jr):

Index Index Index

het volume van het gemiddelde

productie output sterkte:

waar J met wie- arbeidsproductiviteitsindex berekend met de Laspeyres-formule;

J r- index van het aantal werknemers, berekend volgens de Paasche-formule.

Indexsystemen worden gebruikt om de invloed van individuele factoren op de vorming van het niveau van de effectieve indicator te bepalen, ze maken het mogelijk om de waarde van het onbekende te bepalen aan de hand van 2 bekende indexwaarden.

Op basis van het bovenstaande systeem van indexen kan men ook de absolute toename van het productievolume vinden, ontleed in de invloed van factoren.

1. Totale toename van het productievolume:

∆wr = ∑w 1 r 1 - ∑w 0 r 0 .

2. Groei door de actie van de indicator gemiddelde output:

∆wr/w = ∑w 1 r 1 - ∑w 0 r 1 .

3. Groei door de actie van de indicator van het gemiddelde personeelsbestand:

∆wr/r = ∑w 0 r 1 - ∑w 0 r 0

∆wr = ∆wr/w + ∆wr/r.

Voorbeeld. De volgende informatie is bekend:

We kunnen vaststellen hoe het productievolume relatief en absoluut is veranderd en hoe individuele factoren deze verandering hebben beïnvloed.

Het productievolume bedroeg:

in de basisperiode

w 0 * r 0 \u003d 2000 * 90 \u003d 180000,

en in de rapportage

w 1 * r 1 \u003d 2100 * 100 \u003d 210000.

Daardoor steeg het productievolume met 30.000 of 1,16%.

∆wr=∑w 1 r 1 -∑w 0 r 0= (210000-180000)=30000

of (210000:180000)*100%=1,16%.

Deze verandering in het productievolume was te wijten aan:

1) een stijging van het gemiddelde personeelsbestand met 10 personen of met 111,1%

r 1 / r 0 \u003d 100 / 90 \u003d 1,11 of 111,1%.

In absolute termen is door deze factor het productievolume met 20.000 toegenomen:

w 0 r 1 - w 0 r 0 \u003d w 0 (r 1 -r 0) \u003d 2000 (100-90) \u003d 20000.

2) een stijging van de gemiddelde output met 105% of met 10.000:

w 1 r 1 / w 0 r 1 \u003d 2100 * 100 / 2000 * 100 \u003d 1,05 of 105%.

In absolute termen is de stijging:

w 1 r 1 - w 0 r 1 \u003d (w 1 -w 0) r 1 \u003d (2100-2000) * 100 \u003d 10000.

De gecombineerde invloed van factoren was dus:

1. In absolute termen

10000 + 20000 = 30000

2. In relatieve termen

1,11 * 1,05 = 1,16 (116%)

De stijging is dus 1,16%. Beide resultaten zijn eerder behaald.

Het woord "index" in vertaling betekent aanwijzer, indicator. In de statistieken wordt de index geïnterpreteerd als een relatieve indicator die de verandering in een fenomeen in tijd, ruimte of in vergelijking met het plan kenmerkt. Aangezien de index een relatieve waarde is, stemmen de namen van de indices overeen met de namen van de relatieve waarden.

In die gevallen waarin we de verandering in de tijd van de vergeleken producten analyseren, kunnen we de vraag stellen hoe de componenten van de index (prijs, fysiek volume, productiestructuur of verkoop van individuele soorten producten) veranderen onder verschillende omstandigheden (in verschillende regios). In dit opzicht worden indices van constante samenstelling, variabele samenstelling en structurele verschuivingen gebouwd.

Permanente (vaste) samenstellingsindex - dit is een index die de dynamiek van de gemiddelde waarde kenmerkt bij dezelfde vaste structuur van de populatie.

Het principe van het construeren van een index van constante samenstelling is om de invloed van veranderingen in de structuur van gewichten op de geïndexeerde waarde te elimineren door het gewogen gemiddelde niveau van de geïndexeerde indicator met dezelfde gewichten te berekenen.

De index van constante samenstelling is qua vorm identiek aan de geaggregeerde index. De geaggregeerde vorm is de meest voorkomende.

De constante samenstellingsindex wordt berekend met gewichten die zijn vastgesteld op het niveau van een van elke periode en toont alleen de verandering in de geïndexeerde waarde. De constante samenstellingsindex elimineert de invloed van veranderingen in de structuur van gewichten op de geïndexeerde waarde door het gewogen gemiddelde niveau van de geïndexeerde indicator met dezelfde gewichten te berekenen. In indices van constante samenstelling worden indicatoren vergeleken die berekend zijn op basis van een constante structuur van verschijnselen.

De belangrijkste fase in de studie van sociaal-economische verschijnselen en processen is de systematisering van primaire gegevens en op basis hiervan het verkrijgen van een samenvattend kenmerk van het gehele object met behulp van generaliserende indicatoren, wat wordt bereikt door primair statistisch materiaal samen te vatten en te groeperen.

Statistisch overzicht - dit is een complex van opeenvolgende bewerkingen om specifieke afzonderlijke feiten die een set vormen te generaliseren, om typische kenmerken en patronen te identificeren die inherent zijn aan het fenomeen dat als geheel wordt bestudeerd. Het maken van een statistische samenvatting omvat de volgende stappen: :

  • keuze van groeperingsfunctie;
  • bepaling van de volgorde van vorming van groepen;
  • ontwikkeling van een systeem van statistische indicatoren om groepen en het object als geheel te karakteriseren;
  • ontwikkeling van lay-outs van statistische tabellen voor het presenteren van samenvattende resultaten.

Statistische groepering noemde de verdeling van eenheden van de bestudeerde populatie in homogene groepen volgens bepaalde kenmerken die voor hen essentieel zijn. Groeperingen zijn de belangrijkste statistische methode voor het samenvatten van statistische gegevens, de basis voor de juiste berekening van statistische indicatoren.

Er zijn de volgende soorten groeperingen: typologisch, structureel, analytisch. Al deze groeperingen zijn verenigd door het feit dat de eenheden van het object volgens een of ander kenmerk in groepen zijn verdeeld.

groeperingsteken wordt het teken genoemd waarmee de eenheden van de bevolking in afzonderlijke groepen worden verdeeld. De conclusies van een statistisch onderzoek zijn afhankelijk van de juiste keuze van een groeperingsattribuut. Als basis voor groepering is het noodzakelijk om significante, theoretisch onderbouwde kenmerken (kwantitatief of kwalitatief) te gebruiken.

Kwantitatieve tekenen van groepering een numerieke uitdrukking hebben (handelsvolume, leeftijd van een persoon, gezinsinkomen, enz.), en kwalitatieve kenmerken van de groepering de staat van de bevolkingseenheid weergeven (geslacht, burgerlijke staat, branchegebondenheid van de onderneming, haar eigendomsvorm, enz.).

Nadat de basis van de groepering is bepaald, moet worden beslist over het aantal groepen waarin de onderzoekspopulatie moet worden verdeeld. Het aantal groepen hangt af van de doelstellingen van het onderzoek en het type indicator dat aan de groepering ten grondslag ligt, het volume van de populatie, de mate van variatie van de eigenschap.

Zo houdt de groepering van ondernemingen volgens de eigendomsvormen rekening met gemeentelijk, federaal en eigendom van de onderdanen van de federatie. Als de groepering wordt uitgevoerd volgens een kwantitatief kenmerk, moet speciale aandacht worden besteed aan het aantal eenheden van het bestudeerde object en de mate van fluctuatie van het groeperingskenmerk.

Wanneer het aantal groepen is bepaald, moeten de groeperingsintervallen worden bepaald. Interval - dit zijn de waarden van een variabele eigenschap die binnen bepaalde grenzen liggen. Elk interval heeft zijn eigen waarde, boven- en ondergrenzen, of ten minste één ervan.

De ondergrens van het interval wordt de kleinste waarde van het attribuut in het interval genoemd, en bovengrens - de grootste waarde van het attribuut in het interval. De intervalwaarde is het verschil tussen de boven- en ondergrens.

Groepsintervallen zijn, afhankelijk van hun grootte, gelijk en ongelijk. Als de variatie van de eigenschap zich manifesteert in relatief smalle grenzen en de verdeling uniform is, dan wordt een groepering opgebouwd met gelijke intervallen. De waarde van een gelijk interval wordt bepaald door de volgende formule: :

waarbij Xmax, Xmin - de maximale en minimale waarden van het attribuut in het totaal; n is het aantal groepen.

De eenvoudigste groepering, waarbij elke geselecteerde groep wordt gekenmerkt door één indicator, is een distributiereeks.

Statistische distributiereeksen - dit is een geordende verdeling van bevolkingseenheden in groepen volgens een bepaald kenmerk. Afhankelijk van het kenmerk dat ten grondslag ligt aan de vorming van een distributiereeks, worden attributieve en variatieverdelingsreeksen onderscheiden.

attributief ze noemen de distributiereeksen gebouwd volgens kwalitatieve kenmerken, dat wil zeggen tekens die geen numerieke uitdrukking hebben (verdeling naar soort arbeid, naar geslacht, naar beroep, enz.). Attribuutverdelingsreeksen karakteriseren de samenstelling van de populatie volgens een of ander essentieel kenmerk. Deze gegevens, die over verschillende perioden zijn genomen, stellen ons in staat om de verandering in de structuur te bestuderen.

Variatierijen distributiereeksen genoemd die op kwantitatieve basis zijn gebouwd. Elke variatiereeks bestaat uit twee elementen: varianten en frequenties. Opties de individuele waarden van het attribuut dat het in de variatiereeks nodig heeft, worden de specifieke waarde van het variabele attribuut genoemd.

Frequenties het nummer van de individuele variant of elke groep van de variatiereeks genoemd, dat wil zeggen, dit zijn getallen die aangeven hoe vaak bepaalde varianten voorkomen in de distributiereeks. De som van alle frequenties bepaalt de omvang van de gehele populatie, het volume. Frequenties frequenties worden genoemd, uitgedrukt in fracties van een eenheid of als een percentage van het totaal. Dienovereenkomstig is de som van de frequenties gelijk aan 1 of 100%.

Afhankelijk van de aard van de variatie van de eigenschap worden drie vormen van de variatiereeks onderscheiden: een gerangschikte reeks, een discrete reeks en een intervalreeks.

Gerangschikte variatiereeksen - dit is de verdeling van individuele eenheden van de populatie in oplopende of aflopende volgorde van de eigenschap die wordt bestudeerd. Rangschikking maakt het gemakkelijk om kwantitatieve gegevens in groepen te verdelen, onmiddellijk de kleinste en grootste waarden van een functie te detecteren, de waarden te markeren die het vaakst worden herhaald.

Discrete variatiereeksen karakteriseert de verdeling van populatie-eenheden volgens een discreet attribuut dat alleen gehele waarden aanneemt. Bijvoorbeeld de tariefcategorie, het aantal kinderen in het gezin, het aantal werknemers in de onderneming, enz.

Als een bord een continue verandering heeft, die binnen bepaalde limieten elke waarde kan aannemen ("van - tot"), dan moet je voor dit bord bouwen interval variatie serie . Bijvoorbeeld het bedrag van het inkomen, werkervaring, de kosten van vaste activa van de onderneming, enz.

Voorbeelden van het oplossen van problemen over het onderwerp "Statistisch overzicht en groepering"

Taak 1 . Er is informatie over het aantal boeken dat studenten via een abonnement hebben ontvangen in het afgelopen studiejaar.

Bouw een reeks met variabele en discrete variaties op de distributie, die de elementen van de reeks aanduidt.

Oplossing

Deze set is een set opties voor het aantal boeken dat studenten ontvangen. Laten we het aantal van dergelijke varianten tellen en ze rangschikken in de vorm van een variatiereeksen gerangschikt en variaties discrete distributie.

Taak 2 . Er zijn gegevens over de waarde van vaste activa voor 50 ondernemingen, duizend roebel.

Bouw een distributiereeks, waarbij 5 groepen ondernemingen worden belicht (met gelijke tussenpozen).

Oplossing

Voor de oplossing kiezen we de grootste en kleinste waarden van de kosten van vaste activa van ondernemingen. Dit zijn 30,0 en 10,2 duizend roebel.

Zoek de grootte van het interval: h \u003d (30.0-10.2): 5 \u003d 3.96 duizend roebel.

Dan zal de eerste groep ondernemingen omvatten, waarvan het bedrag aan vaste activa 10,2 duizend roebel is. tot 10,2 + 3,96 = 14,16 duizend roebel. Er zullen dergelijke ondernemingen zijn 9. De tweede groep omvat ondernemingen, waarvan het bedrag aan vaste activa 14,16 duizend roebel zal zijn. tot 14,16 + 3,96 = 18,12 duizend roebel. Er zullen 16 van dergelijke ondernemingen zijn. Evenzo vinden we het aantal ondernemingen dat is opgenomen in de derde, vierde en vijfde groep.

De resulterende distributiereeks wordt in de tabel geplaatst.

Taak 3 . Voor een aantal lichte industriële ondernemingen werden de volgende gegevens verkregen:

Maak een groepering van ondernemingen op basis van het aantal werknemers en vorm 6 groepen met gelijke tussenpozen. Tel voor elke groep:

1. aantal ondernemingen
2. aantal arbeiders
3. volume gefabriceerde producten per jaar
4. gemiddelde werkelijke output per werknemer
5. bedrag aan vaste activa
6. gemiddelde omvang van vaste activa van één onderneming
7. gemiddelde waarde van gefabriceerde producten door één onderneming

Noteer de resultaten van de berekening in tabellen. Trek je eigen conclusies.

Oplossing

Voor de oplossing kiezen we de grootste en kleinste waarden van het gemiddelde aantal werknemers in de onderneming. Dit zijn 43 en 256.

Zoek de grootte van het interval: h = (256-43): 6 = 35,5

Dan de eerste groep bedrijven met een gemiddeld aantal werknemers variërend van 43 tot 43 + 35,5 = 78,5 personen. Er zullen 5 van dergelijke ondernemingen zijn, de tweede groep omvat ondernemingen met een gemiddeld aantal werknemers van 78,5 tot 78,5 + 35,5 = 114 personen. Er zullen 12 van dergelijke ondernemingen zijn. Evenzo vinden we het aantal ondernemingen dat is opgenomen in de derde, vierde, vijfde en zesde groep.

We zetten de resulterende distributiereeksen in een tabel en berekenen voor elke groep de nodige indicatoren:

Conclusie : Zoals uit de tabel blijkt, is de tweede groep ondernemingen het talrijkst. Het omvat 12 ondernemingen. De kleinste zijn de vijfde en zesde groep (elk twee ondernemingen). Dit zijn de grootste ondernemingen (in termen van het aantal werknemers).

Aangezien de tweede groep het talrijkst is, is het productievolume per jaar door de ondernemingen van deze groep en het volume vaste activa veel hoger dan bij andere. Tegelijkertijd is de gemiddelde werkelijke productie van één werknemer bij de ondernemingen van deze groep niet de hoogste. De ondernemingen van de vierde groep lopen hier voorop. Ook deze groep vertegenwoordigt een vrij groot aantal vaste activa.

Concluderend merken we op dat de gemiddelde omvang van vaste activa en de gemiddelde waarde van de output van één onderneming recht evenredig zijn met de grootte van de onderneming (in termen van het aantal werknemers).

Statistische distributiereeksen- dit is een geordende verdeling van bevolkingseenheden in groepen volgens een bepaald variërend kenmerk.
Afhankelijk van de eigenschap die ten grondslag ligt aan de vorming van een distributiereeks, zijn er: attribuut- en variatiedistributiereeksen.

De aanwezigheid van een gemeenschappelijk kenmerk is de basis voor de vorming van een statistische populatie, die het resultaat is van een beschrijving of meting van gemeenschappelijke kenmerken van de studieobjecten.

Het onderwerp van studie in de statistiek zijn veranderende (variërende) kenmerken of statistische kenmerken.

Soorten statistische kenmerken.

Distributiereeksen worden attribuutreeksen genoemd. gebouwd op kwaliteitsgronden. Attributief- dit is een teken dat een naam heeft (bijvoorbeeld een beroep: naaister, leraar, enz.).
Het is gebruikelijk om de distributiereeksen in de vorm van tabellen te ordenen. In tafel. 2.8 toont een attribuutreeks van distributie.
Tabel 2.8 - Verdeling van soorten rechtsbijstand verleend door advocaten aan burgers van een van de regio's van de Russische Federatie.

Variatie serie zijn kenmerkwaarden (of waardenbereiken) en hun frequenties.
Variatiereeksen zijn distributiereeksen kwantitatief gebouwd. Elke variatiereeks bestaat uit twee elementen: varianten en frequenties.
Varianten zijn individuele waarden van een kenmerk die nodig zijn in een variatiereeks.
Frequenties zijn het aantal individuele varianten of elke groep van de variatiereeks, d.w.z. dit zijn getallen die aangeven hoe vaak bepaalde opties voorkomen in een distributiereeks. De som van alle frequenties bepaalt de omvang van de gehele populatie, het volume.
Frequenties worden frequenties genoemd, uitgedrukt in fracties van een eenheid of als een percentage van het totaal. Dienovereenkomstig is de som van de frequenties gelijk aan 1 of 100%. De variatiereeks stelt ons in staat om de vorm van de distributiewet te evalueren op basis van werkelijke gegevens.

Afhankelijk van de aard van de variatie van de eigenschap, zijn er: discrete en intervalvariatiereeksen.
Een voorbeeld van een discrete variatiereeks wordt gegeven in Tabel. 2.9.
Tabel 2.9 - Verdeling van gezinnen naar het aantal bezette kamers in individuele appartementen in 1989 in de Russische Federatie.

De eerste kolom van de tabel bevat varianten van een discrete variatiereeks, de tweede kolom bevat de frequenties van de variatiereeks en de derde kolom bevat de frequentie-indicatoren.

Variatie serie

In de algemene bevolking wordt een bepaald kwantitatief kenmerk onderzocht. Er wordt willekeurig een volumemonster uit gehaald n, dat wil zeggen, het aantal elementen in de steekproef is n. In de eerste fase van statistische verwerking, variërend monsters, d.w.z. nummer bestellen x 1 , x 2 , …, x n Oplopend. Elke waargenomen waarde x ik genaamd keuze. Frequentie ik ben is het aantal waarnemingen van de waarde x ik in het monster. Relatieve frequentie (frequentie) met ik is de frequentieverhouding ik ben naar steekproefomvang n: .
Bij het bestuderen van een variatiereeks worden ook de begrippen cumulatieve frequentie en cumulatieve frequentie gebruikt. Laten x een aantal. Dan het aantal opties , waarvan de waarden minder zijn x, heet de geaccumuleerde frequentie: voor x i n wordt de geaccumuleerde frequentie w i max genoemd.
Een attribuut wordt discreet variabel genoemd als de individuele waarden (varianten) ervan in een eindig aantal (meestal een geheel getal) van elkaar verschillen. Een variatiereeks van zo'n kenmerk wordt een discrete variatiereeks genoemd.

Tabel 1. Algemeen overzicht van de discrete variatiereeksen van frequenties

Functiewaardenx ik x 1 x2 x nee
Frequentiesik ben m 1 m2 m nee

Een attribuut wordt continu variërend genoemd als de waarden ervan willekeurig klein van elkaar verschillen, d.w.z. het teken kan in een bepaald interval elke waarde aannemen. Een continue variatiereeks voor zo'n eigenschap wordt een intervalreeks genoemd.

Tabel 2. Algemeen overzicht van de intervalvariatiereeksen van frequenties

Tabel 3. Grafische afbeeldingen van de variatiereeks

RijVeelhoek of histogramEmpirische verdelingsfunctie
Discreet
interval
Kijkend naar de resultaten van de waarnemingen, wordt bepaald hoeveel waarden van de varianten in elk specifiek interval vielen. Aangenomen wordt dat elk interval tot een van zijn uiteinden behoort: ofwel in alle gevallen links (vaker), ofwel in alle gevallen rechts, en de frequenties of frequenties tonen het aantal opties binnen de aangegeven grenzen. Verschillen een ik – een ik +1 worden partiële intervallen genoemd. Om latere berekeningen te vereenvoudigen, kan de intervalvariatiereeks worden vervangen door een voorwaardelijk discrete. In dit geval is de gemiddelde waarde i-de interval wordt als optie genomen x ik en de bijbehorende intervalfrequentie ik ben- voor de frequentie van dit interval.
Voor grafische weergave van variatiereeksen worden meestal veelhoek, histogram, cumulatieve curve en empirische verdelingsfunctie gebruikt.

In tafel. 2.3 (Groepering van de bevolking van Rusland volgens de grootte van het gemiddelde inkomen per hoofd van de bevolking in april 1994) wordt gepresenteerd interval variatie serie.
Het is handig om de distributiereeksen te analyseren met behulp van een grafische weergave, wat het ook mogelijk maakt om de vorm van de distributie te beoordelen. Een visuele weergave van de aard van de verandering in de frequenties van de variatiereeks wordt gegeven door veelhoek en histogram.
De polygoon wordt gebruikt bij het weergeven van discrete variatiereeksen.
Laten we bijvoorbeeld de verdeling van de woningvoorraad naar type appartement grafisch weergeven (tabel 2.10).
Tabel 2.10 - Verdeling van de woningvoorraad van het stedelijk gebied naar type appartementen (voorwaardelijke cijfers).


Rijst. Behuizing distributie veelhoek


Op de y-as kunnen niet alleen de waarden van frequenties, maar ook de frequenties van de variatiereeksen worden uitgezet.
Het histogram wordt gebruikt om de intervalvariatiereeksen weer te geven. Bij het construeren van een histogram worden de waarden van de intervallen uitgezet op de as van de abscis en worden de frequenties weergegeven door rechthoeken die zijn gebouwd op de overeenkomstige intervallen. De hoogte van de kolommen bij gelijke intervallen dient evenredig te zijn met de frequenties. Een histogram is een grafiek waarin een reeks wordt weergegeven als staafjes naast elkaar.
Laten we de intervalverdelingsreeksen in Tabel grafisch weergeven. 2.11.
Tabel 2.11 - Verdeling gezinnen naar woonoppervlakte per persoon (voorwaardelijke cijfers).
Np / p Groepen gezinnen naar de grootte van de leefruimte per persoon Aantal gezinnen met een bepaalde leefruimte Gecumuleerd aantal gezinnen
1 3 – 5 10 10
2 5 – 7 20 30
3 7 – 9 40 70
4 9 – 11 30 100
5 11 – 13 15 115
TOTAAL 115 ----


Rijst. 2.2. Histogram van de verdeling van gezinnen naar de grootte van de woonruimte per persoon


Met behulp van de gegevens van de geaccumuleerde reeks (tabel 2.11) construeren we: distributie cumulatief.


Rijst. 2.3. De cumulatieve verdeling van gezinnen naar de grootte van de woonruimte per persoon


De weergave van een variatiereeks in de vorm van een cumulatief is vooral effectief voor variatiereeksen waarvan de frequenties worden uitgedrukt als fracties of percentages van de som van de frequenties van de reeks.
Als we de assen in de grafische weergave van de variatiereeksen veranderen in de vorm van een cumulatie, dan krijgen we ogivu. Op afb. 2.4 toont een ogive gebouwd op basis van de gegevens in tabel. 2.11.
Een histogram kan worden omgezet in een verdelingspolygoon door de middelpunten van de zijden van de rechthoeken te vinden en deze punten vervolgens met rechte lijnen te verbinden. De resulterende verdelingsveelhoek wordt getoond in Fig. 2.2 stippellijn.
Bij het construeren van een histogram van de verdeling van een variatiereeks met ongelijke intervallen, langs de ordinaat-as, worden geen frequenties toegepast, maar de verdelingsdichtheid van het kenmerk in de overeenkomstige intervallen.
De distributiedichtheid is de frequentie berekend per eenheid intervalbreedte, d.w.z. hoeveel eenheden in elke groep zijn per intervalwaarde. Een voorbeeld van het berekenen van de distributiedichtheid wordt gegeven in Tabel. 2.12.
Tabel 2.12 - Verdeling ondernemingen naar aantal werknemers (cijfers zijn voorwaardelijk)
Np / p Groepen van ondernemingen door het aantal werknemers, pers. Aantal ondernemingen Intervalgrootte, pers. Distributiedichtheid
MAAR 1 2 3=1/2
1 tot 20 15 20 0,75
2 20 – 80 27 60 0,25
3 80 – 150 35 70 0,5
4 150 – 300 60 150 0,4
5 300 – 500 10 200 0,05
TOTAAL 147 ---- ----

Voor een grafische weergave van variatiereeksen kunnen ook worden gebruikt cumulatieve curve. Met behulp van de cumulate (de curve van de sommen) wordt een reeks geaccumuleerde frequenties weergegeven. Geaccumuleerde frequenties worden bepaald door de frequenties achtereenvolgens per groep op te tellen en te laten zien hoeveel eenheden van de populatie kenmerkwaarden hebben die niet groter zijn dan de beschouwde waarde.


Rijst. 2.4. Ogiva verdeling van gezinnen volgens de grootte van de leefruimte per persoon

Bij het construeren van het cumulatief van een intervalvariatiereeks worden de varianten van de reeks uitgezet langs de as van de abscis en de geaccumuleerde frequenties langs de ordinaat-as.