Hvordan lage et. Bygge en intervalldistribusjonsserie

gruppering– dette er inndelingen av befolkningen i grupper som er homogene på en eller annen måte.

Tjenesteoppdrag. Med den elektroniske kalkulatoren kan du:

  • bygge en variantserie, bygge et histogram og en polygon;
  • finne variasjonsindikatorer (gjennomsnitt, modus (inkludert grafisk), median, variasjonsområde, kvartiler, desiler, kvartil differensieringskoeffisient, variasjonskoeffisient og andre indikatorer);

Instruksjon. For å gruppere en serie må du velge typen for den resulterende variasjonsserien (diskret eller intervall) og spesifisere mengden data (antall rader). Den resulterende løsningen lagres i en Word-fil (se eksempelet på gruppering av statistiske data).

Antall inndata
",0);">

Hvis grupperingen allerede er utført og diskrete variasjonsserier eller intervallserie, så må du bruke den elektroniske kalkulatoren Variasjonsindikatorer. Teste hypotesen om type distribusjon produsert ved hjelp av tjenesten Studie av distribusjonsform.

Typer statistiske grupperinger

Variasjonsserie. Ved observasjoner av en diskret tilfeldig variabel kan samme verdi påtreffes flere ganger. Slike verdier av en tilfeldig variabel x i blir registrert som indikerer n i antall ganger den vises i n observasjoner, dette er frekvensen til denne verdien.
Ved en kontinuerlig stokastisk variabel brukes gruppering i praksis.
  1. Typologisk gruppering- dette er inndelingen av den studerte kvalitativt heterogene befolkningen i klasser, sosioøkonomiske typer, homogene grupper av enheter. For å bygge denne grupperingen, bruk parameteren Diskret variasjonsserie.
  2. Strukturell gruppering kalles, der en homogen populasjon er delt inn i grupper som karakteriserer dens struktur i henhold til et eller annet varierende trekk. For å bygge denne grupperingen, bruk parameteren Interval series.
  3. En gruppering som avslører forholdet mellom de studerte fenomenene og deres trekk kalles analytisk gruppe(se analytisk gruppering av serier).

Prinsipper for å bygge statistiske grupperinger

En serie observasjoner ordnet i stigende rekkefølge kalles en variasjonsserie. grupperingsskilt er tegnet som befolkningen er delt inn i separate grupper. Det kalles gruppens base. Gruppering kan baseres på både kvantitative og kvalitative egenskaper.
Etter å ha bestemt grunnlaget for grupperingen, bør spørsmålet om antall grupper som studiepopulasjonen skal deles inn i, avgjøres.

Når du bruker personlige datamaskiner for å behandle statistiske data, utføres grupperingen av enhetene til et objekt ved hjelp av standardprosedyrer.
En slik prosedyre er basert på å bruke Sturgess-formelen for å bestemme det optimale antallet grupper:

k = 1+3,322*lg(N)

Der k er antall grupper, N er antall befolkningsenheter.

Lengden på delintervallene beregnes som h=(x maks -x min)/k

Tell deretter antall treff av observasjoner i disse intervallene, som tas som frekvenser n i. Få frekvenser, hvis verdier er mindre enn 5 (n i< 5), следует объединить. в этом случае надо объединить и соответствующие интервалы.
Midtpunktene til intervallene x i =(c i-1 +c i)/2 tas som nye verdier.

Etter å ha data for statistisk observasjon som karakteriserer dette eller det fenomenet, er det først og fremst nødvendig å strømlinjeforme dem, dvs. gjøre det systematisk

Engelsk statistiker. UjReichman sa billedlig talt om uordnede aggregater at å bli konfrontert med en masse ikke-generaliserte data er ensbetydende med en situasjon der en person blir kastet inn i krattskogen uten kompass. Hva er systematiseringen av statistiske data i form av distribusjonsserier?

Den statistiske fordelingsserien er en ordnet statistisk populasjon (tabell 17). Den enkleste typen statistisk distribusjonsserie er en rangert serie, dvs. en serie tall i stigende eller synkende rekkefølge med varierende tegn. En slik serie tillater oss ikke å bedømme mønstrene som ligger i de distribuerte dataene: hvilken verdi har flertallet av indikatorene gruppert, hva er avvikene fra denne verdien; som et generelt distribusjonsmønster. For dette formålet grupperes data som viser hvor ofte individuelle observasjoner forekommer i deres totale antall (skjema 1a 1).

. Tabell 17

. Generelt syn på statistiske distribusjonsserier

. Scheme 1. Scheme of statistic distribusjonsrekker

Fordelingen av befolkningsenheter etter egenskaper som ikke har et kvantitativt uttrykk kalles attributtserie(for eksempel fordeling av bedrifter i henhold til deres produksjonslinje)

Fordelingsserien av befolkningsenheter i henhold til egenskaper, har et kvantitativt uttrykk, kalles variantserie. I slike serier er verdien av funksjonen (alternativene) i stigende eller synkende rekkefølge

I variasjonsserien av distribusjon skilles det mellom to elementer: varianter og frekvens . Alternativ- dette er en egen verdi for grupperingsfunksjonen Frekvens- et tall som viser hvor mange ganger hvert alternativ forekommer

I matematisk statistikk beregnes ett element til i variasjonsserien - delvis. Sistnevnte er definert som forholdet mellom frekvensen av tilfeller av et gitt intervall og den totale mengden frekvenser, delen bestemmes i brøkdeler av en enhet, prosent (%) i ppm (% o)

Således er en variasjonsfordelingsserie en serie der alternativene er ordnet i stigende eller synkende rekkefølge, deres frekvenser eller frekvenser er indikert. Variasjonsserier er diskrete (pererivny) og andre intervaller (kontinuerlige).

. Diskrete variasjonsserier- dette er distribusjonsserier der varianten som verdien av en kvantitativ egenskap bare kan få en viss verdi. Varianter skiller seg fra hverandre med en eller flere enheter

Så antall deler produsert per skift av en spesifikk arbeider kan bare uttrykkes med ett spesifikt tall (6, 10, 12, etc.). Et eksempel på en diskret variasjonsserie kan være fordelingen av arbeidere i henhold til antall produserte deler (tabell 18-18).

. Tabell 18

. Diskret distribusjonsområde _

. Intervall (kontinuerlig) variasjonsserie- slike distribusjonsserier hvor verdien av opsjonene er gitt som intervaller, dvs. funksjonsverdier kan avvike fra hverandre med en vilkårlig liten mengde. Når du konstruerer en variasjonsserie av NEP, er det umulig å indikere hver verdi av variantene, så settet er fordelt over intervaller. Sistnevnte kan være like eller ikke. For hver av dem er frekvenser eller frekvenser angitt (tabell 1 9 19).

I intervallfordelingsserier med ulikt intervall beregnes matematiske egenskaper som distribusjonstetthet og relativ distribusjonstetthet i et gitt intervall. Den første karakteristikken bestemmes av forholdet mellom frekvensen og verdien av samme intervall, den andre - av forholdet mellom frekvensen og verdien av samme intervall. For eksempelet ovenfor vil fordelingstettheten i det første intervallet være 3: 5 = 0,6, og den relative tettheten i dette intervallet vil være 7,5: 5 = 1,55 %.

. Tabell 19

. Intervallfordelingsserie _

En diskret variasjonsserie er konstruert for diskrete funksjoner.

For å bygge en diskret variasjonsserie, må du gjøre følgende: 1) sortere observasjonsenhetene i stigende rekkefølge av den studerte attributtverdien,

2) bestemme alle mulige verdier av attributtet x i, sorter dem i stigende rekkefølge,

tegnverdi, Jeg .

funksjonsverdifrekvens og betegne f Jeg . Summen av alle frekvenser i serien er lik antall elementer i den studerte populasjonen.

Eksempel 1 .

Liste over karakterer oppnådd av studenter ved eksamen: 3; fire; 3; 5; fire; 2; 2; fire; fire; 3; 5; 2; fire; 5; fire; 3; fire; 3; 3; fire; fire; 2; 2; 5; 5; fire; 5; 2; 3; fire; fire; 3; fire; 5; 2; 5; 5; fire; 3; 3; fire; 2; fire; fire; 5; fire; 3; 5; 3; 5; fire; fire; 5; fire; fire; 5; fire; 5; 5; 5.

Her er nummeret X - karakterer en diskret tilfeldig variabel, og den resulterende listen over estimater erstatistiske (observerte) data .

    rekkefølge observasjonsenhetene i stigende rekkefølge etter den studerte verdien av funksjonen:

2; 2; 2; 2; 2; 2; 2; 2; 3; 3; 3; 3; 3; 3; 3; 3; 3; 3; 3; 3; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5.

2) bestem alle mulige verdier for attributtet x i, sorter dem i stigende rekkefølge:

I dette eksemplet kan alle poengsum deles inn i fire grupper med følgende verdier: 2; 3; fire; 5.

Verdien av en tilfeldig variabel som tilsvarer en egen gruppe observerte data kalles tegnverdi, variant (opsjon) og angi x Jeg .

Tallet som viser hvor mange ganger den tilsvarende funksjonsverdien forekommer i en serie observasjoner kalles funksjonsverdifrekvens og betegne f Jeg .

For vårt eksempel

score 2 forekommer - 8 ganger,

score 3 forekommer - 12 ganger,

score 4 forekommer - 23 ganger,

poengsum 5 forekommer - 17 ganger.

Det er 60 vurderinger totalt.

4) skriv de mottatte dataene inn i en tabell med to rader (kolonner) - x i og f i .

Basert på disse dataene er det mulig å konstruere en diskret variasjonsserie

Diskrete variasjonsserier - dette er en tabell der de forekommende verdiene for den studerte egenskapen er indikert som separate verdier i stigende rekkefølge og deres frekvenser

  1. Konstruksjon av en intervallvariasjonsserie

I tillegg til en diskret variasjonsserie, er det ofte en slik måte å gruppere data på som en intervallvariasjonsserie.

En intervallserie bygges hvis:

    tegnet har en kontinuerlig natur av endring;

    det er mange diskrete verdier (mer enn 10)

    frekvenser av diskrete verdier er veldig små (ikke overstige 1-3 med et relativt stort antall observasjonsenheter);

    mange diskrete verdier av en funksjon med samme frekvenser.

En intervallvariasjonsserie er en måte å gruppere data i form av en tabell som har to kolonner (funksjonsverdier i form av et intervall med verdier og frekvensen til hvert intervall).

I motsetning til en diskret serie, er verdiene til karakteristikken til en intervallserie ikke representert av individuelle verdier, men av et intervall av verdier ("fra - til").

Tallet som viser hvor mange observasjonsenheter som falt i hvert valgt intervall kalles funksjonsverdifrekvens og betegne f Jeg . Summen av alle frekvenser i serien er lik antall elementer (observasjonsenheter) i den studerte populasjonen.

Hvis en enhet har en funksjonsverdi som er lik verdien av den øvre grensen for intervallet, bør den henvises til neste intervall.

For eksempel vil et barn med en høyde på 100 cm falle inn i det andre intervallet, og ikke i det første; og et barn med en høyde på 130 cm vil falle inn i det siste intervallet, og ikke i det tredje.

Basert på disse dataene er det mulig å konstruere en intervallvariasjonsserie.

Hvert intervall har en nedre grense (x n), en øvre grense (x in) og en intervallbredde ( Jeg).

En intervallgrense er en egenskapsverdi som ligger på grensen til to intervaller.

barns høyde (cm)

barns høyde (cm)

antall barn

over 130

Hvis et intervall har en øvre og nedre grense, kalles det lukket intervall. Hvis intervallet bare har en nedre eller bare en øvre grense, så er dette - åpent intervall. Bare det aller første eller det aller siste intervallet kan være åpent. I eksemplet ovenfor er det siste intervallet åpent.

Intervallbredde (Jeg) er forskjellen mellom øvre og nedre grenser.

Jeg = x n - x in

Bredden på et åpent intervall antas å være den samme som bredden på et tilstøtende lukket intervall.

barns høyde (cm)

antall barn

Intervallbredde (i)

for beregninger 130+20=150

20 (fordi bredden på det tilstøtende lukkede intervallet er 20)

Alle intervallserier er delt inn i intervallserier med like intervaller og intervallserier med ulikt intervall. . I intervallrader med like intervaller er bredden på alle intervaller den samme. I intervallserier med ulikt intervall er bredden på intervallene forskjellig.

I dette eksemplet, en intervallserie med ulik intervall.

Tilstand:

Det er data om alderssammensetningen til arbeidere (år): 18, 38, 28, 29, 26, 38, 34, 22, 28, 30, 22, 23, 35, 33, 27, 24, 30, 32, 28 , 25, 29, 26, 31, 24, 29, 27, 32, 25, 29, 29.

    1. Bygg en intervalldistribusjonsserie.
    2. Bygg en grafisk representasjon av serien.
    3. Bestem grafisk modus og median.

Løsning:

1) I følge Sturgess-formelen skal populasjonen deles inn i 1 + 3,322 lg 30 = 6 grupper.

Maksimal alder er 38, minimum er 18.

Intervallbredde Siden endene på intervallene må være heltall, vil vi dele populasjonen inn i 5 grupper. Intervallbredde - 4.

For å lette beregningene, la oss ordne dataene i stigende rekkefølge: 18, 22, 22, 23, 24, 24, 25, 25, 26, 26, 27, 27, 28, 28, 28, 29, 29, 29, 29 , 29, 30, 30, 31, 32, 32, 33, 34, 35, 38, 38.

Aldersfordeling av arbeidere

Grafisk kan en serie vises som et histogram eller en polygon. Histogram - søylediagram. Basen av kolonnen er bredden på intervallet. Høyden på stangen er lik frekvensen.

En polygon (eller distribusjonspolygon) er en graf over frekvenser. For å bygge det i henhold til histogrammet, kobler vi midtpunktene til de øvre sidene av rektanglene. Vi lukker polygonet på x-aksen i avstander lik halve intervallet fra de ekstreme x-verdiene.

Modus (Mo) er verdien av egenskapen som studeres, som forekommer hyppigst i en gitt populasjon.

For å bestemme modusen fra histogrammet, må du velge det høyeste rektangelet, tegne en linje fra høyre toppunkt i dette rektangelet til øvre høyre hjørne av forrige rektangel, og tegne en linje fra venstre toppunkt i det modale rektangelet til venstre toppunkt i neste rektangel. Fra skjæringspunktet mellom disse linjene, tegn en vinkelrett på x-aksen. Abscissen vil være mote. Mo ≈ 27,5. Det betyr at den vanligste alderen i denne populasjonen er 27-28 år.

Medianen (Me) er verdien av egenskapen som studeres, som er midt i en ordnet variasjonsserie.

Vi finner medianen ved kumulering. Cumulate - graf over akkumulerte frekvenser. Abscisser er varianter av en serie. Ordinatene er de akkumulerte frekvensene.

For å bestemme medianen for kumulatet finner vi langs ordinataksen et punkt som tilsvarer 50 % av de akkumulerte frekvensene (i vårt tilfelle 15), trekker en rett linje gjennom den, parallelt med okseaksen, og tegner en vinkelrett på x-aksen fra skjæringspunktet med kumulatet. Abscissen er medianen. Meg ≈ 25,9. Dette betyr at halvparten av arbeiderne i denne befolkningen er under 26 år.

Resultatene av grupperingen av de innsamlede statistiske dataene presenteres vanligvis i form av distribusjonsserier. En distribusjonsserie er en ordnet fordeling av befolkningsenheter i grupper i henhold til egenskapen som studeres.

Distribusjonsseriene er delt inn i attributive og variasjonelle, avhengig av egenskapen som ligger til grunn for grupperingen. Hvis tegnet er kvalitativt, kalles distribusjonsserien attributiv. Et eksempel på en attributtserie er fordelingen av virksomheter og organisasjoner etter eierform (se tabell 3.1).

Hvis attributtet som distribusjonsserien er konstruert på er kvantitativ, kalles serien variasjon.

Variasjonsfordelingsserien består alltid av to deler: en variant og deres tilsvarende frekvenser (eller frekvenser). En variant er en verdi som kan ta et trekk i enheter av populasjonen, en frekvens er antall observasjonsenheter som har en gitt verdi av trekk. Summen av frekvensene er alltid lik størrelsen på befolkningen. Noen ganger, i stedet for frekvenser, beregnes frekvenser - disse er frekvenser uttrykt enten i brøkdeler av en enhet (da er summen av alle frekvenser lik 1), eller som en prosentandel av populasjonsvolumet (summen av frekvenser vil være lik 1) 100 %).

Variasjonsserier er diskrete og intervall. For diskrete serier (tabell 3.7) er opsjoner uttrykt i spesifikke tall, oftest heltall.

Tabell 3.8. Fordeling av ansatte på arbeidstid i forsikringsselskapet
Arbeidstid i bedriften, hele år (opsjoner) Antall ansatte
Menneske (frekvenser) i % av totalt (hyppig)
opptil et år 15 11,6
1 17 13,2
2 19 14,7
3 26 20,2
4 10 7,8
5 18 13,9
6 24 18,6
Total 129 100,0

I intervallserien (se tabell 3.2) er verdiene til indikatoren satt som intervaller. Intervallene har to grenser: nedre og øvre. Intervaller kan være åpne eller lukkede. Åpne har ikke en av grensene, så i tabellen. 3.2 det første intervallet har ingen nedre grense, og det siste har ingen øvre grense. Når du konstruerer en intervallserie, avhengig av arten av spredningen av verdiene til attributtet, brukes både like og ulikt intervall (tabell 3.2 viser en variasjonsserie med like intervaller).

Hvis funksjonen har et begrenset antall verdier, vanligvis ikke mer enn 10, bygges diskrete distribusjonsserier. Hvis varianten er større, mister den diskrete serien sin synlighet; i dette tilfellet er det tilrådelig å bruke intervallformen til variasjonsserien. Med en kontinuerlig variasjon av en funksjon, når verdiene innenfor visse grenser avviker fra hverandre med en vilkårlig liten mengde, bygges det også en intervallfordelingsserie.

3.3.1. Konstruksjon av diskrete variasjonsserier

Tenk på teknikken for å konstruere diskrete variasjonsserier ved å bruke et eksempel.

Eksempel 3.2. Følgende data om den kvantitative sammensetningen av 60 familier er tilgjengelig:

For å få en ide om fordelingen av familier i henhold til antallet medlemmer, bør en variasjonsserie konstrueres. Siden attributtet har et begrenset antall heltallsverdier, konstruerer vi en diskret variasjonsserie. For å gjøre dette, anbefales det først å skrive ut alle verdiene til attributtet (antall medlemmer i familien) i stigende rekkefølge (dvs. for å rangere de statistiske dataene):

Deretter må du telle antall familier med samme sammensetning. Antall familiemedlemmer (verdien av den variable egenskapen) er alternativene (vi vil betegne dem med x), antall familier med samme sammensetning er frekvensene (vi vil betegne dem med f). Vi representerer grupperingsresultatene i form av følgende diskrete variasjonsfordelingsserier:

Tabell 3.11.
Antall familiemedlemmer (x) Antall familier (y)
1 8
2 14
3 20
4 9
5 5
6 4
Total 60

3.3.2. Konstruksjon av intervallvariasjonsserier

La oss vise metoden for å konstruere intved å bruke følgende eksempel.

Eksempel 3.3. Som et resultat av statistisk observasjon ble følgende data innhentet om gjennomsnittsrenten til 50 forretningsbanker (%):

Tabell 3.12.
14,7 19,0 24,5 20,8 12,3 24,6 17,0 14,2 19,7 18,8
18,1 20,5 21,0 20,7 20,4 14,7 25,1 22,7 19,0 19,6
19,0 18,9 17,4 20,0 13,8 25,6 13,0 19,0 18,7 21,1
13,3 20,7 15,2 19,9 21,9 16,0 16,9 15,3 21,4 20,4
12,8 20,8 14,3 18,0 15,1 23,8 18,5 14,4 14,4 21,0

Som du kan se, er det ekstremt upraktisk å se en slik rekke data, i tillegg er det ingen endringsmønstre i indikatoren. La oss konstruere en intervallfordelingsserie.

  1. La oss definere antall intervaller.

    Antall intervaller i praksis er ofte satt av forskeren selv basert på målene for hver enkelt observasjon. Imidlertid kan det også beregnes matematisk ved hjelp av Sturgess-formelen

    n = 1 + 3,322 lgN,

    hvor n er antall intervaller;

    N er volumet av populasjonen (antall observasjonsenheter).

    For vårt eksempel får vi: n \u003d 1 + 3.322lgN \u003d 1 + 3.322lg50 \u003d 6.6 "7.

  2. La oss bestemme verdien av intervallene (i) ved hjelp av formelen

    hvor x max - maksimumsverdien til funksjonen;

    x min - minimumsverdien for attributtet.

    For vårt eksempel

    Intervallene til variasjonsseriene er illustrative hvis grensene deres har "runde" verdier, så vi vil runde verdien av intervallet 1,9 til 2, og minimumsverdien til funksjonen 12,3 til 12,0.

  3. La oss definere grensene for intervallene.

    Intervaller er som regel skrevet på en slik måte at øvre grense for ett intervall samtidig er nedre grense for neste intervall. Så for vårt eksempel får vi: 12.0-14.0; 14,0-16,0; 16,0-18,0; 18,0-20,0; 20,0-22,0; 22,0-24,0; 24.0-26.0.

    En slik rekord betyr at funksjonen er kontinuerlig. Hvis egenskapsalternativene tar strengt definerte verdier, for eksempel bare heltall, men antallet er for stort til å bygge en diskret serie, kan du lage en intervallserie der den nedre grensen for intervallet ikke vil falle sammen med den øvre grensen for intervallet. neste intervall (dette vil bety at funksjonen er diskret ). For eksempel, i fordelingen av ansatte i en bedrift etter alder, kan du opprette følgende intervallgrupper av år: 18-25, 26-33, 34-41, 42-49, 50-57, 58-65, 66 og mer.

    I vårt eksempel kan vi også åpne de første og siste intervallene osv. skriv: opptil 14,0; 24,0 og oppover.

  4. Basert på de første dataene konstruerer vi en rangert serie. For å gjøre dette skriver vi i stigende rekkefølge verdiene som funksjonen tar. Resultatene er presentert i tabellen: Tabell 3.13. Rangert serie med renter til kommersielle banker
    Bankrente % (alternativer)
    12,3 17,0 19,9 23,8
    12,8 17,4 20,0 24,5
    13,0 18,0 20,0 24,6
    13,3 18,1 20,4 25,1
    13,8 18,5 20,4 25,6
    14,2 18,7 20,5
    14,3 18,8 20,7
    14,4 18,9 20,7
    14,7 19,0 20,8
    14,7 19,0 21,0
    15,1 19,0 21,0
    15,2 19,0 21,1
    15,3 19,0 21,4
    16,0 19,6 21,9
    16,9 19,7 22,7
  5. La oss beregne frekvensene.

    Ved telling av frekvenser kan det oppstå en situasjon når verdien av en funksjon faller på grensen til et intervall. I dette tilfellet kan du følge regelen: den gitte enheten er tilordnet intervallet som verdien er den øvre grensen for. Så, verdien 16,0 i vårt eksempel vil referere til det andre intervallet.

Grupperingsresultatene oppnådd i vårt eksempel vil bli presentert i en tabell.

Tabell 3.14. Fordeling av forretningsbanker etter utlånsrente
Kort sats, % Antall banker, enheter (frekvenser) Akkumulerte frekvenser
12,0-14,0 5 5
14,0-16,0 9 14
16,0-18,0 4 18
18,0-20,0 15 33
20,0-22,0 11 44
22,0-24,0 2 46
24,0-26,0 4 50
Total 50 -

Den siste kolonnen i tabellen presenterer de akkumulerte frekvensene, som oppnås ved suksessiv summering av frekvenser, fra den første (for eksempel for det første intervallet - 5, for det andre intervallet 5 + 9 = 14, for det tredje intervallet 5 + 9 + 4 = 18, osv. .). Den akkumulerte frekvensen, for eksempel 33, viser at 33 banker har en lånerente som ikke overstiger 20 % (den øvre grensen for det tilsvarende intervallet).

I prosessen med å gruppere data når man konstruerer variasjonsserier, brukes noen ganger ulike intervaller. Dette gjelder de tilfellene der de karakteristiske verdiene følger regelen for aritmetisk eller geometrisk progresjon, eller når anvendelsen av Sturgess-formelen fører til utseendet til "tomme" intervallgrupper som ikke inneholder en enkelt observasjonsenhet. Deretter settes grensene for intervallene vilkårlig av forskeren selv, basert på sunn fornuft og målene for undersøkelsen, eller etter formler. Så for data som endres i en aritmetisk progresjon, beregnes størrelsen på intervallene som følger.