Beregning av medianen til et sett med tall.

Sammen med gjennomsnittsverdiene beregnes strukturelle gjennomsnitt som statistiske kjennetegn for variasjonsfordelingsserien - mote Og median.
Mote(Mo) representerer verdien av den studerte funksjonen, gjentatt med høyeste frekvens, dvs. modus er verdien av funksjonen som forekommer oftest.
Median(Meg) er verdien av funksjonen som faller i midten av den rangerte (ordnede) populasjonen, dvs. median - den sentrale verdien av variasjonsserien.
Hovedegenskapen til medianen er at summen av de absolutte avvikene til attributtverdiene fra medianen er mindre enn fra noen annen verdi ∑|x i - Me|=min.

Bestemme modus og median fra ugrupperte data

Ta i betraktning bestemmelse av modus og median fra ugrupperte data. La oss anta at arbeidsmannskapene, bestående av 9 personer, har følgende lønnskategorier: 4 3 4 5 3 3 6 2 6 . Siden dette teamet har flest arbeidere i 3. kategori, vil denne tariffkategorien være modal. Mo = 3.
For å bestemme medianen er det nødvendig å rangere: 2 3 3 3 4 4 5 6 6 . Sentralt i denne serien er arbeideren i 4. kategori, derfor vil denne kategorien være medianen. Hvis den rangerte serien inkluderer et partall av enheter, er medianen definert som gjennomsnittet av de to sentrale verdiene.
Hvis modusen gjenspeiler den vanligste varianten av verdien av attributtet, utfører medianen praktisk talt funksjonene til et gjennomsnitt for en heterogen populasjon som ikke overholder normalfordelingsloven. La oss illustrere dens kognitive betydning med følgende eksempel.
Anta at vi må karakterisere gjennomsnittsinntekten til en gruppe mennesker på 100 personer, hvorav 99 har inntekter i området fra $100 til $200 per måned, og den månedlige inntekten til sistnevnte er $50 000 (tabell 1).
Tabell 1 - Månedlig inntekt for den undersøkte gruppen personer. Bruker vi det aritmetiske gjennomsnittet får vi en gjennomsnittsinntekt på ca 600 - 700 dollar, noe som har lite til felles med inntekten til hoveddelen av gruppen. Medianen, i dette tilfellet lik Me = 163 dollar, vil tillate oss å gi en objektiv beskrivelse av inntektsnivået til 99% av denne gruppen mennesker.
Vurder definisjonen av modus og median etter grupperte data (distribusjonsserier).
Anta at fordelingen av arbeidere i hele virksomheten som helhet i henhold til tariffkategorien har følgende form (tabell 2).
Tabell 2 - Fordeling av arbeidere i bedriften etter tariffkategori

Beregning av modus og median for en diskret serie

Beregning av modus og median for en intervallserie

Beregning av modus og median for en variasjonsserie

Bestemme modus fra en diskret variasjonsserie

Raden med funksjonsverdier bygd tidligere, sortert etter verdi, brukes. Hvis prøvestørrelsen er odde, ta midtverdien; hvis prøvestørrelsen er partall, tar vi det aritmetiske gjennomsnittet av de to sentrale verdiene.
Bestemme modus fra en diskret variasjonsserie: den 5. tariffkategorien har den høyeste frekvensen (60 personer), derfor er den modal. Mo = 5.
For å bestemme medianverdien til attributtet, er tallet på medianenheten i serien (N Me) funnet ved å bruke følgende formel: , hvor n er volumet av populasjonen.
I vårt tilfelle: .
Den resulterende brøkverdien, som alltid forekommer med et jevnt antall befolkningsenheter, indikerer at den nøyaktige midten er mellom 95 og 96 arbeidere. Det er nødvendig å bestemme hvilken gruppe arbeiderne med disse serienumrene tilhører. Dette kan gjøres ved å beregne de akkumulerte frekvensene. Det er ingen arbeidere med disse tallene i den første gruppen, hvor det kun er 12 personer, og de er ikke i den andre gruppen (12+48=60). 95. og 96. arbeidere er i den tredje gruppen (12+48+56=116), derfor er 4. lønnskategori medianen.

Beregning av modus og median i en intervallserie

I motsetning til diskrete variasjonsserier, krever bestemmelsen av modus og median fra intervallserier visse beregninger basert på følgende formler:
, (5.6)
hvor x0- den nedre grensen for det modale intervallet (intervallet med den høyeste frekvensen kalles modal);
Jeg er verdien av det modale intervallet;
f Mo er frekvensen til det modale intervallet;
f Mo-1 er frekvensen til intervallet før modalen;
f Mo +1 er frekvensen til intervallet etter modalen.
(5.7)
hvor x0– den nedre grensen for medianintervallet (medianen er det første intervallet, hvis akkumulerte frekvens overstiger halvparten av den totale summen av frekvenser);
Jeg er verdien av medianintervallet;
S Me-1- akkumulert intervall før medianen;
f meg er frekvensen til medianintervallet.
Vi illustrerer anvendelsen av disse formlene ved å bruke dataene i tabellen. 3.
Intervallet med grenser 60 - 80 i denne fordelingen vil være modalt, pga den har den høyeste frekvensen. Ved å bruke formel (5.6), bestemmer vi modusen:

For å etablere medianintervallet er det nødvendig å bestemme den akkumulerte frekvensen for hvert påfølgende intervall til den overstiger halvparten av summen av de akkumulerte frekvensene (i vårt tilfelle 50 %) (tabell 5.11).
Det ble funnet at medianen er intervallet med grensene på 100 - 120 tusen rubler. Vi definerer nå medianen:

Tabell 3 - Fordeling av befolkningen i Den russiske føderasjonen etter nivået av gjennomsnittlig nominell kontantinntekt per innbygger i mars 1994
Grupper etter nivå av gjennomsnittlig månedlig inntekt per innbygger, tusen rublerAndel av befolkningen, %
opptil 201,4
20 – 40 7,5
40 – 60 11,9
60 – 80 12,7
80 – 100 11,7
100 – 120 10,0
120 – 140 8,3
140 –160 6,8
160 – 180 5,5
180 – 200 4,4
200 – 220 3,5
220 – 240 2,9
240 – 260 2,3
260 – 280 1,9
280 – 300 1,5
Over 3007,7
Total100,0

Tabell 4 - Definisjon av medianintervallet
Dermed kan det aritmetiske gjennomsnittet, modusen og medianen brukes som en generalisert karakteristikk av verdiene til et bestemt attributt for enheter i en rangert populasjon.
Hovedkarakteristikken til distribusjonssenteret er det aritmetiske gjennomsnittet, som er preget av det faktum at alle avvik fra det (positive og negative) summerer seg til null. Det er typisk for medianen at summen av avvik fra den i modul er minimal, og modusen er verdien av funksjonen som forekommer oftest.
Forholdet mellom modus, median og aritmetisk gjennomsnitt indikerer arten av fordelingen av egenskapen i aggregatet, lar oss vurdere dens asymmetri. I symmetriske fordelinger er alle tre karakteristikkene like. Jo større avviket er mellom modusen og det aritmetiske gjennomsnittet, desto mer asymmetrisk er serien. For moderat skjeve serier er forskjellen mellom modusen og det aritmetiske gjennomsnittet omtrent tre ganger forskjellen mellom medianen og gjennomsnittet, dvs.:
|Mo–`x| = 3 |Meg –`x|.

Bestemmelse av modus og median ved en grafisk metode

Modus og median i en intervallserie kan bestemmes grafisk. Modusen bestemmes fra histogrammet til distribusjonen. For å gjøre dette velges det høyeste rektangelet, som i dette tilfellet er modalt. Deretter kobler vi det høyre toppunktet til det modale rektangelet med det øvre høyre hjørnet av det forrige rektangelet. Og venstre toppunkt til det modale rektangelet er med det øvre venstre hjørnet av det påfølgende rektangelet. Fra skjæringspunktet deres senker vi vinkelrett på abscisseaksen. Abscissen til skjæringspunktet for disse linjene vil være distribusjonsmodusen (fig. 5.3).


Ris. 5.3. Grafisk definisjon av mote ved histogram.


Ris. 5.4. Grafisk bestemmelse av medianen ved kumulering
For å bestemme medianen fra et punkt på skalaen av akkumulerte frekvenser (frekvenser) tilsvarende 50 %, trekkes en rett linje parallelt med abscisseaksen til den skjærer kumulasjonen. Deretter, fra skjæringspunktet, senkes en perpendikulær til abscisseaksen. Abscissen til skjæringspunktet er medianen.

Kvartiler, desiler, persentiler

På samme måte, med å finne medianen i den variasjonsrekke med distribusjon, kan du finne verdien av en funksjon for en hvilken som helst enhet i den rangerte serien i rekkefølge. Så, for eksempel, kan du finne verdien av en funksjon i enheter som deler serien i fire like deler, i 10 eller 100 deler. Disse verdiene kalles "kvartiler", "desiler", "persentiler".
Kvartiler er verdien av et trekk som deler den varierende populasjonen i 4 like deler.
Skille mellom den nedre kvartilen (Q 1), som skiller ¼ av populasjonen med de laveste verdiene av attributtet, og den øvre kvartilen (Q 3), som avskjærer den ¼ delen med de høyeste verdiene av attributtet . Dette betyr at 25 % av befolkningsenhetene vil være mindre enn Q 1 ; 25 % enheter vil være innelukket mellom Q 1 og Q 2 ; 25 % - mellom Q 2 og Q 3, og de resterende 25 % er bedre enn Q 3. Den midterste kvartilen av Q 2 er medianen.
For å beregne kvartilene etter intervallvariasjonsserien, brukes følgende formler:
, ,
hvor x Q 1– den nedre grensen for intervallet som inneholder den nedre kvartilen (intervallet bestemmes av den akkumulerte frekvensen, den første overstiger 25 %);
x Q 3– den nedre grensen for intervallet som inneholder den øvre kvartilen (intervallet bestemmes av den akkumulerte frekvensen, den første overstiger 75 %);
Jeg– intervallverdi;
S Q 1-1 er den kumulative frekvensen til intervallet foran intervallet som inneholder den nedre kvartilen;
S Q 3-1 er den kumulative frekvensen til intervallet foran intervallet som inneholder den øvre kvartilen;
f Q 1 er frekvensen til intervallet som inneholder den nedre kvartilen;
f Q 3 er frekvensen til intervallet som inneholder den øvre kvartilen.
Vurder beregningen av nedre og øvre kvartil i henhold til tabell. 5.10. Den nedre kvartilen er i området 60 - 80, hvor den kumulative frekvensen er 33,5 %. Den øvre kvartilen ligger i området 160 - 180 med en akkumulert frekvens på 75,8 %. Med dette i bakhodet får vi:
,
.
I tillegg til kvartiler kan desiler bestemmes i variasjonsfordelingsrekkene - alternativer som deler den rangerte variasjonsserien i ti like deler. Den første desilen (d 1) deler populasjonen 1/10 til 9/10, den andre desilen (d 1) 2/10 til 8/10, og så videre.
De beregnes i henhold til formlene:
, .
Funksjonsverdier som deler serien i hundre deler kalles persentiler. Forholdet mellom medianen, kvartilene, desilene og persentilene er vist i fig. 5.5.

Modus og median- en spesiell type gjennomsnitt som brukes til å studere strukturen til variasjonsseriene. De kalles noen ganger strukturelle gjennomsnitt, i motsetning til de tidligere diskuterte kraftlovgjennomsnittene.

Mote- dette er verdien av attributtet (varianten), som oftest finnes i denne populasjonen, dvs. har den høyeste frekvensen.

Mote har en stor praktisk anvendelse, og i noen tilfeller er det bare mote som kan karakterisere sosiale fenomener.

Median er varianten som er midt i den bestilte variantserien.

Medianen viser den kvantitative grensen for verdien av variabelkarakteristikken, som nås av halvparten av populasjonsenhetene. Bruk av medianen sammen med gjennomsnittet eller i stedet for det er tilrådelig hvis det er åpne intervaller i variasjonsserien, fordi beregningen av medianen krever ikke betinget etablering av grensene for åpne intervaller, og derfor påvirker ikke fraværet av informasjon om dem nøyaktigheten av beregningen av medianen.

Medianen brukes også når indikatorene som skal brukes som vekt er ukjente. Medianen brukes i stedet for det aritmetiske gjennomsnittet i statistiske metoder for produktkvalitetskontroll. Summen av absolutte avvik for alternativer fra medianen er mindre enn fra noe annet tall.

Vurder beregningen av modus og median i en diskret variasjonsserie :

Bestem modus og median.

Mote Mo = 4 år, siden denne verdien tilsvarer den høyeste frekvensen f = 5.

De. De fleste av arbeiderne har 4 års erfaring.

For å beregne medianen finner vi først halve summen av frekvensene. Hvis summen av frekvensene er et oddetall, legger vi først en til denne summen, og deler den deretter i to:

Medianen vil være det åttende alternativet.

For å finne hvilket alternativ som blir det åttende i antall, vil vi akkumulere frekvenser til vi får summen av frekvenser lik eller større enn halvparten av summen av alle frekvenser. Det tilsvarende alternativet vil være medianen.

Meg = 4 år.

De. halvparten av arbeiderne har mindre enn fire års erfaring, halvparten mer.

Hvis summen av de akkumulerte frekvensene mot ett alternativ er lik halvparten av summen av frekvensene, er medianen definert som det aritmetiske gjennomsnittet av dette alternativet og det neste.

Beregning av modus og median i en intervallvariasjonsserie

Modusen i intervallvariasjonsserien beregnes av formelen

hvor X М0- innledende grense for det modale intervallet,

hm 0 er verdien av det modale intervallet,

fm 0 , fm 0-1 , fm 0+1 - frekvensen av det modale intervallet, henholdsvis før det modale og etterfølgende.

Modal Intervallet med høyest frekvens kalles.

Eksempel 1

Grupper etter erfaring

Antall arbeidere, mennesker

Akkumulerte frekvenser

Bestem modus og median.

Modalt intervall, fordi det tilsvarer den høyeste frekvensen f = 35. Da:

HM 0 =6, fm 0 =35

ØVELSE #4 .

Beregning av de strukturelle egenskapene til variasjonsfordelingsserien.

Studenten skal:

vet:

- omfang og metodikk for beregning av strukturelle gjennomsnitt;

være i stand til:

- beregne strukturelle gjennomsnitt;

- formulere en konklusjon basert på de oppnådde resultatene.

Retningslinjer

I statistikk beregnes modus og median, som er relatert til strukturelle gjennomsnitt, så hvilken verdi avhenger av bygninger statistisk aggregat.

moteberegning

Mote verdien av funksjonen (varianten) kalles oftere alt som skjer i den studerte befolkningen. I en diskret distribusjonsserie vil modusen være varianten med høyest frekvens.

For eksempel: Fordelingen av damesko solgt etter størrelse er karakterisert som følger:

Skostørrelse

Antall solgte par

I denne distribusjonsserien er modusen størrelse 37, dvs. Mo=37 størrelse.

For en intervallfordelingsserie bestemmes modusen av formelen:

hvor X Mo - den nedre grensen for det modale intervallet;

hMo - verdien av det modale intervallet;

f Mo er frekvensen til det modale intervallet;

f Mo -1Og f Mo +1 – henholdsvis intervallfrekvens

forut for modalen og etter den.

For eksempel: Fordelingen av arbeidere etter tjenestetid er preget av følgende data.

Arbeidserfaring, år

opptil 2

8-10

10 eller flere

Antall arbeidere, pers.

Bestem modusen for intervallserien til fordelingen.

Modusen til intervallserien er

Mote er alltid noe vag; det avhenger av størrelsen på gruppene og den nøyaktige plasseringen av gruppegrensene. Mote er mye brukt i kommersiell praksis når man studerer forbrukernes etterspørsel, når man registrerer priser osv.

Medianberegning

Median i statistikk kalles en variant som ligger midt i en ordnet dataserie, og som deler den statistiske populasjonen i to like deler slik at den ene halvparten av verdien er mindre enn medianen, og den andre halvparten er større enn den. For å bestemme medianen er det nødvendig å bygge en rangert serie, dvs. en serie i stigende eller synkende rekkefølge av individuelle karakteristiske verdier.

I en diskret ordnet serie med et oddetall medlemmer, vil medianen være varianten som ligger i midten av serien.

For eksempel: Erfaringen til fem arbeidere var 2, 4, 7, 9 og 10 år. I denne serien er medianen 7 år, dvs. Meg = 7 år

Hvis en diskret ordnet serie består av et partall av medlemmer, vil medianen være det aritmetiske gjennomsnittet av to tilstøtende alternativer i midten av serien.

For eksempel: Arbeidserfaringen til seks arbeidere var 1, 3, 4, 5, 10 og 11 år. Det er to alternativer i denne raden, stående i midten av raden. Dette er alternativene 4 og 5. Det aritmetiske gjennomsnittet av disse verdiene vil være medianen av serien

For å bestemme medianen for grupperte data, må de kumulative frekvensene leses.

For eksempel:Basert på tilgjengelige data, bestemmer vi median skostørrelse

Skostørrelse

Antall solgte par

Summen av kumulative frekvenser

8+19=27

27+34=61

61+108=169

Total

For å bestemme medianen, er det nødvendig å beregne summen av de akkumulerte frekvensene til serien. Akkumuleringen av totalen fortsetter til den akkumulerte summen av frekvenser overstiger halvparten av summen av frekvensene i serien. I vårt eksempel var summen av frekvenser 300, dens halvparten - 150. Den akkumulerte summen av frekvenser viste seg å være 169. Varianten som tilsvarer denne summen, dvs. 37 er medianen for serien.

Hvis summen av de akkumulerte frekvensene mot et av alternativene er nøyaktig halvparten av summen av frekvensene til serien, er medianen definert som det aritmetiske gjennomsnittet av dette alternativet og det neste.

For eksempel: Basert på tilgjengelige data, bestemmer vi medianlønnen til arbeidere

Månedslønn, tusen rubler

Antall arbeidere, pers.

Summen av kumulative frekvenser

14,0

14,2

2+6=8

16,0

8+12=20

16,8

18,0

Total:

Medianen vil være:

Medianen til intervallvariasjonsserien til fordelingen bestemmes av formelen:

Hvor x meg er den nedre grensen for medianintervallet;

h meg er verdien av medianintervallet;

f- summen av frekvensene til serien;

f Meg er frekvensen til medianintervallet;

For eksempel:Basert på tilgjengelige data om fordeling av foretak etter antall industri- og produksjonspersonell, beregne medianen i intervallvariasjonsserien

Antall foretak

Summen av kumulative frekvenser

100-200

200-300

1+3=4

300-400

4+7=11

400-500

11+30=41

500-600

600-700

700-800

Total:

La oss først definere medianintervallet. I dette eksemplet tilsvarer summen av akkumulerte frekvenser som overstiger halvparten av summen av alle verdiene i serien intervallet 400-500. Dette er medianintervallet, dvs. intervallet som inneholder medianen av serien. La oss definere betydningen

Hvis summen av de akkumulerte frekvensene mot et av intervallene er nøyaktig halvparten av summen av frekvensene til serien, bestemmes medianen av formelen:

hvor n- antall enheter i befolkningen.

For eksempel:Basert på tilgjengelige data om fordeling av foretak etter antall industri- og produksjonspersonell, beregne medianen i intervallvariasjonsserien

Foretaksgrupper etter antall OPS, pers.

Antall foretak

Summen av kumulative frekvenser

100-200

200-300

1+3=4

300-400

4+6=10

400-500

10+30=40

500-600

40+20=60

600-700

700-800

Total:

mennesker

Modus og median i intervallserien kan være definere grafisk:

modusen i diskrete serier - ved fordelingspolygonet, modusen i intervallserier - ved fordelingshistogrammet, og medianen - ved kumuleringen.

Modus for intervallfordelingsserien bestemmes av distribusjonshistogrammet bestemme på følgende måte. For å gjøre dette velges det høyeste rektangelet, som i dette tilfellet er modalt. Deretter kobler vi det høyre toppunktet til det modale rektangelet med det øvre høyre hjørnet av det forrige rektangelet. Og venstre toppunkt til det modale rektangelet er med det øvre venstre hjørnet av det påfølgende rektangelet. Videre, fra skjæringspunktet, senkes en perpendikulær til abscisseaksen. Abscissen til skjæringspunktet for disse linjene vil være distribusjonsmodusen.

Medianen beregnes fra kumuleringen. For å bestemme det, fra et punkt på skalaen av akkumulerte frekvenser (frekvenser), som tilsvarer 50 %, tegnes en rett linje, parallelt med abscisseaksen, til den skjærer kumulasjonen. Deretter, fra skjæringspunktet mellom den spesifiserte rette linjen med kumulatet, senkes en perpendikulær til abscisseaksen. Abscissen til skjæringspunktet er medianen.

I tillegg til modus og median kan andre strukturelle egenskaper, kvantiler, bestemmes i variantserien. Kvantiler er ment for en dypere studie av strukturen til distribusjonsserien.

kvantil- dette er verdien av en funksjon som opptar en bestemt plass i befolkningen sortert etter denne funksjonen. Det finnes følgende typer kvantiler:

- kvartiler er attributtverdiene som deler det bestilte settet inn i fire like deler;

- desiler - attributtverdier som deler det bestilte settet i ti like deler;

- prosenter - attributtverdier som deler det bestilte settet i hundre like deler.

For å karakterisere posisjonen til midten av distribusjonsserien, kan 3 indikatorer brukes: mener funksjon, modus, median. Når du velger type og form for en spesifikk indikator for distribusjonssenteret, er det nødvendig å gå videre fra følgende anbefalinger:

- for bærekraftige sosioøkonomiske prosesser brukes det aritmetiske gjennomsnittet som en indikator på senteret. Slike prosesser er preget av symmetriske fordelinger, der ;

- for ustabile prosesser er distribusjonssentralens posisjon preget av Mo eller Meg. For asymmetriske prosesser er den foretrukne egenskapen til distribusjonssenteret medianen, siden den inntar en posisjon mellom det aritmetiske gjennomsnittet og modusen.

For å karakterisere distribusjonsserien (variasjonsseriens struktur), sammen med gjennomsnittet, den såkalte. strukturelle gjennomsnitt: mote Og median. Modus og median er de mest brukte i økonomisk praksis.

Mote- den varianten som oftest finnes i utbredelsesserien (i denne populasjonen).

I diskret i variasjonsserier bestemmes modusen av den høyeste frekvensen. La oss anta at varer A selges i byen av 9 firmaer til følgende priser i rubler:

44; 43; 44; 45; 43; 46; 42; 46;43. Siden den vanligste prisen er 43 rubler, vil den være modal.

Ved karakterisering av sosiale grupper av befolkningen etter inntektsnivå, bør en modal verdi brukes i stedet for et gjennomsnitt. Gjennomsnittet vil undervurdere noen indikatorer og overvurdere andre - og dermed gjennomsnittliggjøre (utjevne) inntektene til alle segmenter av befolkningen.

I intervall i variasjonsserier bestemmes modusen omtrentlig av formelen:

    ХМ0 - den nedre grensen for det modale intervallet;

    h Mo - verdi (trinn, bredde) av det modale intervallet;

    f 1 - lokal frekvens av intervallet før modalen;

    f 2 - lokal frekvens av det modale intervallet;

    f 3 - lokal frekvens for intervallet etter modalen.

Fordeling av befolkningen etter nivået av gjennomsnittlig månedlig inntekt per innbygger

Intervallet 1000-3000 i denne fordelingen vil være modalt, pga den har den høyeste frekvensen (f=35,5). Deretter, i henhold til formelen ovenfor, vil modusen være lik:

På grafen (distribusjonshistogram) bestemmes modusen som følger: lokale frekvenser er plottet langs y-aksen, og intervaller eller intervallsentre er plottet langs abscissen. Den høyeste linjen er valgt, som tilsvarer verdien til funksjonen med høyest frekvens i distribusjonsserien.

Mote brukes til å løse noen praktiske problemer. Så, for eksempel, når man studerer omsetningen til markedet, tas modalprisen, for å studere etterspørselen etter sko, klær, modale størrelser på sko og klær brukes.

Median- dette er den numeriske verdien av egenskapen for enheten til populasjonen som er i midten av den rangerte serien (bygget i stigende eller synkende rekkefølge av verdiene til egenskapen som studeres). Median noen ganger kalt mellomalternativ, fordi den deler befolkningen i to like deler på en slik måte at det på begge sider av den er like mange enheter av befolkningen. Hvis alle enheter i en serie er tildelt serienummer, vil serienummeret til medianen bli bestemt av formelen (n + 1): 2 for serier, hvor n - merkelig. Hvis en rad med til og med antall enheter, da median vil være gjennomsnittsverdien mellom to tilstøtende alternativer, bestemt av formelen: n:2, (n+1):2, (n:2)+1.

I diskrete variasjonsserier med et oddetall populasjonsenheter er dette en spesifikk tallverdi i midten av serien.

Å finne medianen i intervallvariasjonsserier krever en foreløpig bestemmelse av intervallet som medianen befinner seg i, dvs. median intervall- dette intervallet er preget av det faktum at dets kumulative (kumulative) frekvens er lik halve summen eller overstiger halvsummen av alle frekvenser i serien.

    X Me - den nedre grensen for medianintervallet

    h Me - verdien av medianintervallet;

    S Me-1 - summen av de akkumulerte frekvensene til intervallet før medianintervallet;

    f Me er den lokale frekvensen til medianintervallet.

I følge tabellen fastsetter vi medianverdien av inntekt per innbygger. For å gjøre dette må du bestemme hvilket intervall som vil være medianen. Vi bruker formelen for tallet på medianenheten i serien, dvs. midten:

En brøkverdi av N (alltid med et partall av ledd) lik 50,5 % indikerer at midten av serien er mellom 50 % og 51 %, dvs. i tredje intervall. Med andre ord: medianen er intervallet, som for første gang utgjør mer enn halvparten av summen av akkumulerte frekvenser. Derav medianen:

For å bestemme grafisk intervallet som medianen er plassert i, plottes de akkumulerte frekvensene langs y-aksen, og sentrene til intervallene plottes langs abscissen. Fra punktet på ordinataksen, som tilsvarer 50,5 % av summen av de akkumulerte frekvensene, trekkes en linje parallelt med abscisseaksen til den skjærer kumulasjonen. Fra skjæringspunktet senkes en perpendikulær til abscisseaksen.

Forholdet mellom modus, median og aritmetisk gjennomsnitt indikerer arten av fordelingen av egenskapen i aggregatet, lar oss vurdere dens asymmetri. Hvis M0

Fra forholdet mellom disse indikatorene bør det konkluderes med at det er en høyresidig asymmetri i fordelingen av befolkningen i henhold til nivået på gjennomsnittlig kontantinntekt per innbygger:

Kvartil- dette er den fjerde delen av populasjonen, den er definert som medianen, kun summen av frekvensene må deles på 4, og ved bestemmelse av kvartilintervallet må den kumulative frekvensen være større enn eller lik en fjerdedel av summen av frekvensene til befolkningen.

Desil Deler befolkningen i ti like store deler. Den bestemmes på samme måte som kvartilen, kun summen av frekvensene må deles på 10.

Strukturelle (posisjonelle) gjennomsnitt- dette er gjennomsnittsverdier som opptar en bestemt plass (posisjon) i en rangert variasjonsserie.

Mote(Mo) er verdien av funksjonen som oftest finnes i studiepopulasjonen.

Til diskrete variasjonsserier modusen vil være verdien av alternativene med høyest frekvens

Eksempel. Bestem modusen fra tilgjengelige data (tabell 7.5).

Tabell 7.5 - Fordeling av damesko solgt i skobutikk N, Februar 2013

I følge tabell. 5 viser at den høyeste frekvensen fmax= 28, det tilsvarer verdien av funksjonen x= 37 størrelse. Følgelig Mo= 37 skostørrelse, dvs. det var denne skostørrelsen som var størst etterspørsel etter, kjøpte oftest sko i størrelse 37.

I først bestemt modal avstand, dvs. som inneholder modusen - intervallet med høyest frekvens (i tilfelle av en intervallfordeling med like intervaller, ved ulik intervall - med høyeste tetthet).

Modus anses omtrent som midten av det modale intervallet. Den spesifikke modusverdien for intervallserien bestemmes av formelen:

hvor x Mo er den nedre grensen for det modale intervallet;

i Mo er verdien av det modale intervallet;

f Mo er frekvensen til det modale intervallet;

f Mo-1 er frekvensen til intervallet før modalen;

f Mo +1 er frekvensen til intervallet etter modalen.

Eksempel. Bestem modusen fra tilgjengelige data (tabell 7.6).

Tabell 7.6 - Fordeling av ansatte etter tjenestetid

I følge tabell. 6 viser at den høyeste frekvensen fmax= 35, det tilsvarer intervallet: 6-8 år (modalt intervall). Vi definerer mote med formelen:

år.

Følgelig Mo= 6,8 år, dvs. De fleste ansatte har 6,8 års erfaring.

Navnet på medianen er hentet fra geometri, der det refererer til et segment som forbinder en av toppunktene i en trekant med midtpunktet på motsatt side og dermed deler siden av trekanten i to like deler.

Median(Meg) er verdien av funksjonen som faller i midten av avstandspopulasjonen. Ellers er medianen en verdi som deler antallet av en ordnet variasjonsserie i to like deler - den ene delen har verdiene til det varierende attributtet mindre enn gjennomsnittsvarianten, og den andre har store verdier.

Til rangerte serier(dvs. ordnet - innebygd i stigende eller synkende rekkefølge av individuelle attributtverdier) med et oddetall medlemmer ( n= oddetall) medianen er varianten som er plassert i midten av raden. Ordningsnummer på medianen ( N meg) er definert som følger:

N Meg =(n+1)/ 2.

Eksempel. I en serie på 51 medlemmer er mediantallet (51+1)/2 = 26, dvs. medianen er det 26. alternativet i serien.

For en rangert serie med et partall av termer ( n= selv) - medianen vil være det aritmetiske gjennomsnittet av de to verdiene til attributtet som er plassert i midten av raden. Serienumrene til de to sentrale variantene bestemmes som følger:

N Me 1 =n/ 2; N Me 2 =(n/ 2)+ 1.

Eksempel. Når n=50; N Me1 = 50/2 = 25; N Me2= (50/2)+1 = 26, dvs. medianen er gjennomsnittet av alternativene i 25. og 26. rad i rekkefølge.

I diskrete variasjonsserier medianen er funnet ved den akkumulerte frekvensen som tilsvarer ordinærtallet til medianen eller overskrider den for første gang. Ellers, i henhold til den akkumulerte frekvensen lik eller for første gang over halve summen av alle frekvenser i serien.

Eksempel. Bestem medianen fra tilgjengelige data (tabell 7.7).

Tabell 7.7 - Fordeling av damesko solgt i skobutikk N, Februar 2013

I følge tabell. 7 definerer ordinærtallet til medianen: N meg =( 67+1)/2=34.

Mote. Median. Hvordan beregne dem (s. 1 av 2)

Den kumulative frekvensen som overskrider denne verdien for første gang S= 41, det tilsvarer verdien av funksjonen x= 37 størrelse. Følgelig Meg= 37 skostørrelse, dvs. halvparten av parene kjøpes mindre enn størrelse 37, og den andre halvparten kjøpes større.

I dette eksemplet er modusen og medianen de samme, men de kan være like eller ikke.

I intervallvariasjonsserier kumulative frekvenser bestemmes, i henhold til de kumulative frekvensene data er funnet median intervall– intervallet der den akkumulerte frekvensen er halvparten eller for første gang overstiger halvparten av den totale summen av frekvenser. Formelen for å bestemme medianen i intervallserien til fordelingen er som følger:

.

hvor x meg er den nedre grensen for medianintervallet;

jeg meg er verdien av medianintervallet;

fi er summen av frekvensene til serien;

S Me-1 er summen av de akkumulerte frekvensene til intervallet foran medianen;

f meg er frekvensen til medianintervallet.

Eksempel. Bestem medianen fra tilgjengelige data (tabell 7.8).

Tabell 7.8 - Fordeling av ansatte etter tjenestetid

I følge tabell. 8 definerer ordinærtallet til medianen: NMe=100/2=50. Den kumulative frekvensen som overskrider denne verdien for første gang S= 82, det tilsvarer et intervall på 6-8 år (median intervall). I dette eksemplet er de modale og mediane intervallene de samme, men de kan være like eller ikke. La oss bestemme medianen ved formelen:

år

Følgelig Meg= 6,2 år, dvs. halvparten av de ansatte har mindre enn 6,2 års erfaring og den andre halvparten har mer.

Modus og median er mye brukt i ulike områder av økonomien. Dermed er beregningen av modal arbeidsproduktivitet, modal kostnad, etc. gjør det mulig for økonomen å bedømme det gjeldende nivået på dem. Denne egenskapen bør brukes til å avsløre reservene til økonomien vår. Mote er viktig for å løse praktiske problemer. Så når du planlegger masseproduksjon av klær og fottøy, er størrelsen på produktet satt, som er mest etterspurt (modal størrelse). Modusen kan brukes som en omtrentlig karakteristikk av nivået til den studerte egenskapen i stedet for det aritmetiske gjennomsnittet hvis frekvensfordelingene er nær symmetriske og har én ikke-flat topp.

Medianen skal brukes som et gjennomsnitt i tilfeller der det ikke er tilstrekkelig tillit til homogeniteten til populasjonen som studeres. Medianen påvirkes ikke så mye av verdiene i seg selv som av antall tilfeller på ett eller annet nivå. Det bør også bemerkes at medianen alltid er spesifikk (for et stort antall observasjoner eller i tilfelle av et oddetall medlemmer av befolkningen), fordi under Meg et reelt reelt element av populasjonen er underforstått, mens det aritmetiske gjennomsnittet ofte får en verdi som ingen av enhetene i populasjonen kan ta.

Hovedeiendom Meg ved at summen av absolutte avvik av egenskapsverdiene fra medianen er mindre enn fra noen annen verdi: . Denne eiendommen Meg kan brukes for eksempel ved bestemmelse av byggeplass for offentlige bygninger, fordi Meg bestemmer punktet som gir kortest avstand, for eksempel barnehager fra bosted for foreldre, beboere i bosetningen fra kino, ved utforming av trikk, trolleybussholdeplasser, etc.

I systemet med strukturelle indikatorer fungerer alternativene som opptar en viss plass i den rangerte variasjonsserien (hver fjerde, femte, tiende, tjuefemte, etc.) som indikatorer på egenskapene til distribusjonsformen. På samme måte, med å finne medianen i variasjonsserien, kan du finne verdien av attributtet for en hvilken som helst enhet i den rangerte serien i rekkefølge.

Kvartiler– attributtverdier som deler den varierende populasjonen i fire like deler. Skille nedre kvartil ( Q1), midten ( Q2) og øvre ( Q 3). Den nedre kvartilen skiller 1/4 av populasjonen med de laveste verdiene av funksjonen, den øvre kvartilen skiller 1/4 av populasjonen med de høyeste verdiene av funksjonen. Dette betyr at 25 % av befolkningsenhetene vil være mindre i verdi Q1; 25 % enheter vil bli konkludert mellom Q1 Og Q2; 25 % - mellom Q2 Og Q 3; de resterende 25 % gir bedre resultater Q 3. Den midterste kvartilen ( Q2) er medianen .

For å beregne kvartilene for intervallserien, brukes følgende formler:

;

.

hvor x Q1– den nedre grensen for intervallet som inneholder den nedre kvartilen (intervallet bestemmes av den akkumulerte frekvensen, den første overstiger 25 %);

x Q3– den nedre grensen for intervallet som inneholder den øvre kvartilen (intervallet bestemmes av den akkumulerte frekvensen, den første overstiger 75 %);

S Q 1-1 er den kumulative frekvensen til intervallet foran intervallet som inneholder den nedre kvartilen;

S Q 3-1 er den kumulative frekvensen til intervallet foran intervallet som inneholder den øvre kvartilen;

fQ1 er frekvensen til intervallet som inneholder den nedre kvartilen;

fQ3 er frekvensen til intervallet som inneholder den øvre kvartilen.

Desiler er variantverdier som deler den rangerte serien i ti like deler: 1. desil ( d1) deler populasjonen 1/10 til 9/10, 2. desil ( d2) - i forholdet 2/10 til 8/10, etc. Desiler beregnes på samme måte som medianen og kvartilene:

;

.

Bruken av de ovennevnte karakteristikkene i analysen av variasjonsfordelingsserier lar en dypt og i detalj karakterisere populasjonen som studeres.

SE MER:

Strukturelle gjennomsnitt

Sammen med kraftlovgjennomsnitt er strukturelle gjennomsnitt mye brukt.

Strukturen til statistiske aggregater er annerledes. Samtidig, jo mer symmetrisk fordelingen av befolkningsenheter er, jo mer kvalitativt dens sammensetning i henhold til egenskapen som studeres, desto bedre og mer pålitelig karakteriserer den gjennomsnittlige verdien av egenskapen fenomenet som studeres. Men for tilfeller av skarp skjevhet (asymmetri) av distribusjonsserien, er det aritmetiske gjennomsnittet ikke lenger så typisk. For eksempel er gjennomsnittsstørrelsen på et innskudd i sparebanker ikke av spesiell interesse, siden hoveddelen av innskuddene er under dette nivået, og gjennomsnittet er betydelig påvirket av store innskudd, som er få og som ikke er typiske for massen av innskudd.

Mote (statistikk)

I slike tilfeller bruker statistikken et annet system - systemet med hjelpestrukturelle gjennomsnitt. Disse inkluderer modus, median, samt kvarteller, kvinteller, deceler, prosenter.

Mote (Mo)- den hyppigst forekommende verdien av attributtet, og i en diskret variasjonsserie - dette er alternativene med høyest frekvens.

I statistisk praksis brukes mote i studiet av befolkningens inntekter, forbrukernes etterspørsel, prisregistrering og i analysen av noen tekniske og økonomiske indikatorer for bedrifter.

I noen tilfeller er det modusen som er av interesse, og ikke det aritmetiske gjennomsnittet. Noen ganger brukes det i stedet for det aritmetiske gjennomsnittet, for eksempel for å karakterisere strukturen til distribusjonsserier.

Rekkefølgen som modusen bestemmes i avhenger av typen distribusjonsserie. Hvis variabelattributtet presenteres som en diskret serie, kreves det ingen beregninger for å bestemme modusen. I en slik serie vil modusen være verdien til funksjonen som har høyest frekvens.

Hvis verdien av attributtet presenteres som en intervallvariasjonsserie med like intervaller, bestemmes modusen ved beregning ved hjelp av formelen:

hvor X Mo er den nedre grensen for det modale intervallet,

Jeg Mo er verdien av det modale intervallet,

f Mo , f Mo-1 , f Mo+1 er frekvensene til henholdsvis de modale, premodale (forrige) og postmodale (etter modale) intervaller.

Median (meg)- dette er verdien av funksjonen, som er i midten av serien med variasjonsvariasjoner, der de individuelle verdiene til funksjonen (alternativer) er ordnet i stigende eller synkende rekkefølge (etter rangering).

Medianen skal brukes som et gjennomsnitt i tilfeller der det ikke er tilstrekkelig tillit til homogeniteten til populasjonen som studeres. Medianen finner anvendelse i markedsføringsaktiviteter. For eksempel plassering av heiser, primære vinprodusenter, hermetikkfabrikker, summen av avstandene som fra råvareleverandører bør være den minste.

Medianen, i likhet med modusen, er definert på forskjellige måter. Det avhenger av strukturen til distribusjonsserien.
For å bestemme medianen i diskrete variasjonsserier:

1) finn serienummeret ved hjelp av formelen

N meg =
2) bygge en serie med akkumulerte frekvenser

3) finn den akkumulerte frekvensen, som er lik eller overstiger serienummeret til medianen

4) av varianten som tilsvarer den gitte akkumulerte frekvensen er medianen.

Hvis antallet medlemmer av en diskret serie er oddetall, er medianen i midten av serien og deler denne serien i to like deler i henhold til antallet medlemmer av serien. Ordinaltallet til medianen i dette tilfellet beregnes med formelen:

NMe =(f + 1)2,

hvor f antall medlemmer i serien.

I intervallserier bestemmes først medianintervallet. For dette, akkurat som i diskrete serier, beregnes ordinærtallet til medianen. Den akkumulerte frekvensen, som er lik tallet på medianen eller den første overskrider den, tilsvarer medianintervallet i intervallvariasjonsserien. La oss betegne denne akkumulerte frekvensen som S Me . Medianen beregnes direkte ved å bruke formelen:

,
hvor er den nedre grensen for medianintervallet

- verdien av medianintervallet

er den kumulative frekvensen til intervallet foran medianen

— frekvensen av medianintervallet

Grafisk definisjon av modus og median
Modus og median i en intervallserie kan bestemmes grafisk.

Modusen bestemmes fra histogrammet til distribusjonen. For å gjøre dette velges det høyeste rektangelet, som i dette tilfellet er modalt. Deretter kobler vi det høyre toppunktet til det modale rektangelet med det øvre høyre hjørnet av det forrige rektangelet. Og venstre toppunkt til det modale rektangelet er med det øvre venstre hjørnet av det påfølgende rektangelet. Videre, fra skjæringspunktet, senkes en perpendikulær til abscisseaksen. Abscissen til skjæringspunktet for disse linjene vil være distribusjonsmodusen (fig. 1). Medianen beregnes fra kumulatet (fig. 2). For å bestemme det, fra et punkt på skalaen av akkumulerte frekvenser (frekvenser) som tilsvarer 50 %, trekkes en rett linje parallelt med abscisseaksen til den skjærer kumulasjonen. Deretter, fra skjæringspunktet mellom den spesifiserte rette linjen med kumulatet, senkes en perpendikulær til abscisseaksen. Abscissen til skjæringspunktet er medianen.

Indikatorer for variasjon i statistikk.

I prosessen med statistisk analyse kan det oppstå en situasjon når verdiene til middelverdiene sammenfaller, og populasjonene som de beregnes på grunnlag av består av enheter hvis karakteristiske verdier avviker ganske kraftig fra hverandre. I dette tilfellet beregnes variasjonsindikatorene.

Katalog: nedlastinger -> Sotrudniki
nedlastinger -> N. L. Ivanova M. F. Lukanina
nedlastinger -> Foredrag for førskolebarn og foreldre "Forebygging av aggressiv atferd hos førskolebarn"
nedlastinger -> Psykologisk faglig tilpasning av personlighet
nedlastinger -> Institutt for utdanning og vitenskap i Kemerovo-regionen Kemerovo regionale psykologiske og valeologiske senter
nedlastinger -> Federal Drug Control Service i den russiske føderasjonens avdeling for Kemerovo-regionen
Sotrudniki -> Chuvash-republikkens bue
nedlastinger -> Funksjoner av psykologisk og pedagogisk støtte for utvikling av førskolebarn
nedlastinger -> Mishina M. M. Utviklingen av tenkning avhengig av involvering i familie- og klanerelasjoner
Sotrudniki -> Dannelse av faglig betydningsfulle egenskaper hos studenter med utviklingshemming etter yrke

TEST

Om emnet: "Modus. Median. Metoder for å beregne dem"

Introduksjon

Gjennomsnittsverdier og relaterte variasjonsindikatorer spiller en svært viktig rolle i statistikk, noe som skyldes emnet for studien. Derfor er dette temaet et av de sentrale i kurset.

Gjennomsnittet er en svært vanlig generaliserende indikator i statistikk. Dette forklares med at bare ved hjelp av gjennomsnittet er det mulig å karakterisere befolkningen etter en kvantitativt varierende egenskap. En gjennomsnittsverdi i statistikk er en generaliserende karakteristikk av et sett med fenomener av samme type i henhold til en eller annen kvantitativt varierende egenskap. Gjennomsnittet viser nivået på denne egenskapen, relatert til befolkningens enhet.

Statistikere studerer sosiale fenomener og søker å identifisere deres karakteristiske, typiske trekk under spesifikke forhold for sted og tid, og bruker i stor grad gjennomsnittsverdier. Ved hjelp av gjennomsnitt kan ulike populasjoner sammenlignes med hverandre etter varierende egenskaper.

Gjennomsnitt brukt i statistikk tilhører klassen effektgjennomsnitt. Av effektgjennomsnitt brukes oftest det aritmetiske gjennomsnittet, sjeldnere det harmoniske gjennomsnittet; det harmoniske gjennomsnittet brukes bare når man beregner gjennomsnittshastighetene for dynamikk, og middelkvadraten - bare når man beregner variasjonsindikatorene.

Det aritmetiske gjennomsnittet er kvotienten for å dele summen av alternativene med antallet. Det brukes i tilfeller der volumet av en variabel attributt for hele populasjonen dannes som summen av attributtverdiene for dens individuelle enheter. Det aritmetiske gjennomsnittet er den vanligste typen gjennomsnitt, siden det tilsvarer naturen til sosiale fenomener, der volumet av varierende tegn i aggregatet oftest dannes nøyaktig som summen av verdiene til attributtet i individuelle enheter av attributtet. befolkningen.

I henhold til dens definerende egenskap, bør det harmoniske gjennomsnittet brukes når det totale volumet av attributtet dannes som summen av de gjensidige verdiene til varianten. Den brukes når vektene, avhengig av tilgjengelig materiale, ikke må multipliseres, men divideres med alternativer eller, som er det samme, multiplisert med deres inverse verdi. Det harmoniske gjennomsnittet i disse tilfellene er det resiproke av det aritmetiske gjennomsnittet av de gjensidige verdiene til attributtet.

Det harmoniske gjennomsnittet skal brukes i de tilfellene hvor ikke enhetene til befolkningen - bærerne av attributtet, men produktene til disse enhetene og verdien av attributtet brukes som vekter.

1. Definisjon av modus og median i statistikk

De aritmetiske og harmoniske midlene er de generaliserende egenskapene til befolkningen i henhold til en eller annen varierende egenskap. Hjelpebeskrivende kjennetegn ved fordelingen av et variabelattributt er modusen og medianen.

I statistikk er mote verdien av en funksjon (variant) som oftest finnes i en gitt populasjon. I variantserien vil dette være varianten med høyest frekvens.

Medianen i statistikk er varianten, som er midt i variasjonsserien. Medianen deler serien i to, på begge sider av den (opp og ned) er det samme antall befolkningsenheter.

Modus og median, i motsetning til kraftlovgjennomsnitt, er spesifikke egenskaper, verdien deres er ethvert spesielt alternativ i variasjonsserien.

Modus brukes i tilfeller der det er nødvendig å karakterisere den hyppigst forekommende verdien av en funksjon.

5.5 Modus og median. Deres beregning i diskrete og intervallvariasjonsserier

Hvis det for eksempel er nødvendig å finne ut den vanligste lønnssatsen i bedriften, markedsprisen som det ble solgt flest varer til, størrelsen på sko som er mest etterspurt blant forbrukerne osv., i disse tilfeller ty til mote.

Medianen er interessant ved at den viser den kvantitative grensen for verdien av variabelkarakteristikken, som ble nådd av halvparten av medlemmene av befolkningen. La gjennomsnittslønnen til bankansatte beløpe seg til 650 000 rubler. per måned. Denne egenskapen kan suppleres hvis vi sier at halvparten av arbeiderne fikk en lønn på 700 000 rubler. og høyere, dvs. la oss ta medianen. Modus og median er typiske kjennetegn i tilfeller der populasjonene er homogene og store i antall.

Finne modus og median i en diskret variasjonsserie

Å finne modus og median i en variasjonsserie, der attributtverdiene er gitt av visse tall, er ikke veldig vanskelig. Betrakt tabell 1. med fordelingen av familier etter antall barn.

Tabell 1. Fordeling av familier etter antall barn

Åpenbart, i dette eksemplet, vil moten være en familie med to barn, siden denne verdien av opsjoner tilsvarer det største antallet familier. Det kan være distribusjoner hvor alle varianter er like hyppige, i så fall er det ingen mote, eller med andre ord, alle varianter kan sies å være like modale. I andre tilfeller kan ikke ett, men to alternativer være den høyeste frekvensen. Da blir det to moduser, fordelingen blir bimodal. Bimodale fordelinger kan indikere den kvalitative heterogeniteten til befolkningen i henhold til egenskapen som studeres.

For å finne medianen i en diskret variasjonsserie, må du dele summen av frekvenser i to og legge til ½ til resultatet. Så, i fordelingen av 185 familier etter antall barn, vil medianen være: 185/2 + ½ = 93, dvs. Det 93. alternativet, som deler den bestilte raden i to. Hva er meningen med det 93. alternativet? For å finne ut, må du samle frekvenser, med utgangspunkt i de minste alternativene. Summen av frekvensene til 1. og 2. alternativ er 40. Det er tydelig at det ikke er 93 alternativer her. Hvis vi legger til frekvensen av det 3. alternativet til 40, får vi summen lik 40 + 75 = 115. Derfor tilsvarer det 93. alternativet den tredje verdien av variabelattributtet, og medianen vil være en familie med to barn .

Modus og median i dette eksemplet falt sammen. Hvis vi hadde en jevn sum av frekvenser (for eksempel 184), og ved å bruke formelen ovenfor, får vi antallet medianalternativer, 184/2 + ½ = 92,5. Siden det ikke er noen brøkalternativer, indikerer resultatet at medianen er i midten mellom 92 og 93 alternativer.

3. Beregning av modus og median i intervallvariasjonsserien

Den beskrivende karakteren til modusen og medianen skyldes at de ikke kompenserer for individuelle avvik. De tilsvarer alltid en viss variant. Derfor krever ikke modusen og medianen beregninger for å finne dem hvis alle verdiene til funksjonen er kjent. I intervallvariasjonsseriene brukes imidlertid beregninger for å finne den omtrentlige verdien av modusen og medianen innenfor et visst intervall.

For å beregne en viss verdi av den modale verdien til et tegn innelukket i et intervall, brukes følgende formel:

M o \u003d X Mo + i Mo * (f Mo - f Mo-1) / ((f Mo - f Mo-1) + (f Mo - f Mo + 1)),

Hvor X Mo er minimumsgrensen for det modale intervallet;

i Mo er verdien av det modale intervallet;

fMo er frekvensen til det modale intervallet;

f Mo-1 - frekvensen til intervallet før modalen;

f Mo+1 er frekvensen til intervallet etter modalen.

Vi vil vise beregningen av modusen ved å bruke eksemplet gitt i tabell 2.

Tabell 2. Fordeling av arbeidere i bedriften i henhold til gjennomføringen av produksjonsstandarder

For å finne modusen, bestemmer vi først det modale intervallet til den gitte serien. Det kan ses av eksemplet at den høyeste frekvensen tilsvarer intervallet der varianten ligger i området fra 100 til 105. Dette er det modale intervallet. Verdien av det modale intervallet er 5.

Ved å erstatte de numeriske verdiene fra tabell 2 med formelen ovenfor, får vi:

M o \u003d 100 + 5 * (104 -12) / ((104 - 12) + (104 - 98)) \u003d 108,8

Betydningen av denne formelen er som følger: Verdien av den delen av det modale intervallet, som må legges til minimumsgrensen, bestemmes avhengig av størrelsen på frekvensene til forrige og etterfølgende intervaller. I dette tilfellet legger vi til 8,8 til 100, dvs. mer enn halvparten av intervallet, fordi frekvensen til det forrige intervallet er mindre enn frekvensen til det påfølgende intervallet.

La oss beregne medianen nå. For å finne medianen i intervallvariasjonsserien bestemmer vi først intervallet den befinner seg i (medianintervallet). Et slikt intervall vil være et hvis kumulative frekvens er lik eller større enn halvparten av summen av frekvensene. Kumulative frekvenser dannes ved gradvis summering av frekvenser, med utgangspunkt i intervallet med den minste egenskapsverdien. Halve summen av frekvensene vi har er 250 (500:2). Derfor, i henhold til tabell 3. vil medianintervallet være intervallet med verdien av lønn fra 350 000 rubler. opptil 400 000 rubler.

Tabell 3. Beregning av medianen i intervallvariasjonsserien

Før dette intervallet var summen av de akkumulerte frekvensene 160. Derfor, for å oppnå verdien av medianen, er det nødvendig å legge til ytterligere 90 enheter (250 - 160).

Ved fastsettelse av verdien av medianen antas det at verdien av enheter innenfor intervallets grenser er jevnt fordelt. Derfor, hvis 115 enheter i dette intervallet er fordelt jevnt i et intervall lik 50, vil 90 enheter tilsvare følgende verdi:

Mote i statistikk

Median (statistikk)

Median (statistikk), i matematisk statistikk, et tall som karakteriserer et utvalg (for eksempel et sett med tall). Hvis alle elementene i prøven er forskjellige, så er medianen antallet av prøven slik at nøyaktig halvparten av elementene i prøven er større enn den og den andre halvparten er mindre enn den.

I et mer generelt tilfelle kan medianen finnes ved å bestille elementene i prøven i stigende eller synkende rekkefølge og ta det midterste elementet. Eksempelvis blir prøven (11, 9, 3, 5, 5) etter bestilling til (3, 5, 5, 9, 11) og medianen er tallet 5. Hvis prøven har et partall av elementer, Medianen er kanskje ikke unikt bestemt: for numeriske data brukes oftest halvsummen av to tilstøtende verdier (det vil si at medianen til settet (1, 3, 5, 7) tas lik 4).

Medianen i statistikk er med andre ord verdien som deler serien i to på en slik måte at på begge sider av den (opp eller ned) er det samme antall enheter av den gitte populasjonen. På grunn av denne egenskapen har denne indikatoren flere andre navn: 50. persentilen eller 0,5-kvantilen.

Medianen brukes i stedet for det aritmetiske gjennomsnittet når de ekstreme variantene av den rangerte serien (minste og største) i sammenligning med resten viser seg å være for store eller for små.

MEDIAN-funksjonen måler den sentrale trenden, som er sentrum av et sett med tall i en statistisk fordeling. Det er tre vanligste måter å bestemme den sentrale trenden på:

  • Mener- det aritmetiske gjennomsnittet, som beregnes ved å legge til et sett med tall, etterfulgt av å dele den resulterende summen med tallet deres.
    For eksempel, gjennomsnittet for tallene 2, 3, 3, 5, 7 og 10 er 5, som er resultatet av å dele summen deres, som er 30, med tallet deres, som er 6.
  • Median- et tall som er midten av et sett med tall: halvparten av tallene har verdier som er større enn medianen, og halvparten av tallene er mindre.
    For eksempel, medianen for tallene 2, 3, 3, 5, 7 og 10 er 4.
  • Mote er tallet som forekommer oftest i det gitte settet med tall.

    For eksempel, er modusen for tallene 2, 3, 3, 5, 7 og 10 3.