Gjennomsnittlig avvik i excel-formel. Beregne standardavvik i Microsoft Excel

La oss regne innMSUTMERKEvarians og standardavvik for utvalget. Vi beregner også variansen til en tilfeldig variabel hvis fordelingen er kjent.

Vurder først spredning, deretter standardavvik.

Prøveavvik

Prøveavvik (prøveavvik,prøveforskjell) karakteriserer spredningen av verdier i matrisen i forhold til .

Alle 3 formlene er matematisk likeverdige.

Det kan sees fra den første formelen at prøveavvik er summen av kvadrerte avvik for hver verdi i matrisen fra gjennomsnittet delt på prøvestørrelsen minus 1.

spredning prøver funksjonen DISP() brukes, eng. navnet på VAR, dvs. Forskjell. Siden MS EXCEL 2010, anbefales det å bruke dens analoge DISP.V() , eng. navnet VARS, dvs. Eksempelvarians. I tillegg, fra og med versjonen av MS EXCEL 2010, er det en DISP.G () funksjon, eng. VARP-navn, dvs. BefolkningsVARIanse som beregner spredning til befolkning. Hele forskjellen kommer ned til nevneren: i stedet for n-1 som DISP.V() , har DISP.G() bare n i nevneren. Før MS EXCEL 2010 ble VARP()-funksjonen brukt til å beregne populasjonsvariansen.

Prøveavvik
=FIRKANT(Sample)/(ANTALL(Sample)-1)
=(SUMSQ(Sample)-COUNT(Sample)*AVERAGE(Sample)^2)/ (COUNT(Sample)-1)- den vanlige formelen
=SUM((Sample -AVERAGE(Sample))^2)/ (ANTALL(Sample)-1) –

Prøveavvik er lik 0 bare hvis alle verdier er like med hverandre og følgelig er like middelverdi. Vanligvis, jo høyere verdi spredning, jo større spredning av verdier i matrisen.

Prøveavvik er et punktestimat spredning fordeling av den tilfeldige variabelen som prøve. Om konstruksjon konfidensintervaller ved evaluering spredning kan leses i artikkelen.

Varians av en tilfeldig variabel

Å beregne spredning tilfeldig variabel, du må vite det.

Til spredning tilfeldig variabel X bruker ofte notasjonen Var(X). Spredning er lik kvadratet av avviket fra gjennomsnittet E(X): Var(X)=E[(X-E(X)) 2 ]

spredning beregnet med formelen:

hvor x i er verdien som den tilfeldige variabelen kan ta, og μ er gjennomsnittsverdien (), p(x) er sannsynligheten for at den tilfeldige variabelen vil ta verdien x.

Hvis den tilfeldige variabelen har , da spredning beregnet med formelen:

Dimensjon spredning tilsvarer kvadratet på måleenheten til de opprinnelige verdiene. For eksempel, hvis verdiene i prøven er målinger av vekten til delen (i kg), vil dimensjonen til variansen være kg 2 . Dette kan derfor være vanskelig å tolke for å karakterisere spredningen av verdier, en verdi lik kvadratroten av spredning – standardavvik.

Noen eiendommer spredning:

Var(X+a)=Var(X), der X er en tilfeldig variabel og a er en konstant.

Var(aХ)=a 2 Var(X)

Var(X)=E[(X-E(X)) 2 ]=E=E(X 2)-E(2*X*E(X))+(E(X)) 2=E(X 2)- 2*E(X)*E(X)+(E(X)) 2 =E(X 2)-(E(X)) 2

Denne spredningsegenskapen brukes i artikkel om lineær regresjon.

Var(X+Y)=Var(X) + Var(Y) + 2*Cov(X;Y), hvor X og Y er tilfeldige variabler, er Cov(X;Y) kovariansen til disse tilfeldige variablene.

Hvis tilfeldige variabler er uavhengige, så deres kovarians er 0, og derfor Var(X+Y)=Var(X)+Var(Y). Denne egenskapen til variansen brukes i utdataene.

La oss vise at for uavhengige størrelser Var(X-Y)=Var(X+Y). Faktisk, Var(X-Y)= Var(X-Y)= Var(X+(-Y))= Var(X)+Var(-Y)= Var(X)+Var(-Y)= Var( X)+(- 1) 2 Var(Y)= Var(X)+Var(Y)= Var(X+Y). Denne egenskapen til variansen brukes til å plotte .

Eksempel på standardavvik

Eksempel på standardavvik er et mål på hvor vidt spredt verdiene i prøven er i forhold til deres .

Per definisjon, standardavvik er lik kvadratroten av spredning:

Standardavvik tar ikke hensyn til størrelsen på verdiene i prøvetaking, men bare graden av spredning av verdier rundt dem midten. La oss ta et eksempel for å illustrere dette.

La oss beregne standardavviket for 2 prøver: (1; 5; 9) og (1001; 1005; 1009). I begge tilfeller er s=4. Det er åpenbart at forholdet mellom standardavviket og verdiene til matrisen er betydelig forskjellig for prøvene. For slike tilfeller, bruk Variasjonskoeffisienten(Variasjonskoeffisient, CV) - forhold standardavvik til gjennomsnittet aritmetikk, uttrykt i prosent.

I MS EXCEL 2007 og tidligere versjoner for beregning Eksempel på standardavvik funksjonen =STDEV() brukes, eng. navnet STDEV, dvs. standardavvik. Siden MS EXCEL 2010 anbefales det å bruke dens analoge = STDEV.B () , eng. navn STDEV.S, dvs. Eksempel på standardavvik.

I tillegg, fra og med versjonen av MS EXCEL 2010, er det en funksjon STDEV.G () , eng. navn STDEV.P, dvs. Populasjonsstandard DEViation som beregner standardavvik til befolkning. Hele forskjellen kommer ned til nevneren: i stedet for n-1 som STDEV.V() , har STDEV.G() bare n i nevneren.

Standardavvik kan også beregnes direkte fra formlene nedenfor (se eksempelfil)
=SQRT(SQUADROTIV(Sample)/(COUNT(Sample)-1))
=SQRT((SUMSQ(Sample)-COUNT(Sample)*AVERAGE(Sample)^2)/(COUNT(Sample)-1))

Andre spredningstiltak

SQUADRIVE()-funksjonen beregner med umm av kvadrerte avvik av verdier fra deres midten. Denne funksjonen vil returnere det samme resultatet som formelen =VAR.G( Prøve)*KRYSS AV( Prøve) , hvor Prøve- en referanse til et område som inneholder en rekke prøveverdier (). Beregninger i QUADROTIV()-funksjonen gjøres i henhold til formelen:

SROOT()-funksjonen er også et mål på spredningen til et sett med data. SIROTL()-funksjonen beregner gjennomsnittet av de absolutte verdiene av avvikene til verdier fra midten. Denne funksjonen vil returnere samme resultat som formelen =SUMPRODUKT(ABS(Sample-AVERAGE(Sample)))/ANTALL(Sample), hvor Prøve- en referanse til et område som inneholder en rekke utvalgsverdier.

Beregninger i funksjonen SROOTKL () gjøres i henhold til formelen:

I denne artikkelen vil jeg snakke om hvordan finne standardavvik. Dette materialet er ekstremt viktig for en full forståelse av matematikk, så en matteveileder bør vie en egen leksjon eller til og med flere til å studere det. I denne artikkelen finner du en lenke til en detaljert og forståelig videoopplæring som forklarer hva standardavviket er og hvordan du finner det.

standardavvik gjør det mulig å estimere spredningen av verdier oppnådd som et resultat av å måle en bestemt parameter. Det er betegnet med et symbol (gresk bokstav "sigma").

Formelen for beregningen er ganske enkel. For å finne standardavviket må du ta kvadratroten av variansen. Så nå må du spørre: "Hva er varians?"

Hva er spredning

Definisjonen av varians er som følger. Dispersjon er det aritmetiske gjennomsnittet av kvadrerte avvik av verdier fra gjennomsnittet.

For å finne variansen, utfør følgende beregninger sekvensielt:

Bestem gjennomsnittet (enkelt aritmetisk gjennomsnitt av en rekke verdier).
Trekk deretter gjennomsnittet fra hver av verdiene og kvadrat den resulterende forskjellen (vi fikk forskjell i annen).
Det neste trinnet er å beregne det aritmetiske gjennomsnittet av kvadratene av forskjellene som er oppnådd (Du kan finne ut hvorfor nøyaktig kvadratene er nedenfor).

La oss se på et eksempel. La oss si at du og vennene dine bestemmer deg for å måle høyden på hundene dine (i millimeter). Som et resultat av mål fikk du følgende høydemål (på manken): 600 mm, 470 mm, 170 mm, 430 mm og 300 mm.

La oss beregne gjennomsnittet, variansen og standardavviket.

La oss finne gjennomsnittet først. Som du allerede vet, for dette må du legge til alle de målte verdiene og dividere med antall målinger. Beregningsfremgang:

Gjennomsnittlig mm.

Så gjennomsnittet (aritmetisk gjennomsnitt) er 394 mm.

Nå må vi definere avvik av høyden til hver av hundene fra gjennomsnittet:

Til slutt, for å beregne variansen, hver av de oppnådde forskjellene kvadreres, og så finner vi det aritmetiske gjennomsnittet av resultatene som er oppnådd:

Dispersjon mm 2 .

Dermed er spredningen 21704 mm 2 .

Hvordan finne standardavviket

Så hvordan beregner man standardavviket nå, vel vitende om variansen? Som vi husker, ta kvadratroten av det. Det vil si at standardavviket er:

mm (avrundet til nærmeste hele tall i mm).

Ved å bruke denne metoden fant vi ut at noen hunder (f.eks. Rottweilere) er veldig store hunder. Men det finnes også veldig små hunder (for eksempel dachser, men du bør ikke fortelle dem dette).

Det mest interessante er at standardavviket har nyttig informasjon. Nå kan vi vise hvilke av de oppnådde resultatene av å måle vekst som er innenfor intervallet som vi får hvis vi setter til side fra gjennomsnittet (på begge sider av det) standardavviket.

Det vil si at ved å bruke standardavviket får vi en "standard" metode som lar deg finne ut hvilken av verdiene som er normal (statistisk gjennomsnitt), og som er ekstraordinært stor eller omvendt liten.

Hva er standardavvik

Men ... ting blir litt annerledes hvis vi analyserer prøvetaking data. I vårt eksempel vurderte vi den generelle befolkningen. Det vil si at våre 5 hunder var de eneste hundene i verden som interesserte oss.

Men hvis dataene er et utvalg (verdier valgt fra en stor populasjon), må beregningene gjøres annerledes.

Hvis det er verdier, så:

Alle andre beregninger gjøres på samme måte, inkludert fastsettelse av gjennomsnittet.

For eksempel, hvis våre fem hunder bare er et utvalg av en populasjon av hunder (alle hunder på planeten), må vi dele med 4 i stedet for 5 nemlig:

Prøveavvik = mm 2.

I dette tilfellet er standardavviket for prøven lik mm (avrundet til nærmeste hele tall).

Vi kan si at vi har gjort noen "korreksjon" i tilfellet når verdiene våre bare er et lite utvalg.

Merk. Hvorfor akkurat kvadratene av forskjellene?

Men hvorfor tar vi kvadratene av forskjellene når vi beregner variansen? La oss innrømme at du ved måling av en parameter mottok følgende sett med verdier: 4; fire; -fire; -fire. Hvis vi bare legger til de absolutte avvikene fra gjennomsnittet (forskjellen) seg imellom ... negative verdier oppheves med positive:

Det viser seg at dette alternativet er ubrukelig. Da er det kanskje verdt å prøve de absolutte verdiene til avvikene (det vil si modulene til disse verdiene)?

Ved første øyekast viser det seg ikke dårlig (den resulterende verdien kalles forresten gjennomsnittlig absolutt avvik), men ikke i alle tilfeller. La oss prøve et annet eksempel. La målingen resultere i følgende sett med verdier: 7; en; -6; -2. Da er det gjennomsnittlige absolutte avviket:

Blimey! Vi fikk igjen resultatet 4, selv om forskjellene har en mye større spredning.

La oss nå se hva som skjer hvis vi kvadrerer forskjellene (og så tar kvadratroten av summen deres).

For det første eksemplet får du:

For det andre eksemplet får du:

Nå er det en helt annen sak! Rot-middel-kvadrat-avviket er jo større, jo større spredning av forskjellene ... som er det vi strebet etter.

Faktisk bruker denne metoden den samme ideen som når man beregner avstanden mellom punktene, bare brukt på en annen måte.

Og fra et matematisk synspunkt er bruken av kvadrater og kvadratrøtter mer nyttig enn vi kunne få på grunnlag av de absolutte verdiene av avvikene, på grunn av hvilke standardavviket er anvendelig for andre matematiske problemer.

Sergey Valerievich fortalte deg hvordan du finner standardavviket

Excel-programmet er høyt verdsatt av både profesjonelle og amatører, fordi en bruker på alle treningsnivåer kan jobbe med det. For eksempel kan alle med minimale ferdigheter til "kommunikasjon" med Excel tegne en enkel graf, lage et anstendig tegn, etc.

Samtidig lar dette programmet deg til og med utføre ulike typer beregninger, for eksempel beregning, men dette krever allerede et litt annet treningsnivå. Men hvis du nettopp har startet et nært bekjentskap med dette programmet og er interessert i alt som vil hjelpe deg å bli en mer avansert bruker, er denne artikkelen for deg. I dag vil jeg fortelle deg hva standardavviksformelen i excel er, hvorfor den er nødvendig i det hele tatt, og faktisk når den brukes. Gå!

Hva det er

La oss starte med teori. Standardavviket kalles vanligvis kvadratroten, hentet fra det aritmetiske gjennomsnittet av alle kvadratiske forskjeller mellom de tilgjengelige verdiene, samt deres aritmetiske gjennomsnitt. Forresten, denne verdien kalles vanligvis den greske bokstaven "sigma". Standardavviket beregnes ved hjelp av henholdsvis formelen STDEV, programmet gjør det for brukeren selv.

Essensen av dette konseptet er å identifisere graden av variasjon til instrumentet, det vil si at det på sin egen måte er en indikator fra beskrivende statistikk. Den avslører endringer i instrumentets volatilitet i en hvilken som helst tidsperiode. Ved å bruke STDEV-formler kan du estimere standardavviket til en prøve, mens boolske verdier og tekstverdier ignoreres.

Formel

Hjelper med å beregne standardavviket i excel-formelen, som automatisk leveres i Excel. For å finne den må du finne formeldelen i Excel, og allerede der velge den som har navnet STDEV, så det er veldig enkelt.

Etter det vil et vindu vises foran deg der du må legge inn data for beregningen. Spesielt bør to tall legges inn i spesialfelt, hvoretter programmet automatisk vil beregne standardavviket for prøven.

Matematiske formler og beregninger er utvilsomt en ganske komplisert sak, og ikke alle brukere kan håndtere det med en gang. Men hvis du graver litt dypere og forstår problemstillingen litt mer i detalj, viser det seg at ikke alt er så trist. Jeg håper du er overbevist om dette ved eksemplet med å beregne standardavviket.

Video for å hjelpe

Instruksjon

La det være flere tall som karakteriserer - eller homogene mengder. For eksempel resultater av målinger, veiinger, statistiske observasjoner, etc. Alle mengder som presenteres skal måles med samme måling. For å finne standardavviket, gjør følgende.

Bestem det aritmetiske gjennomsnittet av alle tall: legg sammen alle tallene og del summen på det totale antallet tall.

Bestem spredningen (spredningen) av tall: legg sammen kvadratene av avvikene funnet tidligere og del den resulterende summen med antall tall.

Det er sju pasienter på avdelingen med temperatur på 34, 35, 36, 37, 38, 39 og 40 grader Celsius.

Det er nødvendig å bestemme gjennomsnittsavviket fra gjennomsnittet.
Løsning:
"i avdelingen": (34+35+36+37+38+39+40)/7=37 ºС;

Temperaturavvik fra gjennomsnittet (i dette tilfellet normalverdien): 34-37, 35-37, 36-37, 37-37, 38-37, 39-37, 40-37, viser det seg: -3, -2, -1, 0, 1, 2, 3 (ºС);

Del summen av tall oppnådd tidligere med tallet deres. For nøyaktigheten av beregningen er det bedre å bruke en kalkulator. Resultatet av divisjonen er det aritmetiske gjennomsnittet av summene.

Vær nøye med alle stadier av beregningen, da en feil i minst en av beregningene vil føre til en feil sluttindikator. Sjekk de mottatte beregningene på hvert trinn. Det aritmetiske gjennomsnittet har samme måler som summene av tallene, det vil si at hvis du bestemmer gjennomsnittlig oppmøte, vil alle indikatorer være "person".

Denne beregningsmetoden brukes kun i matematiske og statistiske beregninger. Så for eksempel har det aritmetiske gjennomsnittet i informatikk en annen beregningsalgoritme. Det aritmetiske gjennomsnittet er en svært betinget indikator. Den viser sannsynligheten for en hendelse, forutsatt at den bare har én faktor eller indikator. For den mest dyptgående analysen må mange faktorer tas i betraktning. Til dette benyttes beregning av mer generelle mengder.

Det aritmetiske gjennomsnittet er et av målene for sentral tendens, mye brukt i matematikk og statistiske beregninger. Å finne det aritmetiske gjennomsnittet av flere verdier er veldig enkelt, men hver oppgave har sine egne nyanser, som ganske enkelt er nødvendige å vite for å utføre korrekte beregninger.

Kvantitative resultater av slike eksperimenter.

Hvordan finne det aritmetiske gjennomsnittet

Søket etter det aritmetiske gjennomsnittet for en rekke tall bør begynne med å bestemme den algebraiske summen av disse verdiene. For eksempel, hvis matrisen inneholder tallene 23, 43, 10, 74 og 34, vil deres algebraiske sum være 184. Når du skriver, er det aritmetiske gjennomsnittet angitt med bokstaven μ (mu) eller x (x med en søyle) . Deretter skal den algebraiske summen deles på antall tall i matrisen. I dette eksemplet var det fem tall, så det aritmetiske gjennomsnittet vil være 184/5 og vil være 36,8.

Funksjoner ved å jobbe med negative tall

Hvis det er negative tall i matrisen, blir det aritmetiske gjennomsnittet funnet ved å bruke en lignende algoritme. Det er forskjell kun ved beregning i programmeringsmiljøet, eller hvis det er tilleggsbetingelser i oppgaven. I disse tilfellene kommer det ned til tre trinn å finne det aritmetiske gjennomsnittet av tall med forskjellige fortegn:

1. Finne det vanlige aritmetiske gjennomsnittet ved standardmetoden;
2. Finne det aritmetiske gjennomsnittet av negative tall.
3. Beregning av det aritmetiske gjennomsnittet av positive tall.

Svarene til hver av handlingene er skrevet atskilt med komma.

Naturlige og desimalbrøker

Hvis matrisen av tall er representert med desimalbrøker, skjer løsningen i henhold til metoden for å beregne det aritmetiske gjennomsnittet av heltall, men resultatet reduseres i henhold til kravene til oppgaven for nøyaktigheten av svaret.

Når du arbeider med naturlige brøker, bør de reduseres til en fellesnevner, som multipliseres med antall tall i matrisen. Telleren til svaret vil være summen av de gitte tellerne av de opprinnelige brøkelementene.

Et av hovedverktøyene for statistisk analyse er beregningen av standardavviket. Denne indikatoren lar deg lage et estimat av standardavviket for et utvalg eller for den generelle populasjonen. La oss lære hvordan du bruker standardavviksformelen i Excel.

La oss umiddelbart definere hva standardavviket er og hvordan formelen ser ut. Denne verdien er kvadratroten av det aritmetiske gjennomsnittet av kvadratene av forskjellen mellom alle verdiene i serien og deres aritmetiske gjennomsnitt. Det er et identisk navn for denne indikatoren - standardavvik. Begge navnene er helt like.

Men selvfølgelig, i Excel, trenger ikke brukeren å beregne dette, siden programmet gjør alt for ham. La oss lære hvordan du beregner standardavvik i Excel.

Beregning i Excel

Du kan beregne den angitte verdien i Excel ved å bruke to spesialfunksjoner STDEV.V(ifølge prøven) og STDEV.G(ifølge befolkningen generelt). Prinsippet for deres operasjon er helt det samme, men de kan kalles på tre måter, som vi vil diskutere nedenfor.

Metode 1: Funksjonsveiviser

Metode 2: Formler-fanen

Metode 3: Skriv inn formelen manuelt

Det er også en måte hvor du ikke trenger å kalle argumentvinduet i det hele tatt. For å gjøre dette, skriv inn formelen manuelt.

Som du kan se, er mekanismen for å beregne standardavviket i Excel veldig enkel. Brukeren trenger bare å legge inn tall fra populasjonen eller lenke til celler som inneholder dem. Alle beregninger utføres av programmet selv. Det er mye vanskeligere å forstå hva den beregnede indikatoren er og hvordan resultatene av beregningen kan brukes i praksis. Men å forstå dette hører allerede mer til statistikkens område enn å lære å jobbe med programvare.