Kolmemõõtmeline vähimruutude meetod. Katseandmete lähendamine

Mis leiab kõige laiemat rakendust erinevates teadus- ja praktikavaldkondades. See võib olla füüsika, keemia, bioloogia, majandus, sotsioloogia, psühholoogia ja nii edasi ja nii edasi. Saatuse tahtel pean sageli tegelema majandusega ja seetõttu korraldan täna teile pileti hämmastavasse riiki nimega Ökonomeetria=) … Kuidas sa seda ei taha?! Seal on väga hea – sa pead lihtsalt otsustama! …Aga mida sa ilmselt kindlasti tahad, on õppida probleeme lahendama vähimruudud. Ja eriti usinad lugejad õpivad neid lahendama mitte ainult täpselt, vaid ka VÄGA KIIRESTI ;-) Aga enne probleemi üldine avaldus+ seotud näide:

Laske uurida näitajaid mõnes ainevaldkonnas, millel on kvantitatiivne väljendus. Samas on põhjust arvata, et näitaja sõltub indikaatorist. See oletus võib olla nii teaduslik hüpotees kui ka põhineda elementaarsel tervel mõistusel. Jätame teaduse aga kõrvale ja uurime isuäratavamaid valdkondi – nimelt toidupoode. Tähistage:

– toidupoe kaubanduspind, ruutmeetrit,
- toidupoe aastakäive, miljonit rubla.

On üsna selge, et mida suurem on kaupluse pindala, seda suurem on enamikul juhtudel selle käive.

Oletame, et pärast vaatluste / katsete / arvutuste läbiviimist / tamburiiniga tantsimist on meie käsutuses numbrilised andmed:

Toidupoodidega on minu arvates kõik selge: - see on 1. poe pindala, - selle aastakäive, - 2. kaupluse pind, - selle aastakäive jne. Muide, salastatud materjalidele ligipääs pole üldse vajalik – üsna täpse hinnangu käibele saab kasutades matemaatiline statistika. Kuid ärge laske end segada, kommertsspionaaži kursus on juba tasutud =)

Tabeliandmeid saab kirjutada ka punktide kujul ja kujutada meile tavapärasel viisil. Descartes'i süsteem .

Vastame olulisele küsimusele: mitu punkti on vaja kvalitatiivse uuringu jaoks?

Mida suurem, seda parem. Minimaalne lubatud komplekt koosneb 5-6 punktist. Lisaks ei tohiks väikese andmehulga korral valimisse kaasata "ebanormaalseid" tulemusi. Nii võib näiteks väike eliitpood aidata suurusjärgus rohkem kui “oma kolleegid”, moonutades seeläbi üldist mustrit, mis tuleb leida!

Kui see on üsna lihtne, peame valima funktsiooni, ajakava mis läbib punktidele võimalikult lähedalt . Sellist funktsiooni nimetatakse ligikaudne (ligikaudne – ligikaudne) või teoreetiline funktsioon . Üldiselt ilmub siin kohe ilmne "teeskleja" - kõrge astme polünoom, mille graafik läbib KÕIKI punkte. Kuid see valik on keeruline ja sageli lihtsalt vale. (kuna diagramm "tuuleb" kogu aeg ja kajastab halvasti peamist trendi).

Seega peab soovitud funktsioon olema piisavalt lihtne ja samas peegeldama adekvaatselt sõltuvust. Nagu võite arvata, nimetatakse ühte selliste funktsioonide leidmise meetoditest vähimruudud. Esiteks analüüsime selle olemust üldiselt. Olgu mõni funktsioon katseandmetele ligikaudne:


Kuidas hinnata selle lähenduse täpsust? Arvutagem ka eksperimentaalsete ja funktsionaalsete väärtuste erinevused (hälbed). (uurime joonist). Esimene mõte, mis pähe tuleb, on hinnata, kui suur summa on, kuid probleem on selles, et erinevused võivad olla negatiivsed. (näiteks, ) ja sellisest summeerimisest tulenevad kõrvalekalded tühistavad üksteist. Seetõttu soovitab see ligikaudse täpsuse hinnanguna võtta summa moodulid kõrvalekalded:

või volditud kujul: (äkki, kes ei tea: on summa ikoon ja abimuutuja - "loendur", mis võtab väärtused vahemikus 1 kuni ).

Lähendades katsepunkte erinevate funktsioonidega, saame erinevad väärtused ja on ilmne, et kus see summa on väiksem, on see funktsioon täpsem.

Selline meetod on olemas ja seda nimetatakse vähima mooduli meetod. Praktikas on see aga palju laiemalt levinud. vähimruutude meetod, kus võimalikud negatiivsed väärtused ei välistata mitte mooduli, vaid hälvete ruudustamisel:

, misjärel suunatakse jõupingutused sellise funktsiooni valikule, et hälvete ruudu summa oli võimalikult väike. Tegelikult sellest ka meetodi nimi.

Ja nüüd pöördume tagasi teise olulise punkti juurde: nagu eespool märgitud, peaks valitud funktsioon olema üsna lihtne - kuid selliseid funktsioone on ka palju: lineaarne , hüperboolne, eksponentsiaalne, logaritmiline, ruutkeskne jne. Ja loomulikult tahaks siinkohal kohe "tegevusvaldkonda vähendada". Millist funktsioonide klassi uuringuks valida? Primitiivne, kuid tõhus tehnika:

- Lihtsaim viis punktide tõmbamiseks joonisel ja analüüsida nende asukohta. Kui need kipuvad olema sirgjoonelised, siis peaksite otsima sirgjoone võrrand optimaalsete väärtustega ja . Ehk siis ülesandeks on leida SELLISED koefitsiendid – et hälvete ruudu summa oleks kõige väiksem.

Kui punktid asuvad näiteks mööda hüperbool, siis on selge, et lineaarfunktsioon annab halva lähenduse. Sel juhul otsime hüperboolvõrrandi jaoks kõige soodsamaid koefitsiente - need, mis annavad minimaalse ruutude summa .

Nüüd pange tähele, et mõlemal juhul räägime kahe muutuja funktsioonid, kelle argumendid on otsis sõltuvuse valikuid:

Ja sisuliselt peame lahendama standardprobleemi – leidma vähemalt kahe muutuja funktsioon.

Tuletage meelde meie näidet: oletagem, et "poe" punktid kipuvad asuma sirgjooneliselt ja on põhjust uskuda nende olemasolu lineaarne sõltuvus käive kauplemispiirkonnast. Leiame SELLISED koefitsiendid "a" ja "olla", et hälvete ruudu summa oli väikseim. Kõik nagu tavaliselt – kõigepealt I järgu osatuletised. Vastavalt lineaarsuse reegel saate vahet teha otse summaikooni all:

Kui soovite seda teavet essee või kursusetöö jaoks kasutada, olen allikate loendis oleva lingi eest väga tänulik, nii üksikasjalikke arvutusi ei leia te kuskilt:

Teeme standardse süsteemi:

Vähendame iga võrrandit "kahega" ja lisaks "lõhkume" summad:

Märge : analüüsige iseseisvalt, miks "a" ja "be" saab summaikoonist välja võtta. Muide, formaalselt saab seda teha summaga

Kirjutame süsteemi ümber "rakendatud" kujul:

mille järel hakatakse koostama meie probleemi lahendamise algoritmi:

Kas me teame punktide koordinaate? Me teame. Summad kas leiame? Kergesti. Koostame kõige lihtsama kahe tundmatuga lineaarvõrrandi süsteem("a" ja "beh"). Lahendame süsteemi nt. Crameri meetod, mille tulemuseks on statsionaarne punkt . Kontrollimine ekstreemumi jaoks piisav tingimus, saame kontrollida, et siinkohal on funktsioon ulatub täpselt miinimum. Kontrollimine on seotud täiendavate arvutustega ja seetõttu jätame selle kulisside taha. (vajadusel saab puuduvat kaadrit vaadata). Teeme lõpliku järelduse:

Funktsioon parim viis (vähemalt võrreldes kõigi teiste lineaarsete funktsioonidega) toob katsepunktid lähemale . Jämedalt öeldes läbib selle graafik nendele punktidele võimalikult lähedalt. Traditsiooni järgi ökonomeetria nimetatakse ka saadud lähendusfunktsiooni paaris lineaarse regressiooni võrrand .

Vaadeldav probleem on väga praktilise tähtsusega. Meie näite olukorras võrrand võimaldab ennustada, millist käivet ("yig") on poes ühe või teise müügipinna väärtusega ("x" üks või teine ​​tähendus). Jah, saadud prognoos on vaid prognoos, kuid paljudel juhtudel osutub see üsna täpseks.

Analüüsin ainult ühte probleemi "päris" numbritega, kuna selles pole raskusi - kõik arvutused on 7.-8. klassis kooli õppekava tasemel. 95 protsendil juhtudest palutakse teil leida lihtsalt lineaarne funktsioon, kuid artikli lõpus näitan, et optimaalse hüperbooli, astendaja ja mõne muu funktsiooni võrrandite leidmine pole enam keeruline.

Tegelikult jääb üle lubatud maiuspalade levitamine - nii et õpiksite selliseid näiteid mitte ainult täpselt, vaid ka kiiresti lahendama. Uurime hoolikalt standardit:

Ülesanne

Kahe näitaja vahelise seose uurimise tulemusena saadi järgmised numbripaarid:

Vähimruutude meetodil leidke lineaarfunktsioon, mis kõige paremini lähendab empiirilist väärtust (kogenud) andmeid. Koostage joonis, millele joonistage Descartes'i ristkülikukujulises koordinaatsüsteemis katsepunktid ja lähendusfunktsiooni graafik . Leidke empiiriliste ja teoreetiliste väärtuste vaheliste hälvete ruudu summa. Uurige, kas funktsioon on parem (vähimruutude meetodil) ligikaudsed katsepunktid.

Pange tähele, et "x" väärtused on loomulikud väärtused ja sellel on iseloomulik tähenduslik tähendus, millest räägin veidi hiljem; kuid need võivad muidugi olla murdosalised. Lisaks võivad nii "X" kui ka "G" väärtused olenevalt konkreetse ülesande sisust olla täielikult või osaliselt negatiivsed. Noh, meile on antud "näotu" ülesanne ja me alustame sellega lahendus:

Leiame süsteemi lahendusena optimaalse funktsiooni koefitsiendid:

Kompaktsema tähistuse huvides võib muutuja “loendur” ära jätta, kuna on juba selge, et summeerimine toimub vahemikus 1 kuni .

Vajalikud summad on mugavam arvutada tabeli kujul:


Arvutamist saab teha mikrokalkulaatoriga, kuid palju parem on kasutada Excelit - nii kiiremini kui ka vigadeta; vaadake lühikest videot:

Seega saame järgmise süsteem:

Siin saate korrutada teise võrrandi 3-ga ja lahutage 1. võrrandist liige liikme haaval 2.. Kuid see on õnn - praktikas pole süsteemid sageli andekad ja sellistel juhtudel säästab see Crameri meetod:
, seega on süsteemil ainulaadne lahendus.

Teeme kontrolli. Ma saan aru, et ma ei taha, aga miks jätta vahele vigu, kus neist ei saa mööda minna? Asendage leitud lahendus iga süsteemi võrrandi vasakpoolsesse serva:

Vastavate võrrandite õiged osad saadakse, mis tähendab, et süsteem on õigesti lahendatud.

Seega soovitud ligikaudne funktsioon: – alates kõik lineaarsed funktsioonid katseandmed on selle järgi kõige paremini ligikaudsed.

Erinevalt otse kaupluse käibe sõltuvus oma pindalast, leitud sõltuvus on tagurpidi (põhimõte "mida rohkem - seda vähem"), ja selle fakti paljastab kohe negatiivne nurga koefitsient. Funktsioon teatab meile, et teatud näitaja suurenemisel 1 ühiku võrra sõltuva näitaja väärtus väheneb keskmine 0,65 ühiku võrra. Nagu öeldakse, mida kõrgem on tatra hind, seda vähem müüakse.

Ligikaudse funktsiooni joonistamiseks leiame kaks selle väärtust:

ja teostage joonis:


Ehitatud rida nimetatakse trendijoon (nimelt lineaarne trendijoon, st üldiselt ei pruugi trend olla sirgjoon). Kõik on tuttavad väljendiga "trendis olema" ja ma arvan, et see termin ei vaja täiendavaid kommentaare.

Arvutage kõrvalekallete ruudu summa empiiriliste ja teoreetiliste väärtuste vahel. Geomeetriliselt on see "karmiinpunaste" segmentide pikkuste ruutude summa (neist kaks on nii väikesed, et ei näe neid isegi).

Võtame arvutused tabelisse kokku:


Neid saab jälle käsitsi läbi viia, igaks juhuks toon näite 1. punkti kohta:

kuid palju tõhusam on teha juba tuntud viis:

Kordame: mis on tulemuse tähendus? Alates kõik lineaarsed funktsioonid funktsiooni eksponent on väikseim, see tähendab, et see on oma perekonna parim lähendus. Ja siin, muide, pole probleemi viimane küsimus juhuslik: mis siis, kui pakutud eksponentsiaalne funktsioon kas katsepunkte on parem lähendada?

Leiame vastava hälvete ruudu summa - nende eristamiseks tähistan need tähega "epsilon". Tehnika on täpselt sama:


Ja veelkord iga 1. punkti tulearvutuse kohta:

Excelis kasutame standardfunktsiooni EXP (Süntaksi leiate Exceli spikrist).

Järeldus: , seega lähendab eksponentsiaalfunktsioon katsepunkte halvemini kui sirgjoon .

Kuid siin tuleb märkida, et "hullem" on ei tähenda veel, Mis on valesti. Nüüd koostasin selle eksponentsiaalfunktsiooni graafiku – ja see läbib ka punktide lähedalt - nii palju, et ilma analüütilise uuringuta on raske öelda, milline funktsioon on täpsem.

See lõpetab lahenduse ja ma pöördun tagasi argumendi loodusväärtuste küsimuse juurde. Erinevates uuringutes on reeglina majanduslikud või sotsioloogilised kuud, aastad või muud võrdsed ajavahemikud nummerdatud loomuliku "X-iga". Mõelge näiteks sellisele probleemile.

Vähima ruudu meetod

Teema viimases tunnis tutvume kuulsaima rakendusega FNP, mis leiab kõige laiemat rakendust erinevates teadus- ja praktikavaldkondades. See võib olla füüsika, keemia, bioloogia, majandus, sotsioloogia, psühholoogia ja nii edasi ja nii edasi. Saatuse tahtel pean sageli tegelema majandusega ja seetõttu korraldan täna teile pileti hämmastavasse riiki nimega Ökonomeetria=) … Kuidas sa seda ei taha?! Seal on väga hea – sa pead lihtsalt otsustama! …Aga mida sa ilmselt kindlasti tahad, on õppida probleeme lahendama vähimruudud. Ja eriti usinad lugejad õpivad neid lahendama mitte ainult täpselt, vaid ka VÄGA KIIRESTI ;-) Aga enne probleemi üldine avaldus+ seotud näide:

Laske uurida näitajaid mõnes ainevaldkonnas, millel on kvantitatiivne väljendus. Samas on põhjust arvata, et näitaja sõltub indikaatorist. See oletus võib olla nii teaduslik hüpotees kui ka põhineda elementaarsel tervel mõistusel. Jätame teaduse aga kõrvale ja uurime isuäratavamaid valdkondi – nimelt toidupoode. Tähistage:

– toidupoe kaubanduspind, ruutmeetrit,
- toidupoe aastakäive, miljonit rubla.

On üsna selge, et mida suurem on kaupluse pindala, seda suurem on enamikul juhtudel selle käive.

Oletame, et pärast vaatluste / katsete / arvutuste läbiviimist / tamburiiniga tantsimist on meie käsutuses numbrilised andmed:

Toidupoodidega on minu arvates kõik selge: - see on 1. kaupluse pindala, - selle aastakäive, - 2. kaupluse pind, - selle aastakäive jne. Muide, salastatud materjalidele ligipääs pole üldse vajalik – üsna täpse hinnangu käibele saab kasutades matemaatiline statistika. Kuid ärge laske end segada, kommertsspionaaži kursus on juba tasutud =)

Tabeliandmeid saab kirjutada ka punktide kujul ja kujutada meile tavapärasel viisil. Descartes'i süsteem .

Vastame olulisele küsimusele: mitu punkti on vaja kvalitatiivse uuringu jaoks?

Mida suurem, seda parem. Minimaalne lubatud komplekt koosneb 5-6 punktist. Lisaks ei tohiks väikese andmehulga korral valimisse kaasata "ebanormaalseid" tulemusi. Nii võib näiteks väike eliitpood aidata suurusjärgus rohkem kui “oma kolleegid”, moonutades seeläbi üldist mustrit, mis tuleb leida!



Kui see on üsna lihtne, peame valima funktsiooni, ajakava mis läbib punktidele võimalikult lähedalt . Sellist funktsiooni nimetatakse ligikaudne (ligikaudne – ligikaudne) või teoreetiline funktsioon . Üldiselt ilmub siin kohe ilmne "teeskleja" - kõrge astme polünoom, mille graafik läbib KÕIKI punkte. Kuid see valik on keeruline ja sageli lihtsalt vale. (kuna diagramm "tuuleb" kogu aeg ja kajastab halvasti peamist trendi).

Seega peab soovitud funktsioon olema piisavalt lihtne ja samas peegeldama adekvaatselt sõltuvust. Nagu võite arvata, nimetatakse ühte selliste funktsioonide leidmise meetoditest vähimruudud. Esiteks analüüsime selle olemust üldiselt. Olgu mõni funktsioon katseandmetele ligikaudne:


Kuidas hinnata selle lähenduse täpsust? Arvutagem ka eksperimentaalsete ja funktsionaalsete väärtuste erinevused (hälbed). (uurime joonist). Esimene mõte, mis pähe tuleb, on hinnata, kui suur summa on, kuid probleem on selles, et erinevused võivad olla negatiivsed. (näiteks, ) ja sellisest summeerimisest tulenevad kõrvalekalded tühistavad üksteist. Seetõttu soovitab see ligikaudse täpsuse hinnanguna võtta summa moodulid kõrvalekalded:

või volditud kujul: (kes ei tea: on summa ikoon ja - abimuutuja - "loendur", mis võtab väärtused vahemikus 1 kuni ) .

Lähendades katsepunkte erinevate funktsioonidega, saame erinevad väärtused ja on ilmne, kus see summa on väiksem - see funktsioon on täpsem.

Selline meetod on olemas ja seda nimetatakse vähima mooduli meetod. Praktikas on see aga palju laiemalt levinud. vähimruutude meetod, kus võimalikud negatiivsed väärtused ei välistata mitte mooduli, vaid hälvete ruudustamisel:



, misjärel suunatakse jõupingutused sellise funktsiooni valikule, et hälvete ruudu summa oli võimalikult väike. Tegelikult sellest ka meetodi nimi.

Ja nüüd pöördume tagasi teise olulise punkti juurde: nagu eespool märgitud, peaks valitud funktsioon olema üsna lihtne - kuid selliseid funktsioone on ka palju: lineaarne , hüperboolne , eksponentsiaalne , logaritmiline , ruutkeskne jne. Ja loomulikult tahaks siinkohal kohe "tegevusvaldkonda vähendada". Millist funktsioonide klassi uuringuks valida? Primitiivne, kuid tõhus tehnika:

- Lihtsaim viis punktide tõmbamiseks joonisel ja analüüsida nende asukohta. Kui need kipuvad olema sirgjoonelised, siis peaksite otsima sirgjoone võrrand optimaalsete väärtustega ja . Ehk siis ülesandeks on leida SELLISED koefitsiendid – et hälvete ruudu summa oleks kõige väiksem.

Kui punktid asuvad näiteks mööda hüperbool, siis on selge, et lineaarfunktsioon annab halva lähenduse. Sel juhul otsime hüperboolvõrrandi jaoks kõige soodsamaid koefitsiente - need, mis annavad minimaalse ruutude summa .

Nüüd pange tähele, et mõlemal juhul räägime kahe muutuja funktsioonid, kelle argumendid on otsis sõltuvuse valikuid:

Ja sisuliselt peame lahendama standardprobleemi – leidma vähemalt kahe muutuja funktsioon.

Tuletage meelde meie näidet: oletagem, et "poe" punktid kipuvad asuma sirgjooneliselt ja on põhjust uskuda nende olemasolu lineaarne sõltuvus käive kauplemispiirkonnast. Leiame SELLISED koefitsiendid "a" ja "olla", et hälvete ruudu summa oli väikseim. Kõik nagu tavaliselt – kõigepealt I järgu osatuletised. Vastavalt lineaarsuse reegel saate vahet teha otse summaikooni all:

Kui soovite seda teavet essee või kursusetöö jaoks kasutada, olen allikate loendis oleva lingi eest väga tänulik, nii üksikasjalikke arvutusi ei leia te kuskilt:

Teeme standardse süsteemi:

Vähendame iga võrrandit "kahega" ja lisaks "lõhkume" summad:

Märge : analüüsige iseseisvalt, miks "a" ja "be" saab summaikoonist välja võtta. Muide, formaalselt saab seda teha summaga

Kirjutame süsteemi ümber "rakendatud" kujul:

mille järel hakatakse koostama meie probleemi lahendamise algoritmi:

Kas me teame punktide koordinaate? Me teame. Summad kas leiame? Kergesti. Koostame kõige lihtsama kahe tundmatuga lineaarvõrrandi süsteem("a" ja "beh"). Lahendame süsteemi nt. Crameri meetod, mille tulemuseks on statsionaarne punkt . Kontrollimine ekstreemumi jaoks piisav tingimus, saame kontrollida, et siinkohal on funktsioon ulatub täpselt miinimum. Kontrollimine on seotud täiendavate arvutustega ja seetõttu jätame selle kulisside taha. (vajadusel saab puuduvat kaadrit vaadatasiin ) . Teeme lõpliku järelduse:

Funktsioon parim viis (vähemalt võrreldes kõigi teiste lineaarsete funktsioonidega) toob katsepunktid lähemale . Jämedalt öeldes läbib selle graafik nendele punktidele võimalikult lähedalt. Traditsiooni järgi ökonomeetria nimetatakse ka saadud lähendusfunktsiooni paaris lineaarse regressiooni võrrand .

Vaadeldav probleem on väga praktilise tähtsusega. Meie näite olukorras võrrand võimaldab ennustada, millist käivet ("yig") on poes ühe või teise müügipinna väärtusega ("x" üks või teine ​​tähendus). Jah, saadud prognoos on vaid prognoos, kuid paljudel juhtudel osutub see üsna täpseks.

Analüüsin ainult ühte probleemi "päris" numbritega, kuna selles pole raskusi - kõik arvutused on 7.-8. klassis kooli õppekava tasemel. 95 protsendil juhtudest palutakse teil leida lihtsalt lineaarne funktsioon, kuid artikli lõpus näitan, et optimaalse hüperbooli, astendaja ja mõne muu funktsiooni võrrandite leidmine pole enam keeruline.

Tegelikult jääb üle lubatud maiuspalade levitamine - nii et õpiksite selliseid näiteid mitte ainult täpselt, vaid ka kiiresti lahendama. Uurime hoolikalt standardit:

Ülesanne

Kahe näitaja vahelise seose uurimise tulemusena saadi järgmised numbripaarid:

Vähimruutude meetodil leidke lineaarfunktsioon, mis kõige paremini lähendab empiirilist väärtust (kogenud) andmeid. Koostage joonis, millele joonistage Descartes'i ristkülikukujulises koordinaatsüsteemis katsepunktid ja lähendusfunktsiooni graafik . Leidke empiiriliste ja teoreetiliste väärtuste vaheliste hälvete ruudu summa. Uurige, kas funktsioon on parem (vähimruutude meetodil) ligikaudsed katsepunktid.

Pange tähele, et "x" väärtused on loomulikud väärtused ja sellel on iseloomulik tähenduslik tähendus, millest räägin veidi hiljem; kuid need võivad muidugi olla murdosalised. Lisaks võivad nii "X" kui ka "G" väärtused olenevalt konkreetse ülesande sisust olla täielikult või osaliselt negatiivsed. Noh, meile on antud "näotu" ülesanne ja me alustame sellega lahendus:

Leiame süsteemi lahendusena optimaalse funktsiooni koefitsiendid:

Kompaktsema tähistuse huvides võib muutuja “loendur” ära jätta, kuna on juba selge, et summeerimine toimub vahemikus 1 kuni .

Vajalikud summad on mugavam arvutada tabeli kujul:


Arvutamist saab teha mikrokalkulaatoriga, kuid palju parem on kasutada Excelit - nii kiiremini kui ka vigadeta; vaadake lühikest videot:

Seega saame järgmise süsteem:

Siin saate korrutada teise võrrandi 3-ga ja lahutage 1. võrrandist liige liikme haaval 2.. Kuid see on õnn - praktikas pole süsteemid sageli andekad ja sellistel juhtudel säästab see Crameri meetod:
, seega on süsteemil ainulaadne lahendus.

Teeme kontrolli. Ma saan aru, et ma ei taha, aga miks jätta vahele vigu, kus neist ei saa mööda minna? Asendage leitud lahendus iga süsteemi võrrandi vasakpoolsesse serva:

Vastavate võrrandite õiged osad saadakse, mis tähendab, et süsteem on õigesti lahendatud.

Seega soovitud ligikaudne funktsioon: – alates kõik lineaarsed funktsioonid katseandmed on selle järgi kõige paremini ligikaudsed.

Erinevalt otse kaupluse käibe sõltuvus oma pindalast, leitud sõltuvus on tagurpidi (põhimõte "mida rohkem - seda vähem"), ja selle fakti paljastab kohe negatiivne nurga koefitsient. Funktsioon ütleb meile, et teatud näitaja suurenemisel 1 ühiku võrra väheneb sõltuva näitaja väärtus keskmine 0,65 ühiku võrra. Nagu öeldakse, mida kõrgem on tatra hind, seda vähem müüakse.

Ligikaudse funktsiooni joonistamiseks leiame kaks selle väärtust:

ja teostage joonis:

Ehitatud rida nimetatakse trendijoon (nimelt lineaarne trendijoon, st üldiselt ei pruugi trend olla sirgjoon). Kõik on tuttavad väljendiga "trendis olema" ja ma arvan, et see termin ei vaja täiendavaid kommentaare.

Arvutage kõrvalekallete ruudu summa empiiriliste ja teoreetiliste väärtuste vahel. Geomeetriliselt on see "karmiinpunaste" segmentide pikkuste ruutude summa (neist kaks on nii väikesed, et ei näe neid isegi).

Võtame arvutused tabelisse kokku:


Neid saab jälle käsitsi läbi viia, igaks juhuks toon näite 1. punkti kohta:

kuid palju tõhusam on teha juba tuntud viis:

Kordame: mis on tulemuse tähendus? Alates kõik lineaarsed funktsioonid funktsiooni eksponent on väikseim, see tähendab, et see on oma perekonna parim lähendus. Ja siin, muide, pole probleemi viimane küsimus juhuslik: mis siis, kui pakutud eksponentsiaalne funktsioon kas katsepunkte on parem lähendada?

Leiame vastava hälvete ruudu summa - nende eristamiseks tähistan need tähega "epsilon". Tehnika on täpselt sama:

Ja veelkord iga 1. punkti tulearvutuse kohta:

Excelis kasutame standardfunktsiooni EXP (Süntaksi leiate Exceli spikrist).

Järeldus:, seega lähendab eksponentsiaalfunktsioon katsepunkte halvemini kui sirgjoon.

Kuid siin tuleb märkida, et "hullem" on ei tähenda veel, Mis on valesti. Nüüd olen koostanud selle eksponentsiaalfunktsiooni graafiku - ja see läbib ka punktide lähedalt - nii palju, et ilma analüütilise uuringuta on raske öelda, milline funktsioon on täpsem.

See lõpetab lahenduse ja ma pöördun tagasi argumendi loodusväärtuste küsimuse juurde. Erinevates uuringutes on reeglina majanduslikud või sotsioloogilised kuud, aastad või muud võrdsed ajavahemikud nummerdatud loomuliku "X-iga". Mõelge näiteks järgmisele probleemile:

Meil on kaupluse I poolaasta jaemüügikäibe kohta järgmised andmed:

Otsige sirgjoonelise analüütilise joonduse abil juuli müügimahtu.

Jah, pole probleemi: nummerdame kuud 1, 2, 3, 4, 5, 6 ja kasutame tavalist algoritmi, mille tulemusena saame võrrandi - kellaaja osas on tavaliselt ainult täht “te ” (kuigi see pole kriitiline). Saadud võrrand näitab, et esimesel poolaastal kasvas käive keskmiselt 27,74 CU võrra. kuus. Hankige prognoos juuliks (kuu nr 7): e.u.

Ja sarnased ülesanded - pimedus on pime. Soovijatel on võimalik kasutada lisateenust, nimelt minu Exceli kalkulaator (demoversioon), mis lahendab probleemi peaaegu kohe! Programmi tööversioon on saadaval vastutasuks või eest sümboolne makse.

Tunni lõpus lühike teave mõnda muud tüüpi sõltuvuste leidmise kohta. Tegelikult polegi midagi erilist rääkida, kuna põhimõtteline lähenemine ja lahendusalgoritm jäävad samaks.

Oletame, et katsepunktide asukoht meenutab hüperbooli. Seejärel peate parima hüperbooli koefitsientide leidmiseks leidma funktsiooni miinimumi - soovijad saavad teha üksikasjalikke arvutusi ja jõuda sarnase süsteemi juurde:

Formaalsest tehnilisest vaatepunktist saadakse see "lineaarsest" süsteemist (märgime selle tärniga) asendades "x" -ga. Noh, summad arvutada, mille järel optimaalsete koefitsientideni "a" ja "olla" käepärast.

Kui on põhjust arvata, et punktid on paigutatud piki logaritmilist kõverat, seejärel otsige optimaalseid väärtusi ja leidke funktsiooni miinimum . Formaalselt tuleks süsteemis (*) asendada järgmisega:

Excelis arvutamisel kasutage funktsiooni LN. Tunnistan, et mul pole keeruline iga vaadeldava juhtumi jaoks kalkulaatoreid luua, kuid parem on siiski, kui arvutused ise "programmeerite". Abiks videoõpetused.

Eksponentsiaalse sõltuvuse korral on olukord veidi keerulisem. Asja taandamiseks lineaarseks käändeks võtame funktsiooni ja kasutuse logaritmi logaritmi omadused:

Nüüd, võrreldes saadud funktsiooni lineaarfunktsiooniga, jõuame järeldusele, et süsteemis (*) tuleb asendada , ja - -ga. Mugavuse huvides tähistame:

Pange tähele, et süsteem on lahendatud ja suhtes ning seetõttu ei tohi pärast juurte leidmist unustada koefitsiendi enda leidmist.

Katsepunktide ligikaudseks määramiseks optimaalne parabool , tuleks leida vähemalt kolme muutuja funktsioon . Pärast tavatoimingute tegemist saame järgmise "töötava" süsteem:

Jah, siin on muidugi rohkem summasid, kuid lemmikrakenduse kasutamisel pole raskusi üldse. Ja lõpuks ütlen teile, kuidas Exceli abil kiiresti kontrollida ja soovitud trendijoont luua: looge hajuvusdiagramm, valige hiirega mis tahes punkt ja paremklõpsake valige suvand "Lisa trendijoon". Järgmisena valige diagrammi tüüp ja vahekaardil "Valikud" aktiveerige valik "Näita võrrandit diagrammil". Okei

Nagu alati, tahan artikli lõpetada mõne ilusa fraasiga ja peaaegu kirjutasin "Ole trendis!". Kuid aja jooksul muutis ta meelt. Ja mitte sellepärast, et see oleks vale. Ma ei tea, kuidas keegi, aga ma ei taha üldse järgida propageeritud Ameerika ja eriti Euroopa trendi =) Seetõttu soovin, et igaüks te jääks oma joonele!

http://www.grandars.ru/student/vysshaya-matematika/metod-naimenshih-kvadratov.html

Vähimruutude meetod on selle tõttu üks levinumaid ja enim arenenud lineaarsete ökonomeetriliste mudelite parameetrite hindamise meetodite lihtsus ja efektiivsus. Samal ajal tuleks selle kasutamisel olla ettevaatlik, kuna selle abil ehitatud mudelid ei pruugi vastata paljudele nende parameetrite kvaliteedinõuetele ja seetõttu ei peegelda need protsessi arendamise mustreid "hästi".

Vaatleme üksikasjalikumalt lineaarse ökonomeetrilise mudeli parameetrite hindamise protseduuri vähimruutude meetodil. Sellist mudelit üldkujul saab esitada võrrandiga (1.2):

y t = a 0 + a 1 x 1t +...+ a n x nt + ε t.

Algandmed parameetrite a 0, a 1,..., a n hindamisel on sõltuva muutuja väärtuste vektor y= (y 1 , y 2 , ... , y T)" ja sõltumatute muutujate väärtuste maatriks

milles esimene veerg, mis koosneb ühtedest, vastab mudeli koefitsiendile .

Vähimruutude meetod sai oma nime põhimõttel, et selle alusel saadud parameetrite hinnangud peaksid vastama: mudeli vea ruutude summa peaks olema minimaalne.

Näited ülesannete lahendamisest vähimruutude meetodil

Näide 2.1. Kaubandusettevõttel on 12 kauplusest koosnev võrgustik, mille tegevuse kohta on teavet tabelis. 2.1.

Ettevõtte juhtkond soovib teada, kuidas sõltub aastakäibe suurus kaupluse kaubanduspinnast.

Tabel 2.1

Kaupluse number Aastakäive, miljon rubla Kaubanduspind, tuhat m 2
19,76 0,24
38,09 0,31
40,95 0,55
41,08 0,48
56,29 0,78
68,51 0,98
75,01 0,94
89,05 1,21
91,13 1,29
91,26 1,12
99,84 1,29
108,55 1,49

Vähimruutude lahendus. Märgime - -nda kaupluse aastakäive, miljonit rubla; - kaupluse müügipind, tuhat m 2.

Joonis 2.1. Näite 2.1 hajuvusdiagramm

Määrata muutujatevahelise funktsionaalseose vormi ja koostada hajuvusdiagramm (joonis 2.1).

Hajumisdiagrammi põhjal saame järeldada, et aastakäive on positiivselt sõltuv müügipinnast (s.t. y kasvab koos kasvuga). Kõige sobivam funktsionaalse ühenduse vorm on lineaarne.

Teave edasiste arvutuste jaoks on esitatud tabelis. 2.2. Vähimruutude meetodit kasutades hindame lineaarse ühefaktorilise ökonomeetrilise mudeli parameetreid

Tabel 2.2

t y t x 1t y t 2 x1t2 x 1t y t
19,76 0,24 390,4576 0,0576 4,7424
38,09 0,31 1450,8481 0,0961 11,8079
40,95 0,55 1676,9025 0,3025 22,5225
41,08 0,48 1687,5664 0,2304 19,7184
56,29 0,78 3168,5641 0,6084 43,9062
68,51 0,98 4693,6201 0,9604 67,1398
75,01 0,94 5626,5001 0,8836 70,5094
89,05 1,21 7929,9025 1,4641 107,7505
91,13 1,29 8304,6769 1,6641 117,5577
91,26 1,12 8328,3876 1,2544 102,2112
99,84 1,29 9968,0256 1,6641 128,7936
108,55 1,49 11783,1025 2,2201 161,7395
S 819,52 10,68 65008,554 11,4058 858,3991
Keskmine 68,29 0,89

Sellel viisil,

Seega, kui kauplemispind suureneb 1 tuhande m 2 võrra, kui muud asjaolud jäävad samaks, kasvab keskmine aastakäive 67,8871 miljoni rubla võrra.

Näide 2.2. Ettevõtte juhtkond märkas, et aastakäive ei sõltu ainult kaupluse müügipinnast (vt näide 2.1), vaid ka keskmisest külastajate arvust. Vastav teave on esitatud tabelis. 2.3.

Tabel 2.3

Lahendus. Tähistage - th poe keskmine külastajate arv päevas, tuhat inimest.

Määrata muutujatevahelise funktsionaalseose vormi ja koostada hajuvusdiagramm (joonis 2.2).

Hajumisdiagrammi põhjal saame järeldada, et aastakäive on positiivselt seotud keskmise külastajate arvuga ööpäevas (ehk y kasvab koos kasvuga). Funktsionaalse sõltuvuse vorm on lineaarne.

Riis. 2.2. Hajuvusdiagramm näiteks 2.2

Tabel 2.4

t x 2t x 2t 2 yt x 2t x 1t x 2t
8,25 68,0625 163,02 1,98
10,24 104,8575 390,0416 3,1744
9,31 86,6761 381,2445 5,1205
11,01 121,2201 452,2908 5,2848
8,54 72,9316 480,7166 6,6612
7,51 56,4001 514,5101 7,3598
12,36 152,7696 927,1236 11,6184
10,81 116,8561 962,6305 13,0801
9,89 97,8121 901,2757 12,7581
13,72 188,2384 1252,0872 15,3664
12,27 150,5529 1225,0368 15,8283
13,92 193,7664 1511,016 20,7408
S 127,83 1410,44 9160,9934 118,9728
Keskmine 10,65

Üldjuhul on vaja määrata kahefaktorilise ökonomeetrilise mudeli parameetrid

y t \u003d a 0 + a 1 x 1t + a 2 x 2t + ε t

Edasiste arvutuste jaoks vajalik teave on esitatud tabelis. 2.4.

Hindame lineaarse kahefaktorilise ökonomeetrilise mudeli parameetreid vähimruutude meetodil.

Sellel viisil,

Koefitsiendi = 61,6583 hindamine näitab, et kui kõik muud asjaolud on võrdsed ja müügipind suureneb 1 tuhande m 2 võrra, suureneb aastakäive keskmiselt 61,6583 miljoni rubla võrra.

Koefitsiendi hinnang = 2,2748 näitab, et muude asjaolude muutumisel on keskmine külastajate arv 1 tuhande inimese kohta suurenenud. päevas kasvab aastakäive keskmiselt 2,2748 miljoni rubla võrra.

Näide 2.3. Kasutades tabelis esitatud teavet. 2.2 ja 2.4, hinnata ühefaktorilise ökonomeetrilise mudeli parameetrit

kus on -nda kaupluse aastakäibe tsentreeritud väärtus, miljonit rubla; - t-nda kaupluse keskmise ööpäevase külastajate arvu keskväärtus, tuhat inimest. (vt näiteid 2.1-2.2).

Lahendus. Arvutusteks vajalik lisateave on toodud tabelis. 2.5.

Tabel 2.5

-48,53 -2,40 5,7720 116,6013
-30,20 -0,41 0,1702 12,4589
-27,34 -1,34 1,8023 36,7084
-27,21 0,36 0,1278 -9,7288
-12,00 -2,11 4,4627 25,3570
0,22 -3,14 9,8753 -0,6809
6,72 1,71 2,9156 11,4687
20,76 0,16 0,0348 3,2992
22,84 -0,76 0,5814 -17,413
22,97 3,07 9,4096 70,4503
31,55 1,62 2,6163 51,0267
40,26 3,27 10,6766 131,5387
Summa 48,4344 431,0566

Kasutades valemit (2.35), saame

Sellel viisil,

http://www.cleverstudents.ru/articles/mnk.html

Näide.

Eksperimentaalsed andmed muutujate väärtuste kohta X ja juures on toodud tabelis.

Nende joondamise tulemusena funktsioon

Kasutades vähimruutude meetod, lähendage neid andmeid lineaarse sõltuvusega y=kirves+b(leidke parameetrid a ja b). Uurige välja, milline kahest joonest on parem (vähimruutude meetodi tähenduses), mis joondab katseandmeid. Tee joonis.

Lahendus.

Meie näites n = 5. Nõutavate koefitsientide valemites sisalduvate summade arvutamise mugavuse huvides täidame tabeli.

Tabeli neljanda rea ​​väärtused saadakse, korrutades iga numbri 2. rea väärtused 3. rea väärtustega i.

Tabeli viienda rea ​​väärtused saadakse iga numbri 2. rea väärtuste ruudustamisel i.

Tabeli viimase veeru väärtused on ridade väärtuste summad.

Koefitsientide leidmiseks kasutame vähimruutude meetodi valemeid a ja b. Asendame neis vastavad väärtused tabeli viimasest veerust:

Järelikult y=0,165x+2,184 on soovitud ligikaudne sirgjoon.

Jääb välja selgitada, milline ridadest y=0,165x+2,184 või lähendab paremini algandmeid, st teha hinnang vähimruutude meetodil.

Tõestus.

Nii et kui leitakse a ja b funktsioon võtab väikseima väärtuse, on vajalik, et selles punktis funktsiooni teist järku diferentsiaali ruutkuju maatriks oli positiivne kindlasti. Näitame seda.

Teist järku diferentsiaalil on vorm:

See on

Seetõttu on ruutvormi maatriksil vorm

ja elementide väärtused ei sõltu a ja b.

Näitame, et maatriks on positiivne kindel. See eeldab, et nurk-mollid on positiivsed.

I järgu nurgeline moll . Ebavõrdsus on range, kuna punktid

Pärast joondamist saame funktsiooni järgmisel kujul: g (x) = x + 1 3 + 1 .

Saame neid andmeid lähendada lineaarse seosega y = a x + b, arvutades vastavad parameetrid. Selleks peame rakendama niinimetatud vähimruutude meetodit. Samuti peate tegema joonise, et kontrollida, milline joon joondab katseandmeid kõige paremini.

Yandex.RTB R-A-339285-1

Mis täpselt on OLS (vähimruutude meetod)

Peamine asi, mida peame tegema, on leida sellised lineaarsed sõltuvuskoefitsiendid, mille puhul kahe muutuja funktsiooni väärtus F (a, b) = ∑ i = 1 n (y i - (a x i + b)) 2 on väikseim . Teisisõnu, teatud a ja b väärtuste korral on esitatud andmete ruudus hälbete summa saadud sirgest minimaalne. See on vähimruutude meetodi tähendus. Näite lahendamiseks peame vaid leidma kahe muutuja funktsiooni ekstreemumi.

Kuidas tuletada koefitsientide arvutamise valemeid

Koefitsientide arvutamise valemite tuletamiseks on vaja koostada ja lahendada kahe muutujaga võrrandisüsteem. Selleks arvutame avaldise F (a , b) = ∑ i = 1 n (y i - (a x i + b)) 2 osatuletised a ja b suhtes ning võrdsustame need 0-ga.

δ F (a , b) δ a = 0 δ F (a , b) δ b = 0 ⇔ - 2 ∑ i = 1 n (y i - (a x i + b)) x i = 0 - 2 ∑ i = 1 n ( y i - (a x i + b)) = 0 ⇔ a ∑ i = 1 n x i 2 + b ∑ i = 1 n x i = ∑ i = 1 n x i y i a ∑ i = 1 n x i + ∑ b i = a 1 n x i + ∑ b i = i = i ∑ i = 1 n x i 2 + b ∑ i = 1 n x i = ∑ i = 1 n x i y i a ∑ i = 1 n x i + n b = ∑ i = 1 n y i

Võrrandisüsteemi lahendamiseks võite kasutada mis tahes meetodeid, näiteks asendus- või Crameri meetodit. Selle tulemusena peaksime saama valemid, mis arvutavad koefitsiendid vähimruutude meetodil.

n ∑ i = 1 n x i y i - ∑ i = 1 n x i ∑ i = 1 n y i n ∑ i = 1 n - ∑ i = 1 n x i 2 b = ∑ i = 1 a n 1 n i

Oleme välja arvutanud muutujate väärtused, mille jaoks funktsioon on
F (a , b) = ∑ i = 1 n (y i - (a x i + b)) 2 võtab minimaalse väärtuse. Kolmandas lõigus tõestame, miks see nii on.

See on vähimruutude meetodi rakendamine praktikas. Tema valem, mida kasutatakse parameetri a leidmiseks, sisaldab ∑ i = 1 n x i, ∑ i = 1 n y i, ∑ i = 1 n x i y i, ∑ i = 1 n x i 2 ja parameetrit
n - see tähistab katseandmete hulka. Soovitame teil arvutada iga summa eraldi. Koefitsiendi väärtus b arvutatakse kohe pärast a .

Tuleme tagasi algse näite juurde.

Näide 1

Siin on meil n võrdne viiega. Koefitsientide valemitesse kuuluvate nõutavate summade arvutamise mugavamaks muutmiseks täidame tabeli.

i = 1 i = 2 i = 3 i = 4 i = 5 ∑ i = 1 5
x i 0 1 2 4 5 12
y i 2 , 1 2 , 4 2 , 6 2 , 8 3 12 , 9
x i y i 0 2 , 4 5 , 2 11 , 2 15 33 , 8
x i 2 0 1 4 16 25 46

Lahendus

Neljas rida sisaldab andmeid, mis on saadud teise rea väärtuste korrutamisel kolmanda väärtustega iga üksikisiku i kohta. Viies rida sisaldab teise ruudu andmeid. Viimane veerg näitab üksikute ridade väärtuste summasid.

Kasutame vajalike koefitsientide a ja b arvutamiseks vähimruutude meetodit. Selleks asendage soovitud väärtused viimasest veerust ja arvutage summad:

n ∑ i = 1 n x i y i – ∑ i = 1 n x i ∑ i = 1 n y i n ∑ i = 1 n - ∑ i = 1 n x i 2 b = ∑ i = 1 a n i = 1 n ∑ i = 1 n x i 2 b = ∑ i = 1 a n 1 n - 12 12, 9 5 46 - 12 2 b = 12, 9 - a 12 5 ⇒ a ≈ 0, 165 b ≈ 2, 184

Saime, et soovitud ligikaudne sirge näeb välja selline y = 0, 165 x + 2, 184. Nüüd peame kindlaks määrama, milline rida on andmetele kõige paremini ligikaudne - g (x) = x + 1 3 + 1 või 0, 165 x + 2, 184. Teeme hinnangu vähimruutude meetodil.

Vea arvutamiseks peame leidma sirgelt σ 1 = ∑ i = 1 n (y i - (a x i + b i)) 2 ja σ 2 = ∑ i = 1 n (y i -) andmete ruuduhälbete summad. g (x i)) 2, vastab miinimumväärtus sobivamale reale.

σ 1 = ∑ i = 1 n (y i - (a x i + b i)) 2 = = ∑ i = 1 5 (y i - (0 , 165 x i + 2 , 184)) 2 ≈ 0, 019 ψ 2 = ∑ i = ∑ i = 1 5 1 n (y i - g (x i)) 2 = = ∑ i = 1 5 (y i - (x i + 1 3 + 1)) 2 ≈ 0, 096

Vastus: alates σ 1< σ 2 , то прямой, наилучшим образом аппроксимирующей исходные данные, будет
y = 0, 165 x + 2, 184.

Vähimruutude meetod on graafilisel joonisel selgelt näidatud. Punane joon tähistab sirget g (x) = x + 1 3 + 1, sinine joon tähistab y = 0, 165 x + 2, 184. Algandmed on tähistatud roosade täppidega.

Selgitame, miks on vaja täpselt seda tüüpi lähendusi.

Neid saab kasutada nii andmete silumist nõudvates probleemides kui ka nendes, kus andmeid on vaja interpoleerida või ekstrapoleerida. Näiteks eespool käsitletud ülesandes võiks leida vaadeldava suuruse y väärtuse x = 3 või x = 6 juures. Oleme sellistele näidetele pühendanud eraldi artikli.

LSM meetodi tõestus

Et funktsioon saaks arvutatud a ja b jaoks minimaalse väärtuse, on vajalik, et antud punktis vormi F (a, b) funktsiooni diferentsiaali ruutkuju maatriks = ∑ i = 1 n ( y i - (a x i + b)) 2 olema positiivne kindel. Näitame teile, kuidas see peaks välja nägema.

Näide 2

Meil on teise järgu diferentsiaal järgmisel kujul:

d 2 F (a ; b) = δ 2 F (a ; b) δ a 2 d 2 a + 2 δ 2 F (a ; b) δ a δ b d a d b + δ 2 F (a ; b) δ b 2 d 2b

Lahendus

δ 2 F (a ; b) δ a 2 = δ δ F (a ; b) δ a δ a = = δ - 2 ∑ i = 1 n (y i - (a x i + b)) x i δ a = 2 ∑ i = 1 n (x i) 2 δ 2 F (a ; b) δ a δ b = δ δ F (a ; b) δ a δ b = = δ - 2 ∑ i = 1 n (y i - (a x i + b) ) x i δ b = 2 ∑ i = 1 n x i δ 2 F (a ; b) δ b 2 = δ δ F (a ; b) δ b δ b = δ - 2 ∑ i = 1 n (y i - (a x i + b)) δ b = 2 ∑ i = 1 n (1) = 2 n

Teisisõnu saab selle kirjutada järgmiselt: d 2 F (a ; b) = 2 ∑ i = 1 n (x i) 2 d 2 a + 2 2 ∑ x i i = 1 n d a d b + (2 n) d 2 b .

Oleme saanud ruutkujulise maatriksi M = 2 ∑ i = 1 n (x i) 2 2 ∑ i = 1 n x i 2 ∑ i = 1 n x i 2 n .

Sel juhul ei muutu üksikute elementide väärtused sõltuvalt a-st ja b-st. Kas see maatriks on positiivne? Sellele küsimusele vastamiseks kontrollime, kas selle nurgelised alaealised on positiivsed.

Arvutage esimest järku nurk-moll: 2 ∑ i = 1 n (x i) 2 > 0 . Kuna punktid x i ei lange kokku, on ebavõrdsus range. Peame seda edasistes arvutustes meeles.

Arvutame teist järku nurk-molli:

d e t (M) = 2 ∑ i = 1 n (x i) 2 2 ∑ i = 1 n x i 2 ∑ i = 1 n x i 2 n = 4 n ∑ i = 1 n (x i) 2 - 12 n i = i

Seejärel jätkame matemaatilist induktsiooni kasutades ebavõrdsuse n ∑ i = 1 n (x i) 2 - ∑ i = 1 n x i 2 > 0 tõestamist.

  1. Kontrollime, kas see võrratus kehtib suvalise n korral. Võtame 2 ja arvutame:

2 ∑ i = 1 2 (x i) 2 - ∑ i = 1 2 x i 2 = 2 x 1 2 + x 2 2 - x 1 + x 2 2 = = x 1 2 - 2 x 1 x 2 + x 2 2 = x 1 + x 2 2 > 0

Saime õige võrdsuse (kui väärtused x 1 ja x 2 ei ühti).

  1. Oletame, et see ebavõrdsus kehtib n korral, s.o. n ∑ i = 1 n (x i) 2 - ∑ i = 1 n x i 2 > 0 – tõene.
  2. Nüüd tõestame n + 1 kehtivust, s.o. et (n + 1) ∑ i = 1 n + 1 (x i) 2 - ∑ i = 1 n + 1 x i 2 > 0, kui n ∑ i = 1 n (x i) 2 - ∑ i = 1 n x i 2 > 0 .

Arvutame:

(n + 1) ∑ i = 1 n + 1 (x i) 2 - ∑ i = 1 n + 1 x i 2 = = (n + 1) ∑ i = 1 n (x i) 2 + x n + 1 2 - ∑ i = 1 n x i + x n + 1 2 = = n ∑ i = 1 n (x i) 2 + n x n + 1 2 + ∑ i = 1 n (x i) 2 + x n + 1 2 - - ∑ i = 1 n x 2 i 2 + x n + 1 ∑ i = 1 n x i + x n + 1 2 = = ∑ i = 1 n (x i) 2 - ∑ i = 1 n x i 2 + n x n + 1 2 - x n + 1 i + 1 i = 1 n x n (x i) 2 = = ∑ i = 1 n (x i) 2 - ∑ i = 1 n x i 2 + x n + 1 2 - 2 x n + 1 x 1 + x 1 2 + + x n + 1 2 - 2 x n + 1 x 2 + x 2 2 + . . . + x n + 1 2 - 2 x n + 1 x 1 + x n 2 = = n ∑ i = 1 n (x i) 2 - ∑ i = 1 n x i 2 + + (x n + 1 - x 1) 2 + (x n + 1) - x 2) 2 + . . . + (x n - 1 - x n) 2 > 0

Sulgudes sisalduv avaldis on suurem kui 0 (alusel, mida me 2. sammus eeldasime) ja ülejäänud terminid on suuremad kui 0, kuna need on kõik arvude ruudud. Oleme ebavõrdsust tõestanud.

Vastus: leitud a ja b vastavad funktsiooni F (a, b) = ∑ i = 1 n (y i - (a x i + b)) 2 väikseimale väärtusele, mis tähendab, et need on vähimruutude meetodi soovitud parameetrid (LSM).

Kui märkate tekstis viga, tõstke see esile ja vajutage Ctrl+Enter

Vähimruutude meetod (LSM) võimaldab hinnata erinevaid suurusi, kasutades paljude juhuslikke vigu sisaldavate mõõtmiste tulemusi.

Iseloomulik MNC

Selle meetodi põhiidee seisneb selles, et vigade ruudu summat peetakse ülesande lahenduse täpsuse kriteeriumiks, mida püütakse minimeerida. Selle meetodi kasutamisel saab rakendada nii numbrilisi kui ka analüütilisi lähenemisviise.

Eelkõige eeldab vähimruutude meetod numbrilise teostusena võimalikult paljude tundmatu juhusliku suuruse mõõtmist. Veelgi enam, mida rohkem arvutusi, seda täpsem on lahendus. Sellel arvutuskomplektil (algandmetel) saadakse veel üks pakutud lahenduste komplekt, millest seejärel valitakse välja parim. Kui lahenduste hulk on parametriseeritud, taandatakse vähimruutude meetod parameetrite optimaalse väärtuse leidmiseks.

Analüütilise lähenemisena LSM-i rakendamisele lähteandmete (mõõtmiste) ja pakutud lahenduste kogumi kohta defineeritakse mõned (funktsionaalsed), mida saab väljendada valemiga, mis saadakse teatud hüpoteesina, mis vajab kinnitamist. . Sel juhul taandatakse vähimruutude meetod selle funktsionaalsuse miinimumi leidmiseks algandmete ruuduvigade hulgast.

Pange tähele, et mitte vead ise, vaid vigade ruudud. Miks? Fakt on see, et sageli on mõõtmiste kõrvalekalded täpsest väärtusest nii positiivsed kui ka negatiivsed. Keskmise määramisel võib lihtne liitmine viia hinnangu kvaliteedi kohta vale järelduseni, kuna positiivsete ja negatiivsete väärtuste vastastikune tühistamine vähendab mõõtmiskomplekti proovivõtuvõimsust. Ja sellest tulenevalt ka hinnangu täpsus.

Et seda ei juhtuks, summeeritakse kõrvalekalded ruudus. Veelgi enam, mõõdetud väärtuse ja lõpliku hinnangu mõõtmete võrdsustamiseks kasutatakse väljavõtmiseks vigade ruudu summat.

Mõned MNC-de rakendused

MNC-d kasutatakse laialdaselt erinevates valdkondades. Näiteks tõenäosusteoorias ja matemaatilises statistikas kasutatakse seda meetodit juhusliku suuruse sellise tunnuse määramiseks nagu standardhälve, mis määrab juhusliku suuruse väärtusvahemiku laiuse.

  • õpetus

Sissejuhatus

Olen programmeerija. Tegin oma karjääri suurima hüppe, kui õppisin ütlema: "Ma ei saa millestki aru!" Nüüd ma ei häbene teaduse valgustajale öelda, et ta peab mulle loengut, et ma ei saa aru, millest see, valgusti, minuga räägib. Ja see on väga raske. Jah, on raske ja piinlik tunnistada, et sa ei tea. Kellele meeldib tunnistada, et ta ei tea millegi põhitõdesid-seal. Oma ametist tulenevalt pean osalema paljudel ettekannetel ja loengutel, kus, tunnistan, tunnen valdavalt enamikul juhtudel unisust, sest ma ei saa millestki aru. Ja ma ei saa aru, sest teaduse praeguse olukorra suur probleem seisneb matemaatikas. See eeldab, et kõik õpilased tunnevad absoluutselt kõiki matemaatika valdkondi (mis on absurdne). Tunnistada, et te ei tea, mis on tuletis (et see on veidi hiljem), on häbi.

Aga ma olen õppinud ütlema, et ma ei tea, mis on korrutamine. Jah, ma ei tea, mis on alamgebra üle Lie algebra. Jah, ma ei tea, miks on ruutvõrrandid elus vaja. Muide, kui olete kindel, et teate, siis on meil millestki rääkida! Matemaatika on trikkide jada. Matemaatikud püüavad avalikkust segadusse ajada ja hirmutada; kus pole segadust, mainet ega autoriteeti. Jah, prestiižne on rääkida võimalikult abstraktses keeles, mis on iseenesest täielik jama.

Kas sa tead, mis on tuletis? Tõenäoliselt räägite mulle erinevuse suhte piirist. Peterburi Riikliku Ülikooli matemaatika esimesel kursusel Viktor Petrovitš Khavin mind määratletud tuletis kui funktsiooni Taylori seeria esimese liikme koefitsient punktis (see oli eraldi võimlemine Taylori seeria määramiseks ilma tuletisi). Naersin selle määratluse peale kaua, kuni lõpuks sain aru, millega tegu. Tuletis pole midagi muud kui lihtsalt mõõt selle kohta, kui palju eristatav funktsioon sarnaneb funktsiooniga y=x, y=x^2, y=x^3.

Nüüd on mul au pidada loenguid üliõpilastele, kes hirm matemaatika. Kui kardad matemaatikat – oleme teel. Niipea, kui proovite mõnda teksti lugeda ja teile tundub, et see on liiga keeruline, teadke, et see on halvasti kirjutatud. Ma väidan, et pole ühtegi matemaatika valdkonda, millest ei saaks rääkida "näpuga" ilma täpsust kaotamata.

Lähituleviku väljakutse: andsin õpilastele korralduse mõista, mis on lineaar-ruutkontroller. Ära ole häbelik, raiska kolm minutit oma elust, järgi linki. Kui te millestki aru ei saa, siis oleme teel. Ka mina (professionaalne matemaatik-programmeerija) ei saanud millestki aru. Ja ma kinnitan teile, et seda saab lahendada "näpuga". Praegu ma ei tea, mis see on, kuid kinnitan teile, et saame selle välja mõelda.

Niisiis, esimene loeng, mille ma oma õpilastele pean pärast seda, kui nad õudusega minu juurde jooksevad sõnadega, et lineaar-ruutkontroller on kohutav viga, mida te kunagi oma elus ei valda. vähimruutude meetodid. Kas saate lahendada lineaarvõrrandeid? Kui sa seda teksti loed, siis suure tõenäosusega mitte.

Seega, kui on antud kaks punkti (x0, y0), (x1, y1), näiteks (1,1) ja (3,2), on ülesandeks leida neid kahte punkti läbiva sirge võrrand:

illustratsioon

Sellel sirgel peaks olema järgmine võrrand:

Siin on alfa ja beeta meile tundmatud, kuid selle joone kaks punkti on teada:

Selle võrrandi saate kirjutada maatriksi kujul:

Siin tuleks teha lüüriline kõrvalepõik: mis on maatriks? Maatriks pole midagi muud kui kahemõõtmeline massiiv. See on andmete salvestamise viis, sellele ei tohiks rohkem väärtusi anda. See, kuidas teatud maatriksit täpselt tõlgendada, sõltub meist. Perioodiliselt tõlgendan seda lineaarse kaardistusena, perioodiliselt ruutvormina ja mõnikord lihtsalt vektorite kogumina. Seda kõike selgitatakse kontekstis.

Asendame konkreetsed maatriksid nende sümboolse esitusega:

Siis on (alfa, beeta) lihtne leida:

Täpsemalt meie varasemate andmete kohta:

Mis toob kaasa punkte (1,1) ja (3,2) läbiva sirge järgmise võrrandi:

Olgu, siin on kõik selge. Ja leiame läbiva sirge võrrandi kolm punktid: (x0,y0), (x1,y1) ja (x2,y2):

Oi-oi-oi, aga kahe tundmatu jaoks on meil kolm võrrandit! Tavaline matemaatik ütleb, et lahendust pole. Mida programmeerija ütleb? Ja kõigepealt kirjutab ta eelmise võrrandisüsteemi ümber järgmisel kujul:

Meie puhul on vektorid i, j, b kolmemõõtmelised, mistõttu (üldjuhul) sellele süsteemile lahendust ei ole. Iga vektor (alfa\*i + beeta\*j) asub vektorite (i, j) poolt hõlmatud tasapinnal. Kui b ei kuulu sellele tasapinnale, siis pole lahendust (võrdsust võrrandis ei saa saavutada). Mida teha? Otsime kompromissi. Tähistagem e (alfa, beeta) kuidas me täpselt võrdsust ei saavutanud:

Ja me püüame seda viga minimeerida:

Miks ruut?

Otsime mitte ainult normi miinimumi, vaid normi ruudu miinimumi. Miks? Miinimumpunkt ise langeb kokku ja ruut annab sujuva funktsiooni (argumentide ruutfunktsioon (alfa, beeta)), samas kui lihtsalt pikkus annab funktsiooni koonuse kujul, mis ei ole miinimumpunktis eristatav. Brr. Ruut on mugavam.

Ilmselt on viga minimeeritud, kui vektor e vektorite poolt hõlmatud tasapinnaga risti i ja j.

Illustratsioon

Teisisõnu: otsime joont, mille kõigi punktide ja selle sirgeni ulatuvate kauguste ruudu pikkuste summa on minimaalne:

VÄRSKENDUS: siin on mul leng, kaugust joonest tuleks mõõta vertikaalselt, mitte ortograafilise projektsiooniga. Sellel kommenteerijal on õigus.

Illustratsioon

Täiesti erinevate sõnadega (hoolsalt, halvasti vormistatud, kuid see peaks olema sõrmedel selge): võtame kõik võimalikud jooned kõigi punktipaaride vahel ja otsime kõigi vahelt keskmist joont:

Illustratsioon

Veel üks selgitus sõrmede kohta: kinnitame vedru kõigi andmepunktide (siin on kolm) ja otsitava joone vahele ning tasakaaluseisundi joon on täpselt see, mida otsime.

Ruutvormi miinimum

Niisiis, vektorit arvestades b ja maatriksi veergude-vektorite poolt haaratud tasapind A(antud juhul (x0,x1,x2) ja (1,1,1)), otsime vektorit e minimaalse ruudu pikkusega. Ilmselgelt on miinimum saavutatav ainult vektori puhul e, risti maatriksi veergude-vektoritega kaetud tasapinnaga A:

Teisisõnu otsime vektorit x=(alfa, beeta), et:

Tuletan teile meelde, et see vektor x=(alfa, beeta) on ruutfunktsiooni ||e(alfa, beeta)||^2 miinimum:

Siin on kasulik meeles pidada, et maatriksit saab tõlgendada nii nagu ruutvormi, näiteks identiteedimaatriksit ((1,0),(0,1)) saab tõlgendada funktsioonina x^2 + y ^2:

ruutvorm

Kogu seda võimlemist tuntakse lineaarse regressioonina.

Laplace'i võrrand Dirichlet' piirtingimusega

Nüüd kõige lihtsam tegelik probleem: on teatud kolmnurkne pind, seda on vaja siluda. Näiteks laadime minu näomudeli:

Algne kohustus on saadaval. Väliste sõltuvuste minimeerimiseks võtsin oma tarkvara renderdaja koodi, juba Habré peal. Lineaarse süsteemi lahendamiseks kasutan OpenNL , see on suurepärane lahendaja, kuid seda on väga raske installida: peate kopeerima kaks faili (.h + .c) oma projekti kausta. Kogu silumine toimub järgmise koodiga:

For (int d=0; d<3; d++) { nlNewContext(); nlSolverParameteri(NL_NB_VARIABLES, verts.size()); nlSolverParameteri(NL_LEAST_SQUARES, NL_TRUE); nlBegin(NL_SYSTEM); nlBegin(NL_MATRIX); for (int i=0; i<(int)verts.size(); i++) { nlBegin(NL_ROW); nlCoefficient(i, 1); nlRightHandSide(verts[i][d]); nlEnd(NL_ROW); } for (unsigned int i=0; i&face = näod[i]; jaoks (int j=0; j<3; j++) { nlBegin(NL_ROW); nlCoefficient(face[ j ], 1); nlCoefficient(face[(j+1)%3], -1); nlEnd(NL_ROW); } } nlEnd(NL_MATRIX); nlEnd(NL_SYSTEM); nlSolve(); for (int i=0; i<(int)verts.size(); i++) { verts[i][d] = nlGetVariable(i); } }

X, Y ja Z koordinaadid on eraldatavad, silun eraldi. See tähendab, et lahendan kolm lineaarvõrrandisüsteemi, millest igaühel on sama arv muutujaid kui minu mudeli tippude arv. Maatriksi A esimesel n real on ainult üks 1 rea kohta ja vektori b esimesel n real on mudeli algsed koordinaadid. See tähendab, et ma seon uue tipupositsiooni ja vana tipuasendi vahel - uued ei tohiks olla vanadest liiga kaugel.

Kõigil järgnevatel maatriksi A ridadel (faces.size()*3 = kõigi ruudustiku kolmnurkade servade arv) on üks esinemine 1 ja üks esinemine -1, samas kui vektoril b on null komponenti, mis on vastassuunas. See tähendab, et panen meie kolmnurkse võrgu igale servale vedru: kõik servad püüavad saada sama tippu kui nende algus- ja lõpp-punkt.

Veel kord: kõik tipud on muutujad ja nad ei saa oma algsest asukohast kaugele kõrvale kalduda, kuid samal ajal püüavad nad muutuda üksteisega sarnaseks.

Siin on tulemus:

Kõik oleks hästi, mudel on tõesti silutud, kuid see liikus oma esialgsest servast eemale. Muudame veidi koodi:

For (int i=0; i<(int)verts.size(); i++) { float scale = border[i] ? 1000: 1; nlBegin(NL_ROW); nlCoefficient(i, scale); nlRightHandSide(scale*verts[i][d]); nlEnd(NL_ROW); }

Meie maatriksis A serval olevate tippude jaoks ei lisa ma rida kategooriast v_i = verts[i][d], vaid 1000*v_i = 1000*verts[i][d]. Mida see muudab? Ja see muudab meie vea ruutkuju. Nüüd maksab üks kõrvalekalle ülemisest servast mitte ühe ühiku, nagu varem, vaid 1000 * 1000 ühikut. Ehk siis äärmiste tippude külge riputasime tugevama vedru, lahendus eelistab teisi tugevamalt venitada. Siin on tulemus:

Kahekordistame tippude vahel olevate vedrude tugevust:
nlKoefitsient(nägu[ j ], 2); nlKoefitsient(nägu[(j+1)%3], -2);

On loogiline, et pind on muutunud siledamaks:

Ja nüüd isegi sada korda tugevam:

Mis see on? Kujutage ette, et oleme kastnud traatrõnga seebivette. Selle tulemusena püüab saadud seebikile olla võimalikult väike kumerus, puudutades sama piiri - meie traatrõngast. Täpselt sellise saime, kui tegime äärise ära ja palusime seest sileda pinna. Õnnitleme, lahendasime just Laplace'i võrrandi Dirichlet' piirtingimustega. Kõlab lahedalt? Kuid tegelikult tuleb lahendada vaid üks lineaarvõrrandisüsteem.

Poissoni võrrand

Anname veel ühe laheda nime.

Oletame, et mul on selline pilt:

Kõik on tublid, aga mulle tool ei meeldi.

Lõikasin pildi pooleks:



Ja ma valin oma kätega tooli:

Seejärel lohistan kõik, mis on maskis valge, pildi vasakusse serva ja samal ajal ütlen kogu pildi ulatuses, et kahe naaberpiksli vahe peaks olema võrdne kahe naaberpiksli vahega. parem pilt:

For (int i=0; i

Siin on tulemus:

Kood ja pildid on olemas