Three-dimensional na paraan ng hindi bababa sa mga parisukat. Approximation ng pang-eksperimentong data

Na nakakahanap ng pinakamalawak na aplikasyon sa iba't ibang larangan ng agham at kasanayan. Ito ay maaaring pisika, kimika, biology, ekonomiya, sosyolohiya, sikolohiya at iba pa at iba pa. Sa pamamagitan ng kalooban ng kapalaran, madalas kong kailangang harapin ang ekonomiya, at samakatuwid ngayon ay mag-aayos ako para sa iyo ng isang tiket sa isang kamangha-manghang bansa na tinatawag na Econometrics=) … Paanong ayaw mo niyan?! Napakaganda doon - kailangan mo lang magdesisyon! …Ngunit ang malamang na gusto mo ay matutunan kung paano lutasin ang mga problema hindi bababa sa mga parisukat. At lalo na ang masigasig na mga mambabasa ay matututong lutasin ang mga ito hindi lamang nang tumpak, ngunit napakabilis din ;-) Ngunit una pangkalahatang pahayag ng problema+ kaugnay na halimbawa:

Hayaang pag-aralan ang mga indicator sa ilang subject area na may quantitative expression. Kasabay nito, mayroong bawat dahilan upang maniwala na ang tagapagpahiwatig ay nakasalalay sa tagapagpahiwatig. Ang pagpapalagay na ito ay maaaring parehong siyentipikong hypothesis at batay sa elementarya na sentido komun. Iwanan natin ang agham, gayunpaman, at tuklasin ang higit pang mga lugar na kasiya-siya - ibig sabihin, mga grocery store. Ipahiwatig sa pamamagitan ng:

– retail space ng isang grocery store, sq.m.,
- taunang turnover ng isang grocery store, milyong rubles.

Malinaw na mas malaki ang lugar ng tindahan, mas malaki ang turnover nito sa karamihan ng mga kaso.

Ipagpalagay na pagkatapos magsagawa ng mga obserbasyon / mga eksperimento / mga kalkulasyon / pagsasayaw gamit ang isang tamburin, mayroon kami sa aming pagtatapon ng numerical data:

Sa mga grocery store, sa palagay ko ang lahat ay malinaw: - ito ang lugar ng 1st store, - ang taunang turnover nito, - ang lugar ng 2nd store, - ang taunang turnover nito, atbp. Sa pamamagitan ng paraan, hindi kinakailangan na magkaroon ng access sa mga classified na materyales - ang isang medyo tumpak na pagtatasa ng turnover ay maaaring makuha gamit ang mga istatistika ng matematika. Gayunpaman, huwag magambala, ang kurso ng komersyal na espiya ay binabayaran na =)

Ang data ng tabular ay maaari ding isulat sa anyo ng mga puntos at ilarawan sa karaniwang paraan para sa atin. Sistema ng Cartesian .

Sagutin natin ang isang mahalagang tanong: ilang puntos ang kailangan para sa isang qualitative study?

Ang mas malaki, mas mabuti. Ang minimum na tinatanggap na set ay binubuo ng 5-6 puntos. Bilang karagdagan, na may maliit na halaga ng data, hindi dapat isama ang mga "abnormal" na resulta sa sample. Kaya, halimbawa, ang isang maliit na elite na tindahan ay maaaring makatulong sa mga order ng magnitude higit pa sa "kanilang mga kasamahan", at sa gayon ay distorting ang pangkalahatang pattern na kailangang matagpuan!

Kung ito ay medyo simple, kailangan nating pumili ng isang function, iskedyul na pumasa nang mas malapit hangga't maaari sa mga puntos . Ang ganitong function ay tinatawag tinatantiya (approximation - approximation) o teoretikal na pag-andar . Sa pangkalahatan, dito agad lumilitaw ang isang halatang "nagpapanggap" - isang polynomial na may mataas na antas, ang graph kung saan dumadaan sa LAHAT ng mga puntos. Ngunit ang pagpipiliang ito ay kumplikado, at kadalasan ay hindi tama. (dahil ang tsart ay "hangin" sa lahat ng oras at hindi maganda ang sumasalamin sa pangunahing trend).

Kaya, ang nais na pag-andar ay dapat na sapat na simple at sa parehong oras ay sumasalamin sa pag-asa nang sapat. Tulad ng maaari mong hulaan, ang isa sa mga pamamaraan para sa paghahanap ng mga naturang function ay tinatawag hindi bababa sa mga parisukat. Una, suriin natin ang kakanyahan nito sa pangkalahatang paraan. Hayaan ang ilang function na humigit-kumulang sa pang-eksperimentong data:


Paano suriin ang katumpakan ng pagtatantya na ito? Kalkulahin din natin ang mga pagkakaiba (mga deviation) sa pagitan ng mga pang-eksperimentong at functional na halaga (pinag-aaralan namin ang pagguhit). Ang unang naiisip na pumasok sa isip ay ang tantiyahin kung gaano kalaki ang kabuuan, ngunit ang problema ay ang mga pagkakaiba ay maaaring negatibo. (Halimbawa, ) at ang mga paglihis bilang resulta ng naturang pagsusuma ay magkakansela sa isa't isa. Samakatuwid, bilang isang pagtatantya ng katumpakan ng pagtatantya, iminumungkahi nito ang sarili nitong kunin ang kabuuan mga module mga paglihis:

o sa nakatiklop na anyo: (bigla, sino ang hindi nakakaalam: ay ang sum icon, at isang auxiliary variable-"counter", na kumukuha ng mga halaga mula 1 hanggang ).

Sa pamamagitan ng pagtatantya sa mga pang-eksperimentong punto na may iba't ibang mga pag-andar, makakakuha tayo ng iba't ibang mga halaga ng , at malinaw na kung saan ang kabuuan na ito ay mas maliit, ang pagpapaandar na iyon ay mas tumpak.

Ang ganitong paraan ay umiiral at tinatawag hindi bababa sa modulus na pamamaraan. Gayunpaman, sa pagsasagawa ito ay naging mas laganap. hindi bababa sa parisukat na paraan, kung saan ang mga posibleng negatibong halaga ay inalis hindi ng modulus, ngunit sa pamamagitan ng pag-squaring ng mga deviations:

, pagkatapos kung saan ang mga pagsisikap ay nakadirekta sa pagpili ng naturang function na ang kabuuan ng mga squared deviations ay kasing liit hangga't maaari. Sa totoo lang, kaya ang pangalan ng pamamaraan.

At ngayon bumalik kami sa isa pang mahalagang punto: tulad ng nabanggit sa itaas, ang napiling function ay dapat na medyo simple - ngunit mayroon ding maraming mga naturang function: linear , hyperbolic, exponential, logarithmic, parisukat atbp. At, siyempre, dito gusto ko agad na "bawasan ang larangan ng aktibidad." Anong klase ng mga function ang pipiliin para sa pananaliksik? Primitive ngunit epektibong pamamaraan:

- Ang pinakamadaling paraan upang gumuhit ng mga puntos sa pagguhit at pag-aralan ang kanilang lokasyon. Kung sila ay nasa isang tuwid na linya, dapat mong hanapin straight line equation na may pinakamainam na halaga at . Sa madaling salita, ang gawain ay upang mahanap ang GANITONG mga coefficient - upang ang kabuuan ng mga squared deviations ay ang pinakamaliit.

Kung ang mga punto ay matatagpuan, halimbawa, kasama hyperbole, pagkatapos ay malinaw na ang linear function ay magbibigay ng hindi magandang approximation. Sa kasong ito, hinahanap namin ang pinaka "kanais-nais" na mga coefficient para sa hyperbola equation - ang mga nagbibigay ng pinakamababang kabuuan ng mga parisukat .

Ngayon pansinin na sa parehong mga kaso ang pinag-uusapan natin mga function ng dalawang variable, na ang mga argumento ay naghanap ng mga opsyon sa dependency:

At sa esensya, kailangan nating lutasin ang isang karaniwang problema - upang mahanap minimum ng isang function ng dalawang variable.

Alalahanin ang aming halimbawa: ipagpalagay na ang mga punto ng "shop" ay malamang na matatagpuan sa isang tuwid na linya at mayroong lahat ng dahilan upang maniwala sa presensya linear dependence turnover mula sa lugar ng kalakalan. Hanapin natin ang MGA GANITONG coefficient na "a" at "be" upang ang kabuuan ng mga squared deviations ay ang pinakamaliit. Lahat gaya ng dati - una mga partial derivatives ng 1st order. Ayon kay tuntunin ng linearity maaari kang mag-iba sa ilalim mismo ng icon ng kabuuan:

Kung nais mong gamitin ang impormasyong ito para sa isang sanaysay o coursework, ako ay lubos na nagpapasalamat para sa link sa listahan ng mga mapagkukunan, hindi ka makakahanap ng ganoong detalyadong mga kalkulasyon kahit saan:

Gumawa tayo ng isang karaniwang sistema:

Binabawasan namin ang bawat equation ng "dalawa" at, bilang karagdagan, "paghiwa-hiwalayin" ang mga kabuuan:

Tandaan : nakapag-iisa na pag-aralan kung bakit maaaring alisin ang "a" at "be" sa icon ng kabuuan. Sa pamamagitan ng paraan, pormal na ito ay maaaring gawin sa kabuuan

Isulat muli natin ang system sa isang "inilapat" na form:

pagkatapos kung saan ang algorithm para sa paglutas ng aming problema ay nagsisimulang iguguhit:

Alam ba natin ang mga coordinate ng mga puntos? Alam namin. Sums mahahanap natin? Madali. Binubuo namin ang pinakasimpleng sistema ng dalawang linear na equation na may dalawang hindi alam("a" at "beh"). Niresolba namin ang system, halimbawa, Pamamaraan ni Cramer, na nagreresulta sa isang nakatigil na punto . Sinusuri sapat na kondisyon para sa isang extremum, maaari naming i-verify na sa puntong ito ang function tumpak na umabot pinakamababa. Ang pag-verify ay nauugnay sa mga karagdagang kalkulasyon at samakatuwid ay iiwan namin ito sa likod ng mga eksena. (kung kinakailangan, ang nawawalang frame ay maaaring tingnan). Ginagawa namin ang pangwakas na konklusyon:

Function ang pinakamahusay na paraan (hindi bababa sa kumpara sa anumang iba pang linear function) pinalalapit ang mga pang-eksperimentong punto . Sa halos pagsasalita, ang graph nito ay pumasa nang mas malapit hangga't maaari sa mga puntong ito. Sa tradisyon econometrics ang resultang approximating function ay tinatawag din ipinares na linear regression equation .

Ang problemang isinasaalang-alang ay may malaking praktikal na kahalagahan. Sa sitwasyon sa ating halimbawa, ang equation nagbibigay-daan sa iyo upang mahulaan kung anong uri ng turnover ("yig") ay nasa tindahan na may isa o ibang halaga ng lugar ng pagbebenta (isa o ibang kahulugan ng "x"). Oo, ang magreresultang hula ay magiging isang hula lamang, ngunit sa maraming mga kaso ito ay magiging tumpak.

Susuriin ko lamang ang isang problema sa "tunay" na mga numero, dahil walang mga kahirapan dito - lahat ng mga kalkulasyon ay nasa antas ng kurikulum ng paaralan sa mga baitang 7-8. Sa 95 porsiyento ng mga kaso, hihilingin sa iyo na maghanap lamang ng isang linear na function, ngunit sa pinakadulo ng artikulo ay ipapakita ko na hindi na mahirap hanapin ang mga equation para sa pinakamainam na hyperbola, exponent, at ilang iba pang mga function.

Sa katunayan, nananatili itong ipamahagi ang mga ipinangakong goodies - upang matutunan mo kung paano malutas ang mga naturang halimbawa hindi lamang tumpak, ngunit mabilis din. Maingat naming pinag-aaralan ang pamantayan:

Isang gawain

Bilang resulta ng pag-aaral ng ugnayan sa pagitan ng dalawang tagapagpahiwatig, ang mga sumusunod na pares ng mga numero ay nakuha:

Gamit ang paraan ng least squares, hanapin ang linear function na pinakamahusay na tinatantya ang empirical (nakaranas) datos. Gumawa ng drawing kung saan, sa isang Cartesian rectangular coordinate system, mag-plot ng mga pang-eksperimentong punto at isang graph ng approximating function. . Hanapin ang kabuuan ng mga squared deviations sa pagitan ng empirical at theoretical na mga halaga. Alamin kung ang function ay mas mahusay (sa mga tuntunin ng paraan ng least squares) tinatayang mga pang-eksperimentong punto.

Tandaan na ang mga "x" na halaga ay mga likas na halaga, at ito ay may katangian na makabuluhang kahulugan, na tatalakayin ko sa ibang pagkakataon; ngunit sila, siyempre, ay maaaring maging fractional. Bilang karagdagan, depende sa nilalaman ng isang partikular na gawain, ang parehong "X" at "G" na mga halaga ay maaaring ganap o bahagyang negatibo. Buweno, binigyan kami ng isang "walang mukha" na gawain, at sinimulan namin ito solusyon:

Nahanap namin ang mga coefficient ng pinakamainam na function bilang isang solusyon sa system:

Para sa mga layunin ng isang mas compact na notation, ang "counter" na variable ay maaaring tanggalin, dahil malinaw na na ang pagsusuma ay isinasagawa mula 1 hanggang .

Ito ay mas maginhawa upang kalkulahin ang mga kinakailangang halaga sa isang tabular form:


Maaaring isagawa ang mga kalkulasyon sa isang microcalculator, ngunit mas mahusay na gumamit ng Excel - parehong mas mabilis at walang mga error; manood ng maikling video:

Kaya, nakukuha namin ang sumusunod sistema:

Dito maaari mong i-multiply ang pangalawang equation sa 3 at ibawas ang 2nd mula sa 1st equation term sa pamamagitan ng term. Ngunit ito ay swerte - sa pagsasagawa, ang mga sistema ay madalas na hindi likas na matalino, at sa mga ganitong kaso nakakatipid ito Pamamaraan ni Cramer:
, kaya ang system ay may natatanging solusyon.

Suriin natin. Naiintindihan ko na ayaw ko, ngunit bakit laktawan ang mga pagkakamali kung saan talagang hindi mo makaligtaan ang mga ito? Palitan ang nahanap na solusyon sa kaliwang bahagi ng bawat equation ng system:

Ang mga tamang bahagi ng kaukulang mga equation ay nakuha, na nangangahulugan na ang sistema ay nalutas nang tama.

Kaya, ang gustong approximating function: – mula sa lahat ng linear function Ang pang-eksperimentong data ay pinakamahusay na tinatantya nito.

Unlike tuwid dependence ng turnover ng tindahan sa lugar nito, ang nahanap na dependence ay reverse (prinsipyo "mas marami - mas kaunti"), at ang katotohanang ito ay agad na inihayag ng negatibo angular coefficient. Function nagpapaalam sa amin na sa pagtaas ng isang tiyak na tagapagpahiwatig ng 1 yunit, ang halaga ng umaasa na tagapagpahiwatig ay bumababa karaniwan ng 0.65 units. Tulad ng sinasabi nila, mas mataas ang presyo ng bakwit, mas mababa ang ibinebenta.

Upang i-plot ang approximating function, makikita namin ang dalawa sa mga value nito:

at isagawa ang pagguhit:


Ang itinayong linya ay tinatawag linya ng uso (ibig sabihin, isang linear trend line, ibig sabihin, sa pangkalahatang kaso, ang isang trend ay hindi nangangahulugang isang tuwid na linya). Ang bawat isa ay pamilyar sa pananalitang "maging nasa trend", at sa palagay ko ang terminong ito ay hindi nangangailangan ng karagdagang mga komento.

Kalkulahin ang kabuuan ng mga squared deviations sa pagitan ng empirical at theoretical values. Sa geometriko, ito ang kabuuan ng mga parisukat ng mga haba ng mga segment na "pulang-pula". (dalawa sa mga ito ay napakaliit na hindi mo makita ang mga ito).

Ibuod natin ang mga kalkulasyon sa isang talahanayan:


Maaari silang muling maisagawa nang manu-mano, kung sakaling magbibigay ako ng isang halimbawa para sa unang punto:

ngunit mas mahusay na gawin ang alam nang paraan:

Ulitin natin: ano ang kahulugan ng resulta? Mula sa lahat ng linear function function ang exponent ay ang pinakamaliit, iyon ay, ito ang pinakamahusay na approximation sa pamilya nito. At dito, sa pamamagitan ng paraan, ang huling tanong ng problema ay hindi sinasadya: paano kung ang iminungkahing exponential function mas mabuti bang tantiyahin ang mga pang-eksperimentong punto?

Hanapin natin ang katumbas na kabuuan ng mga squared deviations - upang makilala ang mga ito, itatalaga ko ang mga ito sa titik na "epsilon". Ang pamamaraan ay eksaktong pareho:


At muli para sa bawat pagkalkula ng sunog para sa 1st point:

Sa Excel, ginagamit namin ang karaniwang function EXP (Matatagpuan ang syntax sa Excel Help).

Output: , kaya tinatantya ng exponential function ang mga pang-eksperimentong puntos na mas malala kaysa sa tuwid na linya .

Ngunit dapat tandaan dito na ang "mas malala" ay hindi pa ibig sabihin, ano ang mali. Ngayon ay gumawa ako ng graph ng exponential function na ito - at pumasa din ito malapit sa mga puntos - kaya kung walang analytical na pag-aaral ay mahirap sabihin kung aling function ang mas tumpak.

Nakumpleto nito ang solusyon, at bumalik ako sa tanong ng mga natural na halaga ng argumento. Sa iba't ibang pag-aaral, bilang panuntunan, pang-ekonomiya o sosyolohikal, mga buwan, taon o iba pang pantay na agwat ng oras ay binibilang ng natural na "X". Isaalang-alang, halimbawa, ang gayong problema.

Pinakamababang parisukat na paraan

Sa huling aralin ng paksa, makikilala natin ang pinakatanyag na aplikasyon FNP, na nakakahanap ng pinakamalawak na aplikasyon sa iba't ibang larangan ng agham at kasanayan. Ito ay maaaring pisika, kimika, biology, ekonomiya, sosyolohiya, sikolohiya at iba pa at iba pa. Sa pamamagitan ng kalooban ng kapalaran, madalas kong kailangang harapin ang ekonomiya, at samakatuwid ngayon ay mag-aayos ako para sa iyo ng isang tiket sa isang kamangha-manghang bansa na tinatawag na Econometrics=) … Paanong ayaw mo niyan?! Napakaganda doon - kailangan mo lang magdesisyon! …Ngunit ang malamang na gusto mo ay matutunan kung paano lutasin ang mga problema hindi bababa sa mga parisukat. At lalo na ang masigasig na mga mambabasa ay matututong lutasin ang mga ito hindi lamang nang tumpak, ngunit napakabilis din ;-) Ngunit una pangkalahatang pahayag ng problema+ kaugnay na halimbawa:

Hayaang pag-aralan ang mga indicator sa ilang subject area na may quantitative expression. Kasabay nito, mayroong bawat dahilan upang maniwala na ang tagapagpahiwatig ay nakasalalay sa tagapagpahiwatig. Ang pagpapalagay na ito ay maaaring parehong siyentipikong hypothesis at batay sa elementarya na sentido komun. Iwanan natin ang agham, gayunpaman, at tuklasin ang higit pang mga lugar na kasiya-siya - ibig sabihin, mga grocery store. Ipahiwatig sa pamamagitan ng:

– retail space ng isang grocery store, sq.m.,
- taunang turnover ng isang grocery store, milyong rubles.

Malinaw na mas malaki ang lugar ng tindahan, mas malaki ang turnover nito sa karamihan ng mga kaso.

Ipagpalagay na pagkatapos magsagawa ng mga obserbasyon / mga eksperimento / mga kalkulasyon / pagsasayaw gamit ang isang tamburin, mayroon kami sa aming pagtatapon ng numerical data:

Sa mga grocery store, sa palagay ko ang lahat ay malinaw: - ito ang lugar ng 1st store, - ang taunang turnover nito, - ang lugar ng 2nd store, - ang taunang turnover nito, atbp. Sa pamamagitan ng paraan, hindi kinakailangan na magkaroon ng access sa mga classified na materyales - ang isang medyo tumpak na pagtatasa ng turnover ay maaaring makuha gamit ang mga istatistika ng matematika. Gayunpaman, huwag magambala, ang kurso ng komersyal na espiya ay binabayaran na =)

Ang data ng tabular ay maaari ding isulat sa anyo ng mga puntos at ilarawan sa karaniwang paraan para sa atin. Sistema ng Cartesian .

Sagutin natin ang isang mahalagang tanong: ilang puntos ang kailangan para sa isang qualitative study?

Ang mas malaki, mas mabuti. Ang minimum na tinatanggap na set ay binubuo ng 5-6 puntos. Bilang karagdagan, na may maliit na halaga ng data, hindi dapat isama ang mga "abnormal" na resulta sa sample. Kaya, halimbawa, ang isang maliit na elite na tindahan ay maaaring makatulong sa mga order ng magnitude higit pa sa "kanilang mga kasamahan", at sa gayon ay distorting ang pangkalahatang pattern na kailangang matagpuan!



Kung ito ay medyo simple, kailangan nating pumili ng isang function, iskedyul na pumasa nang mas malapit hangga't maaari sa mga puntos . Ang ganitong function ay tinatawag tinatantiya (approximation - approximation) o teoretikal na pag-andar . Sa pangkalahatan, dito agad lumilitaw ang isang halatang "nagpapanggap" - isang polynomial na may mataas na antas, ang graph kung saan dumadaan sa LAHAT ng mga puntos. Ngunit ang pagpipiliang ito ay kumplikado, at kadalasan ay hindi tama. (dahil ang tsart ay "hangin" sa lahat ng oras at hindi maganda ang sumasalamin sa pangunahing trend).

Kaya, ang nais na pag-andar ay dapat na sapat na simple at sa parehong oras ay sumasalamin sa pag-asa nang sapat. Tulad ng maaari mong hulaan, ang isa sa mga pamamaraan para sa paghahanap ng mga naturang function ay tinatawag hindi bababa sa mga parisukat. Una, suriin natin ang kakanyahan nito sa pangkalahatang paraan. Hayaan ang ilang function na humigit-kumulang sa pang-eksperimentong data:


Paano suriin ang katumpakan ng pagtatantya na ito? Kalkulahin din natin ang mga pagkakaiba (mga deviation) sa pagitan ng mga pang-eksperimentong at functional na halaga (pinag-aaralan namin ang pagguhit). Ang unang naiisip na pumasok sa isip ay ang tantiyahin kung gaano kalaki ang kabuuan, ngunit ang problema ay ang mga pagkakaiba ay maaaring negatibo. (Halimbawa, ) at ang mga paglihis bilang resulta ng naturang pagsusuma ay magkakansela sa isa't isa. Samakatuwid, bilang isang pagtatantya ng katumpakan ng pagtatantya, iminumungkahi nito ang sarili nitong kunin ang kabuuan mga module mga paglihis:

o sa nakatiklop na anyo: (para sa mga hindi nakakaalam: ay ang sum icon, at - auxiliary variable - "counter", na kumukuha ng mga halaga mula 1 hanggang ) .

Ang pagtatantya sa mga pang-eksperimentong punto na may iba't ibang mga pag-andar, makakakuha tayo ng iba't ibang mga halaga, at ito ay malinaw kung saan ang kabuuan na ito ay mas kaunti - ang pagpapaandar na iyon ay mas tumpak.

Ang ganitong paraan ay umiiral at tinatawag hindi bababa sa modulus na pamamaraan. Gayunpaman, sa pagsasagawa ito ay naging mas laganap. hindi bababa sa parisukat na paraan, kung saan ang mga posibleng negatibong halaga ay inalis hindi ng modulus, ngunit sa pamamagitan ng pag-squaring ng mga deviations:



, pagkatapos kung saan ang mga pagsisikap ay nakadirekta sa pagpili ng naturang function na ang kabuuan ng mga squared deviations ay kasing liit hangga't maaari. Sa totoo lang, kaya ang pangalan ng pamamaraan.

At ngayon bumalik kami sa isa pang mahalagang punto: tulad ng nabanggit sa itaas, ang napiling function ay dapat na medyo simple - ngunit mayroon ding maraming mga naturang function: linear , hyperbolic , exponential , logarithmic , parisukat atbp. At, siyempre, dito gusto ko agad na "bawasan ang larangan ng aktibidad." Anong klase ng mga function ang pipiliin para sa pananaliksik? Primitive ngunit epektibong pamamaraan:

- Ang pinakamadaling paraan upang gumuhit ng mga puntos sa pagguhit at pag-aralan ang kanilang lokasyon. Kung sila ay nasa isang tuwid na linya, dapat mong hanapin straight line equation na may pinakamainam na halaga at . Sa madaling salita, ang gawain ay upang mahanap ang GANITONG mga coefficient - upang ang kabuuan ng mga squared deviations ay ang pinakamaliit.

Kung ang mga punto ay matatagpuan, halimbawa, kasama hyperbole, pagkatapos ay malinaw na ang linear function ay magbibigay ng hindi magandang approximation. Sa kasong ito, hinahanap namin ang pinaka "kanais-nais" na mga coefficient para sa hyperbola equation - ang mga nagbibigay ng pinakamababang kabuuan ng mga parisukat .

Ngayon pansinin na sa parehong mga kaso ang pinag-uusapan natin mga function ng dalawang variable, na ang mga argumento ay naghanap ng mga opsyon sa dependency:

At sa esensya, kailangan nating lutasin ang isang karaniwang problema - upang mahanap minimum ng isang function ng dalawang variable.

Alalahanin ang aming halimbawa: ipagpalagay na ang mga punto ng "shop" ay malamang na matatagpuan sa isang tuwid na linya at mayroong lahat ng dahilan upang maniwala sa presensya linear dependence turnover mula sa lugar ng kalakalan. Hanapin natin ang MGA GANITONG coefficient na "a" at "be" upang ang kabuuan ng mga squared deviations ay ang pinakamaliit. Lahat gaya ng dati - una mga partial derivatives ng 1st order. Ayon kay tuntunin ng linearity maaari kang mag-iba sa ilalim mismo ng icon ng kabuuan:

Kung nais mong gamitin ang impormasyong ito para sa isang sanaysay o coursework, ako ay lubos na nagpapasalamat para sa link sa listahan ng mga mapagkukunan, hindi ka makakahanap ng ganoong detalyadong mga kalkulasyon kahit saan:

Gumawa tayo ng isang karaniwang sistema:

Binabawasan namin ang bawat equation ng "dalawa" at, bilang karagdagan, "paghiwa-hiwalayin" ang mga kabuuan:

Tandaan : nakapag-iisa na pag-aralan kung bakit maaaring alisin ang "a" at "be" sa icon ng kabuuan. Sa pamamagitan ng paraan, pormal na ito ay maaaring gawin sa kabuuan

Isulat muli natin ang system sa isang "inilapat" na form:

pagkatapos kung saan ang algorithm para sa paglutas ng aming problema ay nagsisimulang iguguhit:

Alam ba natin ang mga coordinate ng mga puntos? Alam namin. Sums mahahanap natin? Madali. Binubuo namin ang pinakasimpleng sistema ng dalawang linear na equation na may dalawang hindi alam("a" at "beh"). Niresolba namin ang system, halimbawa, Pamamaraan ni Cramer, na nagreresulta sa isang nakatigil na punto . Sinusuri sapat na kondisyon para sa isang extremum, maaari naming i-verify na sa puntong ito ang function tumpak na umabot pinakamababa. Ang pag-verify ay nauugnay sa mga karagdagang kalkulasyon at samakatuwid ay iiwan namin ito sa likod ng mga eksena. (kung kinakailangan, ang nawawalang frame ay maaaring tingnandito ) . Ginagawa namin ang pangwakas na konklusyon:

Function ang pinakamahusay na paraan (hindi bababa sa kumpara sa anumang iba pang linear function) pinalalapit ang mga pang-eksperimentong punto . Sa halos pagsasalita, ang graph nito ay pumasa nang mas malapit hangga't maaari sa mga puntong ito. Sa tradisyon econometrics ang resultang approximating function ay tinatawag din ipinares na linear regression equation .

Ang problemang isinasaalang-alang ay may malaking praktikal na kahalagahan. Sa sitwasyon sa ating halimbawa, ang equation nagbibigay-daan sa iyo upang mahulaan kung anong uri ng turnover ("yig") ay nasa tindahan na may isa o ibang halaga ng lugar ng pagbebenta (isa o ibang kahulugan ng "x"). Oo, ang magreresultang hula ay magiging isang hula lamang, ngunit sa maraming mga kaso ito ay magiging tumpak.

Susuriin ko lamang ang isang problema sa "tunay" na mga numero, dahil walang mga kahirapan dito - lahat ng mga kalkulasyon ay nasa antas ng kurikulum ng paaralan sa mga baitang 7-8. Sa 95 porsiyento ng mga kaso, hihilingin sa iyo na maghanap lamang ng isang linear na function, ngunit sa pinakadulo ng artikulo ay ipapakita ko na hindi na mahirap hanapin ang mga equation para sa pinakamainam na hyperbola, exponent, at ilang iba pang mga function.

Sa katunayan, nananatili itong ipamahagi ang mga ipinangakong goodies - upang matutunan mo kung paano malutas ang mga naturang halimbawa hindi lamang tumpak, ngunit mabilis din. Maingat naming pinag-aaralan ang pamantayan:

Isang gawain

Bilang resulta ng pag-aaral ng ugnayan sa pagitan ng dalawang tagapagpahiwatig, ang mga sumusunod na pares ng mga numero ay nakuha:

Gamit ang paraan ng least squares, hanapin ang linear function na pinakamahusay na tinatantya ang empirical (nakaranas) datos. Gumawa ng drawing kung saan, sa isang Cartesian rectangular coordinate system, mag-plot ng mga pang-eksperimentong punto at isang graph ng approximating function. . Hanapin ang kabuuan ng mga squared deviations sa pagitan ng empirical at theoretical na mga halaga. Alamin kung ang function ay mas mahusay (sa mga tuntunin ng paraan ng least squares) tinatayang mga pang-eksperimentong punto.

Tandaan na ang mga "x" na halaga ay mga likas na halaga, at ito ay may katangian na makabuluhang kahulugan, na tatalakayin ko sa ibang pagkakataon; ngunit sila, siyempre, ay maaaring maging fractional. Bilang karagdagan, depende sa nilalaman ng isang partikular na gawain, ang parehong "X" at "G" na mga halaga ay maaaring ganap o bahagyang negatibo. Buweno, binigyan kami ng isang "walang mukha" na gawain, at sinimulan namin ito solusyon:

Nahanap namin ang mga coefficient ng pinakamainam na function bilang isang solusyon sa system:

Para sa mga layunin ng isang mas compact na notation, ang "counter" na variable ay maaaring tanggalin, dahil malinaw na na ang pagsusuma ay isinasagawa mula 1 hanggang .

Ito ay mas maginhawa upang kalkulahin ang mga kinakailangang halaga sa isang tabular form:


Maaaring isagawa ang mga kalkulasyon sa isang microcalculator, ngunit mas mahusay na gumamit ng Excel - parehong mas mabilis at walang mga error; manood ng maikling video:

Kaya, nakukuha namin ang sumusunod sistema:

Dito maaari mong i-multiply ang pangalawang equation sa 3 at ibawas ang 2nd mula sa 1st equation term sa pamamagitan ng term. Ngunit ito ay swerte - sa pagsasagawa, ang mga sistema ay madalas na hindi likas na matalino, at sa mga ganitong kaso nakakatipid ito Pamamaraan ni Cramer:
, kaya may kakaibang solusyon ang system.

Suriin natin. Naiintindihan ko na ayaw ko, ngunit bakit laktawan ang mga pagkakamali kung saan talagang hindi mo makaligtaan ang mga ito? Palitan ang nahanap na solusyon sa kaliwang bahagi ng bawat equation ng system:

Ang mga tamang bahagi ng kaukulang mga equation ay nakuha, na nangangahulugan na ang sistema ay nalutas nang tama.

Kaya, ang gustong approximating function: – mula sa lahat ng linear function Ang pang-eksperimentong data ay pinakamahusay na tinatantya nito.

Unlike tuwid dependence ng turnover ng tindahan sa lugar nito, ang nahanap na dependence ay reverse (prinsipyo "mas marami - mas kaunti"), at ang katotohanang ito ay agad na inihayag ng negatibo angular coefficient. Ang function ay nagsasabi sa amin na sa isang pagtaas sa isang tiyak na tagapagpahiwatig ng 1 yunit, ang halaga ng umaasa na tagapagpahiwatig ay bumababa karaniwan ng 0.65 units. Tulad ng sinasabi nila, mas mataas ang presyo ng bakwit, mas mababa ang ibinebenta.

Upang i-plot ang approximating function, makikita namin ang dalawa sa mga value nito:

at isagawa ang pagguhit:

Ang itinayong linya ay tinatawag linya ng uso (ibig sabihin, isang linear trend line, ibig sabihin, sa pangkalahatang kaso, ang isang trend ay hindi nangangahulugang isang tuwid na linya). Ang bawat isa ay pamilyar sa pananalitang "maging nasa trend", at sa palagay ko ang terminong ito ay hindi nangangailangan ng karagdagang mga komento.

Kalkulahin ang kabuuan ng mga squared deviations sa pagitan ng empirical at theoretical values. Sa geometriko, ito ang kabuuan ng mga parisukat ng mga haba ng mga segment na "pulang-pula". (dalawa sa mga ito ay napakaliit na hindi mo makita ang mga ito).

Ibuod natin ang mga kalkulasyon sa isang talahanayan:


Maaari silang muling maisagawa nang manu-mano, kung sakaling magbibigay ako ng isang halimbawa para sa unang punto:

ngunit mas mahusay na gawin ang alam nang paraan:

Ulitin natin: ano ang kahulugan ng resulta? Mula sa lahat ng linear function ang function ay may pinakamaliit na exponent, iyon ay, sa pamilya nito, ito ang pinakamahusay na approximation. At dito, sa pamamagitan ng paraan, ang huling tanong ng problema ay hindi sinasadya: paano kung ang iminungkahing exponential function mas mabuti bang tantiyahin ang mga pang-eksperimentong punto?

Hanapin natin ang katumbas na kabuuan ng mga squared deviations - upang makilala ang mga ito, itatalaga ko ang mga ito sa titik na "epsilon". Ang pamamaraan ay eksaktong pareho:

At muli para sa bawat pagkalkula ng sunog para sa 1st point:

Sa Excel, ginagamit namin ang karaniwang function EXP (Matatagpuan ang syntax sa Excel Help).

Output: , na nangangahulugan na ang exponential function ay tinatantya ang mga eksperimentong puntos na mas malala kaysa sa tuwid na linya.

Ngunit dapat tandaan dito na ang "mas malala" ay hindi pa ibig sabihin, ano ang mali. Ngayon ay nakagawa na ako ng graph ng exponential function na ito - at pumasa din ito malapit sa mga puntos - kaya't kung walang analytical na pag-aaral mahirap sabihin kung aling function ang mas tumpak.

Nakumpleto nito ang solusyon, at bumalik ako sa tanong ng mga natural na halaga ng argumento. Sa iba't ibang pag-aaral, bilang panuntunan, pang-ekonomiya o sosyolohikal, mga buwan, taon o iba pang pantay na agwat ng oras ay binibilang ng natural na "X". Isaalang-alang, halimbawa, ang sumusunod na problema:

Mayroon kaming sumusunod na data sa retail turnover ng tindahan para sa unang kalahati ng taon:

Gamit ang straight line analytical alignment, hanapin ang dami ng benta para sa Hulyo.

Oo, walang problema: binibilang namin ang mga buwan 1, 2, 3, 4, 5, 6 at ginagamit ang karaniwang algorithm, bilang isang resulta kung saan nakakakuha kami ng isang equation - ang tanging bagay pagdating sa oras ay karaniwang ang titik na "te ” (bagaman hindi ito kritikal). Ang resultang equation ay nagpapakita na sa unang kalahati ng taon, ang turnover ay tumaas ng average na CU 27.74. kada buwan. Kumuha ng forecast para sa Hulyo (buwan #7): e.u.

At katulad na mga gawain - ang kadiliman ay madilim. Ang mga nais ay maaaring gumamit ng karagdagang serbisyo, katulad ng aking Excel calculator (demo na bersyon), na ang malulutas ang problema halos kaagad! Ang gumaganang bersyon ng programa ay magagamit sa kapalit o para sa simbolikong pagbabayad.

Sa pagtatapos ng aralin, isang maikling impormasyon tungkol sa paghahanap ng mga dependency ng ilang iba pang mga uri. Sa totoo lang, walang espesyal na sasabihin, dahil ang pangunahing diskarte at solusyon algorithm ay nananatiling pareho.

Ipagpalagay natin na ang lokasyon ng mga eksperimentong punto ay kahawig ng isang hyperbola. Pagkatapos, upang mahanap ang mga coefficient ng pinakamahusay na hyperbola, kailangan mong hanapin ang minimum ng function - ang mga nais ay maaaring magsagawa ng mga detalyadong kalkulasyon at pumunta sa isang katulad na sistema:

Mula sa isang pormal na teknikal na punto ng view, ito ay nakuha mula sa "linear" na sistema (markahan natin ito ng asterisk) pinapalitan ang "x" ng . Well, ang dami kalkulahin, pagkatapos nito sa pinakamainam na coefficients "a" at "be" nasa kamay.

Kung mayroong bawat dahilan upang maniwala na ang mga puntos ay nakaayos sa isang logarithmic curve, pagkatapos ay upang maghanap para sa pinakamainam na mga halaga at hanapin ang minimum ng function . Sa pormal, sa system (*) ay dapat palitan ng:

Kapag nagkalkula sa Excel, gamitin ang function LN. Inaamin ko na hindi magiging mahirap para sa akin na lumikha ng mga calculator para sa bawat isa sa mga kaso na isinasaalang-alang, ngunit mas mabuti pa rin kung ikaw mismo ang "mag-program" ng mga kalkulasyon. Mga video tutorial upang makatulong.

Sa exponential dependence, ang sitwasyon ay bahagyang mas kumplikado. Upang bawasan ang bagay sa linear case, kinukuha namin ang logarithm ng function at paggamit mga katangian ng logarithm:

Ngayon, ang paghahambing ng nakuha na function sa linear function , dumating kami sa konklusyon na sa system (*) ay dapat mapalitan ng , at - ng . Para sa kaginhawahan, tinutukoy namin ang:

Mangyaring tandaan na ang sistema ay nalutas na may paggalang sa at , at samakatuwid, pagkatapos mahanap ang mga ugat, hindi mo dapat kalimutang hanapin ang koepisyent mismo.

Upang tantiyahin ang mga pang-eksperimentong punto pinakamainam na parabola , dapat matagpuan minimum ng isang function ng tatlong variable . Pagkatapos magsagawa ng mga karaniwang aksyon, nakukuha namin ang sumusunod na "gumagana" sistema:

Oo, siyempre, mayroong higit pang mga halaga dito, ngunit walang mga paghihirap sa lahat kapag ginagamit ang iyong paboritong application. At sa wakas, sasabihin ko sa iyo kung paano mabilis na suriin gamit ang Excel at bumuo ng nais na linya ng trend: lumikha ng isang scatter chart, piliin ang alinman sa mga punto gamit ang mouse at i-right click piliin ang opsyon "Magdagdag ng trend line". Susunod, piliin ang uri ng tsart at sa tab "Mga Parameter" buhayin ang opsyon "Ipakita ang equation sa chart". OK

Gaya ng dati, gusto kong tapusin ang artikulo sa ilang magagandang parirala, at halos i-type ko ang "Maging trend!". Ngunit sa paglipas ng panahon ay nagbago ang isip niya. At hindi dahil ito ay formulaic. I don't know how anyone, but I don't want to follow the promoted American and especially European trend at all =) Samakatuwid, nais ko ang bawat isa sa inyo na manatili sa inyong sariling linya!

http://www.grandars.ru/student/vysshaya-matematika/metod-naimenshih-kvadratov.html

Ang pamamaraan ng hindi bababa sa mga parisukat ay isa sa mga pinaka-karaniwan at pinaka-binuo dahil sa nito pagiging simple at kahusayan ng mga pamamaraan para sa pagtantya ng mga parameter ng mga linear econometric na modelo. Kasabay nito, ang ilang pag-iingat ay dapat sundin kapag ginagamit ito, dahil ang mga modelo na binuo gamit ito ay maaaring hindi nakakatugon sa isang bilang ng mga kinakailangan para sa kalidad ng kanilang mga parameter at, bilang isang resulta, hindi "mahusay" na sumasalamin sa mga pattern ng pag-unlad ng proseso.

Isaalang-alang natin ang pamamaraan para sa pagtatantya ng mga parameter ng isang linear econometric model gamit ang least squares method nang mas detalyado. Ang ganitong modelo sa pangkalahatang anyo ay maaaring katawanin ng equation (1.2):

y t = a 0 + a 1 x 1t +...+ a n x nt + ε t .

Ang paunang data kapag tinatantya ang mga parameter a 0 , a 1 ,..., a n ay ang vector ng mga halaga ng dependent variable y= (y 1 , y 2 , ... , y T)" at ang matrix ng mga halaga ng mga independiyenteng variable

kung saan ang unang hanay, na binubuo ng mga yunit, ay tumutugma sa koepisyent ng modelo .

Ang pamamaraan ng hindi bababa sa mga parisukat ay nakuha ang pangalan nito batay sa pangunahing prinsipyo na ang mga pagtatantya ng parameter na nakuha sa batayan nito ay dapat matugunan: ang kabuuan ng mga parisukat ng error sa modelo ay dapat na minimal.

Mga halimbawa ng paglutas ng mga problema sa pamamaraang least squares

Halimbawa 2.1. Ang negosyo ng kalakalan ay may isang network na binubuo ng 12 mga tindahan, ang impormasyon sa mga aktibidad na kung saan ay ipinakita sa Talahanayan. 2.1.

Nais malaman ng pamamahala ng kumpanya kung paano nakadepende ang laki ng taunang turnover sa retail space ng tindahan.

Talahanayan 2.1

Numero ng tindahan Taunang turnover, milyong rubles Lugar ng kalakalan, libong m 2
19,76 0,24
38,09 0,31
40,95 0,55
41,08 0,48
56,29 0,78
68,51 0,98
75,01 0,94
89,05 1,21
91,13 1,29
91,26 1,12
99,84 1,29
108,55 1,49

Pinakamababang mga parisukat na solusyon. Italaga natin - ang taunang turnover ng -th store, milyong rubles; - lugar ng pagbebenta ng ika-store, thousand m 2.

Fig.2.1. Scatterplot para sa Halimbawa 2.1

Upang matukoy ang anyo ng functional na relasyon sa pagitan ng mga variable at bumuo ng isang scatterplot (Larawan 2.1).

Batay sa scatter diagram, maaari nating tapusin na ang taunang turnover ay positibong nakadepende sa lugar ng pagbebenta (ibig sabihin, tataas ang y sa paglago ng ). Ang pinaka-angkop na paraan ng functional na koneksyon ay linear.

Ang impormasyon para sa karagdagang mga kalkulasyon ay ipinakita sa Talahanayan. 2.2. Gamit ang paraan ng least squares, tinatantya namin ang mga parameter ng linear one-factor econometric model

Talahanayan 2.2

t y t x 1t y t 2 x1t2 x 1t y t
19,76 0,24 390,4576 0,0576 4,7424
38,09 0,31 1450,8481 0,0961 11,8079
40,95 0,55 1676,9025 0,3025 22,5225
41,08 0,48 1687,5664 0,2304 19,7184
56,29 0,78 3168,5641 0,6084 43,9062
68,51 0,98 4693,6201 0,9604 67,1398
75,01 0,94 5626,5001 0,8836 70,5094
89,05 1,21 7929,9025 1,4641 107,7505
91,13 1,29 8304,6769 1,6641 117,5577
91,26 1,12 8328,3876 1,2544 102,2112
99,84 1,29 9968,0256 1,6641 128,7936
108,55 1,49 11783,1025 2,2201 161,7395
S 819,52 10,68 65008,554 11,4058 858,3991
Ang karaniwan 68,29 0,89

Sa ganitong paraan,

Samakatuwid, na may pagtaas sa lugar ng pangangalakal ng 1 libong m 2, ang iba pang mga bagay ay pantay, ang average na taunang turnover ay tumataas ng 67.8871 milyong rubles.

Halimbawa 2.2. Napansin ng pamamahala ng negosyo na ang taunang turnover ay nakasalalay hindi lamang sa lugar ng pagbebenta ng tindahan (tingnan ang halimbawa 2.1), kundi pati na rin sa average na bilang ng mga bisita. Ang nauugnay na impormasyon ay ipinakita sa talahanayan. 2.3.

Talahanayan 2.3

Solusyon. Tukuyin - ang average na bilang ng mga bisita sa ika na tindahan bawat araw, libong tao.

Upang matukoy ang anyo ng functional na relasyon sa pagitan ng mga variable at bumuo ng isang scatterplot (Larawan 2.2).

Batay sa scatter diagram, maaari nating tapusin na ang taunang turnover ay positibong nauugnay sa average na bilang ng mga bisita bawat araw (ibig sabihin, tataas ang y sa paglago ng ). Ang anyo ng functional dependence ay linear.

kanin. 2.2. Scatterplot halimbawa 2.2

Talahanayan 2.4

t x 2t x 2t 2 yt x 2t x 1t x 2t
8,25 68,0625 163,02 1,98
10,24 104,8575 390,0416 3,1744
9,31 86,6761 381,2445 5,1205
11,01 121,2201 452,2908 5,2848
8,54 72,9316 480,7166 6,6612
7,51 56,4001 514,5101 7,3598
12,36 152,7696 927,1236 11,6184
10,81 116,8561 962,6305 13,0801
9,89 97,8121 901,2757 12,7581
13,72 188,2384 1252,0872 15,3664
12,27 150,5529 1225,0368 15,8283
13,92 193,7664 1511,016 20,7408
S 127,83 1410,44 9160,9934 118,9728
Katamtaman 10,65

Sa pangkalahatan, kinakailangan upang matukoy ang mga parameter ng two-factor econometric model

y t \u003d a 0 + a 1 x 1t + a 2 x 2t + ε t

Ang impormasyong kinakailangan para sa karagdagang mga kalkulasyon ay ipinakita sa Talahanayan. 2.4.

Tantyahin natin ang mga parameter ng isang linear na two-factor econometric model gamit ang least squares method.

Sa ganitong paraan,

Ang pagsusuri ng koepisyent = 61.6583 ay nagpapakita na, ang lahat ng iba pang mga bagay ay pantay, na may pagtaas sa lugar ng pagbebenta ng 1 libong m 2, ang taunang paglilipat ay tataas ng isang average na 61.6583 milyong rubles.

Ang pagtatantya ng koepisyent = 2.2748 ay nagpapakita na, ang iba pang mga bagay ay pantay, na may pagtaas sa average na bilang ng mga bisita sa bawat 1 libong tao. bawat araw, ang taunang turnover ay tataas ng average na 2.2748 milyong rubles.

Halimbawa 2.3. Gamit ang impormasyong ipinakita sa talahanayan. 2.2 at 2.4, tantyahin ang parameter ng isang single-factor econometric model

kung saan ang nakasentro na halaga ng taunang turnover ng -th store, milyong rubles; - nakasentro na halaga ng average na pang-araw-araw na bilang ng mga bisita sa t-th store, libong tao. (tingnan ang mga halimbawa 2.1-2.2).

Solusyon. Ang karagdagang impormasyon na kinakailangan para sa mga kalkulasyon ay ipinakita sa Talahanayan. 2.5.

Talahanayan 2.5

-48,53 -2,40 5,7720 116,6013
-30,20 -0,41 0,1702 12,4589
-27,34 -1,34 1,8023 36,7084
-27,21 0,36 0,1278 -9,7288
-12,00 -2,11 4,4627 25,3570
0,22 -3,14 9,8753 -0,6809
6,72 1,71 2,9156 11,4687
20,76 0,16 0,0348 3,2992
22,84 -0,76 0,5814 -17,413
22,97 3,07 9,4096 70,4503
31,55 1,62 2,6163 51,0267
40,26 3,27 10,6766 131,5387
Sum 48,4344 431,0566

Gamit ang formula (2.35), nakukuha natin

Sa ganitong paraan,

http://www.cleverstudents.ru/articles/mnk.html

Halimbawa.

Pang-eksperimentong data sa mga halaga ng mga variable X At sa ay ibinigay sa talahanayan.

Bilang resulta ng kanilang pagkakahanay, ang pag-andar

Gamit hindi bababa sa parisukat na paraan, tantiyahin ang mga data na ito na may linear na dependence y=ax+b(hanapin ang mga pagpipilian ngunit At b). Alamin kung alin sa dalawang linya ang mas mahusay (sa kahulugan ng pinakamaliit na paraan ng mga parisukat) ang nakahanay sa pang-eksperimentong data. Gumawa ng isang guhit.

Solusyon.

Sa ating halimbawa n=5. Pinupuno namin ang talahanayan para sa kaginhawaan ng pagkalkula ng mga halaga na kasama sa mga formula ng mga kinakailangang coefficient.

Ang mga halaga sa ika-apat na hilera ng talahanayan ay nakuha sa pamamagitan ng pagpaparami ng mga halaga ng ika-2 hilera sa mga halaga ng ika-3 hilera para sa bawat numero i.

Ang mga halaga sa ikalimang hilera ng talahanayan ay nakuha sa pamamagitan ng pag-squaring ng mga halaga ng ika-2 hilera para sa bawat numero i.

Ang mga halaga ng huling hanay ng talahanayan ay ang mga kabuuan ng mga halaga sa mga hilera.

Ginagamit namin ang mga formula ng pinakamaliit na paraan ng mga parisukat upang mahanap ang mga coefficient ngunit At b. Pinapalitan namin sa kanila ang kaukulang mga halaga mula sa huling hanay ng talahanayan:

Dahil dito, y=0.165x+2.184 ay ang nais na tinatayang tuwid na linya.

Ito ay nananatiling alamin kung alin sa mga linya y=0.165x+2.184 o mas mahusay na tinatantya ang orihinal na data, ibig sabihin, gumawa ng pagtatantya gamit ang paraan ng least squares.

Patunay.

Kaya't kapag natagpuan ngunit At b Kinukuha ng function ang pinakamaliit na halaga, kinakailangan na sa puntong ito ang matrix ng quadratic form ng second-order differential para sa function ay tiyak na positibo. Ipakita natin.

Ang second order differential ay may anyo:

I.e

Samakatuwid, ang matrix ng quadratic form ay may anyo

at ang mga halaga ng mga elemento ay hindi nakasalalay sa ngunit At b.

Ipakita natin na ang matrix ay positibong tiyak. Nangangailangan ito na ang anggulo ng mga menor de edad ay positibo.

Angular minor ng unang order . Ang hindi pagkakapantay-pantay ay mahigpit, dahil ang mga puntos

Pagkatapos ng alignment, makakakuha tayo ng function ng sumusunod na form: g (x) = x + 1 3 + 1 .

Maaari naming tantiyahin ang data na ito sa isang linear na relasyon y = a x + b sa pamamagitan ng pagkalkula ng mga naaangkop na parameter. Para magawa ito, kakailanganin nating ilapat ang tinatawag na least squares method. Kakailanganin mo ring gumawa ng drawing para masuri kung aling linya ang pinakamahusay na ihanay ang pang-eksperimentong data.

Yandex.RTB R-A-339285-1

Ano nga ba ang OLS (least squares method)

Ang pangunahing bagay na kailangan nating gawin ay upang mahanap ang mga naturang coefficients ng linear dependence kung saan ang halaga ng function ng dalawang variable F (a, b) = ∑ i = 1 n (yi - (axi + b)) 2 ay magiging pinakamaliit. Sa madaling salita, para sa ilang mga halaga ng a at b, ang kabuuan ng mga squared deviations ng ipinakita na data mula sa nagreresultang tuwid na linya ay magkakaroon ng isang minimum na halaga. Ito ang kahulugan ng pamamaraang least squares. Ang kailangan lang nating gawin upang malutas ang halimbawa ay upang mahanap ang extremum ng function ng dalawang variable.

Paano makakuha ng mga formula para sa pagkalkula ng mga coefficient

Upang makakuha ng mga pormula para sa pagkalkula ng mga coefficient, kinakailangan na bumuo at lutasin ang isang sistema ng mga equation na may dalawang variable. Upang gawin ito, kinakalkula namin ang mga partial derivatives ng expression na F (a , b) = ∑ i = 1 n (y i - (a x i + b)) 2 na may paggalang sa a at b at itinutumbas ang mga ito sa 0 .

δ F (a , b) δ a = 0 δ F (a , b) δ b = 0 ⇔ - 2 ∑ i = 1 n (yi - (axi + b)) xi = 0 - 2 ∑ i = 1 n ( yi - (axi + b)) = 0 ⇔ a ∑ i = 1 nxi 2 + b ∑ i = 1 nxi = ∑ i = 1 nxiyia ∑ i = 1 nxi + ∑ i = 1 nb = ∑ i = 1 nyi ⇔ a ∑ i = 1 nxi 2 + b ∑ i = 1 nxi = ∑ i = 1 nxiyia ∑ i = 1 nxi + nb = ∑ i = 1 nyi

Upang malutas ang isang sistema ng mga equation, maaari kang gumamit ng anumang mga pamamaraan, tulad ng pagpapalit o pamamaraan ng Cramer. Bilang resulta, dapat tayong makakuha ng mga formula na kinakalkula ang mga koepisyent gamit ang pinakamababang paraan ng mga parisukat.

n ∑ i = 1 n x i y i - ∑ i = 1 n x i ∑ i = 1 n y i n ∑ i = 1 n - ∑ i = 1 n x i 2 b = ∑ i = 1 n y i - a ∑ i = 1 n x i n

Kinakalkula namin ang mga halaga ng mga variable kung saan ang function
Ang F (a , b) = ∑ i = 1 n (y i - (a x i + b)) 2 ay kukuha ng pinakamababang halaga. Sa ikatlong talata, patutunayan natin kung bakit nagkaganyan.

Ito ang aplikasyon ng pinakamababang paraan ng mga parisukat sa pagsasanay. Ang kanyang formula, na ginagamit upang mahanap ang parameter a , ay kinabibilangan ng ∑ i = 1 n x i , ∑ i = 1 n y i , ∑ i = 1 n x i y i , ∑ i = 1 n x i 2 , at ang parameter
n - ito ay nagsasaad ng dami ng pang-eksperimentong data. Pinapayuhan ka naming kalkulahin ang bawat halaga nang hiwalay. Ang coefficient value b ay kinakalkula kaagad pagkatapos ng a .

Bumalik tayo sa orihinal na halimbawa.

Halimbawa 1

Narito mayroon kaming n katumbas ng lima. Upang gawing mas maginhawa ang pagkalkula ng mga kinakailangang halaga na kasama sa mga formula ng koepisyent, pinupunan namin ang talahanayan.

ako = 1 ako = 2 ako = 3 ako = 4 ako = 5 ∑ i = 1 5
x i 0 1 2 4 5 12
y i 2 , 1 2 , 4 2 , 6 2 , 8 3 12 , 9
x i y i 0 2 , 4 5 , 2 11 , 2 15 33 , 8
x i 2 0 1 4 16 25 46

Solusyon

Ang ikaapat na hilera ay naglalaman ng data na nakuha sa pamamagitan ng pagpaparami ng mga halaga mula sa pangalawang hilera ng mga halaga ng pangatlo para sa bawat indibidwal na i . Ang ikalimang linya ay naglalaman ng data mula sa pangalawang squared. Ang huling hanay ay nagpapakita ng mga kabuuan ng mga halaga ng mga indibidwal na hilera.

Gamitin natin ang paraan ng least squares para kalkulahin ang coefficients a at b na kailangan natin. Upang gawin ito, palitan ang nais na mga halaga mula sa huling hanay at kalkulahin ang mga kabuuan:

n ∑ i = 1 nxiyi - ∑ i = 1 nxi ∑ i = 1 nyin ∑ i = 1 n - ∑ i = 1 nxi 2 b = ∑ i = 1 nyi - a ∑ i = 1 nxin ⇒ a = 5 33 , 8 - 12 12, 9 5 46 - 12 2 b = 12, 9 - a 12 5 ⇒ a ≈ 0, 165 b ≈ 2, 184

Nakuha namin na ang gustong tinatayang tuwid na linya ay magmumukhang y = 0 , 165 x + 2 , 184 . Ngayon kailangan nating tukuyin kung aling linya ang pinakamahusay na tinatayang ang data - g (x) = x + 1 3 + 1 o 0 , 165 x + 2 , 184 . Gumawa tayo ng pagtatantya gamit ang paraan ng least squares.

Upang kalkulahin ang error, kailangan nating hanapin ang mga kabuuan ng mga squared deviations ng data mula sa mga linyang σ 1 = ∑ i = 1 n (yi - (axi + bi)) 2 at σ 2 = ∑ i = 1 n (yi - g (xi)) 2 , ang pinakamababang halaga ay tumutugma sa isang mas angkop na linya.

σ 1 = ∑ i = 1 n (yi - (axi + bi)) 2 = = ∑ i = 1 5 (yi - (0 , 165 xi + 2 , 184)) 2 ≈ 0 , 019 σ 2 = ∑ i = 1 n (yi - g (xi)) 2 = = ∑ i = 1 5 (yi - (xi + 1 3 + 1)) 2 ≈ 0 , 096

Sagot: mula noong σ 1< σ 2 , то прямой, наилучшим образом аппроксимирующей исходные данные, будет
y = 0 , 165 x + 2 , 184 .

Ang pinakamaliit na paraan ng mga parisukat ay malinaw na ipinapakita sa graphic na paglalarawan. Ang pulang linya ay nagmamarka ng tuwid na linya g (x) = x + 1 3 + 1, ang asul na linya ay nagmamarka ng y = 0, 165 x + 2, 184. Ang raw data ay minarkahan ng mga pink na tuldok.

Ipaliwanag natin kung bakit kailangan ang eksaktong mga pagtatantya ng ganitong uri.

Magagamit ang mga ito sa mga problemang nangangailangan ng pag-smoothing ng data, gayundin sa mga kung saan kailangang i-interpolated o extrapolated ang data. Halimbawa, sa problemang tinalakay sa itaas, maaaring mahanap ang halaga ng naobserbahang dami y sa x = 3 o sa x = 6 . Nagtalaga kami ng isang hiwalay na artikulo sa gayong mga halimbawa.

Patunay ng pamamaraan ng LSM

Para makuha ng function ang pinakamababang halaga para sa kalkuladong a at b, kinakailangan na sa isang naibigay na punto ang matrix ng quadratic form ng differential ng function ng form F (a, b) = ∑ i = 1 n ( yi - (axi + b)) 2 be positive definite. Ipakita natin sa iyo kung paano ito dapat magmukhang.

Halimbawa 2

Mayroon kaming second-order differential ng sumusunod na form:

d 2 F (a ; b) = δ 2 F (a ; b) δ a 2 d 2 a + 2 δ 2 F (a ; b) δ a δ bdadb + δ 2 F (a ; b) δ b 2 d 2b

Solusyon

δ 2 F (a ; b) δ a 2 = δ δ F (a ; b) δ a δ a = = δ - 2 ∑ i = 1 n (yi - (axi + b)) xi δ a = 2 ∑ i = 1 n (xi) 2 δ 2 F (a ; b) δ a δ b = δ δ F (a ; b) δ a δ b = = δ - 2 ∑ i = 1 n (yi - (axi + b) ) xi δ b = 2 ∑ i = 1 nxi δ 2 F (a ; b) δ b 2 = δ δ F (a ; b) δ b δ b = δ - 2 ∑ i = 1 n (yi - (axi + b)) δ b = 2 ∑ i = 1 n (1) = 2 n

Sa madaling salita, maaari itong isulat tulad ng sumusunod: d 2 F (a ; b) = 2 ∑ i = 1 n (x i) 2 d 2 a + 2 2 ∑ x i i = 1 n d a d b + (2 n) d 2 b .

Nakakuha kami ng isang matrix ng quadratic form M = 2 ∑ i = 1 n (x i) 2 2 ∑ i = 1 n x i 2 ∑ i = 1 n x i 2 n .

Sa kasong ito, ang mga halaga ng mga indibidwal na elemento ay hindi magbabago depende sa a at b. Siguradong positibo ba ang matrix na ito? Para masagot ang tanong na ito, tingnan natin kung ang mga angular minor nito ay positibo.

Kalkulahin ang unang ayos angular minor: 2 ∑ i = 1 n (x i) 2 > 0 . Dahil ang mga puntos na x i ay hindi nagtutugma, ang hindi pagkakapantay-pantay ay mahigpit. Isaisip namin ito sa mga karagdagang kalkulasyon.

Kinakalkula namin ang pangalawang-order na angular minor:

d e t (M) = 2 ∑ i = 1 n (x i) 2 2 ∑ i = 1 n x i 2 ∑ i = 1 n x i 2 n = 4 n ∑ i = 1 n (x i) 2 - ∑ i = 1 n x i 2

Pagkatapos nito, magpatuloy tayo sa patunay ng hindi pagkakapantay-pantay n ∑ i = 1 n (x i) 2 - ∑ i = 1 n x i 2 > 0 gamit ang mathematical induction.

  1. Suriin natin kung ang hindi pagkakapantay-pantay na ito ay wasto para sa arbitrary n . Kumuha tayo ng 2 at kalkulahin:

2 ∑ i = 1 2 (xi) 2 - ∑ i = 1 2 xi 2 = 2 x 1 2 + x 2 2 - x 1 + x 2 2 = = x 1 2 - 2 x 1 x 2 + x 2 2 = x 1 + x 2 2 > 0

Nakuha namin ang tamang pagkakapantay-pantay (kung ang mga halaga x 1 at x 2 ay hindi magkatugma).

  1. Gawin natin ang pagpapalagay na ang hindi pagkakapantay-pantay na ito ay magiging totoo para sa n , i.e. n ∑ i = 1 n (x i) 2 - ∑ i = 1 n x i 2 > 0 – totoo.
  2. Ngayon patunayan natin ang bisa para sa n + 1 , i.e. na (n + 1) ∑ i = 1 n + 1 (xi) 2 - ∑ i = 1 n + 1 xi 2 > 0 kung n ∑ i = 1 n (xi) 2 - ∑ i = 1 nxi 2 > 0 .

Kinakalkula namin:

(n + 1) ∑ i = 1 n + 1 (xi) 2 - ∑ i = 1 n + 1 xi 2 = = (n + 1) ∑ i = 1 n (xi) 2 + xn + 1 2 - ∑ i = 1 nxi + xn + 1 2 = = n ∑ i = 1 n (xi) 2 + n xn + 1 2 + ∑ i = 1 n (xi) 2 + xn + 1 2 - - ∑ i = 1 nxi 2 + 2 xn + 1 ∑ i = 1 nxi + xn + 1 2 = = ∑ i = 1 n (xi) 2 - ∑ i = 1 nxi 2 + n xn + 1 2 - xn + 1 ∑ i = 1 nxi + ∑ i = 1 n (xi) 2 = = ∑ i = 1 n (xi) 2 - ∑ i = 1 nxi 2 + xn + 1 2 - 2 xn + 1 x 1 + x 1 2 + + xn + 1 2 - 2 xn + 1 x 2 + x 2 2 + . . . + xn + 1 2 - 2 xn + 1 x 1 + xn 2 = = n ∑ i = 1 n (xi) 2 - ∑ i = 1 nxi 2 + + (xn + 1 - x 1) 2 + (xn + 1) - x 2) 2 + . . . + (x n - 1 - x n) 2 > 0

Ang expression na nakapaloob sa mga kulot na brace ay magiging mas malaki sa 0 (batay sa kung ano ang ipinapalagay namin sa hakbang 2), at ang natitirang mga termino ay magiging mas malaki sa 0 dahil lahat sila ay mga parisukat ng mga numero. Napatunayan natin ang hindi pagkakapantay-pantay.

Sagot: ang nahanap na a at b ay tumutugma sa pinakamaliit na halaga ng function F (a, b) = ∑ i = 1 n (yi - (axi + b)) 2, na nangangahulugan na ang mga ito ang kinakailangang mga parameter ng least squares method (LSM).

Kung may napansin kang pagkakamali sa text, mangyaring i-highlight ito at pindutin ang Ctrl+Enter

Ang pamamaraan ng hindi bababa sa mga parisukat (LSM) ay nagbibigay-daan sa iyo na matantya ang iba't ibang dami gamit ang mga resulta ng maraming mga sukat na naglalaman ng mga random na error.

Katangian ng MNC

Ang pangunahing ideya ng pamamaraang ito ay ang kabuuan ng mga parisukat na error ay itinuturing bilang isang pamantayan para sa katumpakan ng solusyon ng problema, na hinahangad na mabawasan. Kapag ginagamit ang pamamaraang ito, maaaring ilapat ang parehong mga numerical at analytical na diskarte.

Sa partikular, bilang isang numerical na pagpapatupad, ang least squares na paraan ay nagpapahiwatig ng paggawa ng maraming sukat ng isang hindi kilalang random na variable hangga't maaari. Bukod dito, mas maraming mga kalkulasyon, mas tumpak ang magiging solusyon. Sa set na ito ng mga kalkulasyon (paunang data), isa pang hanay ng mga iminungkahing solusyon ang nakuha, kung saan pipiliin ang pinakamahusay. Kung ang hanay ng mga solusyon ay parametrized, kung gayon ang pinakamababang paraan ng mga parisukat ay mababawasan sa paghahanap ng pinakamainam na halaga ng mga parameter.

Bilang isang analytical na diskarte sa pagpapatupad ng LSM sa hanay ng mga paunang data (mga sukat) at ang iminungkahing hanay ng mga solusyon, ang ilan (functional) ay tinukoy, na maaaring ipahayag ng isang formula na nakuha bilang isang tiyak na hypothesis na kailangang kumpirmahin . Sa kasong ito, ang paraan ng least squares ay binabawasan sa paghahanap ng minimum ng functional na ito sa set ng mga squared error ng paunang data.

Tandaan na hindi ang mga pagkakamali mismo, ngunit ang mga parisukat ng mga pagkakamali. Bakit? Ang katotohanan ay madalas na ang mga paglihis ng mga sukat mula sa eksaktong halaga ay parehong positibo at negatibo. Kapag tinutukoy ang average, ang simpleng pagbubuod ay maaaring humantong sa isang hindi tamang konklusyon tungkol sa kalidad ng pagtatantya, dahil ang magkaparehong pagkansela ng positibo at negatibong mga halaga ay magbabawas sa sampling na kapangyarihan ng hanay ng mga sukat. At, dahil dito, ang katumpakan ng pagtatasa.

Upang maiwasang mangyari ito, ang mga squared deviations ay summed up. Higit pa riyan, upang mapantayan ang dimensyon ng sinusukat na halaga at ang panghuling pagtatantya, ang kabuuan ng mga squared error ay ginagamit upang kunin

Ang ilang mga aplikasyon ng MNCs

Ang MNC ay malawakang ginagamit sa iba't ibang larangan. Halimbawa, sa probability theory at mathematical statistics, ang pamamaraan ay ginagamit upang matukoy ang naturang katangian ng isang random variable bilang standard deviation, na tumutukoy sa lapad ng hanay ng mga value ng isang random variable.

  • pagtuturo

Panimula

Ako ay isang computer programmer. Ginawa ko ang pinakamalaking hakbang sa aking karera noong natutunan kong sabihin: "Wala akong maintindihan!" Ngayon hindi ako nahihiyang sabihin sa luminary ng agham na binibigyan niya ako ng lecture, na hindi ko maintindihan kung ano ang pinag-uusapan nito, ang luminary, sa akin. At napakahirap. Oo, mahirap at nakakahiyang aminin na hindi mo alam. Sino ang gustong umamin na hindi niya alam ang mga pangunahing kaalaman ng isang bagay-doon. Dahil sa aking propesyon, kailangan kong dumalo sa isang malaking bilang ng mga pagtatanghal at lektura, kung saan, aminado ako, sa karamihan ng mga kaso ay nakakaramdam ako ng antok, dahil wala akong naiintindihan. At hindi ko maintindihan dahil ang malaking problema ng kasalukuyang sitwasyon sa agham ay nasa matematika. Ipinapalagay nito na ang lahat ng mga mag-aaral ay pamilyar sa ganap na lahat ng mga lugar ng matematika (na walang katotohanan). Ang aminin na hindi mo alam kung ano ang isang derivative (na ito ay isang maliit na mamaya) ay isang kahihiyan.

Pero natutunan kong sabihin na hindi ko alam kung ano ang multiplication. Oo, hindi ko alam kung ano ang subalgebra sa Lie algebra. Oo, hindi ko alam kung bakit kailangan ang mga quadratic equation sa buhay. Oo nga pala, kung sigurado ka na alam mo, may pag-uusapan tayo! Ang matematika ay isang serye ng mga trick. Sinisikap ng mga mathematician na lituhin at takutin ang publiko; kung saan walang kalituhan, walang reputasyon, walang awtoridad. Oo, ito ay prestihiyoso na magsalita sa pinaka-abstract na wika na posible, na kung saan ay ganap na walang kapararakan sa sarili nito.

Alam mo ba kung ano ang derivative? Malamang na sasabihin mo sa akin ang tungkol sa limitasyon ng ugnayan ng pagkakaiba. Sa unang taon ng matematika sa St. Petersburg State University, Viktor Petrovich Khavin ako tinukoy derivative bilang koepisyent ng unang termino ng serye ng Taylor ng function sa punto (ito ay isang hiwalay na himnastiko upang matukoy ang serye ng Taylor na walang mga derivatives). Matagal akong natawa sa depinisyon na ito, hanggang sa huli kong naintindihan kung tungkol saan ito. Ang derivative ay hindi hihigit sa isang sukatan lamang kung gaano kapareho ang function na ating pinagkaiba sa function na y=x, y=x^2, y=x^3.

Karangalan ko na ngayong mag-lecture sa mga mag-aaral na takot matematika. Kung natatakot ka sa matematika - papunta na kami. Sa sandaling sinubukan mong magbasa ng ilang teksto at sa tingin mo ito ay sobrang kumplikado, pagkatapos ay alamin na ito ay hindi maganda ang pagkakasulat. Pinagtatalunan ko na walang isang solong lugar ng matematika na hindi masasabi tungkol sa "sa mga daliri" nang hindi nawawala ang katumpakan.

Ang hamon para sa malapit na hinaharap: Inutusan ko ang aking mga estudyante na maunawaan kung ano ang linear-quadratic controller. Huwag kang mahiya, sayangin ang tatlong minuto ng iyong buhay, sundan ang link. Kung hindi mo maintindihan ang anumang bagay, pagkatapos ay nasa daan na kami. Ako (isang propesyonal na mathematician-programmer) ay wala ring naintindihan. At tinitiyak ko sa iyo, maaari itong ayusin "sa mga daliri." Sa ngayon ay hindi ko alam kung ano ito, ngunit tinitiyak ko sa iyo na malalaman natin ito.

Kaya, ang unang lektura na ibibigay ko sa aking mga mag-aaral pagkatapos nilang tumakbo sa akin na may takot na may mga salitang ang linear-quadratic controller ay isang kakila-kilabot na bug na hinding-hindi mo mahahawakan sa iyong buhay ay mga pamamaraan ng least squares. Kaya mo bang lutasin ang mga linear equation? Kung binabasa mo ang tekstong ito, malamang na hindi.

Kaya, dahil sa dalawang puntos (x0, y0), (x1, y1), halimbawa, (1,1) at (3,2), ang gawain ay hanapin ang equation ng isang tuwid na linya na dumadaan sa dalawang puntong ito:

paglalarawan

Ang tuwid na linyang ito ay dapat magkaroon ng equation tulad ng sumusunod:

Dito hindi alam sa amin ang alpha at beta, ngunit alam ang dalawang punto ng linyang ito:

Maaari mong isulat ang equation na ito sa matrix form:

Dito dapat tayong gumawa ng lyrical digression: ano ang matrix? Ang matrix ay walang iba kundi isang two-dimensional array. Ito ay isang paraan ng pag-iimbak ng data, wala nang mga halaga na dapat ibigay dito. Nasa sa atin kung paano eksaktong i-interpret ang isang tiyak na matrix. Paminsan-minsan, bibigyang-kahulugan ko ito bilang isang linear na pagmamapa, pana-panahon bilang isang parisukat na anyo, at kung minsan bilang isang set lang ng mga vector. Ang lahat ng ito ay lilinawin sa konteksto.

Palitan natin ang mga partikular na matrice ng kanilang simbolikong representasyon:

Pagkatapos (alpha, beta) ay madaling mahanap:

Mas partikular para sa aming nakaraang data:

Na humahantong sa sumusunod na equation ng isang tuwid na linya na dumadaan sa mga puntos (1,1) at (3,2):

Okay, malinaw na ang lahat dito. At hanapin natin ang equation ng isang tuwid na linya na dumadaan tatlo puntos: (x0,y0), (x1,y1) at (x2,y2):

Oh-oh-oh, ngunit mayroon kaming tatlong equation para sa dalawang hindi alam! Sasabihin ng karaniwang mathematician na walang solusyon. Ano ang sasabihin ng programmer? At muli niyang isusulat ang nakaraang sistema ng mga equation sa sumusunod na anyo:

Sa aming kaso, ang mga vectors i, j, b ay tatlong-dimensional, samakatuwid, (sa pangkalahatang kaso) walang solusyon sa sistemang ito. Ang anumang vector (alpha\*i + beta\*j) ay nasa eroplanong pinalawak ng mga vectors (i, j). Kung ang b ay hindi kabilang sa eroplanong ito, kung gayon walang solusyon (ang pagkakapantay-pantay sa equation ay hindi makakamit). Anong gagawin? Maghanap tayo ng kompromiso. Tukuyin natin ng e(alpha, beta) kung paano eksaktong hindi namin nakamit ang pagkakapantay-pantay:

At susubukan naming bawasan ang error na ito:

Bakit parisukat?

Kami ay naghahanap hindi lamang para sa pinakamababa ng pamantayan, ngunit para sa pinakamababang parisukat ng pamantayan. Bakit? Ang pinakamababang punto mismo ay nagtutugma, at ang parisukat ay nagbibigay ng isang maayos na pag-andar (isang parisukat na pag-andar ng mga argumento (alpha,beta)), habang ang haba lamang ay nagbibigay ng isang function sa anyo ng isang kono, na hindi nakikilala sa pinakamababang punto. Brr. Ang parisukat ay mas maginhawa.

Malinaw, ang error ay minimize kapag ang vector e orthogonal sa eroplanong pinalawak ng mga vectors i At j.

Ilustrasyon

Sa madaling salita: naghahanap kami ng isang linya na ang kabuuan ng mga parisukat na haba ng mga distansya mula sa lahat ng mga punto hanggang sa linyang ito ay minimal:

I-UPDATE: dito mayroon akong hamba, ang distansya sa linya ay dapat na sukatin nang patayo, hindi orthographic projection. Tama ang commenter na ito.

Ilustrasyon

Sa ganap na magkakaibang mga salita (maingat, hindi gaanong pormal, ngunit dapat itong malinaw sa mga daliri): kinukuha namin ang lahat ng posibleng mga linya sa pagitan ng lahat ng mga pares ng mga punto at hinahanap ang average na linya sa pagitan ng lahat:

Ilustrasyon

Ang isa pang paliwanag sa mga daliri: nag-attach kami ng isang spring sa pagitan ng lahat ng mga punto ng data (narito mayroon kaming tatlo) at ang linya na hinahanap namin, at ang linya ng estado ng balanse ay eksakto kung ano ang hinahanap namin.

Quadratic na anyo minimum

Kaya, ibinigay ang vector b at ang eroplanong pinalawak ng mga column-vector ng matrix A(sa kasong ito (x0,x1,x2) at (1,1,1)), naghahanap kami ng isang vector e na may pinakamababang parisukat na haba. Malinaw, ang minimum ay makakamit lamang para sa vector e, orthogonal sa eroplanong pinalawak ng mga column-vector ng matrix A:

Sa madaling salita, naghahanap kami ng isang vector x=(alpha, beta) tulad ng:

Ipinaaalala ko sa iyo na ang vector na ito na x=(alpha, beta) ay ang minimum ng quadratic function ||e(alpha, beta)||^2:

Dito kapaki-pakinabang na tandaan na ang matrix ay maaaring bigyang-kahulugan pati na rin ang parisukat na anyo, halimbawa, ang identity matrix ((1,0),(0,1)) ay maaaring bigyang-kahulugan bilang isang function ng x^2 + y ^2:

parisukat na anyo

Ang lahat ng himnastiko na ito ay kilala bilang linear regression.

Laplace equation na may Dirichlet boundary condition

Ngayon ang pinakasimpleng tunay na problema: mayroong isang tiyak na triangulated na ibabaw, kinakailangan upang pakinisin ito. Halimbawa, i-load natin ang modelo ng aking mukha:

Available ang orihinal na commit. Upang mabawasan ang mga panlabas na dependency, kinuha ko ang code ng aking software renderer, na nasa Habré na. Upang malutas ang linear system, ginagamit ko ang OpenNL , ito ay isang mahusay na solver, ngunit napakahirap i-install: kailangan mong kopyahin ang dalawang file (.h + .c) sa iyong folder ng proyekto. Ang lahat ng smoothing ay ginagawa sa pamamagitan ng sumusunod na code:

Para sa (int d=0; d<3; d++) { nlNewContext(); nlSolverParameteri(NL_NB_VARIABLES, verts.size()); nlSolverParameteri(NL_LEAST_SQUARES, NL_TRUE); nlBegin(NL_SYSTEM); nlBegin(NL_MATRIX); for (int i=0; i<(int)verts.size(); i++) { nlBegin(NL_ROW); nlCoefficient(i, 1); nlRightHandSide(verts[i][d]); nlEnd(NL_ROW); } for (unsigned int i=0; i&face = mukha[i]; para sa (int j=0; j<3; j++) { nlBegin(NL_ROW); nlCoefficient(face[ j ], 1); nlCoefficient(face[(j+1)%3], -1); nlEnd(NL_ROW); } } nlEnd(NL_MATRIX); nlEnd(NL_SYSTEM); nlSolve(); for (int i=0; i<(int)verts.size(); i++) { verts[i][d] = nlGetVariable(i); } }

Ang mga coordinate ng X, Y at Z ay mapaghihiwalay, hinihiwalay ko ang mga ito. Ibig sabihin, nilulutas ko ang tatlong sistema ng mga linear na equation, bawat isa ay may kasing daming variable gaya ng bilang ng vertices sa aking modelo. Ang unang n row ng matrix A ay may isa lamang 1 bawat row, at ang unang n row ng vector b ay may orihinal na mga coordinate ng modelo. Iyon ay, spring-tie ko sa pagitan ng bagong posisyon ng vertex at ng lumang posisyon ng vertex - ang mga bago ay hindi dapat masyadong malayo sa mga luma.

Ang lahat ng kasunod na row ng matrix A (faces.size()*3 = ang bilang ng mga gilid ng lahat ng triangles sa grid) ay may isang paglitaw ng 1 at isang paglitaw ng -1, habang ang vector b ay may zero na bahagi sa tapat. Nangangahulugan ito na naglalagay ako ng spring sa bawat gilid ng aming triangular mesh: sinusubukan ng lahat ng mga gilid na makuha ang parehong vertex bilang kanilang mga panimulang punto at pagtatapos.

Muli: ang lahat ng mga vertex ay mga variable, at hindi sila maaaring lumihis nang malayo sa kanilang orihinal na posisyon, ngunit sa parehong oras sinusubukan nilang maging katulad sa bawat isa.

Narito ang resulta:

Magiging maayos ang lahat, ang modelo ay talagang pinakinis, ngunit lumayo ito sa orihinal nitong gilid. Baguhin natin ng kaunti ang code:

Para sa (int i=0; i<(int)verts.size(); i++) { float scale = border[i] ? 1000: 1; nlBegin(NL_ROW); nlCoefficient(i, scale); nlRightHandSide(scale*verts[i][d]); nlEnd(NL_ROW); }

Sa aming matrix A, para sa mga vertices na nasa gilid, hindi ako nagdaragdag ng isang row mula sa kategoryang v_i = verts[i][d], ngunit 1000*v_i = 1000*verts[i][d]. Ano ang binabago nito? At binabago nito ang aming quadratic form ng error. Ngayon ang isang solong paglihis mula sa tuktok sa gilid ay nagkakahalaga ng hindi isang yunit, tulad ng dati, ngunit 1000 * 1000 na mga yunit. Iyon ay, nag-hang kami ng isang mas malakas na spring sa matinding vertices, mas pinipili ng solusyon na iunat ang iba nang mas malakas. Narito ang resulta:

Doblehin natin ang lakas ng mga bukal sa pagitan ng mga vertex:
nlCoefficient(mukha[j], 2); nlCoefficient(mukha[(j+1)%3], -2);

Ito ay lohikal na ang ibabaw ay naging mas makinis:

At ngayon kahit isang daang beses na mas malakas:

Ano ito? Isipin na nagsawsaw tayo ng wire ring sa tubig na may sabon. Bilang resulta, ang resultang soap film ay susubukan na magkaroon ng pinakamaliit na curvature hangga't maaari, na humahawak sa parehong hangganan - ang aming wire ring. Ito ay eksakto kung ano ang nakuha namin sa pamamagitan ng pag-aayos ng hangganan at paghingi ng isang makinis na ibabaw sa loob. Binabati kita, nalutas na natin ang Laplace equation na may mga kundisyon sa hangganan ng Dirichlet. Mukhang cool? Ngunit sa katunayan, isang sistema lamang ng mga linear na equation upang malutas.

Poisson equation

Magkaroon tayo ng isa pang cool na pangalan.

Sabihin nating mayroon akong larawang tulad nito:

Lahat ay mabuti, ngunit hindi ko gusto ang upuan.

Pinutol ko ang larawan sa kalahati:



At pipili ako ng upuan gamit ang aking mga kamay:

Pagkatapos ay i-drag ko ang lahat ng puti sa maskara sa kaliwang bahagi ng larawan, at sa parehong oras ay sasabihin ko sa buong larawan na ang pagkakaiba sa pagitan ng dalawang magkalapit na mga pixel ay dapat na katumbas ng pagkakaiba sa pagitan ng dalawang magkalapit na mga pixel ng kanang larawan:

Para sa (int i=0; i

Narito ang resulta:

Available ang code at mga larawan