Метод на тридимензионални најмали квадрати. Приближување на експериментални податоци

Која наоѓа најширока примена во различни области на науката и практичната дејност. Ова може да биде физика, хемија, биологија, економија, социологија, психологија и така натаму и така натаму. По волја на судбината, честопати морам да се занимавам со економијата, и затоа денес ќе ви организирам патување во неверојатна земја наречена Економетрија=) ...Како не сакаш?! Таму е многу добро - само треба да се одлучите! ...Но, она што сигурно дефинитивно го сакате е да научите како да ги решавате проблемите метод на најмали квадрати. А особено вредните читатели ќе научат да ги решаваат не само точно, туку и МНОГУ БРЗО ;-) Но прво општа изјава за проблемот+ придружен пример:

Дозволете ни да проучуваме индикатори во одредена предметна област кои имаат квантитативен израз. Во исто време, постојат сите причини да се верува дека индикаторот зависи од индикаторот. Оваа претпоставка може да биде или научна хипотеза или врз основа на основниот здрав разум. Сепак, да ја оставиме науката настрана и да истражиме повеќе апетитни области - имено, продавници за храна. Да означиме со:

– малопродажна површина на самопослуга, кв.м.,
- годишен промет на самопослуга, милиони рубли.

Апсолутно е јасно дека колку е поголема површината на продавницата, толку во повеќето случаи нејзиниот промет ќе биде поголем.

Да претпоставиме дека по извршувањето на набљудувања/експерименти/пресметки/танци со тамбура имаме на располагање нумерички податоци:

Со намирниците, мислам дека сè е јасно: - ова е областа на првата продавница, - нејзиниот годишен промет, - областа на 2-та продавница, - нејзиниот годишен промет итн. Патем, воопшто не е неопходно да се има пристап до класифицирани материјали - прилично точна проценка на трговскиот промет може да се добие со помош на математичка статистика. Сепак, да не се расејуваме, курсот за комерцијална шпионажа е веќе платен =)

Табеларните податоци можат да се напишат и во форма на точки и да се прикажат во познатата форма Декартов систем .

Ајде да одговориме на едно важно прашање: Колку поени се потребни за квалитативна студија?

Колку е поголем, толку подобро. Минималниот прифатлив сет се состои од 5-6 поени. Дополнително, кога количината на податоци е мала, „аномалните“ резултати не можат да бидат вклучени во примерокот. Така, на пример, мала елитна продавница може да заработи повеќе нарачки од „своите колеги“, а со тоа да ја искриви општата шема што треба да ја пронајдете!

Многу едноставно кажано, треба да избереме функција, распоредкој поминува што поблиску до точките . Оваа функција се нарекува приближување (приближување - приближување)или теоретска функција . Општо земено, овде веднаш се појавува очигледен „претендент“ - полином со висок степен, чиј график поминува низ СИТЕ точки. Но, оваа опција е комплицирана и често едноставно неточна. (бидејќи графиконот ќе „јамка“ цело време и слабо ќе го одразува главниот тренд).

Така, бараната функција мора да биде прилично едноставна и во исто време соодветно да ја одразува зависноста. Како што може да претпоставите, еден од методите за наоѓање такви функции се нарекува метод на најмали квадрати. Прво, да ја разгледаме нејзината суштина во општи рамки. Дозволете некоја функција да ги приближи експерименталните податоци:


Како да се оцени точноста на ова приближување? Да ги пресметаме и разликите (отстапувањата) помеѓу експерименталните и функционалните вредности (го проучуваме цртежот). Првата мисла што ми паѓа на ум е да се процени колку е голема сумата, но проблемот е што разликите можат да бидат негативни (На пример, ) а отстапувањата како резултат на таквото сумирање ќе се поништат едни со други. Затоа, како проценка на точноста на приближувањето, се моли да се земе збирот модулиотстапувања:

или пропадна: (во случај некој да не знае: - ова е иконата за збир и - помошна променлива „контра“, која зема вредности од 1 до ).

Со приближување на експериментални точки со различни функции, ќе добиеме различни вредности и очигледно, каде што оваа сума е помала, таа функција е попрецизна.

Таков метод постои и се нарекува метод со најмал модул. Меѓутоа, во пракса стана многу пораспространета метод на најмал квадрат, во кој можните негативни вредности не се елиминираат од модулот, туку со квадратирање на отстапувањата:

, по што напорите се насочени кон избор на функција таква што збирот на квадратните отстапувања беше што е можно помал. Всушност, оттука доаѓа името на методот.

И сега се враќаме на друга важна точка: како што е наведено погоре, избраната функција треба да биде прилично едноставна - но има и многу такви функции: линеарна , хиперболичен, експоненцијален, логаритамски, квадратни итн. И, се разбира, тука веднаш би сакал да го „намалам полето на активност“. Која класа на функции треба да ја изберам за истражување? Примитивна, но ефикасна техника:

– Најлесен начин е да се прикажат точките на цртежот и анализирајте ја нивната локација. Ако тие имаат тенденција да трчаат во права линија, тогаш треба да барате равенка на права со оптимални вредности и . Со други зборови, задачата е да се најдат ТАКВИ коефициенти така што збирот на квадратните отстапувања да биде најмал.

Ако точките се наоѓаат, на пример, заедно хипербола, тогаш очигледно е јасно дека линеарната функција ќе даде слаба апроксимација. Во овој случај, ние ги бараме „најповолните“ коефициенти за равенката на хиперболата – оние кои даваат минимален збир на квадрати .

Сега забележете дека и во двата случаи зборуваме функции на две променливи, чии аргументи се пребарувани параметри на зависност:

И во суштина треба да решиме стандарден проблем - најдете минимална функција од две променливи.

Ајде да се потсетиме на нашиот пример: да претпоставиме дека точките за складирање имаат тенденција да се наоѓаат во права линија и постојат сите причини да се верува дека линеарна зависностпромет од малопродажен простор. Да најдеме ТАКВИ коефициенти „а“ и „биди“ такви што збирот на квадратните отстапувања беше најмал. Сè е како и обично - прво Делумни деривати од 1 ред. Според правило за линеарностМожете да разликувате директно под иконата за сума:

Ако сакате да ги искористите овие информации за есеј или термински труд, ќе ви бидам многу благодарен за врската во листата на извори; такви детални пресметки ќе најдете на неколку места:

Ајде да создадеме стандарден систем:

Секоја равенка ја намалуваме за „два“ и, дополнително, ги „разбиваме“ збировите:

Забелешка : независно анализирајте зошто „a“ и „be“ може да се извадат надвор од иконата за збир. Патем, формално ова може да се направи со сумата

Ајде да го преработиме системот во „применета“ форма:

по што почнува да се појавува алгоритмот за решавање на нашиот проблем:

Дали ги знаеме координатите на точките? Знаеме. Износите можеме да го најдеме? Лесно. Ајде да направиме наједноставно систем од две линеарни равенки во две непознати(„а“ и „биди“). Ние го решаваме системот, на пример, Крамеровиот метод, како резултат на што добиваме стационарна точка. Проверка доволен услов за екстрем, можеме да потврдиме дека во овој момент функцијата достигнува точно минимум. Проверката вклучува дополнителни пресметки и затоа ќе ја оставиме зад сцената (доколку е потребно, рамката што недостасува може да се види). Го извлекуваме конечниот заклучок:

Функција најдобриот начин (барем во споредба со која било друга линеарна функција)ги доближува експерименталните точки . Грубо кажано, неговиот график поминува што е можно поблиску до овие точки. Во традицијата економетријатасе нарекува и добиената приближна функција спарена линеарна регресивна равенка .

Проблемот што се разгледува е од големо практично значење. Во нашиот пример ситуација, равенка. ви овозможува да предвидите каков трговски промет („Игрек“)продавницата ќе има на една или друга вредност на продажниот простор (едно или друго значење на „x“). Да, добиената прогноза ќе биде само прогноза, но во многу случаи ќе испадне доста точна.

Ќе анализирам само еден проблем со „вистинските“ бројки, бидејќи нема никакви тешкотии - сите пресметки се на ниво на училишна програма од 7-8 одделение. Во 95 проценти од случаите, ќе биде побарано да најдете само линеарна функција, но на самиот крај на статијата ќе покажам дека не е потешко да се најдат равенките на оптималната хипербола, експоненцијалната и некои други функции.

Всушност, останува само да ги дистрибуирате ветените добра - за да научите да решавате такви примери не само точно, туку и брзо. Ние внимателно го проучуваме стандардот:

Задача

Како резултат на проучување на врската помеѓу два индикатори, добиени се следните парови на броеви:

Користејќи го методот на најмали квадрати, пронајдете ја линеарната функција која најдобро ја приближува емпириската (искусен)податоци. Направете цртеж на кој ќе се конструираат експериментални точки и график на приближната функција во Декартов правоаголен координатен систем . Најдете го збирот на квадратните отстапувања помеѓу емпириските и теоретските вредности. Дознајте дали функцијата би била подобра (од гледна точка на методот на најмали квадрати)доближи ги експерименталните точки.

Ве молиме имајте предвид дека значењата „x“ се природни и ова има карактеристично значајно значење, за кое ќе зборувам малку подоцна; но тие, се разбира, можат да бидат и фракционо. Покрај тоа, во зависност од содржината на одредена задача, и вредностите „Х“ и „игра“ можат да бидат целосно или делумно негативни. Па, ни беше дадена задача „без лице“ и ја започнуваме решение:

Како решение на системот ги наоѓаме коефициентите на оптималната функција:

За покомпактно снимање, променливата „контра“ може да се испушти, бидејќи веќе е јасно дека сумирањето се врши од 1 до .

Попогодно е да се пресметаат потребните износи во табеларна форма:


Пресметките може да се вршат на микрокалкулатор, но многу е подобро да се користи Excel - и побрзо и без грешки; погледнете кратко видео:

Така, го добиваме следново систем:

Овде можете да ја помножите втората равенка со 3 и одземете го 2-риот од првата равенка член по член. Но, ова е среќа - во пракса, системите често не се подарок, а во такви случаи тоа заштедува Крамеровиот метод:
, што значи дека системот има уникатно решение.

Ајде да провериме. Разбирам дека не сакате, но зошто да ги прескокнете грешките каде што тие апсолутно не можат да се пропуштат? Да го замениме пронајденото решение во левата страна на секоја равенка на системот:

Се добиваат десните страни на соодветните равенки, што значи дека системот е правилно решен.

Така саканата апроксимативна функција: – од сите линеарни функцииТаа е таа што најдобро ги приближува експерименталните податоци.

За разлика од директно зависност на прометот на продавницата од нејзината површина, пронајдената зависност е обратно (принцип „колку повеќе, толку помалку“), а овој факт веднаш се открива со негативното наклон. Функција ни кажува дека со зголемување на одреден индикатор за 1 единица, вредноста на зависниот индикатор се намалува просекза 0,65 единици. Како што велат, колку поскапува леќата, толку помалку се продава.

За да го нацртаме графикот на приближната функција, ги наоѓаме нејзините две вредности:

и извршете го цртежот:


Конструираната права линија се нарекува линија на тренд (имено, линеарна линија на тренд, т.е. во општ случај, трендот не е нужно права линија). На сите им е познат изразот „да се биде во тренд“ и мислам дека овој термин не бара дополнителни коментари.

Да го пресметаме збирот на квадратни отстапувања помеѓу емпириските и теоретските вредности. Геометриски, ова е збирот на квадратите на должините на сегментите „малина“ (од кои две се толку мали што не се ни видливи).

Ајде да ги сумираме пресметките во табела:


Повторно, тие можат да се направат рачно; за секој случај, ќе дадам пример за првата точка:

но многу поефективно е тоа да се направи на веќе познат начин:

Повторуваме уште еднаш: Кое е значењето на добиениот резултат?Од сите линеарни функции y функција индикаторот е најмал, односно во неговото семејство е најдобрата апроксимација. И тука, патем, конечното прашање на проблемот не е случајно: што ако предложената експоненцијална функција дали би било подобро да се доближат експерименталните точки?

Ајде да го најдеме соодветниот збир на квадратни отстапувања - за да ги разликувам, ќе ги означам со буквата „епсилон“. Техниката е сосема иста:


И повторно, за секој случај, пресметките за првата точка:

Во Excel ја користиме стандардната функција EXP (синтаксата може да се најде во помошта за Excel).

Заклучок: , што значи дека експоненцијалната функција ги приближува експерименталните точки полошо од права линија .

Но, тука треба да се забележи дека е „полошо“. уште не значи, што е проблемот. Сега изградив график на оваа експоненцијална функција - и исто така поминува блиску до точките - толку многу што без аналитичко истражување е тешко да се каже која функција е поточна.

Ова го завршува решението и се враќам на прашањето за природните вредности на аргументот. Во различни студии, обично економски или социолошки, природните „Х“ се користат за нумерирање месеци, години или други еднакви временски интервали. Размислете, на пример, на следниот проблем.

Метод на најмал квадрат

Во последната лекција од темата, ќе се запознаеме со најпознатата апликација FNP, кој наоѓа најширока примена во различни области на науката и практичната дејност. Ова може да биде физика, хемија, биологија, економија, социологија, психологија и така натаму и така натаму. По волја на судбината, честопати морам да се занимавам со економијата, и затоа денес ќе ви организирам патување во неверојатна земја наречена Економетрија=) ...Како не сакаш?! Таму е многу добро - само треба да се одлучите! ...Но, она што сигурно дефинитивно го сакате е да научите како да ги решавате проблемите метод на најмали квадрати. А особено вредните читатели ќе научат да ги решаваат не само точно, туку и МНОГУ БРЗО ;-) Но прво општа изјава за проблемот+ придружен пример:

Дозволете ни да проучуваме индикатори во одредена предметна област кои имаат квантитативен израз. Во исто време, постојат сите причини да се верува дека индикаторот зависи од индикаторот. Оваа претпоставка може да биде или научна хипотеза или врз основа на основниот здрав разум. Сепак, да ја оставиме науката настрана и да истражиме повеќе апетитни области - имено, продавници за храна. Да означиме со:

– малопродажна површина на самопослуга, кв.м.,
- годишен промет на самопослуга, милиони рубли.

Апсолутно е јасно дека колку е поголема површината на продавницата, толку во повеќето случаи нејзиниот промет ќе биде поголем.

Да претпоставиме дека по извршувањето на набљудувања/експерименти/пресметки/танци со тамбура имаме на располагање нумерички податоци:

Со намирниците, мислам дека сè е јасно: - ова е областа на првата продавница, - нејзиниот годишен промет, - областа на 2-та продавница, - нејзиниот годишен промет итн. Патем, воопшто не е неопходно да се има пристап до класифицирани материјали - прилично точна проценка на трговскиот промет може да се добие со помош на математичка статистика. Сепак, да не се расејуваме, курсот за комерцијална шпионажа е веќе платен =)

Табеларните податоци можат да се напишат и во форма на точки и да се прикажат во познатата форма Декартов систем .

Ајде да одговориме на едно важно прашање: Колку поени се потребни за квалитативна студија?

Колку е поголем, толку подобро. Минималниот прифатлив сет се состои од 5-6 поени. Дополнително, кога количината на податоци е мала, „аномалните“ резултати не можат да бидат вклучени во примерокот. Така, на пример, мала елитна продавница може да заработи повеќе нарачки од „своите колеги“, а со тоа да ја искриви општата шема што треба да ја пронајдете!



Многу едноставно кажано, треба да избереме функција, распоредкој поминува што поблиску до точките . Оваа функција се нарекува приближување (приближување - приближување)или теоретска функција . Општо земено, овде веднаш се појавува очигледен „претендент“ - полином со висок степен, чиј график поминува низ СИТЕ точки. Но, оваа опција е комплицирана и често едноставно неточна. (бидејќи графиконот ќе „јамка“ цело време и слабо ќе го одразува главниот тренд).

Така, бараната функција мора да биде прилично едноставна и во исто време соодветно да ја одразува зависноста. Како што може да претпоставите, еден од методите за наоѓање такви функции се нарекува метод на најмали квадрати. Прво, да ја разгледаме нејзината суштина во општи рамки. Дозволете некоја функција да ги приближи експерименталните податоци:


Како да се оцени точноста на ова приближување? Да ги пресметаме и разликите (отстапувањата) помеѓу експерименталните и функционалните вредности (го проучуваме цртежот). Првата мисла што ми паѓа на ум е да се процени колку е голема сумата, но проблемот е што разликите можат да бидат негативни (На пример, ) а отстапувањата како резултат на таквото сумирање ќе се поништат едни со други. Затоа, како проценка на точноста на приближувањето, се моли да се земе збирот модулиотстапувања:

или пропадна: (во случај некој да не знае: е иконата за сума, и - помошна „контра“ променлива, која зема вредности од 1 до ) .

Со приближување на експериментални точки со различни функции, ќе добиеме различни вредности и очигледно, каде што оваа сума е помала, таа функција е попрецизна.

Таков метод постои и се нарекува метод со најмал модул. Меѓутоа, во пракса стана многу пораспространета метод на најмал квадрат, во кој можните негативни вредности не се елиминираат од модулот, туку со квадратирање на отстапувањата:



, по што напорите се насочени кон избор на функција таква што збирот на квадратните отстапувања беше што е можно помал. Всушност, оттука доаѓа името на методот.

И сега се враќаме на друга важна точка: како што е наведено погоре, избраната функција треба да биде прилично едноставна - но има и многу такви функции: линеарна , хиперболичен , експоненцијален , логаритамски , квадратни итн. И, се разбира, тука веднаш би сакал да го „намалам полето на активност“. Која класа на функции треба да ја изберам за истражување? Примитивна, но ефикасна техника:

– Најлесен начин е да се прикажат точките на цртежот и анализирајте ја нивната локација. Ако тие имаат тенденција да трчаат во права линија, тогаш треба да барате равенка на права со оптимални вредности и . Со други зборови, задачата е да се најдат ТАКВИ коефициенти така што збирот на квадратните отстапувања да биде најмал.

Ако точките се наоѓаат, на пример, заедно хипербола, тогаш очигледно е јасно дека линеарната функција ќе даде слаба апроксимација. Во овој случај, ние ги бараме „најповолните“ коефициенти за равенката на хиперболата – оние кои даваат минимален збир на квадрати .

Сега забележете дека и во двата случаи зборуваме функции на две променливи, чии аргументи се пребарувани параметри на зависност:

И во суштина треба да решиме стандарден проблем - најдете минимална функција од две променливи.

Ајде да се потсетиме на нашиот пример: да претпоставиме дека точките за складирање имаат тенденција да се наоѓаат во права линија и постојат сите причини да се верува дека линеарна зависностпромет од малопродажен простор. Да најдеме ТАКВИ коефициенти „а“ и „биди“ такви што збирот на квадратните отстапувања беше најмал. Сè е како и обично - прво Делумни деривати од 1 ред. Според правило за линеарностМожете да разликувате директно под иконата за сума:

Ако сакате да ги искористите овие информации за есеј или термински труд, ќе ви бидам многу благодарен за врската во листата на извори; такви детални пресметки ќе најдете на неколку места:

Ајде да создадеме стандарден систем:

Секоја равенка ја намалуваме за „два“ и, дополнително, ги „разбиваме“ збировите:

Забелешка : независно анализирајте зошто „a“ и „be“ може да се извадат надвор од иконата за збир. Патем, формално ова може да се направи со сумата

Ајде да го преработиме системот во „применета“ форма:

по што почнува да се појавува алгоритмот за решавање на нашиот проблем:

Дали ги знаеме координатите на точките? Знаеме. Износите можеме да го најдеме? Лесно. Ајде да направиме наједноставно систем од две линеарни равенки во две непознати(„а“ и „биди“). Ние го решаваме системот, на пример, Крамеровиот метод, како резултат на што добиваме стационарна точка. Проверка доволен услов за екстрем, можеме да потврдиме дека во овој момент функцијата достигнува точно минимум. Проверката вклучува дополнителни пресметки и затоа ќе ја оставиме зад сцената (доколку е потребно, рамката што недостасува може да се видиЕве ) . Го извлекуваме конечниот заклучок:

Функција најдобриот начин (барем во споредба со која било друга линеарна функција)ги доближува експерименталните точки . Грубо кажано, неговиот график поминува што е можно поблиску до овие точки. Во традицијата економетријатасе нарекува и добиената приближна функција спарена линеарна регресивна равенка .

Проблемот што се разгледува е од големо практично значење. Во нашиот пример ситуација, равенка. ви овозможува да предвидите каков трговски промет („Игрек“)продавницата ќе има на една или друга вредност на продажниот простор (едно или друго значење на „x“). Да, добиената прогноза ќе биде само прогноза, но во многу случаи ќе испадне доста точна.

Ќе анализирам само еден проблем со „вистинските“ бројки, бидејќи нема никакви тешкотии - сите пресметки се на ниво на училишна програма од 7-8 одделение. Во 95 проценти од случаите, ќе биде побарано да најдете само линеарна функција, но на самиот крај на статијата ќе покажам дека не е потешко да се најдат равенките на оптималната хипербола, експоненцијалната и некои други функции.

Всушност, останува само да ги дистрибуирате ветените добра - за да научите да решавате такви примери не само точно, туку и брзо. Ние внимателно го проучуваме стандардот:

Задача

Како резултат на проучување на врската помеѓу два индикатори, добиени се следните парови на броеви:

Користејќи го методот на најмали квадрати, пронајдете ја линеарната функција која најдобро ја приближува емпириската (искусен)податоци. Направете цртеж на кој ќе се конструираат експериментални точки и график на приближната функција во Декартов правоаголен координатен систем . Најдете го збирот на квадратните отстапувања помеѓу емпириските и теоретските вредности. Дознајте дали функцијата би била подобра (од гледна точка на методот на најмали квадрати)доближи ги експерименталните точки.

Ве молиме имајте предвид дека значењата „x“ се природни и ова има карактеристично значајно значење, за кое ќе зборувам малку подоцна; но тие, се разбира, можат да бидат и фракционо. Покрај тоа, во зависност од содржината на одредена задача, и вредностите „Х“ и „игра“ можат да бидат целосно или делумно негативни. Па, ни беше дадена задача „без лице“ и ја започнуваме решение:

Како решение на системот ги наоѓаме коефициентите на оптималната функција:

За покомпактно снимање, променливата „контра“ може да се испушти, бидејќи веќе е јасно дека сумирањето се врши од 1 до .

Попогодно е да се пресметаат потребните износи во табеларна форма:


Пресметките може да се вршат на микрокалкулатор, но многу е подобро да се користи Excel - и побрзо и без грешки; погледнете кратко видео:

Така, го добиваме следново систем:

Овде можете да ја помножите втората равенка со 3 и одземете го 2-риот од првата равенка член по член. Но, ова е среќа - во пракса, системите често не се подарок, а во такви случаи тоа заштедува Крамеровиот метод:
, што значи дека системот има уникатно решение.

Ајде да провериме. Разбирам дека не сакате, но зошто да ги прескокнете грешките каде што тие апсолутно не можат да се пропуштат? Да го замениме пронајденото решение во левата страна на секоја равенка на системот:

Се добиваат десните страни на соодветните равенки, што значи дека системот е правилно решен.

Така саканата апроксимативна функција: – од сите линеарни функцииТаа е таа што најдобро ги приближува експерименталните податоци.

За разлика од директно зависност на прометот на продавницата од нејзината површина, пронајдената зависност е обратно (принцип „колку повеќе, толку помалку“), а овој факт веднаш се открива со негативното наклон. Функцијата ни кажува дека како што одреден индикатор се зголемува за 1 единица, вредноста на зависниот индикатор се намалува просекза 0,65 единици. Како што велат, колку поскапува леќата, толку помалку се продава.

За да го нацртаме графикот на приближната функција, ги наоѓаме нејзините две вредности:

и извршете го цртежот:

Конструираната права линија се нарекува линија на тренд (имено, линеарна линија на тренд, т.е. во општ случај, трендот не е нужно права линија). На сите им е познат изразот „да се биде во тренд“ и мислам дека овој термин не бара дополнителни коментари.

Да го пресметаме збирот на квадратни отстапувања помеѓу емпириските и теоретските вредности. Геометриски, ова е збирот на квадратите на должините на сегментите „малина“ (од кои две се толку мали што не се ни видливи).

Ајде да ги сумираме пресметките во табела:


Повторно, тие можат да се направат рачно; за секој случај, ќе дадам пример за првата точка:

но многу поефективно е тоа да се направи на веќе познат начин:

Повторуваме уште еднаш: Кое е значењето на добиениот резултат?Од сите линеарни функциифункцијата има најмал експонент, односно е најдобрата апроксимација во нејзиното семејство. И тука, патем, конечното прашање на проблемот не е случајно: што ако предложената експоненцијална функција дали би било подобро да се доближат експерименталните точки?

Ајде да го најдеме соодветниот збир на квадратни отстапувања - за да ги разликувам, ќе ги означам со буквата „епсилон“. Техниката е сосема иста:

И повторно, за секој случај, пресметките за првата точка:

Во Excel ја користиме стандардната функција EXP (синтаксата може да се најде во помошта за Excel).

Заклучок: , што значи дека експоненцијалната функција се приближува на експерименталните точки полошо од правата линија.

Но, тука треба да се забележи дека е „полошо“. уште не значи, што е проблемот. Сега изградив график на оваа експоненцијална функција - и исто така поминува блиску до точките - толку многу што без аналитичко истражување е тешко да се каже која функција е попрецизна.

Ова го завршува решението и се враќам на прашањето за природните вредности на аргументот. Во различни студии, обично економски или социолошки, природните „Х“ се користат за нумерирање месеци, години или други еднакви временски интервали. Размислете, на пример, на следниот проблем:

Следниве податоци се достапни за прометот на малопродажбата на продавницата за првата половина од годината:

Користејќи аналитичко порамнување на права линија, определете го обемот на прометот за јули.

Да, нема проблем: ги нумерираме месеците 1, 2, 3, 4, 5, 6 и го користиме вообичаениот алгоритам, како резултат на што добиваме равенка - единственото нешто е што кога станува збор за времето, тие обично користат буквата „те“ (иако ова не е критично). Добиената равенка покажува дека во првата половина од годината трговскиот промет се зголемил во просек за 27,74 единици. месечно. Ајде да ја добиеме прогнозата за јули (месец бр. 7): д.е.

И има безброј вакви задачи. Оние кои сакаат можат да користат дополнителна услуга, имено мојата Ексел калкулатор (демо верзија), кои го решава анализираниот проблем речиси инстантно!Работната верзија на програмата е достапна во заменаили за симболична такса.

На крајот од лекцијата, кратки информации за пронаоѓање на зависности од некои други типови. Всушност, нема многу што да се каже, бидејќи основниот пристап и алгоритам за решение остануваат исти.

Да претпоставиме дека распоредот на експерименталните точки наликува на хипербола. Потоа, за да ги пронајдете коефициентите на најдобрата хипербола, треба да го пронајдете минимумот на функцијата - секој може да изврши детални пресметки и да дојде до сличен систем:

Од формална техничка гледна точка, се добива од „линеарен“ систем (да го означиме со ѕвездичка)заменувајќи го „x“ со . Па, што е со сумите? пресметај, по што до оптималните коефициенти „а“ и „биди“ блиску при рака.

Ако постојат сите причини да се верува дека точките се наоѓаат по логаритамска крива, а потоа за да ги најдеме оптималните вредности го наоѓаме минимумот на функцијата . Формално, во системот (*) треба да се замени со:

Кога вршите пресметки во Excel, користете ја функцијата LN. Признавам дека не би ми било особено тешко да креирам калкулатори за секој од случаите што се разгледуваат, но сепак би било подобро самите да ги „програмирате“ пресметките. Видеа од лекции за помош.

Со експоненцијална зависност ситуацијата е малку посложена. За да ја намалиме материјата на линеарен случај, ја земаме функцијата логаритам и ја користиме својства на логаритмот:

Сега, споредувајќи ја добиената функција со линеарната функција, доаѓаме до заклучок дека во системот (*) мора да се замени со , и – со . За погодност, да означиме:

Забележете дека системот е решен во однос на и, затоа, откако ќе ги пронајдете корените, не смеете да заборавите да го пронајдете самиот коефициент.

Да се ​​доближат експерименталните точки оптимална парабола , треба да се најде минимална функција од три променливи . По извршувањето на стандардните дејства, го добиваме следново „работно“ систем:

Да, се разбира, тука има повеќе износи, но воопшто нема потешкотии при користење на вашата омилена апликација. И, конечно, ќе ви кажам како брзо да извршите проверка со помош на Excel и да ја изградите саканата линија на тренд: креирајте заговор за расејување, изберете која било од точките со глувчето и десен клик изберете ја опцијата „Додај линија на тренд“. Следно, изберете го типот на графиконот и на јазичето "Опции"активирајте ја опцијата „Прикажи ја равенката на дијаграмот“. добро

Како и секогаш, сакам да ја завршам статијата со некоја убава фраза и речиси напишав „Биди во тренд!“ Но, со време се предомислил. И не затоа што е стереотипно. Не знам како е за никого, но баш и не сакам да го следам промовираниот американски и особено европски тренд =) Затоа посакувам секој од вас да се држи до својата линија!

http://www.grandars.ru/student/vysshaya-matematika/metod-naimenshih-kvadratov.html

Методот на најмали квадрати е еден од најчестите и најразвиените поради неговата едноставност и ефикасност на методите за проценка на параметрите на линеарни економетриски модели. Во исто време, кога се користи, треба да се внимава, бидејќи моделите конструирани со него може да не задоволуваат голем број барања за квалитетот на нивните параметри и, како резултат на тоа, не ги одразуваат „добро“ моделите на развој на процесот. доволно.

Да ја разгледаме постапката за проценка на параметрите на линеарен економетриски модел со користење на методот на најмали квадрати подетално. Таков модел генерално може да се претстави со равенката (1.2):

y t = a 0 + a 1 x 1t +...+ a n x nt + ε t.

Почетните податоци при проценка на параметрите a 0, a 1,..., a n се вектор на вредности на зависната променлива y= (y 1 , y 2 , ... , y T)" и матрицата на вредности на независни променливи

во која првата колона, составена од такви, одговара на коефициентот на моделот.

Методот на најмали квадрати го доби своето име врз основа на основниот принцип дека проценките на параметрите добиени врз основа на него мора да ги задоволуваат: збирот на квадрати на грешката на моделот треба да биде минимален.

Примери за решавање проблеми со методот на најмали квадрати

Пример 2.1.Трговското претпријатие има мрежа од 12 продавници, информации за чии активности се прикажани во табела. 2.1.

Раководството на претпријатието би сакало да знае како големината на годишниот промет зависи од малопродажниот простор на продавницата.

Табела 2.1

Број на продавница Годишен промет, милиони рубли. Малопродажна површина, илјада м2
19,76 0,24
38,09 0,31
40,95 0,55
41,08 0,48
56,29 0,78
68,51 0,98
75,01 0,94
89,05 1,21
91,13 1,29
91,26 1,12
99,84 1,29
108,55 1,49

Најмали квадрати решение.Дозволете ни да го означиме годишниот промет на продавницата, милиони рубли; - малопродажна површина на продавницата, илјада м2.

Сл.2.1. Scatterplot за Пример 2.1

За да ја одредиме формата на функционалната врска помеѓу променливите и ќе конструираме дијаграм на расфрлање (сл. 2.1).

Врз основа на дијаграмот на расејување, можеме да заклучиме дека годишниот промет е позитивно зависен од малопродажниот простор (т.е., y ќе се зголемува со зголемувањето ). Најпогодна форма на функционална врска е линеарна.

Информациите за понатамошни пресметки се прикажани во табелата. 2.2. Користејќи го методот на најмали квадрати, ги проценуваме параметрите на линеарен еднофакторен економетриски модел

Табела 2.2

т y t x 1t y t 2 x 1t 2 x 1t y t
19,76 0,24 390,4576 0,0576 4,7424
38,09 0,31 1450,8481 0,0961 11,8079
40,95 0,55 1676,9025 0,3025 22,5225
41,08 0,48 1687,5664 0,2304 19,7184
56,29 0,78 3168,5641 0,6084 43,9062
68,51 0,98 4693,6201 0,9604 67,1398
75,01 0,94 5626,5001 0,8836 70,5094
89,05 1,21 7929,9025 1,4641 107,7505
91,13 1,29 8304,6769 1,6641 117,5577
91,26 1,12 8328,3876 1,2544 102,2112
99,84 1,29 9968,0256 1,6641 128,7936
108,55 1,49 11783,1025 2,2201 161,7395
С 819,52 10,68 65008,554 11,4058 858,3991
Просечна 68,29 0,89

Така,

Затоа, со зголемување на малопродажниот простор за 1 илјада м2, додека другите работи се еднакви, просечниот годишен промет се зголемува за 67,8871 милиони рубли.

Пример 2.2.Раководството на компанијата забележа дека годишниот промет не зависи само од продажната област на продавницата (види пример 2.1), туку и од просечниот број на посетители. Релевантните информации се прикажани во табела. 2.3.

Табела 2.3

Решение.Дозволете ни да означиме - просечниот број на посетители на продавницата дневно, илјада луѓе.

За да ја одредиме формата на функционалната врска помеѓу променливите и ќе конструираме дијаграм на расфрлање (сл. 2.2).

Врз основа на расејувањето, можеме да заклучиме дека годишниот промет е позитивно зависен од просечниот број на посетители дневно (т.е., y ќе се зголемува со зголемувањето ). Формата на функционална зависност е линеарна.

Ориз. 2.2. Scatterplot за Пример 2.2

Табела 2.4

т x 2t x 2t 2 y t x 2t x 1t x 2t
8,25 68,0625 163,02 1,98
10,24 104,8575 390,0416 3,1744
9,31 86,6761 381,2445 5,1205
11,01 121,2201 452,2908 5,2848
8,54 72,9316 480,7166 6,6612
7,51 56,4001 514,5101 7,3598
12,36 152,7696 927,1236 11,6184
10,81 116,8561 962,6305 13,0801
9,89 97,8121 901,2757 12,7581
13,72 188,2384 1252,0872 15,3664
12,27 150,5529 1225,0368 15,8283
13,92 193,7664 1511,016 20,7408
С 127,83 1410,44 9160,9934 118,9728
Просечна 10,65

Генерално, потребно е да се одредат параметрите на двофакторен економетриски модел

y t = a 0 + a 1 x 1t + a 2 x 2t + ε t

Информациите потребни за понатамошни пресметки се прикажани во табелата. 2.4.

Да ги процениме параметрите на линеарен двофакторен економетриски модел користејќи го методот на најмали квадрати.

Така,

Проценката на коефициентот =61,6583 покажува дека, со оглед на тоа што другите работи се еднакви, со зголемување на малопродажниот простор за 1 илјади m 2, годишниот промет ќе се зголеми во просек за 61,6583 милиони рубли.

Проценката на коефициентот = 2,2748 покажува дека, додека другите нешта се еднакви, со зголемување на просечниот број на посетители на илјада луѓе. дневно, годишниот промет ќе се зголемува во просек за 2,2748 милиони рубли.

Пример 2.3.Користејќи ги информациите прикажани во табелата. 2.2 и 2.4, проценете го параметарот на еднофакторскиот економетриски модел

каде е централната вредност на годишниот промет на продавницата, милиони рубли; - центрирана вредност на просечниот дневен број на посетители на t-тата продавница, илјади луѓе. (види примери 2.1-2.2).

Решение.Дополнителни информации потребни за пресметките се прикажани во табелата. 2.5.

Табела 2.5

-48,53 -2,40 5,7720 116,6013
-30,20 -0,41 0,1702 12,4589
-27,34 -1,34 1,8023 36,7084
-27,21 0,36 0,1278 -9,7288
-12,00 -2,11 4,4627 25,3570
0,22 -3,14 9,8753 -0,6809
6,72 1,71 2,9156 11,4687
20,76 0,16 0,0348 3,2992
22,84 -0,76 0,5814 -17,413
22,97 3,07 9,4096 70,4503
31,55 1,62 2,6163 51,0267
40,26 3,27 10,6766 131,5387
износ 48,4344 431,0566

Користејќи ја формулата (2.35), добиваме

Така,

http://www.cleverstudents.ru/articles/mnk.html

Пример.

Експериментални податоци за вредностите на променливите XИ насе дадени во табелата.

Како резултат на нивното усогласување, се добива функцијата

Користење на метод на најмал квадрат, приближете ги овие податоци со линеарна зависност y=ax+b(најдете параметри АИ б). Откријте која од двете линии подобро (во смисла на методот на најмали квадрати) ги усогласува експерименталните податоци. Направете цртеж.

Решение.

Во нашиот пример n=5. Ја пополнуваме табелата за погодност за пресметување на износите што се вклучени во формулите на потребните коефициенти.

Вредностите во четвртиот ред од табелата се добиваат со множење на вредностите на вториот ред со вредностите на третиот ред за секој број јас.

Вредностите во петтиот ред од табелата се добиваат со квадратирање на вредностите во вториот ред за секој број јас.

Вредностите во последната колона од табелата се збировите на вредностите низ редовите.

Ги користиме формулите на методот на најмали квадрати за да ги најдеме коефициентите АИ б. Соодветните вредности од последната колона на табелата ги заменуваме во нив:

Оттука, y = 0,165x+2,184- саканата приближна права линија.

Останува да дознаеме кој од редовите y = 0,165x+2,184или подобро ги приближува оригиналните податоци, односно прави проценка користејќи го методот на најмали квадрати.

Доказ.

Така што кога ќе се најде АИ бфункцијата ја зема најмалата вредност, неопходно е во овој момент матрицата на квадратната форма на диференцијалот од втор ред за функцијата беше позитивно дефинитивно. Ајде да го покажеме.

Диференцијалот од втор ред има форма:

Тоа е

Според тоа, матрицата на квадратна форма ја има формата

а вредностите на елементите не зависат од АИ б.

Да покажеме дека матрицата е позитивна дефинитивна. За да го направите ова, аголните малолетници мора да бидат позитивни.

Аголна мол од прв ред . Нееднаквоста е строга, бидејќи точките

По израмнувањето добиваме функција од следниот облик: g (x) = x + 1 3 + 1 .

Можеме да ги приближиме овие податоци користејќи ја линеарната врска y = a x + b со пресметување на соодветните параметри. За да го направите ова, ќе треба да го примениме таканаречениот метод на најмали квадрати. Ќе треба да направите и цртеж за да проверите која линија најдобро ќе ги усогласи експерименталните податоци.

Yandex.RTB R-A-339285-1

Што точно е OLS (метод на најмали квадрати)

Главната работа што треба да ја направиме е да најдеме такви коефициенти на линеарна зависност при кои вредноста на функцијата на две променливи F (a, b) = ∑ i = 1 n (y i - (a x i + b)) 2 ќе биде најмал. Со други зборови, за одредени вредности на a и b, збирот на квадратните отстапувања на презентираните податоци од добиената права линија ќе има минимална вредност. Ова е значењето на методот на најмали квадрати. Сè што треба да направиме за да го решиме примерот е да го најдеме екстремот на функцијата на две променливи.

Како да се извлечат формули за пресметување коефициенти

За да извлечете формули за пресметување коефициенти, треба да креирате и решите систем на равенки со две променливи. За да го направите ова, ги пресметуваме парцијалните изводи на изразот F (a, b) = ∑ i = 1 n (y i - (a x i + b)) 2 во однос на a и b и ги изедначуваме со 0.

δ F (a , b) δ a = 0 δ F (a , b) δ b = 0 ⇔ - 2 ∑ i = 1 n (y i - (a x i + b)) x i = 0 - 2 ∑ i = 1 n ( y i - (a x i + b)) = 0 ⇔ a ∑ i = 1 n x i 2 + b ∑ i = 1 n x i = ∑ i = 1 n x i y i a ∑ i = 1 n x i + ∑ i = 1 n b = ∑ i = 1 n x i = ∑ i = ∑ i = 1 n x i 2 + b ∑ i = 1 n x i = ∑ i = 1 n x i y i a ∑ i = 1 n x i + n b = ∑ i = 1 n y i

За да решите систем на равенки, можете да користите какви било методи, на пример, замена или метод на Крамер. Како резултат на тоа, треба да имаме формули кои можат да се користат за пресметување коефициенти користејќи го методот на најмали квадрати.

n ∑ i = 1 n x i y i - ∑ i = 1 n x i ∑ i = 1 n y i n ∑ i = 1 n - ∑ i = 1 n x i 2 b = ∑ i = 1 n y i - a ∑ i = 1 n

Ги пресметавме вредностите на променливите на кои функционира функцијата
F (a , b) = ∑ i = 1 n (y i - (a x i + b)) 2 ќе ја земе минималната вредност. Во третиот пасус ќе докажеме зошто е токму вака.

Ова е примена на методот на најмали квадрати во пракса. Неговата формула, која се користи за наоѓање на параметарот a, вклучува ∑ i = 1 n x i, ∑ i = 1 n y i, ∑ i = 1 n x i y i, ∑ i = 1 n x i 2, како и параметарот
n – ја означува количината на експериментални податоци. Ве советуваме да ја пресметате секоја сума посебно. Вредноста на коефициентот b се пресметува веднаш по a.

Да се ​​вратиме на оригиналниот пример.

Пример 1

Овде имаме n еднакво на пет. За да биде поудобно да се пресметаат потребните износи вклучени во формулите за коефициенти, ајде да ја пополниме табелата.

јас = 1 i=2 i=3 i=4 i=5 ∑ i = 1 5
x i 0 1 2 4 5 12
y јас 2 , 1 2 , 4 2 , 6 2 , 8 3 12 , 9
x i y i 0 2 , 4 5 , 2 11 , 2 15 33 , 8
x i 2 0 1 4 16 25 46

Решение

Четвртиот ред ги вклучува податоците добиени со множење на вредностите од вториот ред со вредностите на третиот за секој поединец т.е. Петтата линија ги содржи податоците од втората, на квадрат. Последната колона ги прикажува збировите на вредностите на поединечните редови.

Да го користиме методот на најмали квадрати за да ги пресметаме коефициентите a и b што ни се потребни. За да го направите ова, заменете ги бараните вредности од последната колона и пресметајте ги износите:

n ∑ i = 1 n x i y i - ∑ i = 1 n x i ∑ i = 1 n y i n ∑ i = 1 n - ∑ i = 1 n x i 2 b = ∑ i = 1 n y i - a ∑ i = 3 x 1 n - 12 12, 9 5 46 - 12 2 b = 12, 9 - a 12 5 ⇒ a ≈ 0, 165 b ≈ 2, 184

Излегува дека потребната приближна права линија ќе изгледа како y = 0, 165 x + 2, 184. Сега треба да одредиме која линија подобро ќе ги приближи податоците - g (x) = x + 1 3 + 1 или 0, 165 x + 2, 184. Ајде да процениме користејќи го методот на најмали квадрати.

За да ја пресметаме грешката, треба да го најдеме збирот на квадратните отстапувања на податоците од правите линии σ 1 = ∑ i = 1 n (y i - (a x i + b i)) 2 и σ 2 = ∑ i = 1 n (y i - g (x i)) 2, минималната вредност ќе одговара на посоодветна линија.

σ 1 = ∑ i = 1 n (y i - (a x i + b i)) 2 = = ∑ i = 1 5 (y i - (0, 165 x i + 2, 184)) 2 ≈ 0, 019 σ 2 = ∑ i = 1 n (y i - g (x i)) 2 = = ∑ i = 1 5 (y i - (x i + 1 3 + 1)) 2 ≈ 0,096

Одговор:бидејќи σ 1< σ 2 , то прямой, наилучшим образом аппроксимирующей исходные данные, будет
y = 0,165 x + 2,184.

Методот на најмали квадрати е јасно прикажан на графичката илустрација. Црвената линија ја означува правата линија g (x) = x + 1 3 + 1, сината линија ја означува y = 0, 165 x + 2, 184. Оригиналните податоци се означени со розови точки.

Дозволете ни да објасниме зошто се потребни точно приближувања од овој тип.

Тие можат да се користат во задачи кои бараат измазнување на податоците, како и во оние каде што податоците мора да се интерполираат или екстраполираат. На пример, во проблемот дискутиран погоре, може да се најде вредноста на набљудуваната количина y на x = 3 или на x = 6. На таквите примери им посветивме посебна статија.

Доказ за методот OLS

За да може функцијата да добие минимална вредност кога се пресметуваат a и b, потребно е во дадена точка матрицата на квадратната форма на диференцијалот на функцијата од формата F (a, b) = ∑ i = 1 n (y i - (a x i + b)) 2 е позитивно определено. Ајде да ви покажеме како треба да изгледа.

Пример 2

Имаме диференцијал од втор ред од следнава форма:

d 2 F (a ; b) = δ 2 F (a ; b) δ a 2 d 2 a + 2 δ 2 F (a ; б) δ a δ b d a d b + δ 2 F (a ; b) δ b 2 d 2 б

Решение

δ 2 F (a ; б) δ a 2 = δ δ F (a ; б) δ a δ a = = δ - 2 ∑ i = 1 n (y i - (a x i + b)) x i δ a = 2 ∑ i = 1 n (x i) 2 δ 2 F (a; б) δ a δ b = δ δ F (a; б) δ a δ b = = δ - 2 ∑ i = 1 n (y i - (a x i + b) ) x i δ b = 2 ∑ i = 1 n x i δ 2 F (a ; б) δ b 2 = δ δ F (a ; б) δ b δ b = δ - 2 ∑ i = 1 n (y i - (a x i + б)) δ b = 2 ∑ i = 1 n (1) = 2 n

Со други зборови, можеме да го запишеме вака: d 2 F (a ; b) = 2 ∑ i = 1 n (x i) 2 d 2 a + 2 2 ∑ x i i = 1 n d a d b + (2 n) d 2 b.

Добивме матрица од квадратната форма M = 2 ∑ i = 1 n (x i) 2 2 ∑ i = 1 n x i 2 ∑ i = 1 n x i 2 n .

Во овој случај, вредностите на поединечните елементи нема да се променат во зависност од a и b. Дали оваа матрица е позитивна дефинитивна? За да одговориме на ова прашање, да провериме дали неговите аголни минори се позитивни.

Го пресметуваме аголниот минор од прв ред: 2 ∑ i = 1 n (x i) 2 > 0 . Бидејќи точките x i не се совпаѓаат, неравенството е строга. Ова ќе го имаме на ум во понатамошните пресметки.

Го пресметуваме аголниот минор од втор ред:

d e t (M) = 2 ∑ i = 1 n (x i) 2 2 ∑ i = 1 n x i 2 ∑ i = 1 n x i 2 n = 4 n ∑ i = 1 n (x i) 2 - ∑ i = 1 n x i 2

По ова, продолжуваме со докажување на неравенството n ∑ i = 1 n (x i) 2 - ∑ i = 1 n x i 2 > 0 користејќи математичка индукција.

  1. Ајде да провериме дали оваа неравенка е валидна за произволна n. Да земеме 2 и да пресметаме:

2 ∑ i = 1 2 (x i) 2 - ∑ i = 1 2 x i 2 = 2 x 1 2 + x 2 2 - x 1 + x 2 2 = = x 1 2 - 2 x 1 x 2 + x 2 2 = x 1 + x 2 2 > 0

Добивме точна еднаквост (ако вредностите x 1 и x 2 не се совпаѓаат).

  1. Да направиме претпоставка дека оваа неравенка ќе биде вистинита за n, т.е. n ∑ i = 1 n (x i) 2 - ∑ i = 1 n x i 2 > 0 – точно.
  2. Сега ќе ја докажеме валидноста за n + 1, т.е. дека (n + 1) ∑ i = 1 n + 1 (x i) 2 - ∑ i = 1 n + 1 x i 2 > 0, ако n ∑ i = 1 n (x i) 2 - ∑ i = 1 n x i 2 > 0 .

Ние пресметуваме:

(n + 1) ∑ i = 1 n + 1 (x i) 2 - ∑ i = 1 n + 1 x i 2 = = (n + 1) ∑ i = 1 n (x i) 2 + x n + 1 2 - ∑ i = 1 n x i + x n + 1 2 = = n ∑ i = 1 n (x i) 2 + n x n + 1 2 + ∑ i = 1 n (x i) 2 + x n + 1 2 - - ∑ i = 1 n x i 2 + 2 x n + 1 ∑ i = 1 n x i + x n + 1 2 = = ∑ i = 1 n (x i) 2 - ∑ i = 1 n x i 2 + n x n + 1 2 - x n + 1 ∑ i = 1 n x i + ∑ i = n (x i) 2 = = ∑ i = 1 n (x i) 2 - ∑ i = 1 n x i 2 + x n + 1 2 - 2 x n + 1 x 1 + x 1 2 + + x n + 1 2 - 2 x n + 1 x 2 + x 2 2 + . . . + x n + 1 2 - 2 x n + 1 x 1 + x n 2 = = n ∑ i = 1 n (x i) 2 - ∑ i = 1 n x i 2 + + (x n + 1 - x 1) 2 + (x n + 1 - x 2) 2 + . . . + (x n - 1 - x n) 2 > 0

Изразот затворен во кадрави загради ќе биде поголем од 0 (врз основа на она што го претпоставивме во чекор 2), а останатите членови ќе бидат поголеми од 0, бидејќи сите тие се квадрати од броеви. Ја докажавме нееднаквоста.

Одговор:пронајдените a и b ќе одговараат на најмалата вредност на функцијата F (a, b) = ∑ i = 1 n (y i - (a x i + b)) 2, што значи дека тие се бараните параметри на методот на најмали квадрати (LSM).

Доколку забележите грешка во текстот, означете ја и притиснете Ctrl+Enter

Методот на најмали квадрати (OLS) ви овозможува да процените различни количини користејќи ги резултатите од многу мерења кои содржат случајни грешки.

Карактеристики на МНЕ

Главната идеја на овој метод е збирот на квадратни грешки да се смета како критериум за точноста на решавање на проблемот, што тие се стремат да го минимизираат. Кога се користи овој метод, може да се користат и нумерички и аналитички пристапи.

Особено, како нумеричка имплементација, методот на најмали квадрати вклучува преземање што е можно повеќе мерења на непозната случајна променлива. Покрај тоа, колку повеќе пресметки, толку попрецизно ќе биде решението. Врз основа на овој сет на пресметки (почетни податоци), се добива уште еден сет на проценети решенија, од кои потоа се избира најдоброто. Ако множеството решенија се параметризира, тогаш методот на најмали квадрати ќе се сведе на наоѓање на оптималната вредност на параметрите.

Како аналитички пристап за имплементација на LSM на збир на почетни податоци (мерења) и очекувано множество решенија, се одредува одредено (функционално), кое може да се изрази со формула добиена како одредена хипотеза која бара потврда. Во овој случај, методот на најмали квадрати се сведува на наоѓање на минимумот од оваа функционалност на множеството квадратни грешки на оригиналните податоци.

Ве молиме имајте предвид дека тоа не се самите грешки, туку квадратите на грешките. Зошто? Факт е дека често отстапувањата на мерењата од точната вредност се и позитивни и негативни. При одредување на просекот, едноставното сумирање може да доведе до неточен заклучок за квалитетот на проценката, бидејќи откажувањето на позитивните и негативните вредности ќе ја намали моќта на земање примероци од повеќе мерења. И, следствено, точноста на проценката.

За да се спречи тоа да се случи, се сумираат квадратните отстапувања. Уште повеќе, за да се изедначи димензијата на измерената вредност и конечната проценка, се извлекува збирот на квадратните грешки

Некои MNC апликации

МНК е широко користен во различни области. На пример, во теоријата на веројатност и математичката статистика, методот се користи за одредување на таква карактеристика на случајна променлива како стандардна девијација, која ја одредува ширината на опсегот на вредности на случајната променлива.

  • Упатство

Вовед

Јас сум математичар и програмер. Најголемиот скок што го направив во кариерата беше кога научив да кажам: "Не разбирам ништо!"Сега не се срамам да му кажам на науката дека ми држи предавање, дека не разбирам што ми кажува тој, светилникот. И тоа е многу тешко. Да, признавањето на вашето незнаење е тешко и срамно. Кој сака да признае дека не ги знае основите на нешто? Поради мојата професија морам да присуствувам на голем број презентации и предавања, каде што, признавам, во огромно мнозинство од случаите сакам да спијам бидејќи ништо не разбирам. Но, не разбирам затоа што огромниот проблем на моменталната ситуација во науката лежи во математиката. Се претпоставува дека сите слушатели се запознаени со апсолутно сите области од математиката (што е апсурдно). Да признаеш дека не знаеш што е дериват (ќе зборуваме за тоа што е малку подоцна) е срамно.

Но, научив да кажам дека не знам што е множење. Да, не знам што е субалгебра над алгебра Лага. Да, не знам зошто се потребни квадратни равенки во животот. Патем, ако сте сигурни дека знаете, тогаш имаме за што да разговараме! Математиката е низа трикови. Математичарите се обидуваат да ја збунат и заплашат јавноста; каде што нема конфузија, нема углед, нема авторитет. Да, престижно е да се зборува на што е можно поапстрактен јазик, што е целосна глупост.

Дали знаете што е дериват? Најверојатно ќе ми кажете за границата на односот на разликата. Во првата година по математика и механика на Државниот универзитет во Санкт Петербург, Виктор Петрович Кавин ми кажа одлученизвод како коефициент на првиот член од серијата Тејлор на функцијата во точка (ова беше посебна гимнастика за одредување на Тејлоровата серија без деривати). Долго се смеев на оваа дефиниција додека конечно не разбрав за што се работи. Изводот не е ништо повеќе од едноставна мерка за тоа колку е слична функцијата што ја диференцираме со функцијата y=x, y=x^2, y=x^3.

Сега ја имам честа да им држам предавања на студенти кои се плашиматематика. Ако се плашите од математика, ние сме на истиот пат. Штом се обидете да прочитате некој текст и ви се чини дека е премногу комплициран, тогаш знајте дека е лошо напишан. Тврдам дека не постои ниту една област на математика за која не може да се дискутира „на прсти“ без губење на точноста.

Задача за блиска иднина: На моите ученици им дадов да разберат што е линеарен квадратен регулатор. Не бидете срамежливи, потрошете три минути од вашиот живот и следете ја врската. Ако ништо не разбирате, тогаш ние сме на истиот пат. И јас (професионален математичар-програмер) ништо не разбрав. И ве уверувам, можете да го сфатите ова „на вашите прсти“. Во моментов не знам што е тоа, но ве уверувам дека ќе можеме да го сфатиме.

Така, првото предавање што ќе им го одржам на моите студенти откако ќе дотрчаат кај мене со ужас и ќе кажат дека линеарно-квадратниот регулатор е страшна работа што никогаш нема да ја совладате во вашиот живот е методи на најмали квадрати. Дали можете да решите линеарни равенки? Ако го читате овој текст, тогаш најверојатно не.

Значи, со оглед на две точки (x0, y0), (x1, y1), на пример, (1,1) и (3,2), задачата е да се најде равенката на правата што минува низ овие две точки:

илустрација

Оваа линија треба да има равенка како што следува:

Овде алфа и бета ни се непознати, но две точки од оваа линија се познати:

Можеме да ја напишеме оваа равенка во форма на матрица:

Тука треба да направиме лирска дигресија: што е матрица? Матрицата не е ништо повеќе од дводимензионална низа. Ова е начин на складирање на податоци; не треба да се прикачуваат дополнителни значења на нив. Од нас зависи точно како да интерпретираме одредена матрица. Периодично ќе го толкувам како линеарно пресликување, периодично како квадратна форма, а понекогаш едноставно како збир на вектори. Сето ова ќе се разјасни во контекст.

Да ги замениме конкретните матрици со нивната симболична претстава:

Потоа (алфа, бета) може лесно да се најде:

Поконкретно за нашите претходни податоци:

Што води до следнава равенка на правата што минува низ точките (1,1) и (3,2):

Во ред, се е јасно овде. Да ја најдеме равенката на правата што минува низ триточки: (x0,y0), (x1,y1) и (x2,y2):

О-о-о, но имаме три равенки за две непознати! Стандарден математичар ќе каже дека нема решение. Што ќе каже програмерот? И тој прво ќе го препише претходниот систем на равенки во следната форма:

Во нашиот случај, векторите i, j, b се тродимензионални, затоа (во општиот случај) нема решение за овој систем. Секој вектор (алфа\*i + бета\*j) лежи во рамнината опфатена со векторите (i, j). Ако b не припаѓа на оваа рамнина, тогаш нема решение (во равенката не може да се постигне еднаквост). Што да се прави? Ајде да бараме компромис. Да означиме со е(алфа, бета)точно колку не сме постигнале еднаквост:

И ние ќе се обидеме да ја минимизираме оваа грешка:

Зошто квадрат?

Ние не бараме само минимум на нормата, туку и минимум од квадратот на нормата. Зошто? Самата минимална точка се совпаѓа, а квадратот дава мазна функција (квадратна функција на аргументите (алфа, бета)), додека едноставно должината дава функција во облик на конус, која не може да се разликува во минималната точка. Бр. Плоштадот е поудобен.

Очигледно, грешката е минимизирана кога векторот дортогонално на рамнината опфатена со векторите јасИ ј.

Илустрација

Со други зборови: бараме права линија таква што збирот на квадратните должини на растојанијата од сите точки до оваа права линија е минимален:

АЖУРИРАЊЕ: Имам проблем овде, растојанието до правата треба да се мери вертикално, а не со ортогонална проекција. Во право е овој коментатор.

Илустрација

Со сосема различни зборови (внимателно, слабо формализирано, но треба да биде јасно): ги земаме сите можни линии помеѓу сите парови точки и ја бараме просечната линија помеѓу сите:

Илустрација

Друго објаснување е едноставно: прикачуваме пружина помеѓу сите точки на податоци (тука имаме три) и правата линија што ја бараме, а правата линија на состојбата на рамнотежа е токму она што го бараме.

Минимална квадратна форма

Значи, со оглед на овој вектор би рамнина опфатена со вектори на колоните на матрицата А(во овој случај (x0,x1,x2) и (1,1,1)), го бараме векторот дсо минимален квадрат на должина. Очигледно, минимумот е остварлив само за векторот д, ортогонално на рамнината опфатена со вектори на колоните на матрицата А:

Со други зборови, бараме вектор x=(алфа, бета) таков што:

Дозволете ми да ве потсетам дека овој вектор x=(алфа, бета) е минимумот на квадратната функција ||e(алфа, бета)||^2:

Тука би било корисно да се запамети дека матрицата може да се толкува и како квадратна форма, на пример, идентитетската матрица ((1,0),(0,1)) може да се толкува како функција x^2 + y^ 2:

квадратна форма

Целата оваа гимнастика е позната под името линеарна регресија.

Лапласова равенка со граничната состојба на Дирихле

Сега наједноставната вистинска задача: има одредена триаголна површина, неопходно е да се измазне. На пример, да вчитаме модел на моето лице:

Оригиналниот commit е достапен. За да ги минимизирам надворешните зависности, го зедов кодот на мојот софтверски рендерер, веќе на Habré. За решавање на линеарен систем, користам OpenNL, ова е одличен решавач, кој, сепак, е многу тешко да се инсталира: треба да копирате две датотеки (.h+.c) во папката со вашиот проект. Целото измазнување се врши со следниов код:

За (int d=0; d<3; d++) { nlNewContext(); nlSolverParameteri(NL_NB_VARIABLES, verts.size()); nlSolverParameteri(NL_LEAST_SQUARES, NL_TRUE); nlBegin(NL_SYSTEM); nlBegin(NL_MATRIX); for (int i=0; i<(int)verts.size(); i++) { nlBegin(NL_ROW); nlCoefficient(i, 1); nlRightHandSide(verts[i][d]); nlEnd(NL_ROW); } for (unsigned int i=0; i&лице = лица[i]; за (int j=0; j<3; j++) { nlBegin(NL_ROW); nlCoefficient(face[ j ], 1); nlCoefficient(face[(j+1)%3], -1); nlEnd(NL_ROW); } } nlEnd(NL_MATRIX); nlEnd(NL_SYSTEM); nlSolve(); for (int i=0; i<(int)verts.size(); i++) { verts[i][d] = nlGetVariable(i); } }

Координатите X, Y и Z се раздвојуваат, ги измазнувам одделно. Односно, решавам три системи на линеарни равенки, секој со број на променливи еднаков на бројот на темиња во мојот модел. Првите n редици од матрицата А имаат само еден 1 по ред, а првите n редови од векторот b ги имаат оригиналните координати на моделот. Односно, врзувам пружина помеѓу новата позиција на темето и старата позиција на темето - новите не треба да се движат премногу далеку од старите.

Сите последователни редови од матрицата А (faces.size()*3 = број на рабови на сите триаголници во мрежата) имаат една појава од 1 и една појава од -1, при што векторот b има нула спротивставени компоненти. Ова значи дека ставам пружина на секој раб на нашата триаголна мрежа: сите рабови се обидуваат да го добијат истото теме како нивната почетна и крајна точка.

Уште еднаш: сите темиња се променливи и не можат да се движат подалеку од нивната првобитна позиција, но во исто време се обидуваат да станат слични едни на други.

Еве го резултатот:

Се би било во ред, моделот е навистина измазнет, ​​но се оддалечи од првобитниот раб. Ајде малку да го смениме кодот:

За (int i=0; i<(int)verts.size(); i++) { float scale = border[i] ? 1000: 1; nlBegin(NL_ROW); nlCoefficient(i, scale); nlRightHandSide(scale*verts[i][d]); nlEnd(NL_ROW); }

Во нашата матрица А, за темињата што се на работ, не додавам ред од категоријата v_i = verts[i][d], туку 1000*v_i = 1000*verts[i][d]. Што менува тоа? И ова ја менува нашата квадратна форма на грешка. Сега едно отстапување од врвот на работ ќе чини не една единица, како порано, туку 1000 * 1000 единици. Тоа е, закачивме посилна пружина на екстремните темиња, решението ќе претпочита да ги истегне другите посилно. Еве го резултатот:

Да ја удвоиме јачината на пружината помеѓу темињата:
nlКоефициент(лице[ j], 2); nlКоефициент(лице[(j+1)%3], -2);

Логично е дека површината стана помазна:

И сега уште сто пати посилно:

Што е ова? Замислете дека сме натопиле жичен прстен во вода со сапуница. Како резултат на тоа, добиениот сапунски филм ќе се обиде да има што е можно помала искривување, допирајќи ја границата - нашиот жичен прстен. Токму тоа го добивме со фиксирање на границата и барање мазна површина внатре. Честитки, штотуку ја решивме Лапласовата равенка со граничните услови на Дирихле. Звучи кул? Но, во реалноста, само треба да решите еден систем на линеарни равенки.

Поасонова равенка

Да се ​​потсетиме на уште едно кул име.

Да речеме дека имам ваква слика:

На сите им изгледа добро, но не ми се допаѓа столот.

Сликата ќе ја преполовам:



И јас ќе изберам стол со моите раце:

Потоа ќе повлечам сè што е бело во маската на левата страна од сликата, а во исто време низ целата слика ќе кажам дека разликата помеѓу два соседни пиксели треба да биде еднаква на разликата помеѓу два соседни пиксели од десната страна. слика:

За (int i=0; i

Еве го резултатот:

Достапни се кодови и слики