Least squares approximation | Linear Algebra | Khan Academy - YouTube

Channel: Khan Academy

[0]
Дадена е някаква матрица А.
[2]
Да кажем, че е с размери n x k,
[5]
и имаме уравнението А по х равно на b.
[10]
В този случай вектор х трябва да принадлежи на Rk, защото
[17]
има k стълба, а вектор b принадлежи на Rn.
[22]
Да кажем, че уравнението
[31]
А по х равно на b няма решение.
[35]
Какво означава това?
[37]
Да запишем подробно матрицата А.
[39]
Мисля, че се досещаш какво означава това.
[41]
Ако я запишем като а1, а2... ако я запиша чрез
[45]
нейните вектор-стълбове, а1, а2 и така нататък до ak,
[49]
а после я умножа по вектор [х1; х2;... хk],
[55]
това е същото като това уравнение ето тук.
[57]
Просто представих множителите като две матрици.
[59]
Това е равно на х1 по а1, плюс х2 по а2,
[66]
и така нататък до плюс xk по ak, равно на вектор b.
[73]
Ако това уравнение няма решение, това означава, че не съществува
[77]
множество от коефициенти на вектор-стълбовете на А, такива,
[83]
че да получим вектор b.
[85]
Друг начин да го формулираме е, че няма линейни комбинации на
[87]
тези вектор-стълбове, които да са равни на вектор b.
[90]
Даже може да кажем, че вектор b
[96]
не принадлежи на векторното пространство на матрицата А.
[101]
Никоя линейна комбинация на тези стълбове не е равна на този вектор.
[105]
Да видим можем ли да го представим графично.
[108]
Ще начертая векторното пространство на матрицата А.
[111]
Може би векторното пространство на матрицата А изглежда ето така.
[116]
Да предположим, че това е равнина в Rn.
[120]
Не е задължително да бъде равнина.
[122]
Нещата може да са много по-общи, но да кажем, че това е
[124]
векторното пространство на матрицата А.
[129]
Ако това е векторното пространство и вектор b не принадлежи на него,
[132]
може би можем да начертаем вектор b ето така.
[134]
Може би вектор b, да кажем, че началото е ето тук, и вектор b
[138]
излиза ето тук.
[139]
Значи това е нулевият вектор.
[140]
Това е нашият вектор b, очевидно не е във векторното пространство,
[143]
очевидно не е в тази равнина.
[146]
Досега, ако имаме едно такова уравнение,
[149]
ще направим разширена матрица, ще я преобразуваме в ешелонна форма,
[152]
и ще получим нещо, което казва 0 равно на 1, като
[154]
ще кажем, че няма решение, нищо не може да се направи.
[157]
Но дали наистина не можем да направим нищо?
[159]
Досещаш се, очевидно не можем да намерим решение.
[161]
Но ако намерим решение, което е доста близо до това?
[165]
Ако искам да намеря някакъв вектор х, ще го означа като х* засега,
[171]
като... искам да намеря х звезда, такъв че А по х* равно на...
[179]
това е вектор – да е максимално близо –
[189]
ще го запиша по следния начин – да е възможно най-близо до вектор b.
[196]
Друг начин да разглеждаме това е – когато казвам близо, имам предвид
[199]
дължината, така че искам да минимизирам дължината на...
[205]
ще го запиша.
[206]
Искам да минимизирам дължината на b минус А по х*.
[221]
Може би вече се досещаш накъде отива това.
[224]
Когато вземем разликата между двете и после
[228]
измерим дължината ѝ, какво ще получим?
[231]
Ще нарека това просто А по х.
[233]
А по х ще принадлежи на нашето векторно пространство.
[235]
Ще го нарека просто V.
[237]
А по х равно на V.
[240]
Умножаваме произволен вектор в Rk по нашата матрица А, и ще получим
[246]
член на нашето векторно пространство.
[249]
Значи всяко произведение А по х ще принадлежи на векторното ни пространство.
[256]
Може би това е вектор v равен на А по х*.
[260]
Искаме този вектор да бъде възможно най-близко до този,
[264]
стига да остава... искам да кажа, че той
[266]
трябва да принадлежи на векторното пространство.
[268]
Искаме разстоянието между този вектор и този вектор
[271]
да е възможно най-малко.
[273]
Искам само да ти покажа откъде идват термините, свързани с това.
[277]
Аз все още не съм използвал точното понятие.
[280]
Ако трябва да вземем този вектор – ще го нарека просто
[283]
вектор v за простота – това е еквивалентно на
[287]
дължината на този вектор...
[291]
Взимаме разликата между всеки от елементите.
[293]
Значи b1 минус v1, b2 минус v2, и така нататък до bn минус vn.
[302]
Ако вземем дължината на този вектор, това е същото
[305]
като ето това.
[306]
Това ще е равно на квадратен корен.
[309]
Ще повдигна дължината на квадрат.
[310]
Дължината на квадрат на това е равна на (b1 – v1) на квадрат,
[314]
плюс (b2 – v2)^2, плюс... и така нататък, до
[321]
(bn – vn)^2.
[323]
Искам да минимизирам това.
[325]
Искам тази стойност да бъде възможно най-малката,
[329]
или искам да получа оценка по метода на най-малките квадрати.
[332]
Ето защо през последните една-две минути, когато просто
[336]
обяснявах това, това е обяснението защо
[339]
това тук се нарича оценка по метода на най-малките квадрати,
[352]
или апроксимация по метода на най-малките квадрати
[357]
на уравнението А по х равно на b.
[360]
Тук няма решение на уравнението, но може би можем да намерим
[364]
някакъв вектор х звезда, такъв, че като умножа матрицата А по х*,
[369]
полученото ще принадлежи на векторното пространство, като искам
[371]
този вектор да е възможно най-близко до b.
[374]
Вече видяхме в няколко урока – кой е
[377]
най-близкият вектор в едно подпространство
[381]
до някакъв вектор, който не е в това подпространство?
[383]
Най-близкият вектор до него е неговата проекция.
[386]
Най-близкият вектор до b, който е в подпространството,
[391]
е проекцията на b в това векторно пространство.
[397]
Това е най-близкият вектор ето тук.
[399]
Ако искам да минимизирам това разстояние, значи искам
[407]
да намеря вектор х звезда, такъв че А по х* да е равно на проекцията на вектор b
[418]
в нашето подпространство или във векторното пространство на А.
[422]
Спомни си какво правим тук.
[423]
Казахме, че А по х = b няма решение, но може би можем да намерим някакво х,
[428]
което е възможно най-близко.
[430]
Наричам това решение оценка по метода на най-малките квадрати
[433]
или апроксимация по метода на най-малките квадрати.
[435]
Този вектор ето тук определено ще принадлежи на
[439]
векторното ни пространство, защото умножаваме някакъв вектор х по А,
[443]
което е линейна комбинация на тези вектор-стълбове,
[445]
значи ще принадлежи на векторното подпространство.
[447]
Искам този вектор да е възможно най-близо до този вектор.
[453]
Най-близкият вектор до този във векторното пространство
[456]
е неговата проекция.
[458]
Значи А по х трябва да е равно на проекцията на вектор b
[461]
в нашето векторно пространство.
[464]
Това трябва да е равно на това.
[466]
Но това все още е твърде трудно да бъде определено.
[470]
Видя как, спомняш си, умножихме А по обратната матрица на
[472]
произведението на А транспонирана по А, и после умножено с А транспонирана.
[474]
Доста трудно е да се намери тази трансформационна матрица.
[476]
Да видим можем ли да намерим по-лесен начин да получим
[481]
решението по метода на най-малките квадрати, или един вид най-доброто решение.
[484]
Това не е РЕШЕНИЕТО.
[486]
Това е нашето НАЙ-ДОБРО решение на това уравнение.
[488]
Затова го наричаме приблизителна оценка
[491]
по метода на най-малките квадрати.
[494]
Да извадим вектор b от двете на страни на уравнението
[497]
и може да получим нещо интересно.
[499]
Какво ще стане, ако извадим А по х минус вектор b
[504]
от двете страни на уравнението?
[505]
Ще го направя тук горе вдясно.
[507]
Отляво получаваме А по х*.
[510]
Трудно е да се напише х и после индекс звезда,
[512]
защото те много си приличат.
[513]
Изваждаме b от него.
[516]
Изваждаме нашия вектор b.
[518]
Това става равно на проекцията на вектор b
[526]
във векторното пространство минус вектор b.
[528]
Просто извадих вектор b от двете страни
[531]
на това уравнение.
[532]
Какво представлява проекцията на вектор b минус самия вектор b?
[538]
Ако го начертая ето тук, това ще бъде ето този вектор –
[541]
ще го направя в оранжево.
[545]
Това ще бъде това тук.
[546]
Това ще е ето този вектор тук, нали?
[549]
Ако взема проекцията на вектор b, която е ето това, минус вектор b,
[553]
ще получа този вектор, като можем да кажем, че вектор b
[556]
плюс този вектор е равно на проекцията на вектор b
[559]
в нашето подпространство.
[561]
Значи този вектор ето тук е ортогонален.
[564]
Това всъщност е част от определението за проекция,
[568]
че този вектор тук ще е ортогонален на нашето подпространство,
[574]
или на нашето векторно пространство.
[575]
Значи този вектор е ортогонален на векторното ни пространство.
[579]
Така че мога да напиша, че А по х* минус вектор b е ортогонален на
[587]
векторното пространство, или можем да кажем, че принадлежи
[591]
на ортогоналното допълнение на векторното пространство.
[596]
Ортогоналното допълнение е просто множеството на всички вектори,
[600]
които са ортогонални на всички вектори
[603]
в нашето подпространство, в нашето векторно пространство ето тук.
[605]
Значи този вектор ето тук, който един вид сочи
[607]
право надолу към равнината очевидно принадлежи на
[611]
ортогоналното допълнение на векторното пространство.
[614]
Това може би ти се струва познато.
[617]
Кое е ортогоналното допълнение на векторното пространство, определено чрез вектор-стълбовете?
[620]
Ортогоналното допълнение на векторното пространство, определено чрез вектор-стълбовете, е равно на
[625]
нулевото пространство на матрицата А транспонирана или на лявото нулево пространство на матрицата А.
[631]
Видяхме това преди доста уроци.
[633]
Можем да кажем, че матрицата А по решението по метода на най-малките квадрати
[640]
на уравнението А по х = b... аз го написах.
[643]
Значи х* е решението по метода на най-малките квадрати на А по х = b.
[649]
Значи А по х* минус b принадлежи на
[655]
нулевото пространство на матрицата А транспонирана.
[657]
Какво означава това?
[659]
Това означава, че ако умножа матрицата А транспонирана по
[665]
това тук, по А по х* – искам само...
[672]
не, не искам да пропускам знака за вектор върху х.
[674]
Това е вектор.
[675]
Не искам да забравям знака за вектор.
[677]
А по х* минус b.
[680]
Ако умножа А транспонирана по това ето тук, тогава
[684]
това е същото като това, и какво получаваме?
[686]
Този вектор принадлежи на нулевото пространство на А транспонирана,
[689]
значи това по А транспонирана трябва да е равно на нула.
[692]
Това е решението на А транспонирана по нещо, равно на нулевия вектор.
[700]
Сега.
[700]
Да видим можем ли да опростим малко това.
[702]
Получаваме А транспонирана по А по х* минус А транспонирана по b
[717]
равно на нула, и тогава, ако прибавя този член към двете страни на уравнението,
[724]
ще ни остане само А транспонирана по А по решението по метода
[731]
на най-малките квадрати на А по х = b,
[737]
равно на А транспонирана по b.
[743]
Това получаваме.
[744]
Но защо свършихме цялата тази работа?
[746]
Спомни си с какво започнахме.
[748]
Казахме, че ще опитаме да намерим решение на А по х = b,
[754]
но уравнението няма решение.
[758]
Затова казахме, че искаме да намерим поне вектор х*, за който отклонението от
[766]
b е минимално, при който се минимизира разстоянието
[773]
между b и А по х*.
[776]
Нарекохме х* решение по метода на най-малките квадрати.
[778]
Нарекохме го решение по метода на най-малките квадрати защото
[780]
когато вземем тази дължина, или когато минимизираме дължината,
[783]
минимизираме квадратите на тези разлики ето тук.
[786]
Така че х* е решението по метода на най-малките квадрати.
[789]
За да намерим това, ние знаехме, че това трябва да е
[793]
най-близкият вектор до вектор b в нашето подпространство.
[796]
Знаехме, че най-близкият вектор до вектор b в подпространството е
[799]
проекцията на вектор b в нашето подпространство,
[805]
във векторното пространство на матрицата А.
[806]
Така знаехме, че А – ще сменя цветовете.
[811]
Знаехме, че А по х* (решението по метода на най-малките квадрати)
[817]
трябва да е равно на проекцията на вектор b във векторното пространство на А.
[825]
Ако намерим някакъв вектор х в Rk, който удовлетворява това уравнение,
[829]
това е решението по метода на най-малките квадрати.
[830]
Но ние сме виждали вече, че проекцията на b
[833]
е трудно да се намери.
[835]
Спомняш си, че това е много трудоемко решение.
[836]
Затова потърсихме по-лесен начин.
[838]
И това беше нашият по-лесен начин.
[841]
Ако намерим това, алтернативно, можем просто да намерим
[844]
решение на това уравнение.
[845]
Така, даваш ми уравнението А по х = B, което няма решение.
[849]
Но сега аз просто ще умножа двете страни на уравнението
[852]
по матрицата А транспонирана.
[854]
Ако умножа двете страни на уравнението по А транспонирана,
[857]
ще получа А транспонирана по А по х равно на А транспонирана по –
[867]
искам същия син цвят, не това не е същото синьо –
[870]
А транспонирана по вектор b.
[877]
Просто умножих двете страни на уравнението по това.
[879]
Но решението на това модифицирано уравнение няма да е същото
[885]
като решението на първоначалното уравнение.
[887]
Това уравнение винаги ще има решение и това е
[891]
решението по метода на най-малките квадрати.
[896]
Значи това тук е нашето решение по метода на най-малките квадрати.
[899]
Обърни внимание, това е някаква матрица, а това тук
[903]
е просто някакъв вектор.
[906]
Това тук е вектор.
[908]
Но щом можем да намерим решение тук, това е
[911]
най-добрият ни шанс да намерим решение на А по х = b.
[915]
Минимизирахме грешката.
[916]
Ще получим А по x*, и разликата между
[919]
А по х* и b ще бъде минимизирана.
[921]
Това е нашето решение по метода на най-малките квадрати.
[923]
В момента нещата изглеждат доста абстрактни,
[925]
но в следващото видео се надявам да покажа, че
[928]
реално това е една много полезна концепция.