🔍
Least squares approximation | Linear Algebra | Khan Academy - YouTube
Channel: Khan Academy
[0]
Дадена е някаква матрица А.
[2]
Да кажем, че е с размери n x k,
[5]
и имаме уравнението
А по х равно на b.
[10]
В този случай вектор х трябва
да принадлежи на Rk, защото
[17]
има k стълба, а вектор b
принадлежи на Rn.
[22]
Да кажем, че уравнението
[31]
А по х равно на b няма решение.
[35]
Какво означава това?
[37]
Да запишем подробно
матрицата А.
[39]
Мисля, че се досещаш
какво означава това.
[41]
Ако я запишем като а1, а2...
ако я запиша чрез
[45]
нейните вектор-стълбове,
а1, а2 и така нататък до ak,
[49]
а после я умножа по
вектор [х1; х2;... хk],
[55]
това е същото като
това уравнение ето тук.
[57]
Просто представих множителите
като две матрици.
[59]
Това е равно на
х1 по а1, плюс х2 по а2,
[66]
и така нататък до плюс xk по ak,
равно на вектор b.
[73]
Ако това уравнение няма решение,
това означава, че не съществува
[77]
множество от коефициенти на
вектор-стълбовете на А, такива,
[83]
че да получим вектор b.
[85]
Друг начин да го формулираме е,
че няма линейни комбинации на
[87]
тези вектор-стълбове, които
да са равни на вектор b.
[90]
Даже може да кажем, че
вектор b
[96]
не принадлежи на векторното
пространство на матрицата А.
[101]
Никоя линейна комбинация на
тези стълбове не е равна на този вектор.
[105]
Да видим можем ли
да го представим графично.
[108]
Ще начертая векторното
пространство на матрицата А.
[111]
Може би векторното пространство
на матрицата А изглежда ето така.
[116]
Да предположим, че
това е равнина в Rn.
[120]
Не е задължително
да бъде равнина.
[122]
Нещата може да са много по-общи,
но да кажем, че това е
[124]
векторното пространство
на матрицата А.
[129]
Ако това е векторното пространство
и вектор b не принадлежи на него,
[132]
може би можем да начертаем
вектор b ето така.
[134]
Може би вектор b, да кажем, че
началото е ето тук, и вектор b
[138]
излиза ето тук.
[139]
Значи това е нулевият вектор.
[140]
Това е нашият вектор b,
очевидно не е във векторното пространство,
[143]
очевидно не е в
тази равнина.
[146]
Досега, ако имаме
едно такова уравнение,
[149]
ще направим разширена матрица,
ще я преобразуваме в ешелонна форма,
[152]
и ще получим нещо, което
казва 0 равно на 1, като
[154]
ще кажем, че няма решение,
нищо не може да се направи.
[157]
Но дали наистина не можем
да направим нищо?
[159]
Досещаш се, очевидно
не можем да намерим решение.
[161]
Но ако намерим решение,
което е доста близо до това?
[165]
Ако искам да намеря някакъв
вектор х, ще го означа като х* засега,
[171]
като... искам да намеря х звезда,
такъв че А по х* равно на...
[179]
това е вектор – да е
максимално близо –
[189]
ще го запиша по следния начин –
да е възможно най-близо до вектор b.
[196]
Друг начин да разглеждаме това е –
когато казвам близо, имам предвид
[199]
дължината, така че искам
да минимизирам дължината на...
[205]
ще го запиша.
[206]
Искам да минимизирам
дължината на b минус А по х*.
[221]
Може би вече се досещаш
накъде отива това.
[224]
Когато вземем разликата
между двете и после
[228]
измерим дължината ѝ,
какво ще получим?
[231]
Ще нарека това просто А по х.
[233]
А по х ще принадлежи
на нашето векторно пространство.
[235]
Ще го нарека просто V.
[237]
А по х равно на V.
[240]
Умножаваме произволен вектор в Rk
по нашата матрица А, и ще получим
[246]
член на нашето
векторно пространство.
[249]
Значи всяко произведение А по х
ще принадлежи на векторното ни пространство.
[256]
Може би това е вектор v
равен на А по х*.
[260]
Искаме този вектор да бъде
възможно най-близко до този,
[264]
стига да остава...
искам да кажа, че той
[266]
трябва да принадлежи
на векторното пространство.
[268]
Искаме разстоянието между
този вектор и този вектор
[271]
да е възможно най-малко.
[273]
Искам само да ти покажа откъде
идват термините, свързани с това.
[277]
Аз все още не съм използвал
точното понятие.
[280]
Ако трябва да вземем този
вектор – ще го нарека просто
[283]
вектор v за простота –
това е еквивалентно на
[287]
дължината на този вектор...
[291]
Взимаме разликата
между всеки от елементите.
[293]
Значи b1 минус v1, b2 минус v2,
и така нататък до bn минус vn.
[302]
Ако вземем дължината
на този вектор, това е същото
[305]
като ето това.
[306]
Това ще е равно на
квадратен корен.
[309]
Ще повдигна дължината
на квадрат.
[310]
Дължината на квадрат на това
е равна на (b1 – v1) на квадрат,
[314]
плюс (b2 – v2)^2,
плюс... и така нататък, до
[321]
(bn – vn)^2.
[323]
Искам да минимизирам това.
[325]
Искам тази стойност да бъде
възможно най-малката,
[329]
или искам да получа оценка
по метода на най-малките квадрати.
[332]
Ето защо през последните
една-две минути, когато просто
[336]
обяснявах това, това
е обяснението защо
[339]
това тук се нарича оценка
по метода на най-малките квадрати,
[352]
или апроксимация по метода
на най-малките квадрати
[357]
на уравнението
А по х равно на b.
[360]
Тук няма решение на уравнението,
но може би можем да намерим
[364]
някакъв вектор х звезда, такъв, че
като умножа матрицата А по х*,
[369]
полученото ще принадлежи на
векторното пространство, като искам
[371]
този вектор да е възможно
най-близко до b.
[374]
Вече видяхме в няколко
урока – кой е
[377]
най-близкият вектор в
едно подпространство
[381]
до някакъв вектор, който не е
в това подпространство?
[383]
Най-близкият вектор до него
е неговата проекция.
[386]
Най-близкият вектор до b,
който е в подпространството,
[391]
е проекцията на b в
това векторно пространство.
[397]
Това е най-близкият вектор ето тук.
[399]
Ако искам да минимизирам
това разстояние, значи искам
[407]
да намеря вектор х звезда, такъв че
А по х* да е равно на проекцията на вектор b
[418]
в нашето подпространство
или във векторното пространство на А.
[422]
Спомни си какво правим тук.
[423]
Казахме, че А по х = b няма решение,
но може би можем да намерим някакво х,
[428]
което е възможно най-близко.
[430]
Наричам това решение оценка
по метода на най-малките квадрати
[433]
или апроксимация по метода
на най-малките квадрати.
[435]
Този вектор ето тук определено
ще принадлежи на
[439]
векторното ни пространство, защото
умножаваме някакъв вектор х по А,
[443]
което е линейна комбинация
на тези вектор-стълбове,
[445]
значи ще принадлежи
на векторното подпространство.
[447]
Искам този вектор да е възможно
най-близо до този вектор.
[453]
Най-близкият вектор до този във
векторното пространство
[456]
е неговата проекция.
[458]
Значи А по х трябва
да е равно на проекцията на вектор b
[461]
в нашето векторно пространство.
[464]
Това трябва да е равно на това.
[466]
Но това все още е твърде
трудно да бъде определено.
[470]
Видя как, спомняш си, умножихме
А по обратната матрица на
[472]
произведението на А транспонирана по А, и после
умножено с А транспонирана.
[474]
Доста трудно е да се намери
тази трансформационна матрица.
[476]
Да видим можем ли да намерим
по-лесен начин да получим
[481]
решението по метода на най-малките квадрати,
или един вид най-доброто решение.
[484]
Това не е РЕШЕНИЕТО.
[486]
Това е нашето НАЙ-ДОБРО
решение на това уравнение.
[488]
Затова го наричаме
приблизителна оценка
[491]
по метода на най-малките квадрати.
[494]
Да извадим вектор b от
двете на страни на уравнението
[497]
и може да получим
нещо интересно.
[499]
Какво ще стане, ако извадим А по х
минус вектор b
[504]
от двете страни на уравнението?
[505]
Ще го направя тук горе вдясно.
[507]
Отляво получаваме
А по х*.
[510]
Трудно е да се напише х
и после индекс звезда,
[512]
защото те много си приличат.
[513]
Изваждаме b от него.
[516]
Изваждаме нашия вектор b.
[518]
Това става равно на
проекцията на вектор b
[526]
във векторното пространство
минус вектор b.
[528]
Просто извадих вектор b
от двете страни
[531]
на това уравнение.
[532]
Какво представлява проекцията
на вектор b минус самия вектор b?
[538]
Ако го начертая ето тук, това
ще бъде ето този вектор –
[541]
ще го направя в оранжево.
[545]
Това ще бъде това тук.
[546]
Това ще е ето този вектор тук, нали?
[549]
Ако взема проекцията на вектор b,
която е ето това, минус вектор b,
[553]
ще получа този вектор,
като можем да кажем, че вектор b
[556]
плюс този вектор е равно
на проекцията на вектор b
[559]
в нашето подпространство.
[561]
Значи този вектор
ето тук е ортогонален.
[564]
Това всъщност е част от
определението за проекция,
[568]
че този вектор тук ще е
ортогонален на нашето подпространство,
[574]
или на нашето векторно
пространство.
[575]
Значи този вектор е ортогонален
на векторното ни пространство.
[579]
Така че мога да напиша, че А по х* минус
вектор b е ортогонален на
[587]
векторното пространство, или
можем да кажем, че принадлежи
[591]
на ортогоналното допълнение на
векторното пространство.
[596]
Ортогоналното допълнение е просто
множеството на всички вектори,
[600]
които са ортогонални на
всички вектори
[603]
в нашето подпространство, в нашето
векторно пространство ето тук.
[605]
Значи този вектор ето тук,
който един вид сочи
[607]
право надолу към равнината
очевидно принадлежи на
[611]
ортогоналното допълнение
на векторното пространство.
[614]
Това може би ти се
струва познато.
[617]
Кое е ортогоналното допълнение на векторното
пространство, определено чрез вектор-стълбовете?
[620]
Ортогоналното допълнение на векторното пространство, определено чрез вектор-стълбовете, е равно на
[625]
нулевото пространство на матрицата А транспонирана
или на лявото нулево пространство на матрицата А.
[631]
Видяхме това преди
доста уроци.
[633]
Можем да кажем, че матрицата А по
решението по метода на най-малките квадрати
[640]
на уравнението А по х = b...
аз го написах.
[643]
Значи х* е решението по метода
на най-малките квадрати на А по х = b.
[649]
Значи А по х* минус b
принадлежи на
[655]
нулевото пространство на
матрицата А транспонирана.
[657]
Какво означава това?
[659]
Това означава, че ако
умножа матрицата А транспонирана по
[665]
това тук, по А по х* –
искам само...
[672]
не, не искам да пропускам знака
за вектор върху х.
[674]
Това е вектор.
[675]
Не искам да забравям
знака за вектор.
[677]
А по х* минус b.
[680]
Ако умножа А транспонирана по
това ето тук, тогава
[684]
това е същото като това,
и какво получаваме?
[686]
Този вектор принадлежи на
нулевото пространство на А транспонирана,
[689]
значи това по А транспонирана
трябва да е равно на нула.
[692]
Това е решението на А транспонирана
по нещо, равно на нулевия вектор.
[700]
Сега.
[700]
Да видим можем ли
да опростим малко това.
[702]
Получаваме А транспонирана по А
по х* минус А транспонирана по b
[717]
равно на нула, и тогава, ако прибавя
този член към двете страни на уравнението,
[724]
ще ни остане само А транспонирана
по А по решението по метода
[731]
на най-малките квадрати на
А по х = b,
[737]
равно на А транспонирана по b.
[743]
Това получаваме.
[744]
Но защо свършихме цялата
тази работа?
[746]
Спомни си с какво започнахме.
[748]
Казахме, че ще опитаме
да намерим решение на А по х = b,
[754]
но уравнението няма решение.
[758]
Затова казахме, че искаме да намерим
поне вектор х*, за който отклонението от
[766]
b е минимално, при който
се минимизира разстоянието
[773]
между b и А по х*.
[776]
Нарекохме х* решение по
метода на най-малките квадрати.
[778]
Нарекохме го решение по метода
на най-малките квадрати защото
[780]
когато вземем тази дължина,
или когато минимизираме дължината,
[783]
минимизираме квадратите
на тези разлики ето тук.
[786]
Така че х* е решението
по метода на най-малките квадрати.
[789]
За да намерим това,
ние знаехме, че това трябва да е
[793]
най-близкият вектор до вектор b
в нашето подпространство.
[796]
Знаехме, че най-близкият вектор
до вектор b в подпространството е
[799]
проекцията на вектор b в
нашето подпространство,
[805]
във векторното пространство
на матрицата А.
[806]
Така знаехме, че А –
ще сменя цветовете.
[811]
Знаехме, че А по х* (решението
по метода на най-малките квадрати)
[817]
трябва да е равно на проекцията
на вектор b във векторното пространство на А.
[825]
Ако намерим някакъв вектор х в Rk,
който удовлетворява това уравнение,
[829]
това е решението по метода
на най-малките квадрати.
[830]
Но ние сме виждали вече,
че проекцията на b
[833]
е трудно да се намери.
[835]
Спомняш си, че това
е много трудоемко решение.
[836]
Затова потърсихме
по-лесен начин.
[838]
И това беше нашият
по-лесен начин.
[841]
Ако намерим това, алтернативно,
можем просто да намерим
[844]
решение на това уравнение.
[845]
Така, даваш ми уравнението
А по х = B, което няма решение.
[849]
Но сега аз просто ще умножа
двете страни на уравнението
[852]
по матрицата А транспонирана.
[854]
Ако умножа двете страни на
уравнението по А транспонирана,
[857]
ще получа А транспонирана по
А по х равно на А транспонирана по –
[867]
искам същия син цвят, не
това не е същото синьо –
[870]
А транспонирана по вектор b.
[877]
Просто умножих двете
страни на уравнението по това.
[879]
Но решението на това модифицирано
уравнение няма да е същото
[885]
като решението на
първоначалното уравнение.
[887]
Това уравнение винаги
ще има решение и това е
[891]
решението по метода на
най-малките квадрати.
[896]
Значи това тук е нашето решение
по метода на най-малките квадрати.
[899]
Обърни внимание, това е
някаква матрица, а това тук
[903]
е просто някакъв вектор.
[906]
Това тук е вектор.
[908]
Но щом можем да намерим
решение тук, това е
[911]
най-добрият ни шанс да намерим
решение на А по х = b.
[915]
Минимизирахме грешката.
[916]
Ще получим А по x*,
и разликата между
[919]
А по х* и b ще бъде
минимизирана.
[921]
Това е нашето решение по
метода на най-малките квадрати.
[923]
В момента нещата
изглеждат доста абстрактни,
[925]
но в следващото видео
се надявам да покажа, че
[928]
реално това е една
много полезна концепция.
Most Recent Videos:
You can go back to the homepage right here: Homepage





