Law of large numbers | Probability and Statistics | Khan Academy - YouTube

Channel: Khan Academy

[0]
Нека научим малко за Закона за големите числа,
[8]
който на много нива е един от най-логичните закони
[11]
в математиката и в теорията на вероятностите.
[14]
Но понеже е толкова приложим в различни области,
[18]
понякога се прилага погрешно, като е леко неразбран.
[22]
За да бъдем малко формални в нашата математика,
[26]
нека просто най-напред да го дефинирам
[28]
и след това ще говорим малко за логиката.
[29]
Та да кажем, че имам една случайна променлива Х.
[33]
И знаем нейната очаквана стойност или средната стойност на генералната съвкупност.
[38]
Законът за големите числа казва, че
[41]
ако вземем дадена извадка с n на брой наблюдения на нашата случайна променлива,
[46]
и ако намерим средната стойност от всички тези наблюдения...
[49]
тук ще дефинирам още една променлива.
[50]
Нека я наречем х с индекс n с черта над нея.
[54]
Това представлява средната стойност за n наблюдения
[56]
на нашата случайна променлива.
[57]
Така че буквално това е първото ми наблюдение.
[60]
И може някак да си представиш, че веднъж провеждам експеримента,
[63]
получавам наблюдаваното, и пак го провеждам, и пак е налице това наблюдение.
[67]
Продължавам да го провеждам n на брой пъти,
[71]
след което разделям на броя наблюдения.
[72]
Така че това е моята извадкова средна стойност.
[74]
Това е средната стойност на всички направени от мен наблюдения.
[77]
Законът на големите числа ни казва, че моята извадкова средна стойност
[83]
ще достигне очакваната стойност на случайната променлива...
[87]
Или бих могъл да го напиша и така: извадковата средна стойност ще достигне
[92]
средната стойност на генералната съвкупност при n, клонящо към безкрайност.
[99]
Ще използвам малко по-обикновен език относно това какво значи
[103]
клонящ или приближаване.
[104]
Но мисля, че схващаш логически това, че ако тук
[106]
взема достатъчно голяма извадка, то накрая ще получа
[110]
очакваната стойност на генералната съвкупност.
[114]
И мисля, че за много от нас това е един вид логично.
[116]
Че ако направя достатъчно опити с големи извадки, тези опити
[121]
биха ми дали числата, които ще покажат
[124]
очакваната стойност и вероятността и подобните на тях.
[126]
Но мисля, че често не се разбира
[129]
причината, поради която се случва.
[130]
Преди да премина по-нататък,
[133]
ще дам един конкретен пример.
[135]
Законът за големите числа ще ни каже, че... да кажем,
[137]
че имам една случайна променлива – Х е равно на броя ези-та
[144]
след 100 подхвърляния на една балансирана монета - подхвърляния или хвърляния
[150]
на една симетрична монета.
[156]
Най-напред, знаем каква е очакваната стойност
[157]
на тази случайна променлива.
[159]
Тя представлява броя подхвърляния, броя опити, умножен
[163]
по вероятността за успех при всеки опит.
[166]
А това е равно на 50.
[169]
Законът за големите числа гласи, че ако взема една извадка
[173]
или ако взема средната стойност от извадката на всички тези опити,
[177]
тогава получавам... първият ми път, в който провеждам този опит
[183]
аз подхвърлям 100 монети или разполагам със 100 монети в една кутия за обувки,
[186]
разтърсвам кутията и преброявам броя на ези-тата, като получавам 55.
[190]
Това ще е Х1.
[191]
След това отново разтърсвам кутията и получавам 65.
[195]
Тогава пак разтърсвам кутията и получавам 45.
[198]
Така правя това n пъти, след което го разделям на
[202]
броя пъти, които съм го направил.
[204]
Законът за големите числа ни казва, че тази средна стойност
[207]
от всички мои наблюдения,
[211]
ще доближи 50 при n, клонящо към безкрайност.
[218]
Или при n, клонящо към 50.
[220]
Извинявам се, при n, клонящо към безкрайност.
[222]
Сега искам да обсъдим причината това да се случва
[225]
или да покажа логически защо е така.
[227]
Много хора някак си чувстват, че, това означава, че
[230]
ако след 100 опита аз съм над средната стойност, и
[234]
законите на вероятностите ще ми осигурят повече ези-та
[237]
или по-малко ези-та, за да се компенсира разликата.
[240]
Това не е точно така.
[241]
Често го наричаме заблудата на комарджията.
[244]
Нека разгранича нещата.
[245]
И ще използвам този пример.
[246]
Тук ще начертая една графика.
[248]
И ще сменя цветовете.
[255]
Нека това да е...
[263]
Това е n, моята абсцисна ос е n.
[265]
Това е броят опити, които правя.
[267]
На ординатна ос е извадковата средна стойност.
[272]
Знаем какво представлява очакваната стойност, знаем и това,
[276]
че за тази случайна променлива тя е 50.
[279]
Ще начертая това тук.
[282]
Така, 50.
[287]
Сега се връщаме на разглеждания пример.
[289]
Когато n е равно на...
[294]
При първия си опит получих 55 ези и това беше моята средна стойност.
[299]
Имах само една точка за данните.
[300]
После след два опита, да видим... тук резултатът е 65.
[304]
И моята средна стойност ще е равна на 65 плюс 55, делено на 2.
[309]
Което е 60.
[310]
Така моята средна стойност малко се покачва.
[313]
При следващия опит имахме 45, което леко ще
[315]
намали средната стойност.
[316]
Тук няма да нанасям 45.
[318]
Сега трябва да намерим средната стойност на всичко.
[319]
Колко е 45 плюс 65?
[322]
Ще сметна числото,
[323]
за да схванеш основното.
[324]
Имаме 55 плюс 65.
[328]
Това е 120 плюс 45, което дава 165.
[332]
Делено на 3.
[336]
3 се съдържа в 165... 5 по 3 е 15.
[339]
Това е 53.
[342]
Не, не, не.
[343]
55.
[345]
Така че средната стойност слиза на 55.
[346]
И можем да продължим да правим тези опити.
[349]
Може да кажеш, че законът за големите числа е причина за това.
[351]
Значи след 3 опита нашата средна стойност е това.
[356]
И много хора мислят, че някак си властелините на вероятността
[360]
ще я направят по-голяма, така че в бъдеще да получим
[362]
по-малко на брой ези-та.
[363]
Че някак си следващите два опита ще трябва да са тук долу,
[366]
за да може нашата средна стойност да намалее.
[369]
Но това не е задължително така.
[370]
При продължаването нататък вероятностите си остават същите.
[373]
Вероятността винаги е 50% да получим ези.
[376]
Не е все едно да имам определен брой езита в началото или
[379]
ако получа повече на брой езита, отколкото съм очаквал за началото,
[382]
и после изведнъж нещата ще се компенсират и ще получа повече тура.
[385]
Това представлява заблудата на комарджията.
[387]
Ако имаме една голяма поредица от ези-та
[389]
или непропорционален брой ези-та, на определен етап ще получим...
[392]
има по-голяма вероятност да получим
[395]
диспропорционален брой тура.
[397]
А това не е вярно.
[398]
Основното в закона за големите числа е, че той не се интересува...
[402]
Да кажем, че след определен брой опити
[405]
средната стойност всъщност... има малка вероятност това да се случи,
[408]
но да кажем, че средната стойност е тук горе.
[410]
Тя всъщност е на 70.
[412]
Олеле, наистина сме се отклонили от
[416]
очакваната стойност.
[417]
Но това, което ни казва законът за големите числа, е,
[418]
че не ни интересува колко опити са направени.
[420]
Остатъкът от опити, които имаме е безкраен.
[423]
А очакваната стойност при този безкрайно голям брой опити,
[426]
особено в този вид ситуация, ще е следната.
[431]
И когато намираме средната стойност на крайно число към
[435]
някакво по-голямо число, а след това периодична дроб, която
[438]
ще се приближи към стойността на това, с течение на времето ще се приближим
[442]
до очакваната стойност.
[444]
Този начин на описание беше малко неформален,
[447]
но така гласи законът за големите числа.
[449]
И това е нещо важно.
[450]
Не е казано, че ако са имаме няколко ези-та, тогава
[453]
вероятността да получим тура някак си ще се
[456]
увеличи за сметка на ези-тата.
[458]
Това, което се казва тук, е, че без значение какво се е случило,
[461]
за определен брой опити, без значение каква е средната стойност
[464]
след този определен брой опити, останали са
[466]
ни неопределен брой опити.
[467]
И ако човек направи достатъчно от тях, това ще се приближи
[471]
до нашата очаквана стойност.
[472]
И това е много важно.
[474]
Но това не се използва в ежедневната практика при лотарията и в казината,
[479]
защото там знаят, че ако човек направи достатъчно голям брой опити,
[482]
а можем дори да изчислим
[484]
дали правим достатъчен брой опити,
[485]
каква е вероятността тогава нещата значително да се отклонят?
[489]
Но казината и лотарията ежедневно прилагат този принцип ,
[493]
така че ако вземем достатъчно хора – естествено
[495]
в кратък срок – или с няколко опита,
[498]
двама ще ударят джакпота.
[499]
Но през повечето от времето казиното винаги ще печели,
[502]
поради параметрите на игрите, които
[504]
то предлага на играчите.
[505]
Както и да е, това е нещо важно при вероятностите
[508]
и мисля, че е сравнително разбираемо.
[509]
Въпреки че понякога, когато го виждаме обяснено подробно,
[512]
като в случая със случайните променливи,
[514]
а това е малко объркващо.
[514]
Всичко, което се казва е, че като правим повече и повече опити,
[519]
средната стойност на тези извадки ще приближава
[524]
истинската средна стойност.
[525]
Или трябва да съм малко по-конкретен.
[527]
Средната стойност на извадката ще се доближи до
[531]
истинската средна стойност на генералната съвкупност или
[534]
до очакваната стойност на случайната променлива.
[536]
Както и да е, ще се видим следващия път.