Sampling distribution example problem | Probability and Statistics | Khan Academy - YouTube

Channel: Khan Academy

[0]
Средностатистическият мъж изпива 2 литра вода
[4]
при активност на открито,
[6]
със стандартно отклонение от 0,7 литра.
[10]
Ти планираш целодневен излет сред природата за 50 мъже
[16]
и ще вземеш 110 литра вода.
[19]
Каква е вероятността да свърши водата?
[24]
Нека помислим какво се случва тук.
[25]
Има някакво разпределение на броя литри, от които един средностатистически
[29]
мъж се нуждае при активност навън.
[31]
Нека ти покажа пример.
[33]
Може да изглежда ето така.
[36]
Т.е. всички ще се нуждаят от поне повече от 0 литра,
[40]
така че това тук ще са 0 литра.
[42]
Средностатистическият мъж, т.е. средната стойност на количеството вода, от която един мъж
[47]
се нуждае при физическа активност на открито, е два литра.
[50]
Така че тук ще имаме 2 литра.
[52]
Един вид средната стойност е равна на 2 литра.
[54]
Тя има стандартно отклонение 0,7 литра или 0,7 литра.
[59]
Така че стандартното отклонение... може би ще го начертая така.
[62]
И това разпределение, още веднъж, не знаем дали
[64]
е нормално разпределение или не.
[65]
Това може да е някакво ненормално разпределение.
[68]
Може би някои хора се нуждаят от почти...
[71]
всеки има нужда от поне малко вода, но може би някои хора
[73]
се нуждаят от много, много малко вода.
[76]
Тогава са налице много хора, които имат такава нужда, може би при някои
[78]
тя е по-голяма, и никой не може да изпие повече от може би,
[81]
това са 4 литра вода.
[83]
Вероятно това е действителното разпределение.
[85]
Тогава едно стандартно отклонение е 0,7 литра.
[90]
Така това е 1; 0,7 литра е... това ще е 1 литър,
[94]
2 литра, 3 литра.
[96]
И едно стандартно отклонение ще е на около това разстояние
[98]
от средната стойност.
[100]
Ако отидем над него, разстоянието би било такава,
[102]
и такова, ако отидем под него.
[103]
Нека покажа.
[104]
Това е стандартното отклонение.
[106]
Това там е стандартното отклонение
[108]
надясно, а това – стандартното отклонение наляво.
[111]
И знаем, че стандартното отклонение е равно на...
[114]
ще напиша 0 отпред тук, 0,7 литра.
[118]
Това е действителното разпределение на количеството вода,
[121]
от което се нуждае един мъж при активност.
[123]
Сега, това, което е интересно при тази задача, планираме
[126]
един пълен ден сред природата за 50 мъже, като ще вземем
[129]
110 литра вода.
[132]
Каква е вероятността тя да свърши?
[134]
Вероятността водата да свърши –
[138]
ще запиша това.
[139]
Вероятността моята или твоята вода да свърши е равна
[146]
или е същата, като вероятността да използваме повече от
[151]
110 литра по време на нашия ден сред природата,
[162]
каквото и да правим.
[163]
Което е точно равно на вероятността, ако използваме повече
[166]
от 110 литра, това означава, че на средно ниво, понеже
[169]
имаме 50 мъже, тогава 110, разделено на 50 дава колко?
[174]
Дава 2. Нека сега взема калкулатора,
[176]
за да не правим грешки тук.
[180]
Така това ще е равно на... изваждаме калкулатора.
[183]
Средно, ако имаме 110 литра, които ще бъдат
[187]
изпити от 50 мъже, включително и нас, предполагам, това означава,
[192]
че имаме... че ще свърши водата, ако средно повече
[197]
от 2,2 литра са употребени от един човек.
[200]
Това е точно равно на вероятността средно
[204]
или може би трябва да кажем извадковата средна стойност... или нека
[207]
го напиша така, че средното употребено количество вода за един мъж
[216]
от общия брой мъже, 50, е по-голямо от, или можем да кажем по-голямо или
[220]
равно на, по-голямо... ще кажа по-голямо,защото
[225]
ако сме добре с парите, тогава няма да ни свърши водата... така,
[228]
по-голямо от 2,2 литра на човек.
[235]
Нека помислим за това.
[237]
По същество разглеждаме 50 мъже в нашата универсална извадка (пример).
[241]
Получихме тези данни... кой знае откъде сме ги получили,
[243]
че средностатистическият мъж изпива 2 литра, и че стандартното
[246]
отклонение е това.
[247]
Може би има някакво голямо изследване и това е полученият най-добър резултат
[250]
за това какви може да са параметрите на генералната съвкупност.
[252]
Така че това е средната стойност, а това е стандартното отклонение.
[255]
Сега имаме извадка от 50 мъже.
[257]
И това, което е нужно да направим, е да намерим каква по същество
[259]
е вероятността средната стойност на извадката, извадковата средна стойност
[263]
да е по-голяма от 2,2 литра.
[267]
За да направим това, трябва да намерим разпределението
[270]
на извадковата средна стойност.
[271]
Знаем как се нарича това.
[272]
Това е извадково разпределение на извадковата средна стойност.
[275]
А знаем, че това ще е едно нормално разпределение.
[277]
Знаем и няколко от свойствата на това нормално разпределение.
[281]
Разпределението е за всички мъже.
[283]
И ако вземем извадки от, да кажем 50 мъже, тогава ще имаме...
[286]
нека напиша това.
[287]
Тук долу ще начертая извадковото разпределение
[298]
на извадковата средна стойност, когато n, когато извадката ни е
[308]
с размер, който е равен на 50.
[312]
Това по същество ни казва вероятността за
[314]
различните средни стойности, когато имаме 50 мъже от тази
[317]
генерална съвкупност и тяхното средно потребление на вода.
[320]
Нека начертая това.
[322]
Да кажем, че това е честотата, а тук са
[326]
различните стойности.
[327]
Средната стойност на това... нека я напиша...
[332]
средната стойност на извадковото разпределение на тази
[337]
извадкова средна стойност, този х стълб, това е самата извадкова средна стойност,
[341]
е равна на... ако правим това
[345]
милиони и милиони пъти.
[346]
Ако трябваше да отбележим всички средни стойности, като правим
[349]
извадки от по 50, и разглеждаме всяка една от тях, това би
[352]
показало, че тази средна стойност на разпределението всъщност
[355]
ще е средната стойност на нашата генерална съвкупност.
[357]
Т.е. ще имаме същата стойност... ще използвам
[359]
същото синьо за оцветяване.
[360]
Ще имаме същата стойност като
[363]
при тази генерална съвкупност тук.
[365]
И това ще са 2 литра.
[366]
Все още в центъра са 2 литра.
[370]
Но хубавото тук е, че извадковото разпределение
[374]
на извадковата средна стойност... вземаме 50 души, намираме тяхната
[377]
средна стойност, отбелязваме честотата.
[380]
Всъщност тук ще има нормално разпределение, без да се взема предвид...
[382]
това тук си има добре определена средна стойност
[384]
на стандартното отклонение.
[385]
Което не е нормално.
[385]
Макар и това да не е нормално, това тук
[388]
ще е, това го видяхме вече в доста от миналите клипове.
[390]
Това ще си е едно нормално разпределение.
[392]
А стандартното отклонение – това го видяхме миналия път,
[395]
и надявам се, че схвана поне малко логиката
[397]
относно верността на това.
[399]
Стандартното отклонение... всъщност нека
[402]
го формулирам по-добре.
[402]
Дисперсията на извадковата средна стойност
[406]
ще е общата дисперсия.
[408]
Така че запомни, това ще е... това е стандартното
[410]
отклонение, което ще представлява дисперсията на генералната съвкупност,
[414]
разделена на n.
[416]
И ако искаме стандартното отклонение на това разпределение
[419]
да е тук, коренуваме двете страни.
[421]
Ако коренуваме двете страни, ще получим,
[425]
че стандартното отклонение на извадковата средна стойност ще е
[428]
равно на корен квадратен от тази страна тук, ще е
[431]
равно на стандартното отклонение на генералната съвкупност,
[434]
разделено на корен квадратен от n.
[437]
Какво ще даде това в нашия случай?
[439]
Знаем колко е стандартното отклонение
[440]
на генералната съвкупност.
[441]
То е 0,7.
[448]
А колко е n?
[449]
Имаме 50 мъже.
[450]
Така това, което имаме тук е 0,7 върху квадратен корен от 50.
[454]
Да пресметнем това с помощта на калкулатора.
[457]
Имаме 0,7, разделено на квадратен корен от 50.
[466]
И получаваме 0,09... ще кажа 0,098... което е доста
[473]
близо до 0,99.
[475]
Така че ще го запиша.
[476]
Това е равно на 0,099.
[483]
Това е стандартното отклонение тук.
[484]
Ще е по-ниско стандартно отклонение.
[486]
И разпределението ще е нормално,
[489]
ще изглежда по този начин.
[491]
Така това тук е 3 литра, това е 1 литър.
[497]
Стандартното отклонение е почти една десета, така че
[500]
ще имаме доста по-тясно разпределение.
[503]
То ще изглежда някак... опитвам се да го начертая...
[507]
ще изглежда по този начин.
[513]
Схаващаш идеята.
[515]
Където сега стандартното отклонение е почти 0,1, и
[518]
имаме 0,09, почти една десета.
[520]
Така че ще имаме нещо... едно стандартно
[522]
отклонение ще изглежда по този начин.
[525]
Така имаме нашето разпределение.
[526]
То е нормално разпределение.
[528]
А сега нека се върнем на въпроса, който задаваме.
[531]
Искаме да знаем вероятността нашата извадка
[534]
да има средна стойност, по-голяма от 2,2.
[539]
Това е разпределението на всички възможни извадки.
[543]
Средните стойности на всички възможни извадки.
[546]
И за да има стойност, по-голяма от 2,2, 2,2 ще се намира точно тук.
[553]
А по същество питаме дали ще има недостиг, ако нашата извадкова
[557]
средна стойност попадне в този участък тук.
[560]
И всъщност трябва да намерим...можем
[563]
дори да го разглеждаме като площта, която се намира под тази извивка там.
[566]
И за да я намерим, трябва да намерим на колко
[568]
стандартни отклонения над средната стойност сме, което ще е
[572]
нашият Z-резултат.
[573]
И след това можем да използваме Z-таблица, за да намерим каква е
[576]
тази област тук.
[579]
Искаме да знаем кога сме над 2,2 литра, т.е. 2,2 литра...
[586]
дори можем да го направим наум –
[588]
интересуват ни 2,2 литра.
[590]
Това се намира тук.
[592]
Нашата средна стойност е 2, така че
[595]
сме на разстояние 0,2 над средната стойност.
[602]
И ако искаме да знаем това, изразено като стандартни отклонения,
[606]
само разделяме това на стандартното отклонение на
[609]
разпределението тук.
[610]
Намерихме колко е това.
[612]
Стандартното отклонение на това разпределение е 0,099.
[617]
Така че, ако вземем... и ще видим една формула, в която вземаме тази
[620]
стойност минус средната стойност и разделяме полученото на стандартното
[623]
отклонение – това е всичко, което правим.
[623]
Просто намираме на колко стандартни отклонения над
[627]
средната стойност сме.
[628]
Така че вземаме това число тук, разделено на
[630]
стандартното отклонение, 0,099, и тогава получаваме-
[638]
нека използваме калкулатора.
[639]
И всъщност тук получихме точното число.
[641]
Така че можем да вземем 0,2; да вземем това 0,2,
[646]
разделено на тази стойност тук.
[648]
При този калкулатор, когато натисна втори отговор, това
[651]
означава окончателен отговор.
[652]
Така че вземам 0,2 разделено на тази стойност
[654]
тук, и получавам 2,020.
[659]
Което означава, че тази стойност, или трябва да напиша тази
[665]
вероятност, е същата вероятност да сме на 2,02
[672]
стандартни отклонения, или може би по-добре да го напиша така:
[676]
повече от... нека го напиша тук долу,
[680]
където имам повече място.
[681]
И всичко това ни отвежда до верояността да свърши
[684]
водата, и това е вероятността извадковата средна стойност да е повече
[693]
от... 50, което избрахме – да не забравяме, че
[696]
ако вземем един набор от 50 извадки, и разпределим всички тях,
[699]
ще получим това цялото разпределение.
[700]
Но за тези 50, групата от 50, която се случи да изберем,
[703]
вероятността да свърши водата е точно равна на
[705]
вероятността средната стойност за тези хора да е по-голяма
[710]
от 2,020 стандартни отклонения над средната стойност за това
[722]
разпределение, което показва, че те представляват същото
[726]
разпределение.
[727]
И колко ще е това?
[727]
Тук просто трябва да погледнем нашата Z-таблица.
[729]
Да не забравяме, че това 2,02 е точно тази стойност тук.
[732]
0,2 разделяме на 0,09.
[737]
Трябва да спра малко клипа, защото някакъв изтребител
[738]
или нещо подобно бръмчи отвън.
[740]
Както и да е, вероятно няма да се върне.
[742]
Така, трябва да намерим вероятността
[744]
средната стойност да е на повече от 2,02 стандартни
[747]
отклонения над средната стойност.
[749]
А за да намерим това, отиваме на Z-таблицата, и можем
[751]
това да го намерим къде ли не.
[753]
По принцип го има във всяка статистическа книга, или в интернет, навсякъде.
[756]
И по същество искаме да знаем вероятността...
[759]
Z-таблицата ще ни каже на какво разстояние сме под тази стойност.
[763]
И ако отидем на z при 2,02, това е стойността, с която
[767]
се занимавахме, така.
[767]
Имаме 2,02, това е.... т.е. търсим първата цифра.
[773]
Отиваме на 2,0, а това беше 2,02.
[779]
2,02 е точно там.
[782]
Така имаме 2,0, а за следващата цифра отиваме тук горе.
[786]
И 2,02 се намира там.
[788]
Тук получаваме 0,9783... ще го напиша долу.
[792]
0,9783 – искам да внимавам повече.
[795]
0,9783, тази Z-таблица, това не е тази стойност тук.
[800]
Това 0,9783 от Z-таблицата ни дава цялата тази област тук.
[807]
Така има вероятност да сме под тази стойност.
[809]
Да сме на по-малко от 2,02 стандартни
[813]
отклонения над средната стойност.
[815]
Така имаме тази стойност тук.
[817]
А за да отговорим на нашия въпрос, относно тази вероятност,
[821]
трябва само да извадим това от 1, защото всички тези стойности
[824]
ще се прибавят към 1.
[825]
Така че пак вземаме калкулатора и смятаме
[829]
1 минус 0,9783, което дава 0,0217.
[840]
Така че това тук е 0,0217.
[845]
Или другият начин, по който можем да го кажем, това е 2,17% вероятност
[852]
водата ни да свърши.
[855]
И сме готови.
[857]
Нека се уверя, че получих правилно число.
[859]
Така, това число беше... да, 0,0217, правилно.
[863]
Така имаме 2,17% възможност
[865]
водата ни да свърши.