🔍
P-values and significance tests | AP Statistics | Khan Academy - YouTube
Channel: Khan Academy
[0]
Да кажем, че ръководя уебсайт,
[2]
фонът на който е
[5]
този бял цвят
[6]
и знам средната стойност на
количеството време,
[8]
което хората прекарват в уебсайта ми,
[10]
да кажем, че е 20 минути,
[12]
и искам да направя промяна,
[14]
която ще накара хората да прекарват
повече време на уебсайта ми.
[16]
Идеята ми е да направя фона на
[19]
уебсайта си жълт.
[21]
Но след като направя тази промяна,
[23]
как да съм сигурен, че това ще има
[26]
замислените последици?
[28]
Тук в играта влизат
тестовете за значимост.
[31]
Първо ще съставя някакви хипотези,
[34]
нулева хипотеза и алтернативна хипотеза.
[37]
Нулевата хипотеза
по принцип е твърдение че:
[41]
"Хей, промяната ти нямаше ефект,
[43]
няма нищо ново тук" и това ще е
[46]
че средната стойност все още
е равна на 20 минути
[51]
след промяната на фона,
в този случай, в жълто.
[57]
И ще имаме и алтернативна хипотеза.
[60]
Алтернативната ни хипотеза
[63]
е че нашата средна стойност сега
е по-голяма заради промяната,
[65]
че хората прекарват повече време в сайта ми.
[67]
Средната ни стойност е по-голяма
от 20 минути след промяната.
[77]
Следващото нещо е да поставим
[80]
граница, позната като
ниво на значимост.
[83]
И след малко ще видиш как
това влиза в играта.
[86]
Нивото ти на значимост
[92]
обикновено се отбелязва
с гръцката буква алфа
[95]
и обикновено се срещат
нива на значимост като
[98]
1/100 или 5/100, или 1/10,
[102]
или 1%, 5% или 10%.
[104]
Може да видиш и други,
[105]
но ще поставим ниво на значимост
[107]
за този случай в частност...
[109]
Да кажем, че ще е 0,05.
[112]
И сега ще
[115]
вземем извадка от хората, посещаващи
[118]
този сайт с новия жълт фон
[120]
и ще пресметнем някои
статистически характеристики.
[122]
Средната стойност на извадката,
стандартното отклонение на извадката
[125]
и ще кажем: "Ако приемем, че
[128]
нулевата хипотеза е вярна,
[130]
каква е вероятността да имаме извадка
[132]
със статистическите характеристики,
които получихме?"
[135]
И ако вероятността е по-ниска от
[137]
нашето ниво на значимост,
[139]
ако тази вероятност е по-малка от 5/100,
[141]
ако това е по-малко от 5%, тогава
ще отхвърлим нулевата хипотеза
[146]
и ще кажем, че имаме
доказателство за алтернативната.
[149]
Но ако вероятността да получим
статистическите характеристики
[152]
за тази извадка е
нивото на значимост или по-висока,
[156]
тогава ще кажем, че не можем
да отхвърлим нулевата хипотеза
[159]
и нямаме доказателство за
алтернативната.
[163]
Ще нарека това стъпка 3.
[168]
В стъпка 3 ще вземем извадка.
[173]
Да кажем, че взимаме извадка с размер...
[175]
да кажем, че взимаме 100 души, които
са посетили новия ни уебсайт,
[178]
уебсайта с жълт фон,
[180]
и измерваме същите статистически
характеристики за извадката.
[182]
Измерваме средната стойност
на извадката тук,
[185]
да кажем, че за тази извадка
[188]
средната стойност е 25 минути.
[194]
И също е вероятно да...
[195]
ако не знаем реалното
[198]
стандартно отклонение
на генералната съвкупност,
[199]
което обикновено не знаем,
[201]
също ще пресметнем стандартното
отклонение на извадката.
[204]
После следващата ни стъпка е
да пресметнем р-стойността.
[209]
р-стойността, което означава
вероятностна стойност,
[212]
това е вероятността да получим
една характеристика
[214]
поне толкова далеч от средната стойност,
[217]
ако приемем, че нулевата хипотеза
е вярна.
[222]
Един начин да помислим за това
[223]
е, че това е условна вероятност.
[225]
Това е вероятността средната
стойност на извадката ни,
[230]
когато вземем извадка с размер n=100,
[233]
е по-голяма от или равна на 25 минути,
[239]
при положение, че нулевата
ни хипотеза е вярно.
[245]
В други видеа сме говорили
как да направим това.
[248]
Ако приемем, че извадковото
разпределение
[251]
на средните стойности на извадката
е приблизително нормално,
[254]
можем да използваме средната
стойност на извадката,
[255]
можем да използваме
размера на извадката,
[257]
можем да използваме стандартното
отклонение на извадката,
[259]
вероятно използваме t-критерий
(критерий на Стюдънт),
[261]
за да намерим колко
ще е тази вероятност.
[265]
И после решаваме
дали можем да отхвърлим
[267]
нулевата хипотеза.
[268]
Нека нарека това стъпка 5.
[271]
Стъпка 5, има две ситуации.
[274]
Ако моята р-стойност,
ако е по-малка от алфа,
[281]
тогава мога да отхвърля
нулевата хипотеза
[289]
и да кажа, че имам доказателство
за алтернативната си хипотеза.
[294]
Ако имаме другата ситуация,
[296]
ако р-стойността ми е
по-голяма от или равна на,
[302]
в този случай 0,05,
[305]
ако е по-голяма от или равна
на нивото ми на значимост,
[309]
тогава не мога да отхвърля
нулевата хипотеза.
[312]
Няма да кажа, че приемам
нулевата хипотеза,
[315]
просто ще кажа, че
[320]
не отхвърляме нулевата хипотеза.
[324]
Да кажем, че когато извърша
всички тези пресмятания,
[328]
получавам р-стойност, която
ще ме постави в този сценарий ето тук.
[332]
Да кажем, че получа р-стойност от 0,03.
[338]
0,03 наистина е по-малко от 0,05
[342]
и затова ще отхвърля
нулевата хипотеза
[344]
и ще кажа, че имам доказателство
за алтернативната хипотеза.
[348]
И това трябва да има логика,
[350]
понеже казваме, че
[351]
взехме извадка и ако приемем
нулевата хипотеза,
[355]
вероятността да получим
тази извадка е 3%, тя е 3/100,
[361]
и след като тази вероятност
[362]
е по-малка от прага ни
на вероятност тук,
[365]
тогава ще я отхвърлим и ще кажем,
че имаме доказателство
[367]
за алтернативната хипотеза.
[368]
От друга страна, може да има сценарий,
[370]
при който извършваме
всички изчисления тук
[373]
и р-стойността, която получаваме,
[377]
е равна на 0,5 което можеш да
интерпретираш като кажеш,
[382]
че ако приемем, че
нулевата хипотеза е вярна,
[386]
тогава правенето на фона жълт
не води до никаква промяна,
[390]
ще имам 50% шанс да получа
този резултат.
[393]
И в тази ситуация, след като
е по-висок от нивото ми на значимост,
[397]
няма да отхвърля нулевата хипотеза.
[399]
В случай, че
нулевата хипотеза е вярна
[401]
и получа този резултат,
[402]
това изглежда логично и вероятно.
[405]
Това е основата за тестовете
за значимост като цяло
[409]
и, както ще видиш, може
да се приложи в почти всяка област,
[413]
в която се озовеш.
[415]
Има едно последно пояснение,
[417]
което искам да направя много,
много, много ясно.
[420]
Нашата р-стойност, това,
което използваме,
[422]
за да решим дали да отхвърлим
нулевата хипотеза или не,
[426]
това е вероятността да получиш
статистическите характеристики на извадката,
[429]
при положение, че
нулевата хипотеза е вярна.
[433]
Понякога хората объркват това
и казват:
[435]
"Това ли е вероятността нулевата хипотеза
[438]
да е вярна, според статистическите
характеристики, които получаваме?"
[447]
И аз ще кажа, че това
изобщо не е така.
[450]
Не се опитваме да измерим
вероятността
[452]
нулевата хипотеза да е вярна
или грешна.
[454]
Опитваме се да кажем,
[456]
че ако приемем нулевата хипотеза
за вярна,
[460]
каква е вероятността
да получим резултата,
[463]
който получихме за извадката си.
[464]
И ако тази вероятност е ниска,
[466]
ако е под някакъв праг, който
предварително сме поставили,
[470]
тогава решаваме да отхвърлим
нулевата хипотеза
[473]
и да кажем, че имаме доказателство
за алтернативната.
Most Recent Videos:
You can go back to the homepage right here: Homepage





