P-values and significance tests | AP Statistics | Khan Academy - YouTube

Channel: Khan Academy

[0]
Да кажем, че ръководя уебсайт,
[2]
фонът на който е
[5]
този бял цвят
[6]
и знам средната стойност на количеството време,
[8]
което хората прекарват в уебсайта ми,
[10]
да кажем, че е 20 минути,
[12]
и искам да направя промяна,
[14]
която ще накара хората да прекарват повече време на уебсайта ми.
[16]
Идеята ми е да направя фона на
[19]
уебсайта си жълт.
[21]
Но след като направя тази промяна,
[23]
как да съм сигурен, че това ще има
[26]
замислените последици?
[28]
Тук в играта влизат тестовете за значимост.
[31]
Първо ще съставя някакви хипотези,
[34]
нулева хипотеза и алтернативна хипотеза.
[37]
Нулевата хипотеза по принцип е твърдение че:
[41]
"Хей, промяната ти нямаше ефект,
[43]
няма нищо ново тук" и това ще е
[46]
че средната стойност все още е равна на 20 минути
[51]
след промяната на фона, в този случай, в жълто.
[57]
И ще имаме и алтернативна хипотеза.
[60]
Алтернативната ни хипотеза
[63]
е че нашата средна стойност сега е по-голяма заради промяната,
[65]
че хората прекарват повече време в сайта ми.
[67]
Средната ни стойност е по-голяма от 20 минути след промяната.
[77]
Следващото нещо е да поставим
[80]
граница, позната като ниво на значимост.
[83]
И след малко ще видиш как това влиза в играта.
[86]
Нивото ти на значимост
[92]
обикновено се отбелязва с гръцката буква алфа
[95]
и обикновено се срещат нива на значимост като
[98]
1/100 или 5/100, или 1/10,
[102]
или 1%, 5% или 10%.
[104]
Може да видиш и други,
[105]
но ще поставим ниво на значимост
[107]
за този случай в частност...
[109]
Да кажем, че ще е 0,05.
[112]
И сега ще
[115]
вземем извадка от хората, посещаващи
[118]
този сайт с новия жълт фон
[120]
и ще пресметнем някои статистически характеристики.
[122]
Средната стойност на извадката, стандартното отклонение на извадката
[125]
и ще кажем: "Ако приемем, че
[128]
нулевата хипотеза е вярна,
[130]
каква е вероятността да имаме извадка
[132]
със статистическите характеристики, които получихме?"
[135]
И ако вероятността е по-ниска от
[137]
нашето ниво на значимост,
[139]
ако тази вероятност е по-малка от 5/100,
[141]
ако това е по-малко от 5%, тогава ще отхвърлим нулевата хипотеза
[146]
и ще кажем, че имаме доказателство за алтернативната.
[149]
Но ако вероятността да получим статистическите характеристики
[152]
за тази извадка е нивото на значимост или по-висока,
[156]
тогава ще кажем, че не можем да отхвърлим нулевата хипотеза
[159]
и нямаме доказателство за алтернативната.
[163]
Ще нарека това стъпка 3.
[168]
В стъпка 3 ще вземем извадка.
[173]
Да кажем, че взимаме извадка с размер...
[175]
да кажем, че взимаме 100 души, които са посетили новия ни уебсайт,
[178]
уебсайта с жълт фон,
[180]
и измерваме същите статистически характеристики за извадката.
[182]
Измерваме средната стойност на извадката тук,
[185]
да кажем, че за тази извадка
[188]
средната стойност е 25 минути.
[194]
И също е вероятно да...
[195]
ако не знаем реалното
[198]
стандартно отклонение на генералната съвкупност,
[199]
което обикновено не знаем,
[201]
също ще пресметнем стандартното отклонение на извадката.
[204]
После следващата ни стъпка е да пресметнем р-стойността.
[209]
р-стойността, което означава вероятностна стойност,
[212]
това е вероятността да получим една характеристика
[214]
поне толкова далеч от средната стойност,
[217]
ако приемем, че нулевата хипотеза е вярна.
[222]
Един начин да помислим за това
[223]
е, че това е условна вероятност.
[225]
Това е вероятността средната стойност на извадката ни,
[230]
когато вземем извадка с размер n=100,
[233]
е по-голяма от или равна на 25 минути,
[239]
при положение, че нулевата ни хипотеза е вярно.
[245]
В други видеа сме говорили как да направим това.
[248]
Ако приемем, че извадковото разпределение
[251]
на средните стойности на извадката е приблизително нормално,
[254]
можем да използваме средната стойност на извадката,
[255]
можем да използваме размера на извадката,
[257]
можем да използваме стандартното отклонение на извадката,
[259]
вероятно използваме t-критерий (критерий на Стюдънт),
[261]
за да намерим колко ще е тази вероятност.
[265]
И после решаваме дали можем да отхвърлим
[267]
нулевата хипотеза.
[268]
Нека нарека това стъпка 5.
[271]
Стъпка 5, има две ситуации.
[274]
Ако моята р-стойност, ако е по-малка от алфа,
[281]
тогава мога да отхвърля нулевата хипотеза
[289]
и да кажа, че имам доказателство за алтернативната си хипотеза.
[294]
Ако имаме другата ситуация,
[296]
ако р-стойността ми е по-голяма от или равна на,
[302]
в този случай 0,05,
[305]
ако е по-голяма от или равна на нивото ми на значимост,
[309]
тогава не мога да отхвърля нулевата хипотеза.
[312]
Няма да кажа, че приемам нулевата хипотеза,
[315]
просто ще кажа, че
[320]
не отхвърляме нулевата хипотеза.
[324]
Да кажем, че когато извърша всички тези пресмятания,
[328]
получавам р-стойност, която ще ме постави в този сценарий ето тук.
[332]
Да кажем, че получа р-стойност от 0,03.
[338]
0,03 наистина е по-малко от 0,05
[342]
и затова ще отхвърля нулевата хипотеза
[344]
и ще кажа, че имам доказателство за алтернативната хипотеза.
[348]
И това трябва да има логика,
[350]
понеже казваме, че
[351]
взехме извадка и ако приемем нулевата хипотеза,
[355]
вероятността да получим тази извадка е 3%, тя е 3/100,
[361]
и след като тази вероятност
[362]
е по-малка от прага ни на вероятност тук,
[365]
тогава ще я отхвърлим и ще кажем, че имаме доказателство
[367]
за алтернативната хипотеза.
[368]
От друга страна, може да има сценарий,
[370]
при който извършваме всички изчисления тук
[373]
и р-стойността, която получаваме,
[377]
е равна на 0,5 което можеш да интерпретираш като кажеш,
[382]
че ако приемем, че нулевата хипотеза е вярна,
[386]
тогава правенето на фона жълт не води до никаква промяна,
[390]
ще имам 50% шанс да получа този резултат.
[393]
И в тази ситуация, след като е по-висок от нивото ми на значимост,
[397]
няма да отхвърля нулевата хипотеза.
[399]
В случай, че нулевата хипотеза е вярна
[401]
и получа този резултат,
[402]
това изглежда логично и вероятно.
[405]
Това е основата за тестовете за значимост като цяло
[409]
и, както ще видиш, може да се приложи в почти всяка област,
[413]
в която се озовеш.
[415]
Има едно последно пояснение,
[417]
което искам да направя много, много, много ясно.
[420]
Нашата р-стойност, това, което използваме,
[422]
за да решим дали да отхвърлим нулевата хипотеза или не,
[426]
това е вероятността да получиш статистическите характеристики на извадката,
[429]
при положение, че нулевата хипотеза е вярна.
[433]
Понякога хората объркват това и казват:
[435]
"Това ли е вероятността нулевата хипотеза
[438]
да е вярна, според статистическите характеристики, които получаваме?"
[447]
И аз ще кажа, че това изобщо не е така.
[450]
Не се опитваме да измерим вероятността
[452]
нулевата хипотеза да е вярна или грешна.
[454]
Опитваме се да кажем,
[456]
че ако приемем нулевата хипотеза за вярна,
[460]
каква е вероятността да получим резултата,
[463]
който получихме за извадката си.
[464]
И ако тази вероятност е ниска,
[466]
ако е под някакъв праг, който предварително сме поставили,
[470]
тогава решаваме да отхвърлим нулевата хипотеза
[473]
и да кажем, че имаме доказателство за алтернативната.