Hypothesis testing and p-values | Inferential statistics | Probability and Statistics | Khan Academy - YouTube

Channel: Khan Academy

[0]
神經學家測試一種藥物對反應時間的效果
[3]
分別對100只老鼠注射一單位劑量的藥物
[8]
對其進行神經刺激 然後記錄反應時間
[13]
已知沒有注射藥物的老鼠平均反應時間是1.2秒
[17]
已知沒有注射藥物的老鼠平均反應時間是1.2秒
[21]
100只注射了藥物的老鼠 平均反應時間是1.05秒
[27]
樣本標準差是0.5秒
[31]
你認爲該藥物對反應時間有效果嗎
[36]
這裡 我們需要建立兩個假設
[40]
第一個假設是零假設
[46]
即藥物對反應時間無效果
[50]
零假設可以認爲是現狀
[53]
假設的總是研究沒有效果 這裡是藥物無效果
[66]
或者說 注射了藥物的老鼠 其均值…
[71]
或者說 注射了藥物的老鼠 其均值…
[79]
這樣寫吧 就算注射了藥物 反應時間均值仍是1.2秒
[92]
也就是說藥物無效 因爲不注射藥物的反應時間均值是1.2秒
[94]
也就是說藥物無效 因爲不注射藥物的反應時間均值是1.2秒
[98]
然後需要一個備擇假設
[100]
也就是說 假設藥物有效果
[104]
備擇假設是 藥物有效果
[116]
也就是說 注射藥物後 均值不再等於1.2秒
[121]
也就是說 注射藥物後 均值不再等於1.2秒
[130]
那麽如何知道 是應該接受備擇假設
[136]
還是應該接受零假設呢
[139]
還是應該接受零假設呢
[142]
該影片將講到一般的科學方法
[144]
該影片將講到一般的科學方法
[147]
假設零假設是正確的
[152]
如果零假設正確 我們得到這個樣本的機率是多少
[157]
如果零假設正確 我們得到這個樣本的機率是多少
[159]
如果該機率非常非常小 就可以認爲零假設不對
[165]
於是拒絕零假設
[168]
轉而認爲備擇假設是正確的
[171]
假設零假設是正確的
[180]
然後求得到樣本平均數1.05 標準差0.5這一結果的機率
[184]
然後求得到樣本平均數1.05 標準差0.5這一結果的機率
[186]
然後求得到樣本平均數1.05 標準差0.5這一結果的機率
[193]
假設零假設是正確的
[197]
我要求出… 其實 我不只要求出這個的機率
[201]
我要求出… 其實 我不只要求出這個的機率
[203]
而是類似這個結果 甚至更極端情況的機率
[208]
這樣的情況發生可能性有多大
[210]
要考慮這些 首先考慮一下抽樣分布
[212]
要考慮這些 首先考慮一下抽樣分布
[217]
抽樣分布是這樣的 是一個正態分布
[224]
樣本容量不錯 達到100
[227]
這是抽樣分布 這是其均值
[232]
假設零假設是正確的 藥物無效
[236]
抽樣分布的均值
[241]
將等於總體分布的均值 即1.2秒
[249]
再看抽樣分布的標準差是多少
[253]
抽樣分布標準差等於總體分布標準差除以根號下樣本容量
[256]
抽樣分布標準差等於總體分布標準差除以根號下樣本容量
[260]
抽樣分布標準差等於總體分布標準差除以根號下樣本容量
[264]
也就是除以根號100
[266]
總體的標準差σ現在尚不知道
[270]
因此我們只能通過樣本標準差來估計它
[274]
在樣本容量足夠的情況下 這樣做很合理
[278]
在樣本容量足夠的情況下 這樣做很合理
[280]
樣本標準差S是總體標準差σ很不錯的估計值
[284]
樣本標準差S是總體標準差σ很不錯的估計值
[288]
這裡可以說是 約等於樣本標準差除以根號100
[290]
這裡可以說是 約等於樣本標準差除以根號100
[295]
樣本標準差是0.5 根號100是10 所以是0.5/10
[304]
樣本標準差是0.5 根號100是10 所以是0.5/10
[307]
0.5/10=0.05
[312]
因此 抽樣分布的標準差估計值 上面用一個"帽子"表示
[317]
因此 抽樣分布的標準差估計值 上面用一個"帽子"表示
[320]
這表示是估計值 用樣本標準差估計得到的標準差
[323]
這表示是估計值 用樣本標準差估計得到的標準差
[326]
這等於0.5/10 也就是0.05
[332]
再想想 得到1.05秒的機率是多少
[336]
再想想 得到1.05秒的機率是多少
[340]
或者說 1.05秒離抽樣分布均值有多少個標準差遠
[342]
或者說 1.05秒離抽樣分布均值有多少個標準差遠
[348]
以及均值周圍這麽多標準差遠之內的機率是多少
[354]
首先求這離均值有多少個標準差遠
[358]
這裡其實也就是求一個z分數
[364]
換個好一點的顏色 橙色吧
[367]
z分數也可以看成是z統計量
[371]
它是由其它樣本統計量推出的
[375]
z統計量 離均值有多少遠呢
[379]
均值是1.2
[383]
這裡是1.05 兩者相減
[389]
這是距離 然後要以標準差計
[394]
這裡需要除以抽樣分布的標準差估計值0.05
[397]
這裡需要除以抽樣分布的標準差估計值0.05
[412]
除以0.05之後等於什麽呢
[418]
分子上1.2-1.05=0.15
[426]
0.15除以0.05等於3
[432]
0.15除以0.05等於3
[435]
因此這裡離均值有3個標準差遠
[441]
畫一下 這是均值
[443]
1個標準差遠 2個標準差遠 3個標準差遠 這是正方向
[448]
1個標準差遠 2個標準差遠 3個標準差遠 這是正方向
[450]
我重新畫一下
[453]
鍾形曲線畫得不好
[456]
正方向1個標準差遠 2個標準差遠 3個標準差遠
[460]
正方向1個標準差遠 2個標準差遠 3個標準差遠
[463]
然後負方向1個標準差遠 2個標準差遠 3個標準差遠
[466]
然後負方向1個標準差遠 2個標準差遠 3個標準差遠
[470]
樣本中100只老鼠的反應時間 1.05秒大概在這裡
[477]
比均值小3個標準差
[480]
得到這樣極端的情況 機率有多少
[485]
這樣極端的情況是指 比這個更小 或者在正方向更極端
[488]
這樣極端的情況是指 比這個更小 或者在正方向更極端
[493]
超過3個標準差遠
[495]
這種極端情況的機率也就是鍾形曲線下方相應的面積
[497]
這種極端情況的機率也就是鍾形曲線下方相應的面積
[500]
這種極端情況的機率也就是鍾形曲線下方相應的面積
[504]
包括負尾部和正尾部兩個部分 這個機率是多少呢
[509]
包括負尾部和正尾部兩個部分 這個機率是多少呢
[510]
根據經驗法則 3個標準差內的機率是99.7%
[515]
根據經驗法則 3個標準差內的機率是99.7%
[518]
當然 也可以查z表格
[521]
不過一般 3個標準差範圍內的機率是可以記住的
[526]
也就是這個橙色範圍內的面積 它等於99.7%
[529]
也就是這個橙色範圍內的面積 它等於99.7%
[536]
那麽剩下的這兩個粉色 或者說紫紅色區域面積
[541]
就是1-99.7%=0.3%
[547]
這兩個區域加起來是0.3%
[560]
或者寫成小數也就是曲線下0.003的面積
[568]
想想 假設藥物沒有效果
[574]
得到這種極端情況或更極端情況的機率只有0.3%
[582]
少於1/300
[584]
如果零假設成立 只有不到1/300的幾率得到
[589]
這麽極端或更極端的結果
[592]
因此在我看來 這個結果更傾向於支持備擇假設
[600]
我拒絕零假設 雖然不是100%確信
[610]
但如果零假設成立 得到這種情況的機率只有1/300
[615]
我更願意相信備擇假設
[618]
下面給大家介紹一下統計中常用的標記
[623]
下面給大家介紹一下統計中常用的標記
[626]
很多論文中 得到零假設中這種極端情況
[632]
甚至更極端情況的機率 稱作p值
[640]
p代表機率 這裡的p值也就是0.003
[645]
p代表機率 這裡的p值也就是0.003
[652]
如果零假設成立 得到此結果的機率非常非常小 所以拒絕它
[656]
如果零假設成立 得到此結果的機率非常非常小 所以拒絕它
[660]
通常 人們會制定一個門檻
[663]
比如門檻設在5% 如果p值少於5% 或1/20
[668]
就拒絕假設
[671]
少於1/20的幾率得到這種結果
[674]
這裡比1/20小很多
[676]
所以這是顯示零假設不正確的很強指標
[680]
藥物是具有效果的