假设检验是以前学习统计学时候比较讨厌的一块知识点,总感觉这里面说的不是人话。最近学到了CFA Level 2,突然觉得对这个概念有了更简单的理解。于是记录与此,并与大家分享。本文适合学了但不是很理解的人,不适合零基础阅读。

其实,假设检验就一句话:

假设检验是统计学中的

等于符号

我们以一个例子来说明上面这句话什么意思。

小明在做一道数学题,题目是 12 + 35 = ?。小明通过数学的加法法则,计算出答案是47。那如何判断小明是否做对了呢?看习题答案。答案上面说,这题的结果是47。于是:

47 = 47

等式左边的47是小明算出来的答案,右边的47是习题答案。这两者相等的时候,证明小明做对了。

那如果没有习题答案呢?很简单,小明做个试验就可以了。假设小明的真名叫王小聪,那他可以先买12台iPhoneX,然后再买35台iPhoneX。然后数一数,他一共买了47台iPhoneX。于是:

47 = 47

等式左边的47是小明算出来的答案,右边的47是靠做实验得到的答案。这两者相等的时候,证明小明做对了。

好,例子结束,上面的例子是属于普通的数学的。我们现在把上面的例子改造成统计学中的例子。

小萌在做一道统计学数学题,题目是一个6面骰子,扔很多次,问平均值是多少。(为了描述人话一点,说法不是很严谨)。

小萌通过统计学原理,计算出来答案是3.5。好,假设现在没有习题答案,小萌要通过做实验的方式来验证自己的答案是不是正确,于是小萌蛋疼地扔了一下午的骰子。最后,他实验做出来的平均值是3.47。

小萌看看他的答案:3.5,再看看实验结果:3.47,再看看他的答案:3.5,突然就好像觉得实验结果给他唱了一首歌

01

讲完这个例子,大家应该就理解了。小萌明明是做对了,但是在数学上,你不能认为3.5就等于3.47。所以,在统计学中,我们要有一个概念来定义说,3.5就是等于3.47。那问题又来了,你说3.5等于3.47,那3.5是否等于3.46?3.3呢?这就要靠significant level(显著水平)这个概念来解决以上问题。显著水平就是用来设定这个等于的范围的。

总结一下。在有随机性参与的数学计算中,理论值和你实验室取样后算出来的计算值是会有一定程度的偏差的。所以,假设检验的用处就是告诉你,你算没算错。(这句话还是不严谨,下文会有更严谨的形式)

重复一下,

假设检验就是统计学中的

等于符号


具体假设检验的流程和方式,各种书上都有,这里就不重复啦。



就到这里完了吗?哪有那么简单就放过你,给你看看假设检验对于某一个假设的结论:

We can not reject the null hypothesis.

02

这么非人类的描述是怎么回事?cannot一个否定,reject又一个否定,到底是要还是不要?

事情是这样的,这牵涉到一个数学上非常基本的原理。这个原理大家在初中就学过,那就是:

在不能穷举的情况下,你不能靠举例子来证明一个命题是正确的,但是你可以靠举出一个反例来证明一个命题是错误的。

拿刚才的掷骰子例子来说明,每一次小萌采集完数据得到结果,就相当于举了一次栗子,你就算做了一万次实验,实验结果都在3.5左右,你还是不能证明答案就是3.5,因为你不能靠举例子来证明一个命题

但是如果你做了一次实验,实验结果是52,这个值远超过理论计算出来的3.5。那你就有相当大的理由来认为这是一个反例。你只需要一个反例就可以否定掉整个命题。

所以假设检验只能告诉你有没有足够理由认为你错了。但是没有办法告诉你对了。那你可能要问,都不能告诉我对不对,这有啥用?在科学上面,我们可以认为,只要暂时没有证据显示我错了,我就可以暂时认为我是对的。同时,我们要保持一种谦逊和开放的态度,一旦遇到反例,就要承认自己是错的。嗯,这很科学。

关于significant level(显著水平)


最后说说显著水平。这个词也是挺反人类的,听着特别别扭,还不好记。刚才说了,显著水平就是用来确定等于的范围的。那5%的显著水平自然和1%的显著水平不一样。那究竟是5%的范围宽还是1%的范围宽呢?

我们把这个显著水平,用1减一下,得到的值,叫做容错比例,也许能好理解一些。比如,5%的显著水平,变成95%的容错比例。1%的显著水平,变成99%的容错比例。 那就很好理解了。1%的显著水平,因为其容错更高,自然是更容易接受原假设。

那具体如何理解显著这个词呢?其实就是有足够强的证据的意思。例如:这个结果显著,翻译成人话,就是我们有足够强的证据表明这个结果超过了容错范围,所以我们要reject掉原假设。

关于假设检验的人话版解释就说这些,希望可以帮助你更好的理解这个概念。当你更加熟悉了之后,希望你能够随口说出显著、We can not reject the null hypothesis这种非人类的话了😂。