手机浏览器扫描二维码访问
1.1什么是因果推断
因果推断用于衡量一个行为的价值。
即判断一个“因”
能导致多少“果”
。
比如说我今晚复习数学,明天数学考试能提升多少分。
这是一个很难回答的问题,因为我无法同时知道不复习和复习后,我分别能考多少分,当前时刻我只能做一种选择并得到一个结果,另一个选择的结果是永远不可知的,这在因果推断里叫做反事实(conterfactual)。
因果推断往往会衍生出一个研究方向,因果发现。
即判断一个行为是否和一个事件互为因果(推断是判断带来了多少果,发现是判断是否为因果)。
比如冰棍卖的多和电费高往往同时出现,但他们不是因果关系,因为这种现象主要是天气热带来的。
1.2为什么要研究因果
1.2.1因果性≠相关性[2]
设想一个场景:大数据发现,穿鞋睡觉的人第二天往往会头疼。
因此我们可以得出穿鞋睡觉和头疼相关,但这显然是反直觉的,客观规律告诉我们穿鞋睡觉不应该导致头疼。
那但数据上为什么会呈现出这个现象呢?
原来是穿鞋睡觉的人大多都喝酒了,所以,真正导致头疼的其实是“隐藏”
变量-是否喝酒。
(这在因果推断里叫混淆变量,confounder)
深入思考一下,我们为什么会得出”
因为穿鞋睡觉所以头疼“的错误结论,那是因为我们隐含的观察到“不穿鞋睡觉不头疼“,两组数据对比下得出结论。
但是这个结论错误的关键是,两个集合里喝酒的人分布是不一致的,真实的因果是喝酒所以头疼,因此这里会有数学上的“辛普森悖论”
。
因此,这个场景我们只能说穿鞋睡觉和头疼有相关性,但不能说他们互为因果。
即相关≠因果
1.2.2因果推断>相关性分析
为了对比因果推断和其他的机器学习问题,学术界提出了三层的因果之梯[3][4]:
相关(Association,观察):解释p(y|x),即已知x的条件下,y会怎么样。
这是大部分场景下机器学习所面对的问题,如上一节所述,相关≠因果,故常规的机器学习方法无法处理因果问题。
以上面的case为例,假设x=穿鞋睡觉,y=头疼,则该层级会看到两者相关性很高的“假象”
。
干预(Intervention,行动):解释p(y|do(x),z),即做某个行为x后,y是怎么样的。
比如上面的例子,干预穿鞋睡觉的行为x,单独分析穿鞋睡觉(即do(x)=1)和不穿鞋睡觉(do(x)=0),在不同喝酒状态下的头疼(y)分布。
这个层面可以分析出穿鞋睡觉对头疼可能无影响。
但无法判断每个人穿鞋睡觉会不会导致头疼,因为观察不到。
在皎白的月光下,跨越了五百年时光的神秘少女血族女王希莉欧特回到了这个世界。...
8年前,因为家中巨变,她忍痛和他分开,甘心被他误会。8年后,两人在同学聚会上重逢,之后又多次巧遇。她以为他恨之入骨,未料他竟向她求婚。她以为他对她仍旧有情,未料婚后两人相敬如冰。终于,她受不了没有爱情的婚姻,丢下一纸离婚协议,再次远走他乡...
呼呼,好热,被雷击后竟然没有成焦炭某女睁开眼睛,便看见个谪仙似的男人,正拿着纸笔在上面不停的画着。难道是在给她画仕女图?某女内心狂喜,正想坐起摆个淑女姿势,赫然发现,自己竟穿越来异世,中了春药差点不纯洁!喂,帅哥,有没有衣服借来穿穿?扔来一件白大褂,穿着象戏服。喂,帅哥,有没有被子盖?白袍男子径直躺下,阖眸养神。某女扑上去,压在身下当床垫,自带体温,美事一件!片段一(斯文版)氤氲温泉,风景如画。娇徒如鱼,仙师如石。鱼绕石游,鱼搂石颈,鱼吻石唇。鱼媚眼如丝,石纹丝不动。鱼伸手探下,一切如昔。鱼欺身上前附耳轻语师傅,是否有难言之隐?石半阖墨眸,嘴角勾笑。只见鱼双手捧着一锦盒,谄媚笑着师傅,徒儿有壮阳药一盒,请师傅品尝。片段二(流氓版)师傅,我要下山去玩。不许。师傅,今晚歇息时你睡我上面。不行。师傅,让灵鹊说几个荤段子来听听解决,如何?不可。某女怒了,当下解扣落衣师傅,你如果什么都不答应,就来帮我穿衣服吧。...
身为九天金仙的林言在炼制九天玄丹的时候遭遇到七大金仙的围攻,最终肉身陨落,却没想到竟然重生在地球上一个平凡的同名大学生身上,于是一个天才少年横空出世,在校园和都市中装逼打脸,与美同行。一个个美女贴身跟来,林言感觉也很压力山大啊!...
晏溪穿成死了男人,家徒四壁,带着两只小萌娃的农家小寡妇。想强卖她闺女?一棒打碎你狗头。想强娶她回家?一脚踩碎你鸟蛋。想强抢她事业?一刀送你当太监。直到某一天,她死掉的男人回来了守寡时晏溪岁月静好对未来充满希望。守寡失败后晏溪总想谋杀亲夫继续守寡。晏溪我有银子,有儿女,要男人作甚?当了一辈子侯爷的周安鸣慌了娘子,求不抛弃不放弃!...
十八年的等待,换来了十八年后强势崛起的实力千年的传说,八家千年的恩怨纠葛。大病一场,揭开身世之谜,踏上寻亲,复仇,成长之路!接踵而来的清纯学妹,极品御姐,辣妹,玉女掌门,让主角是被动的成长了起来…...