【大咖解读Bengio笔记】邓侃:用深度学习模型,解构并重构人类思维

赞赏 2017-10-03

Yoshua Bengio 在 Arxiv 上发表了一篇题为《意识先验》的笔记。大数医达创始人、CMU 计算机学院暨机器人研究所博士邓侃专为此笔记做了解读。他认为:“笔记往往比论文更有启发,就如同与教授喝咖啡聊天,往往更容易学到教授的思想方法。”邓侃同时也是 AI WORLD 2017 世界人工智能大会智能医疗论坛的讲者,届时他将以《多模态智能疾病诊断系统的四大技术难点》为题做出精彩分享。


新智元专栏  

作者:邓侃


2017 年 9月 26 日,深度学习大佬 Yoshua Bengio 在Arxiv 上发表了一篇笔记,标题是 The Consciousness Prior 意识先验。

之所以说这篇文章,不是严谨的论文,而是笔记,是因为这篇文章,既没有严谨的算法和公式,也没有严谨的实验结果和分析,而是一篇冥想和提议。


但是笔记往往比论文更有启发,就如同与教授喝咖啡聊天,往往更容易学到教授的思想方法。


Bengio 把人类思维解构为三个层次:感知、表征、意识


Yoshua Bengio 在这篇文章里,把人类思维解构为三个层次,感知Perception、表征 Representation、和意识 Consciousness。

 

面对一张人物照片,人类“感知”到的,是一堆像素。进而抽象到“表征”,包括五官、发型、服饰、背景等等。再进一步抽象到“意识”,包括凝重的表情、粗犷的外表、苍凉的环境等等。

 

Yoshua Bengio 提议,可以借鉴深度学习模型,譬如 RNN,来模拟从感知到表征的第一次抽象的过程。


    h_{t} = F( s_{t}, h_{t-1} ),其中 s_{t} 是感知的像素,h_{t-1} 是前序的表征,h_{t} 是修正后的表征。

 

他进而又提议,从表征到意识的第二次抽象的过程,也可以借鉴深度学习模型来完成。


    c_{t} = C( h_{t}, c_{t-1}, z_{t} ),其中 c_{t} 是意识,z_{t} 是噪音。

 

之所以有噪音,是因为意识的界定,往往模糊。譬如粗犷和野性,虽然有区别,但是难以并没有严格界定。

 

假如我们有大量做好标签的照片,就可以训练从感知到表征的深度学习模型 F(* ),和从表征到意识的模型 C( * )。

 

一个简单的系统架构,是3-layer stacked RNN。当然也可以尝试用更多层的复杂架构,或者用 CNN 替换 RNN,或者用 Attention-based Transformer 来替换 RNN。


通过重构人类思维来验证解构过程

 

从感知,到表征,到意识,是人类思维的解构过程。为了验证解构的正确,Yoshua Bengio 提议通过重构来完成验证。

 

训练好从感知到表征的模型 F(* ),和从表征到意识的模型 C( * ) 以后,假如电脑能够自动合成一张人像照片,表情凝重、外表粗犷、背景苍凉,那么重构宣告成功。

 

如果重构成功,那么解构也被证明是成功的。

 

重构的模型可以用 GAN 和 VAE 来尝试。


打破语言的束缚,解放思维


模型 F(* ) 的输出,是表征,譬如五官、发型、服饰、背景等等。模型C( * ) 的输出,是意识,譬如表情凝重、外表粗犷、背景苍凉等等。

 

意识的形态是张量,是一组数字。但是人类习惯用词汇来表达意识。YoshuaBengio 提议意识与词汇之间的关系,仍然可以用深度学习模型来模拟,

    u_{t} = U( c_{t}, u_{t-1} ),其中 c_{t} 是意识,u_{t-1} 是前序词汇,u_{t} 是修正后的词汇。

 

哲学家维特根斯坦曾说,“人有着这种感觉,他心里想说的话,总比他用言辞表述得更为清楚”。U( * ) 这个模型,把维特根斯坦的判断,表述得既清晰又简练。

 

人类的知识,往往由事实 fact 和规则 rule 组成,而且人类习惯于用简练的词汇,来表达事实和规则。所以,维特根斯坦认为,人类思维受制于语言结构,语言的界限决定思维的界限。

 

Yoshua Bengio 提议,直接用意识 c_{t} 来表达知识,而不受语言 u_{t} 的制约。

 

进而推论,不妨尝试用深度学习模型,或者强化学习模式,来重构思维逻辑,而不屈从于规则和一阶逻辑那样的推理演绎方式的束缚。

 

作者小传:



邓侃,大数医达创始人。(邮箱:kan.deng@qq.com)上海交通大学本科及硕士,美国卡内基梅隆大学(CMU)计算机学院暨机器人研究所博士,专攻人工智能及数据挖掘。


历任美国甲骨文公司(Oracle)主任系统架构师,美国泰为手机导航公司(Telenav)北京分公司总经理,百度高级总监并主管网页搜索和知识图谱。


2015年,邓侃创建北京大数医达科技有限公司,旨在将深度强化学习技术应用于医疗健康领域。


大数医达对几亿份三甲医院病历,进行结构化解析,构建海量训练数据,并结合临床指南,训练医疗深度强化学习模型。用于实现面向患者的医疗咨询服务,面向基层医生的临床导航服务,以及面向医院和医疗保险的全流程精细化质量控制和成本控制服务。


11 月 8 日,邓侃将在北京国家会议中心 AI WORLD 2017 世界人工智能大会智能医疗论坛发表题为《多模态智能疾病诊断系统的四大技术难点》。世界人工智能大会的 5 折早鸟票还有 5 天截止,抢票请点击“阅读原文”或直接去往活动行页面 http://www.huodongxing.com/event/2405852054900?td=4231978320026


欢迎登录 AI WORLD 2017 世界人工智能大会官网了解大会详情。

官网地址:http://www.aiworld2016.com/cn/2017.html 


在此,让我们透露一下邓侃老师的精彩演讲内容:


演讲主题:多模态智能疾病诊断系统的四大技术难点


北京大数医达科技有限公司,实现了多模态智能疾病诊断系统,该系统把 CNN、RNN、Attention、GAN、RL、MCTR、Knowledge Graph 等多种前沿技术融为一体,构建医学智能诊断新体系。本演讲重点介绍该系统以下 4 个方面的技术难点。


1. 把多模态数据,都转换成以医疗知识图谱为轴心的语义向量,在同一个参照系下进行相互比较和交叉操作。


2. 在知识图谱为轴心的语义向量空间中,融合多模态数据,并使用生成对抗模型提供可行又可靠的质量评估方案。


3. 用卷积神经网络技术,从病情描述中提炼病情特征,用聚焦机制,从医学知识图谱中补充相应病理逻辑,优化疾病的诊断与验证。


4. 用深度强化学习和蒙特卡洛搜索树技术,给医生推荐最佳后续化验和检查项目,补充病情描述,用最小的代价,找到诊断金指标,提高诊断精度

登陆后阅读全文
阅读 3145 赞赏 0 有用 13 没用 0 收藏 2 分享

   



0 条留言

列位于大天的头像

列位于大天

六合八荒唯我独尊

相关文章

黑爪:风靡的“深度学习”只有这一刷子了?

阿里小蜜如何读懂人话?(深度学习)

有料推荐

这世界欠我一个这样的老公!

高校学生模仿“世界名画”摆拍,可以说是戏精本精了

iPhone X 跌破发行价,苏宁200亿入股恒大 | 财经日日评

果然是高手!这次在日本,特朗普竹杠敲得不是一般狠

资深黄牛现身说法:iPhone X价格秒变不停,就像炒股一样

长一样的双胞胎也能识别?蚂蚁金服发布「眼纹识别」技术

苏联是怎么被阿富汗拖垮的?

美团或入局「分时租赁」共享汽车,王兴要大笔投入「泛出行」领域了? | 36氪独家

你或许被“一盘番茄炒蛋”刷屏了,但有人辛酸,有人质疑

iPhone X发售前夜,黄牛与苹果公司的不安

他的文章

【面试107问】谷歌等巨头机器学习面试题:从逻辑回归到智力测验

牛津大学研发类脑光子芯片,运算速度超人脑1000倍

【深度学习框架的未来】李沐:AWS开源端到端AI框架编译器NNVM

【AI拯救爱情】婚姻/恋爱关系垂危,AI帮你重返爱河

【谷歌新项目公开】无需学编程,用手机摄像头和浏览器即可机器学习

手把手搭建游戏AI—如何使用深度学习搞定《流放之路》

4亿欧元的天价收购的DeepMind去年巨亏1.6亿美元,他为谷歌带来了什么?

【ICML+NIPS过去12年数据】机器学习被引次数最高作者Top 20

【大咖解读Bengio笔记】邓侃:用深度学习模型,解构并重构人类思维

深度线性神经网络也能做非线性计算,OpenAI使用进化策略新发现

手机扫一扫
分享文章