< Return to Video

通过深度学习实现人工智能的兴起 | Yoshua Bengio | TEDxMontreal

  • 0:18 - 0:21
    我们的世界在许多方面一直在变,
  • 0:21 - 0:26
    其中对我们的未来产生巨大影响的是
  • 0:26 - 0:29
    人工智能。
  • 0:29 - 0:33
    它给我们带来了又一场工业革命。
  • 0:34 - 0:40
    之前的工业革命扩大了人类的机械能力。
  • 0:40 - 0:46
    这场新的革命,这第二次的机械时代
  • 0:46 - 0:50
    将会拓展我们的认知能力,
  • 0:50 - 0:52
    以及我们的精神力。
  • 0:53 - 0:57
    计算机不仅仅将取代体力劳动,
  • 0:58 - 1:00
    还将取代脑力劳动。
  • 1:00 - 1:03
    那么,我们如今的立场是什么呢?
  • 1:04 - 1:08
    你有可能听说过去年三月发生的事情,
  • 1:08 - 1:12
    一个被称为AlphaGo的机器学习系统
  • 1:12 - 1:18
    在围棋游戏中使用了深度学习
    来击败了当时的世界冠军。
  • 1:18 - 1:21
    围棋是一款古老的中国游戏,
  • 1:21 - 1:24
    对于计算机来说,
  • 1:24 - 1:26
    它比国际象棋更难掌握。
  • 1:27 - 1:32
    经过几十年的人工智能的研究,
    我们如今是如何成功的?
  • 1:33 - 1:37
    为了下围棋,AlphaGo经过了
    专门的培训。
  • 1:38 - 1:41
    首先,他需要观察由非常强大的
    人类玩家进行的
  • 1:42 - 1:47
    成千上万次的出招。
  • 1:48 - 1:52
    接着,它再与自己进行上万次的演练。
  • 1:54 - 2:00
    机器学习允许计算机从实例中学习。
  • 2:00 - 2:03
    从数据中学习。
  • 2:04 - 2:07
    机器学习已成为
  • 2:07 - 2:12
    将知识塞进计算机里的关键。
  • 2:12 - 2:14
    这很重要,
  • 2:14 - 2:19
    因为知识是智力的源泉。
  • 2:20 - 2:27
    把知识放入计算机中是对之前的
    人工智能方法的一种挑战。
  • 2:28 - 2:29
    为什么?
  • 2:29 - 2:34
    有很多事是我们凭直觉了解的。
  • 2:35 - 2:38
    所以我们无法口头沟通。
  • 2:39 - 2:43
    我们没有意识到这种直观的知识。
  • 2:43 - 2:47
    我们如何在没有知识的情况下
    为计算机编程呢?
  • 2:48 - 2:49
    解决方法是什么?
  • 2:49 - 2:55
    解决方法就是让机器它们自己学习知识,
  • 2:55 - 2:56
    正如我们一样。
  • 2:56 - 3:03
    这非常重要,因为知识是智力的源泉。
  • 3:03 - 3:07
    我的任务就是通过学习
  • 3:07 - 3:13
    来发现和理解智能的原理。
  • 3:13 - 3:18
    不管是动物,人类还是机器学习。
  • 3:19 - 3:25
    我和别人相信有几个关键的原则,
  • 3:25 - 3:27
    正如物理定律一样。
  • 3:28 - 3:33
    简单的原理可以解释我们自身的智力,
  • 3:33 - 3:37
    并帮助我们建造智能机器。
  • 3:38 - 3:42
    例如,思考一下空气动力学定律,
  • 3:42 - 3:48
    它足以解释鸟类和飞机的飞行。
  • 3:49 - 3:55
    若我们可以发现同样简单却有力的原理
    来解释智能本身,
  • 3:55 - 3:59
    那就太棒了。
  • 4:00 - 4:03
    我们取得了一些进展。
  • 4:04 - 4:11
    这些年来,我和我的合作者们通过对
    神经网络和深度学习的研究,
  • 4:12 - 4:16
    为人工智能邻域的一场变革做出了贡献。
  • 4:16 - 4:21
    一种受大脑启发的机器学习方法。
  • 4:22 - 4:25
    它始于你手机上的语音识别,
  • 4:25 - 4:30
    自2012年一直使用的神经网络。
  • 4:31 - 4:36
    不久之后,在计算机视觉上取得了突破。
  • 4:37 - 4:43
    计算机现在可以很好地识别图像的内容。
  • 4:44 - 4:50
    事实上,在过去的5年里,
    它们在一些基准上近似于人类的表现。
  • 4:51 - 4:55
    现在计算机可以对围棋的视觉外观
  • 4:55 - 4:58
    产生一个直观的理解,
  • 4:58 - 5:02
    这足以和人类最好的选手媲美。
  • 5:02 - 5:03
    最近,
  • 5:03 - 5:07
    根据我的实验室的一些发现,
  • 5:07 - 5:11
    深度学习被用来去把一种语言
    翻译成另一种,
  • 5:11 - 5:14
    你会开始在谷歌翻译中看到这个。
  • 5:15 - 5:18
    它拓展了计算机的理解
  • 5:18 - 5:23
    和生成自然语言的能力。
  • 5:24 - 5:26
    但是,别被愚弄了。
  • 5:26 - 5:30
    我们仍旧离一台
  • 5:30 - 5:34
    能像人类一样学习掌握
    世界的许多方面的计算机
  • 5:34 - 5:38
    很远很远。
  • 5:39 - 5:41
    所以,让我们举个例子。
  • 5:42 - 5:47
    即使是一个两岁的孩子可以
  • 5:47 - 5:51
    以计算机现在无法做到的方式学习事物。
  • 5:52 - 5:56
    一个两岁的孩子事实上掌握了直观物理。
  • 5:57 - 6:02
    她知道当她扔下一个球,球就会落下。
  • 6:02 - 6:06
    当她把一些液体洒出来的时候,
    她知道会弄脏地板。
  • 6:07 - 6:10
    她的父母根本不需要去教她
  • 6:10 - 6:13
    关于牛顿定律或者微分方程。
  • 6:14 - 6:20
    她在无人监管的情况下
    独自发现了这一切。
  • 6:21 - 6:28
    无监管学习确实仍是人工智能
    所面临的挑战之一。
  • 6:28 - 6:33
    它可能还需要花上好几十年的基础研究
  • 6:33 - 6:35
    来解开这个结。
  • 6:35 - 6:41
    无监管学习事实上
    是试图发现数据的表现形式。
  • 6:42 - 6:44
    让我来向你举例。
  • 6:44 - 6:49
    试想你用你的双眼看着的屏幕上的一页
  • 6:49 - 6:54
    或者计算机将其视为一个图像,
    一堆像素。
  • 6:55 - 7:00
    为了回答关于图像内容的问题,
  • 7:01 - 7:05
    你需要理解它的高级含义。
  • 7:06 - 7:11
    这种高级别的含义相对于在你脑中的
  • 7:11 - 7:12
    最高级别的表现形式。
  • 7:13 - 7:18
    再往下,你就有了单词的单独含义,
  • 7:19 - 7:24
    甚至再往下,你就会有由字符
    拼凑出来的单词。
  • 7:25 - 7:28
    这些字符可以用构成字符的不同的笔画
  • 7:28 - 7:31
    以不同的方式呈现。
  • 7:32 - 7:35
    这些笔画是由边组成的,
  • 7:35 - 7:37
    而这些边是由像素组成的。
  • 7:37 - 7:40
    所以这些是不同级别的表现方式。
  • 7:41 - 7:44
    但是像素本身并不足以
  • 7:44 - 7:47
    去理解图像,
  • 7:47 - 7:52
    来回答关于页面内容的高级问题。
  • 7:53 - 7:58
    事实上,你的大脑有着
    不同等级的表现形式。
  • 7:58 - 8:02
    从大脑皮层的第一个视觉区域的
    神经元开始--V1,
  • 8:02 - 8:05
    它识别边。
  • 8:05 - 8:09
    接着,在大脑皮层的第二个视觉区域的
    神经元--V2,
  • 8:09 - 8:13
    它能识别笔画和小的图形。
  • 8:13 - 8:17
    再往上,你有神经元来检测物体的部分
  • 8:17 - 8:20
    然后是物体和整个场景。
  • 8:21 - 8:25
    神经网络,当它们接受图像训练时,
  • 8:25 - 8:29
    可以真的发现这些类型的表现水平
  • 8:29 - 8:33
    与我们在大脑中所观察到的十分吻合。
  • 8:34 - 8:39
    无论是生物神经网络,换言之,
    你大脑中的神经网络
  • 8:39 - 8:43
    还是我们在机器上训练的深层神经网络,
  • 8:43 - 8:48
    都可以学习从一个等级的表达方式
    转化到下一个等级,
  • 8:48 - 8:53
    而高等级的表现形式应对
    更抽象的概念。
  • 8:53 - 8:58
    例如,字符A的抽象概念
  • 8:58 - 9:01
    可以通过许多不同的方法在
    最底级别上呈现,
  • 9:01 - 9:04
    可以呈现出许多不同的像素配置,
  • 9:04 - 9:09
    根据位置,旋转,字体等配置。
  • 9:10 - 9:16
    所以,我们该怎么学习这些
    高等级的表现方法呢?
  • 9:17 - 9:21
    目前为止,有一件事在深度学习的应用上
  • 9:21 - 9:23
    非常成功,
  • 9:23 - 9:26
    我们称之为监管学习。
  • 9:26 - 9:32
    有监管学习的情况下,
    计算机只需被手拿着,
  • 9:32 - 9:35
    人类必须要告诉计算机许多问题的答案。
  • 9:35 - 9:41
    例如,在数百万的图像中,
    人们必须很好地告诉机器,
  • 9:41 - 9:44
    对于这张图像,这是一只猫。
  • 9:44 - 9:47
    对于这张图像,这是一只狗。
  • 9:47 - 9:50
    对于这张图像,这是一台笔记本电脑。
  • 9:50 - 9:56
    对于这张图像,这是一个键盘。
    等等,等等数百万次。
  • 9:56 - 10:01
    这是非常痛苦的,
    我们使用众包来做到这一点。
  • 10:01 - 10:03
    虽然,它非常的强大,
  • 10:03 - 10:06
    这让我们可以解决许多有趣的问题,
  • 10:06 - 10:08
    但是人类更加的强大,
  • 10:08 - 10:12
    他们可以学习世界上更多不同的方面,
  • 10:12 - 10:14
    以一种更自主的方式,
  • 10:14 - 10:18
    这正如我们所见的孩子学习直观物理。
  • 10:18 - 10:24
    无监管学习也可以帮助我们
    研发自动驾驶汽车。
  • 10:25 - 10:26
    让我来解释一下:
  • 10:26 - 10:32
    无监管学习允许计算机
    将自己投射到未来,
  • 10:32 - 10:37
    根据当前的情况生成可信的未来。
  • 10:38 - 10:43
    这使得计算机可以推理和提前计划。
  • 10:43 - 10:48
    即使是它们还没训练过的情况下
    也是如此。
  • 10:49 - 10:50
    这很重要,
  • 10:50 - 10:54
    因为如果我们使用监管学习,
    我们将不得不告诉计算机
  • 10:54 - 10:57
    所有汽车可能会出现的情况
  • 10:57 - 11:01
    以及人们在这种情况下的反应。
  • 11:02 - 11:06
    我是怎么学会避免危险驾驶的行为的呢?
  • 11:07 - 11:11
    难道我必须在一场事故中死去一千次吗?
  • 11:11 - 11:12
    (笑声)
  • 11:12 - 11:15
    这是我们现在训练机器的方法。
  • 11:15 - 11:18
    所以,它不会飞,至少它不会驾驶。
  • 11:18 - 11:20
    (笑声)
  • 11:21 - 11:26
    所以,我们需要的是训练我们的模型
  • 11:26 - 11:32
    能够产生可信的图像或者
    可信的未来,具有创造性。
  • 11:32 - 11:34
    我们正在这方面取得进展。
  • 11:34 - 11:37
    所以,我们正在训练这些深层神经网络
  • 11:37 - 11:41
    从高级意义到像素,
  • 11:41 - 11:43
    而不是从像素到高级意义。
  • 11:43 - 11:47
    通过表达方法进入另一个方向。
  • 11:47 - 11:50
    通过这种方法,
    计算机可以生成新的图像,
  • 11:51 - 11:55
    这些图像和它们受训时所见的
  • 11:55 - 11:56
    完全不一样,
  • 11:57 - 12:00
    但看起来可信的,看起来像自然图像。
  • 12:02 - 12:06
    我们同样可以用这些模型来
    幻想一些奇怪的东西,
  • 12:06 - 12:09
    有时是可怕的图像,
  • 12:09 - 12:12
    正如我们的梦境和噩梦。
  • 12:13 - 12:17
    这里有一些计算机使用深度图表模型
  • 12:17 - 12:20
    所合成的图像。
  • 12:20 - 12:22
    它们看上去就像自然图像,
  • 12:22 - 12:25
    但是如果你凑近看,
    你会发现它们还是有区别的,
  • 12:25 - 12:29
    而且它们仍缺少一些
  • 12:29 - 12:31
    我们认为是自然的重要细节。
  • 12:32 - 12:34
    大约10年前,
  • 12:34 - 12:39
    无监管学习是我们发现深度学习的
  • 12:39 - 12:42
    突破口。
  • 12:44 - 12:48
    这种情况发生在少数实验室,
    包括我的实验室,
  • 12:48 - 12:51
    当时神经网络还未流行。
  • 12:51 - 12:55
    它们几乎被科学界所抛弃。
  • 12:56 - 12:59
    如今,事情已经改变了许多。
  • 12:59 - 13:01
    它已成为一个非常难的领域。
  • 13:01 - 13:07
    如今每年有成百上千的学生申请研究生课程
  • 13:07 - 13:10
    到我的实验室和我的合作者一起工作。
  • 13:11 - 13:17
    蒙特利尔已成为世界上最大的
  • 13:17 - 13:19
    深度学习研究人员学术聚集地。
  • 13:20 - 13:26
    我们刚收到9400万美元的
    巨额研究经费,
  • 13:26 - 13:30
    用于推动人工智能和数据科学的发展,
  • 13:30 - 13:36
    并将深度学习技术和
    数据科学转移到工业。
  • 13:37 - 13:44
    受到这些刺激的商业人士
    建立创业公司,工业实验室,
  • 13:44 - 13:47
    它们中的许多就坐落于大学附近。
  • 13:49 - 13:50
    例如,
  • 13:50 - 13:55
    几周前,我们宣布成立一家名为
  • 13:55 - 13:57
    “Element AI"的初创工厂,
  • 13:57 - 14:00
    它将专注于深度学习的应用上。
  • 14:02 - 14:06
    只是没有足够多的深度学习的专家。
  • 14:06 - 14:11
    所以,那些专家们被支付了疯狂多的薪水,
  • 14:11 - 14:17
    我的许多前学术同事
    都接受了公司的慷慨薪资,
  • 14:17 - 14:21
    来到了工业实验室工作。
  • 14:21 - 14:25
    就我自己而言,选择呆在大学,
  • 14:25 - 14:27
    为公众利益工作,
  • 14:27 - 14:29
    和学生们一起工作,
  • 14:29 - 14:31
    保持独立。
  • 14:31 - 14:35
    指导下一代的深度学习专家。
  • 14:35 - 14:41
    除了商业价值,
  • 14:41 - 14:45
    我们还在思考人工智能的社会影响。
  • 14:46 - 14:50
    我们中的许多人现在开始把目光
  • 14:50 - 14:56
    投向于社会增值应用,例如健康。
  • 14:56 - 14:59
    我们认为我们可以利用深度学习
  • 14:59 - 15:03
    来改进个性化治疗。
  • 15:04 - 15:06
    我相信在未来,
  • 15:06 - 15:10
    当我们从地球上数以百万计的人们
    那里收集到更多的数据时,
  • 15:10 - 15:14
    我们将可以提供医疗建议
  • 15:14 - 15:17
    给数十亿现在无法得到这些建议的人们。
  • 15:18 - 15:23
    我们可以想象人工智能在
    社会价值方面的其他许多应用。
  • 15:23 - 15:26
    例如,我们对
  • 15:26 - 15:29
    自然语言的理解的研究,
  • 15:29 - 15:31
    将会为那些无法负担的人们
  • 15:31 - 15:34
    提供各种各样的服务,比如法律服务。
  • 15:35 - 15:37
    我们如今同样也将目光
  • 15:37 - 15:41
    转向了人工智能对我们的社区的
    社会影响。
  • 15:42 - 15:45
    但这不仅仅是专家需要思考的问题。
  • 15:46 - 15:50
    我相信,除了数学和专业术语,
  • 15:50 - 15:53
    普通人能充分知晓
  • 15:53 - 15:56
    幕后发生了什么,
  • 15:56 - 16:01
    从而参与在未来几年,乃至几十年的
  • 16:01 - 16:07
    有关人工智能的重要决策。
  • 16:08 - 16:09
    所以,
  • 16:10 - 16:16
    请把你的费用放在一边,
    留一些空间让自己去学习吧。
  • 16:18 - 16:23
    我和我的合作者写了几篇介绍性论文
  • 16:23 - 16:25
    和一本名为《深度学习》的书,
  • 16:25 - 16:30
    来帮助学生们和工程师们
    进入这个令人兴奋的领域。
  • 16:31 - 16:36
    同样也有许多在线资源:
    软件,学习指南,视频......
  • 16:36 - 16:41
    很多本科生都自学了
  • 16:41 - 16:45
    很多关于深度学习的研究,
  • 16:45 - 16:48
    为了之后加入实验室。
  • 16:49 - 16:55
    人工智能将对我们的社会
    产生深远的影响。
  • 16:57 - 17:02
    所以,重要的是要问:
    我们该如何使用它?
  • 17:03 - 17:08
    巨大的积极面可能会伴随着消极面,
  • 17:08 - 17:10
    譬如军事使用
  • 17:11 - 17:15
    或者就业市场急速颠覆性的变化。
  • 17:16 - 17:22
    为了确保在未来的几年内,
  • 17:22 - 17:23
    人工智能所面临的集体选择
  • 17:23 - 17:25
    将会对所有人有利,
  • 17:25 - 17:29
    每一个公民应该
  • 17:29 - 17:33
    在定义人工智能将如何塑造
    我们的未来时发挥积极的作用。
  • 17:34 - 17:35
    谢谢。
  • 17:35 - 17:39
    (掌声)
Title:
通过深度学习实现人工智能的兴起 | Yoshua Bengio | TEDxMontreal
Description:

由于深度学习的进步,人工智能正发生一场变革。我们离实现人类水平的人工智能还有多远?未来的主要挑战是什么?

Yoshua Bengio认为理解人工智能的基本要素是每个公民都可以做到的。使这些问题民主化是很重要的,这样我们的社会才能就人工智能将带来的重大改变做出最佳的集体决策,从而使这些变化对所有人都有益。

___________________________

Yoshua Bengio是深度学习的先驱之一。他是蒙特利尔算法学习研究所(MILA)的所长,蒙特利尔大学的教授,NIPS董事会的成员,Element AI的联合创始人。他拥有麦吉尔大学的博士学位(1991,计算机科学),麻省理工和美国电话电报公司(AT&T)贝尔实验室的博士后。他还是加拿大统计学习算法的研究主席,加拿大高级研究所的高级研究员,并共同执导了其专注于深度学习的研究项目。他最著名的贡献是深度学习,循环网络,神经语言模型,神经机器翻译和生物学启发的机器学习。

https://mila.umontreal.ca/en/
https://www.elementai.com/

___________________________

更多信息请访问: http://www.tedxmontreal.com

此演讲内容来自TEDx活动,采用TED大会形式,由当地社群独立举办。更多相关信息:http://ted.com/tedx

more » « less
Video Language:
English
Team:
closed TED
Project:
TEDxTalks
Duration:
17:54

Chinese, Simplified subtitles

Revisions