会学习的电脑带来的美好和恐怖
-
0:01 - 0:05在过去,如果你想让计算机做一件事
-
0:05 - 0:06你需要设计电脑程序
-
0:06 - 0:10你们可能从没做过这件事
-
0:10 - 0:19编程需要排列出你想让电脑做的
每一个细枝末节的小步骤来达到你的目的 -
0:19 - 0:23假如你自己都不清楚完成这某件事的话
-
0:23 - 0:25要编写处电脑程序来完成那件事就会显得
比登天还要困难 -
0:25 - 0:28这也是这个人,亚瑟 塞缪尔,所面临的挑战
-
0:28 - 0:34在1956年,他想让这台电脑和他下国际象棋
-
0:35 - 0:40你怎样才能罗列出所有的细枝末节,
并且让电脑下象棋比你厉害? -
0:40 - 0:42他想出一个办法
-
0:42 - 0:46它让电脑和自己对战几千次
-
0:46 - 0:48学习如何下象棋
-
0:48 - 0:52事实证明他做到了。1962年
-
0:52 - 0:56这台电脑打败了美国康涅狄克州象棋冠军
-
0:56 - 0:59亚瑟 塞缪尔是机器学习之父
-
0:59 - 1:00我非常敬畏他
-
1:00 - 1:03因为我是机器学习的实践者
-
1:03 - 1:04我曾是Kaggle的主席
-
1:04 - 1:08Kaggle是一个拥有200,000机器学习实践者地社区
-
1:08 - 1:10Kaggle会组织竞赛
-
1:10 - 1:14让人们尝试解决过去未解决的问题
-
1:14 - 1:17已成功解决问题几百次
-
1:17 - 1:20在这个有利环境中,我发现了
-
1:20 - 1:26机器学习在过去,现在,和将来可以做些什么
-
1:26 - 1:31第一个机器学习的商业成功案例应该是谷歌
-
1:31 - 1:36谷歌用计算机算法寻找信息
-
1:36 - 1:38而且这个算法以计算机学习为基础
-
1:38 - 1:42从那以后,机器学习得到了很多的商业成功
-
1:42 - 1:44像亚马逊、网飞这类公司
-
1:44 - 1:48通过机器学习向你推荐你可能想买的东西
-
1:48 - 1:50你可能想看的电影
-
1:50 - 1:52有时候你会被吓一跳
-
1:52 - 1:54像领英、脸谱这类的公司
-
1:54 - 1:56有时会告诉你谁会是你的朋友
-
1:56 - 1:58你根本不知道他们是如何做到的
-
1:58 - 2:01其实他们正是运用了机器学习的力量
-
2:01 - 2:04这种运算方法使用数据
-
2:04 - 2:07而非手动编写程序
-
2:07 - 2:14这也是IBM的Watson超级计算机
在《危险边缘》里打败两届世界冠军的秘诀 -
2:14 - 2:17成功回答了这样一个极其模糊且复杂的问题
-
2:17 - 2:20[“古代‘尼姆鲁德狮像’于2003年在这个城市的国家博物馆消失(连同其它很多物品)”]
-
2:20 - 2:23这也是为什么我们现在有了第一台自驾车
-
2:23 - 2:26如果你想区分一棵树和一个行人
-
2:26 - 2:28显然这很重要
-
2:28 - 2:31但是我们不知道如何写这样一个程序
-
2:31 - 2:34有了机器学习,这就成为了可能
-
2:34 - 2:37这台自驾车已经行驶了十万英里
-
2:37 - 2:40在正常路面上零事故
-
2:40 - 2:44我们知道电脑能够学习
-
2:44 - 2:49学习做一件有时我们自己都不知道怎么做的事情
-
2:49 - 2:52有时甚至比我们做得更好
-
2:52 - 2:58我见过机器学习最惊人的例子
是我在Kaggle做的一个项目 -
2:58 - 3:03一个叫杰弗里 辛顿的人毕业于多伦多大学,
带领一个团队 -
3:03 - 3:06赢得了一个自动查毒的竞赛
-
3:06 - 3:13然而真正精彩的不是他们打败了所有默克公司
或者国际学术团体设计的运算 -
3:13 - 3:18而是他们团队里没有一个人有化学、生物
或者生命科学的背景 -
3:18 - 3:20却在两个星期内赢得了比赛
-
3:20 - 3:22他们是如何做到的?
-
3:22 - 3:25他们应用了一种超凡的算法叫做深度学习
-
3:25 - 3:31几个星期后纽约时报在其首页
报道了此次的重要成功 -
3:31 - 3:34在左手边就是杰弗里 辛顿
-
3:34 - 3:38深度学习是受到人类大脑的启发
-
3:38 - 3:44也因此这种算法的能力不受任何理论限制
-
3:44 - 3:47你给它越多的数据和运算时间
-
3:47 - 3:48它会工作的越好
-
3:48 - 3:53纽约时报在其文章中
还说明了深度学习的另一非凡之处 -
3:53 - 3:56现在我要展示给你们看
-
3:56 - 4:01它表明电脑能够听懂信息
-
4:01 - 4:06(视频)理查德 拉希德:现在,
我要做的最后一步是 -
4:06 - 4:11用汉语和大家说话
-
4:11 - 4:19在这之前,我们已经通过很多说汉语的人
收集了大量信息 -
4:19 - 4:21然后形成一个语音合成系统
-
4:21 - 4:26把汉字转换成汉语言
-
4:26 - 4:30之后我们收录了一个小时我的声音
-
4:30 - 4:36使声音合成系统的声音听起来像我
-
4:36 - 4:39再次,结果并不完美
-
4:39 - 4:42他们会有不少错误
-
4:42 - 4:44(中文)
-
4:44 - 4:49(掌声)
-
4:49 - 4:53在这个领域还有很多工作要做
-
4:53 - 4:57(中文)
-
4:57 - 5:01(掌声)
-
5:01 - 5:05杰里米 霍华德:这是在一个中国的机器学习会议上
-
5:05 - 5:09事实上,一般来说,你不会在学术会议上
听到如此热烈的掌声 -
5:09 - 5:13当然除了TEDx演讲可以随意鼓掌
-
5:13 - 5:15你所看到的一切都伴随着深入学习
-
5:15 - 5:17(掌声)谢谢
-
5:17 - 5:19对英文的转录是深入学习
-
5:19 - 5:23翻译成汉语以及屏幕右上方的文字是深入学习
-
5:23 - 5:26声音的合成也是深入学习
-
5:26 - 5:29深入学习就是这样神奇的事情
-
5:29 - 5:32这个单一的算法似乎可以做任何事情
-
5:32 - 5:35而且一年前我发现他甚至有视觉
-
5:35 - 5:38这个名不见经传的德国竞赛
-
5:38 - 5:40叫做德国交通标志识别基准
-
5:40 - 5:44深度学习已学得识别这些交通标识
-
5:44 - 5:47它不仅能够做的比其它算法好
-
5:47 - 5:50排行榜显示它比人更厉害
-
5:50 - 5:52是人的准确率的两倍
-
5:52 - 5:57到2011年,我们有了第一台视力高于人类的电脑
-
5:57 - 5:59从此更多的电脑也可以做到
-
5:59 - 6:04在2012年,谷歌宣布让一个深度学习的算法看YouTube视频
-
6:04 - 6:08收集16,000台电脑上的数据,为期一个月
-
6:08 - 6:14之后电脑便能仅通过看视频独立识别人和猫
-
6:14 - 6:16这近似于人类学习的过程
-
6:16 - 6:19人类不需要被告诉他们看到了什么
-
6:19 - 6:22而是在自己认知事物的过程中学习
-
6:22 - 6:26同样在2012年,杰弗里 辛顿,我们之前看到的人
-
6:26 - 6:29赢了很火的ImageNet比赛
-
6:29 - 6:34分辨出150万张图片的内容
-
6:34 - 6:39到2014年,我们已经将图像识别的误差
降低到百分之六 -
6:39 - 6:41低于人类误差率
-
6:41 - 6:47这项非凡的工作现在已经用于工业
-
6:47 - 6:50比如说,去年谷歌声明
-
6:50 - 6:55他们在两小时内把法国的每一个地点汇成地图
-
6:55 - 7:03他们是将街景填入深度学习算法以辨认街道号
-
7:03 - 7:08可以想象从前这件事要花费多少时间和精力
-
7:08 - 7:10同样的事情也发生在中国
-
7:10 - 7:14百度大概类似于中国的谷歌
-
7:14 - 7:17我们看到左上角
-
7:17 - 7:20是一张我上传到百度的深度学习系统的图片
-
7:20 - 7:24下面你可以看到系统理解了这张照片
-
7:24 - 7:26并且找到了类似的图片
-
7:26 - 7:29同样的背景
-
7:29 - 7:31同样的角度
-
7:31 - 7:33有的甚至也有伸出来的舌头
-
7:33 - 7:36网页上没有准确的文字
-
7:36 - 7:37我只是上传了图片
-
7:37 - 7:41所以说电脑能够真正理解它所看到的事物
-
7:41 - 7:46进而在数据库的几百万张图片中进行实时搜索
-
7:46 - 7:50就现在而言,电脑的视力意味着什么呢?
-
7:50 - 7:52事实上不仅仅是电脑能够看见
-
7:52 - 7:54深度学习其实可以做得更多
-
7:54 - 7:57像这样一个细小复杂的语句
-
7:57 - 7:59对深度学习来说是相对易于理解的
-
7:59 - 8:01你可以看到
-
8:01 - 8:07斯坦福基础系统显示上面的红点指出
这个语句表达的是否定语气 -
8:07 - 8:16深度学习在理解语句内容方面已经接近人类水平
-
8:16 - 8:22同样,深度学习在用于阅读汉语上已经相当于中国本土人水平
-
8:22 - 8:24这个算法开发于瑞士
-
8:24 - 8:27没有一个人懂汉语
-
8:27 - 8:37要我说,深度学习是比较于人类
做这件事最好的系统 -
8:37 - 8:40这个系统是在我们公司建立的
-
8:40 - 8:42它要把这些东西集合起来
-
8:42 - 8:44这些图片没有文字描述
-
8:44 - 8:47随着我在这输入文字
-
8:47 - 8:50同时它会了解这些图片
-
8:50 - 8:51理解它们是关于什么的
-
8:51 - 8:54然后找出和这些相似的图片
-
8:54 - 8:57所以你看,他真正在理解我的文字
-
8:57 - 8:59理解这些图片
-
8:59 - 9:02我知道你在谷歌上看到过类似的
-
9:02 - 9:05你可以输入文字,它会提供给你图片
-
9:05 - 9:08但实际上它是在网页上搜索文字
-
9:08 - 9:11这和理解图片是有很大不同的
-
9:11 - 9:17理解图片是电脑在过去几个月里才刚刚会做的事情
-
9:17 - 9:21电脑不仅有视力,而且能够阅读
-
9:21 - 9:25而且当然,电脑也能理解所听到的
-
9:25 - 9:28也许并不意外,我现在要告诉你们,电脑也可以写
-
9:28 - 9:33这是我昨天用深度学习算法写的文字
-
9:33 - 9:37这些是斯坦福的算法做的
-
9:37 - 9:43每一句话都是深度学习算法对图片进行的描述
-
9:43 - 9:48算法没见过一个穿黑衣服的男人弹吉他
-
9:48 - 9:50它见过男人,见过黑色
-
9:50 - 9:51见过吉他
-
9:51 - 9:56它便自己对这个图片作出了这样的描述
-
9:56 - 9:59我们还做不到完全和人类同等水平,
但我们已经很接近了 -
9:59 - 10:05统计表明,四分之一的人更喜欢电脑做的图片说明
-
10:05 - 10:07目前这个系统刚被开发两周之久
-
10:07 - 10:09所以按这个速度,估计明年
-
10:09 - 10:13电脑算法会超过人类水平
-
10:13 - 10:16电脑会写
-
10:16 - 10:20我们把这些都放在一起,会发现一个令人兴奋的机遇
-
10:20 - 10:21比如说,在医药业
-
10:21 - 10:24一个波士顿团队宣布
-
10:24 - 10:27他们发现了肿瘤的几十种临床表现
-
10:27 - 10:31帮助医生预测癌症
-
10:32 - 10:35同样的,在斯坦福
-
10:35 - 10:38一个团队宣布通过用放大镜观察组织
-
10:38 - 10:41开发了一个基于机器学习的系统
-
10:41 - 10:48可以比病理学家更有效地预测癌症患者的幸存率
-
10:48 - 10:51在这两个例子中,不仅预测更加准确
-
10:51 - 10:53而且他们创造了新的科学视角
-
10:53 - 10:55在放射学中
-
10:55 - 10:58新视角是人类可以明白的新临床表现
-
10:58 - 11:00在病理学中
-
11:00 - 11:04电脑发现癌细胞周围的细胞
-
11:04 - 11:09在诊断中同癌细胞一样重要
-
11:09 - 11:15这和病理学家几十年来的教学是相反的
-
11:15 - 11:18这两个案例中的系统都是由
-
11:18 - 11:22医学专家和机器学习专家共同开发的
-
11:22 - 11:24去年我们就已经超过了这个水平
-
11:24 - 11:30这个是用显微镜识别组织癌变区的例子
-
11:30 - 11:35所显示的这个系统能够与病理学专家同样准确地识别癌变区
-
11:35 - 11:38甚至比病理专家更准确
-
11:38 - 11:41但是建立系统的都是深度学习的专家
-
11:41 - 11:44没有一个医学专家
-
11:45 - 11:47类似的,这是神经细胞分裂
-
11:47 - 11:51我们已经可以和人类一样准确地分裂细胞
-
11:51 - 11:54但这是个深度学习系统
-
11:54 - 11:57没有一个开发者拥有医学背景
-
11:57 - 12:00对于我这个完全没有医学背景的人来说
-
12:00 - 12:04看起来我也完全可以开一个医药公司
-
12:04 - 12:06我确实这么做了
-
12:06 - 12:08我开始有点不知所措
-
12:08 - 12:11但理论上说这件事是可行的
-
12:11 - 12:16用这些数据分析技术制作医药
-
12:16 - 12:19所幸的是,反响非常好
-
12:19 - 12:21不仅是媒体的,包括医药行业
-
12:21 - 12:23都很支持
-
12:23 - 12:27理论表明我们可以将制药的中间过程
-
12:27 - 12:30充分转换成数据分析
-
12:30 - 12:33让医生去做他们最擅长的
-
12:33 - 12:35我有一个例子
-
12:35 - 12:40制作一个医学诊断测试需要十五分钟
-
12:40 - 12:42我会给你们实际展示
-
12:42 - 12:45但是我去掉了一部分,把它压缩到了三分钟
-
12:45 - 12:48不要医学诊断试验
-
12:48 - 12:52我要给你们展示制作一个汽车图片的诊断测试
-
12:52 - 12:54因为这个我们都能懂
-
12:54 - 12:57现在我们有150万张汽车图片
-
12:57 - 13:03我想要根据拍照的角度对他们进行分类
-
13:03 - 13:07这些图片完全没有标签,所以我要先对他们进行简单描述
-
13:07 - 13:08有深度学习算法
-
13:08 - 13:12它可以自动识别图片的结构要素
-
13:12 - 13:16令人高兴的是人和电脑可以合作
-
13:16 - 13:18你可以看到,这个人
-
13:18 - 13:21正在告诉电脑什么是感兴趣的要素
-
13:21 - 13:25为之后电脑用来完善算法
-
13:25 - 13:30现在,这些深度学习算法处在16,000维空间中
-
13:30 - 13:33所以你看到电脑让他们在这个空间中旋转
-
13:33 - 13:35尝试找到新的结构要素
-
13:35 - 13:37当他成功时
-
13:37 - 13:41开车的人就可以指出感兴趣的要素
-
13:41 - 13:43现在电脑成功找出这些要素
-
13:43 - 13:46比如,角度
-
13:46 - 13:47我们在这个过程中
-
13:47 - 13:50逐渐的告诉电脑更多
-
13:50 - 13:52我们想寻找的结构
-
13:52 - 13:54你可以想象一个诊断测试
-
13:54 - 13:57这就像是病理学家识别病态区域
-
13:57 - 14:02或者放射学专家找出潜在的问题囊肿
-
14:02 - 14:05有时候这对算法来说有些难度
-
14:05 - 14:07我们的例子就比较麻烦
-
14:07 - 14:09车的正面和背面全部混淆了
-
14:09 - 14:11所以我们要仔细一些
-
14:11 - 14:15人工地选出正面和背面
-
14:15 - 14:22人后告诉电脑这是我们所感兴趣的一类
-
14:22 - 14:24做这件事花了一些时间,所以我们跳过
-
14:24 - 14:28之后我们用这几百个东西训练机器学习算法
-
14:28 - 14:30希望他会有很大进步
-
14:30 - 14:34你能看到,它正在消退一些图片
-
14:34 - 14:38说明他已经开始可以自己理解这些图片了
-
14:38 - 14:41我们可以用相似图片的概念
-
14:41 - 14:43用相似的图片,你可以看到
-
14:43 - 14:47电脑现在能够只找出正面的车
-
14:47 - 14:50在这个时候,人可以告诉电脑
-
14:50 - 14:52对的,没错,你做的很好
-
14:54 - 14:56当然,有时,即使在这个阶段
-
14:56 - 15:00分组仍然是很困难的
-
15:00 - 15:03像我们这里,让电脑在这里旋转了一段时间了
-
15:03 - 15:08我们还是看到左面的和右面的图片有混淆
-
15:08 - 15:10所以我们可以再一次给电脑一些提示
-
15:10 - 15:18我们让它通过深度学习算法尽可能分离出左面和右面的图片
-
15:18 - 15:21有了这个指示——好的,它已经完成了
-
15:21 - 15:26它要想办法分开这一部分
-
15:26 - 15:29你现在知道了
-
15:29 - 15:37这不是电脑取代人类
-
15:37 - 15:40而是一起合作
-
15:40 - 15:45我们在做的是将过去需要五六人的团队
用七年时间做的事情 -
15:45 - 15:50变成只需一个人花十五分钟就能完成
-
15:50 - 15:54这个过程需要四到五次反复
-
15:54 - 15:59你可以看到我们已经将150万张图片的62%正确分类
-
15:59 - 16:03现在我们就可以快速地检查整个分组
-
16:03 - 16:06确保没有错误
-
16:06 - 16:10如果哪里有错误,我们可以告诉电脑
-
16:10 - 16:13每个分组我们都这样做
-
16:13 - 16:18现在这150万张图片已经达到80%的成功率
-
16:18 - 16:20现在这个阶段
-
16:20 - 16:23只需要找出几个不正确的分类
-
16:23 - 16:26并让电脑明白为什么
-
16:26 - 16:28到了这个步骤
-
16:28 - 16:32十五分钟后我们达到了97%的正确率
-
16:32 - 16:37这种技术能帮助我们解决一个问题
-
16:37 - 16:40医疗专家不足的问题
-
16:40 - 16:46世界经济论坛表明,在发展中国家,
内科医生有十倍到二十倍的短缺 -
16:46 - 16:51而弥补这一短缺需要300年的时间
-
16:51 - 16:56所以想象一下,是否我们能够用深度学习的方法
帮助他们提高效率? -
16:56 - 16:59我对这个机会表示很激动
-
16:59 - 17:01我同样的担心一些问题
-
17:01 - 17:04问题是在这张地图上的蓝色区域内
-
17:04 - 17:08服务占就业的80%以上
-
17:08 - 17:10什么是服务?
-
17:10 - 17:11这些是服务
-
17:11 - 17:16这些也是电脑才刚刚开始学习的事情
-
17:16 - 17:19也就是说世界上发达国家的80%的就业
-
17:19 - 17:22是电脑刚开始学习的
-
17:22 - 17:23这是什么意思?
-
17:23 - 17:26其实也没什么大不了的,他们会被其他职业替代
-
17:26 - 17:29比如说会有更多的数据学家
-
17:29 - 17:30也不尽然
-
17:30 - 17:33数据学家不需要太久的时间做这些事
-
17:33 - 17:36比如这四个算法都是同时一个人开发的
-
17:36 - 17:38如果你认为这些曾经都发生过
-
17:38 - 17:42我们看到过新的事物出现
-
17:42 - 17:44然后被新的职业所取代
-
17:44 - 17:46那这些新的职业又会是什么?
-
17:46 - 17:48很难做出估计
-
17:48 - 17:51因为人的能力以这个均匀的速度增长
-
17:51 - 17:54但是现在我们有了深度学习系统
-
17:54 - 17:57它的能力以指数方式增长
-
17:57 - 17:58我们现在在这
-
17:58 - 18:01目前,我们看周围的事物
-
18:01 - 18:03会说:“电脑还是很笨。”对吧?
-
18:03 - 18:07但是在五年内,电脑会超出这张图
-
18:07 - 18:11所以我们现在要开始考虑这样的能力了
-
18:11 - 18:13当然,我们曾经见过这个
-
18:13 - 18:14在工业革命时期
-
18:14 - 18:17发动机让生产力迈进一大步
-
18:18 - 18:21然而问题是,一段时间之后,形势转平了
-
18:21 - 18:23是由于社会的破坏
-
18:23 - 18:26但当发动机被普遍应用时
-
18:26 - 18:28一切都稳定下来了
-
18:28 - 18:30机器学习革命
-
18:30 - 18:33将和工业革命有很大不同
-
18:33 - 18:36因为机器学习革命不会停止
-
18:36 - 18:39电脑越擅长智能活动
-
18:39 - 18:43它们越能制造出更加擅长智能活动的电脑
-
18:43 - 18:47这将会是世界从未经历过的改变
-
18:47 - 18:51所以你之前理解的可能性是不一样的
-
18:51 - 18:53这正在影响我们的生活
-
18:53 - 18:56在过去的25年里,随着资本生产力的增加
-
18:56 - 19:01劳动生产力在变缓,甚至下降
-
19:01 - 19:04所以我希望可以发起大家的讨论
-
19:04 - 19:07我知道当我和人们讲述这样的处境时
-
19:07 - 19:09人们往往表现出不以为然
-
19:09 - 19:10电脑不会思考
-
19:10 - 19:13它们没有情感,也不懂诗
-
19:13 - 19:16它们甚至都不知道自己是如何运作的
-
19:16 - 19:17那又怎样?
-
19:17 - 19:19电脑现在可以做
-
19:19 - 19:22人类用大部分有偿的劳动时间做的事情
-
19:22 - 19:24所以现在该到我们思考
-
19:24 - 19:28我们将如何调整我们的社会结构和经济结构
-
19:28 - 19:30来应对新形势
-
19:30 - 19:31谢谢
-
19:31 - 19:32(鼓掌)
- Title:
- 会学习的电脑带来的美好和恐怖
- Speaker:
- 杰里米 霍华德
- Description:
-
如果我们教电脑学习会发生什么?技术专家杰里米 霍华德分享了一些快速发展的深度学习领域里令人惊奇的新发展,让计算机能够学习汉语,识别物体和图片,或者帮助医疗诊断。(一个深度学习工具在看了一个小时YouTube视频后,教会自己“猫”这个概念。)深度学习会改变你身边的电脑得行为...远比你想象的要快。
- Video Language:
- English
- Team:
- closed TED
- Project:
- TEDTalks
- Duration:
- 19:45
Tony Yet approved Chinese, Simplified subtitles for The wonderful and terrifying implications of computers that can learn | ||
Tony Yet edited Chinese, Simplified subtitles for The wonderful and terrifying implications of computers that can learn | ||
Tony Yet edited Chinese, Simplified subtitles for The wonderful and terrifying implications of computers that can learn | ||
Tony Yet edited Chinese, Simplified subtitles for The wonderful and terrifying implications of computers that can learn | ||
Li Li edited Chinese, Simplified subtitles for The wonderful and terrifying implications of computers that can learn | ||
Li Li edited Chinese, Simplified subtitles for The wonderful and terrifying implications of computers that can learn | ||
Li Li accepted Chinese, Simplified subtitles for The wonderful and terrifying implications of computers that can learn | ||
Yuchen Shen edited Chinese, Simplified subtitles for The wonderful and terrifying implications of computers that can learn |