[Script Info] Title: [Events] Format: Layer, Start, End, Style, Name, MarginL, MarginR, MarginV, Effect, Text Dialogue: 0,0:00:00.80,0:00:03.95,Default,,0000,0000,0000,,我在谷歌领导着一个\N机器智能的项目组, Dialogue: 0,0:00:03.95,0:00:08.66,Default,,0000,0000,0000,,换句话说,利用工程学原理制造出 Dialogue: 0,0:00:08.66,0:00:11.04,Default,,0000,0000,0000,,能够像人脑一样\N完成某些任务的电脑和设备。 Dialogue: 0,0:00:11.44,0:00:14.60,Default,,0000,0000,0000,,这也使我们对人类的\N大脑以及神经科学 Dialogue: 0,0:00:14.60,0:00:15.87,Default,,0000,0000,0000,,产生了兴趣, Dialogue: 0,0:00:15.88,0:00:20.09,Default,,0000,0000,0000,,尤其在那些大脑的表现 Dialogue: 0,0:00:20.09,0:00:24.11,Default,,0000,0000,0000,,比电脑强太多的领域。 Dialogue: 0,0:00:25.21,0:00:28.92,Default,,0000,0000,0000,,长期以来,我们研究的\N其中一个领域便是感知, Dialogue: 0,0:00:28.92,0:00:31.86,Default,,0000,0000,0000,,一种将外界事物—— Dialogue: 0,0:00:31.86,0:00:33.54,Default,,0000,0000,0000,,比如图像或声音— Dialogue: 0,0:00:33.54,0:00:35.69,Default,,0000,0000,0000,,转化为大脑内概念的过程。 Dialogue: 0,0:00:36.24,0:00:38.90,Default,,0000,0000,0000,,这对我们的大脑很重要, Dialogue: 0,0:00:38.90,0:00:41.24,Default,,0000,0000,0000,,对计算机的作用也非同小可。 Dialogue: 0,0:00:41.64,0:00:44.79,Default,,0000,0000,0000,,例如,我们团队开发的机器感知算法 Dialogue: 0,0:00:44.79,0:00:48.92,Default,,0000,0000,0000,,会根据图片的内容\N让你在谷歌相册的图片\N Dialogue: 0,0:00:48.92,0:00:50.30,Default,,0000,0000,0000,,出现在搜索结果中。 Dialogue: 0,0:00:51.59,0:00:55.16,Default,,0000,0000,0000,,感知的另一方面是创意: Dialogue: 0,0:00:55.16,0:00:58.20,Default,,0000,0000,0000,,将概念变成现实。 Dialogue: 0,0:00:58.20,0:01:01.77,Default,,0000,0000,0000,,因此,这些年我们\N在机器感知能力方面的工作 Dialogue: 0,0:01:01.77,0:01:06.69,Default,,0000,0000,0000,,也意外地跟机器创意以及机器艺术 Dialogue: 0,0:01:06.69,0:01:07.80,Default,,0000,0000,0000,,联系在了一起。 Dialogue: 0,0:01:08.56,0:01:11.89,Default,,0000,0000,0000,,我觉得米开朗基罗对感知和创意 Dialogue: 0,0:01:11.89,0:01:15.52,Default,,0000,0000,0000,,之间的双重关系有着深刻的见解。 Dialogue: 0,0:01:16.02,0:01:18.10,Default,,0000,0000,0000,,他有一句名言: Dialogue: 0,0:01:18.10,0:01:21.38,Default,,0000,0000,0000,,“每一块石头里都藏着一尊雕像, Dialogue: 0,0:01:22.04,0:01:25.04,Default,,0000,0000,0000,,而雕塑家的工作就是去发现它。” Dialogue: 0,0:01:26.03,0:01:29.28,Default,,0000,0000,0000,,我想米开朗基罗意思是 Dialogue: 0,0:01:29.28,0:01:32.49,Default,,0000,0000,0000,,我们通过感知来创造, Dialogue: 0,0:01:32.49,0:01:35.54,Default,,0000,0000,0000,,而感知本身是想象力的表现, Dialogue: 0,0:01:35.54,0:01:37.98,Default,,0000,0000,0000,,以及创意的来源。 Dialogue: 0,0:01:38.69,0:01:42.67,Default,,0000,0000,0000,,而进行思考、感知和想象的器官, Dialogue: 0,0:01:42.67,0:01:44.23,Default,,0000,0000,0000,,毫无疑问,就是大脑。 Dialogue: 0,0:01:45.09,0:01:47.68,Default,,0000,0000,0000,,我想先简单地谈一谈 Dialogue: 0,0:01:47.68,0:01:49.96,Default,,0000,0000,0000,,我们对大脑的了解。 Dialogue: 0,0:01:50.50,0:01:53.01,Default,,0000,0000,0000,,因为不像心脏或其它内脏, Dialogue: 0,0:01:53.01,0:01:56.16,Default,,0000,0000,0000,,你无法仅仅通过观察\N就能看出点什么来, Dialogue: 0,0:01:56.16,0:01:57.55,Default,,0000,0000,0000,,至少仅凭肉眼看不出来。 Dialogue: 0,0:01:57.98,0:02:00.45,Default,,0000,0000,0000,,早期的解剖学家看着大脑, Dialogue: 0,0:02:00.45,0:02:04.26,Default,,0000,0000,0000,,给它的表面结构\N取了各种充满想象力的名字。 Dialogue: 0,0:02:04.26,0:02:06.72,Default,,0000,0000,0000,,比如说海马体,意思是“小虾子”。 Dialogue: 0,0:02:06.72,0:02:09.38,Default,,0000,0000,0000,,但这些并不能告诉我们 Dialogue: 0,0:02:09.38,0:02:11.82,Default,,0000,0000,0000,,大脑里面究竟是怎样工作的。 Dialogue: 0,0:02:12.78,0:02:16.42,Default,,0000,0000,0000,,我认为第一个真正对大脑的工作方式 Dialogue: 0,0:02:16.42,0:02:18.38,Default,,0000,0000,0000,,有所洞悉的人, Dialogue: 0,0:02:18.38,0:02:22.34,Default,,0000,0000,0000,,是19世纪西班牙\N伟大的神经解剖学家 Dialogue: 0,0:02:22.34,0:02:23.84,Default,,0000,0000,0000,,圣地亚哥 · 拉蒙 · 卡哈尔\N(Santiago Ramón y Cajal), Dialogue: 0,0:02:23.84,0:02:27.69,Default,,0000,0000,0000,,他使用了显微镜以及某种特殊染色剂, Dialogue: 0,0:02:27.69,0:02:31.89,Default,,0000,0000,0000,,有选择性地将大脑中的\N单个细胞填充或者渲染上 Dialogue: 0,0:02:31.89,0:02:33.85,Default,,0000,0000,0000,,高对比度的颜色, Dialogue: 0,0:02:33.85,0:02:37.04,Default,,0000,0000,0000,,以便了解它们的形态。 Dialogue: 0,0:02:37.97,0:02:40.86,Default,,0000,0000,0000,,这些就是他在19世纪 Dialogue: 0,0:02:40.86,0:02:42.09,Default,,0000,0000,0000,,完成的的神经元手绘图。 Dialogue: 0,0:02:42.09,0:02:44.08,Default,,0000,0000,0000,,这是一只鸟的大脑。 Dialogue: 0,0:02:44.08,0:02:47.02,Default,,0000,0000,0000,,能看到这些形态各异的细胞, Dialogue: 0,0:02:47.02,0:02:50.54,Default,,0000,0000,0000,,甚至在当时对细胞学说\N本身还是新鲜事物。 Dialogue: 0,0:02:50.54,0:02:51.84,Default,,0000,0000,0000,,而这些结构, Dialogue: 0,0:02:51.84,0:02:54.17,Default,,0000,0000,0000,,像树枝一样分岔, Dialogue: 0,0:02:54.17,0:02:56.42,Default,,0000,0000,0000,,能够延伸到很长的距离—— Dialogue: 0,0:02:56.42,0:02:58.40,Default,,0000,0000,0000,,这些在当时都是闻所未闻。 Dialogue: 0,0:02:58.78,0:03:01.71,Default,,0000,0000,0000,,他们让人联想到的,当然是电线。 Dialogue: 0,0:03:01.71,0:03:05.16,Default,,0000,0000,0000,,这对于很多19世纪的人\N来说是显而易见的, Dialogue: 0,0:03:05.19,0:03:09.50,Default,,0000,0000,0000,,因为那时电线和电力革命刚刚兴起。 Dialogue: 0,0:03:09.96,0:03:11.20,Default,,0000,0000,0000,,但是在许多方面 Dialogue: 0,0:03:11.20,0:03:14.46,Default,,0000,0000,0000,,拉蒙 · 卡哈尔的神经解剖学\N绘画,比如这一张, Dialogue: 0,0:03:14.46,0:03:16.88,Default,,0000,0000,0000,,从某些方面来说是很卓越的。 Dialogue: 0,0:03:16.88,0:03:18.74,Default,,0000,0000,0000,,一个多世纪后的我们,仍然在继续 Dialogue: 0,0:03:18.74,0:03:21.60,Default,,0000,0000,0000,,尝试完成拉蒙 · 卡哈尔开启的事业。 Dialogue: 0,0:03:21.60,0:03:24.74,Default,,0000,0000,0000,,提供这些原始数据的,是我们来自 Dialogue: 0,0:03:24.74,0:03:27.68,Default,,0000,0000,0000,,马克斯 · 普朗克\N神经科学研究所的合作者。 Dialogue: 0,0:03:27.68,0:03:29.43,Default,,0000,0000,0000,,他们的工作 Dialogue: 0,0:03:29.43,0:03:34.54,Default,,0000,0000,0000,,是对那些小块的脑组织进行成像。 Dialogue: 0,0:03:34.54,0:03:37.84,Default,,0000,0000,0000,,这一整个样品的大小\N是1立方毫米左右, Dialogue: 0,0:03:37.84,0:03:40.52,Default,,0000,0000,0000,,而我展示的只是它上面\N很小很小的一块区域。 Dialogue: 0,0:03:40.52,0:03:42.91,Default,,0000,0000,0000,,左边那段比例尺的长度是1微米。 Dialogue: 0,0:03:42.91,0:03:45.25,Default,,0000,0000,0000,,你看到的这个结构 Dialogue: 0,0:03:45.25,0:03:47.36,Default,,0000,0000,0000,,是一个细菌大小的线粒体。 Dialogue: 0,0:03:47.36,0:03:49.00,Default,,0000,0000,0000,,这些是利用这个非常微小的组织 Dialogue: 0,0:03:49.00,0:03:52.12,Default,,0000,0000,0000,,所制作成的连续的切片。 Dialogue: 0,0:03:52.12,0:03:54.54,Default,,0000,0000,0000,,我们来做个对比。 Dialogue: 0,0:03:54.54,0:03:58.41,Default,,0000,0000,0000,,通常一根头发的直径是\N100微米左右。 Dialogue: 0,0:03:58.41,0:04:00.59,Default,,0000,0000,0000,,所以我们看到的东西 Dialogue: 0,0:04:00.59,0:04:02.03,Default,,0000,0000,0000,,比一根头发丝还要细很多。 Dialogue: 0,0:04:02.03,0:04:06.09,Default,,0000,0000,0000,,通过这些连续的电子显微镜切片, Dialogue: 0,0:04:06.09,0:04:11.16,Default,,0000,0000,0000,,人们可以重构出类似这样的\N神经元三维图像。 Dialogue: 0,0:04:11.16,0:04:14.35,Default,,0000,0000,0000,,某种程度上,这跟拉蒙 · 卡哈尔\N所用的方式是一样的。 Dialogue: 0,0:04:14.35,0:04:15.87,Default,,0000,0000,0000,,我们只对少量的神经元进行了突出显示, Dialogue: 0,0:04:15.87,0:04:18.61,Default,,0000,0000,0000,,否则我们不可能看到任何东西, Dialogue: 0,0:04:18.61,0:04:19.100,Default,,0000,0000,0000,,因为那样一来画面会很拥挤, Dialogue: 0,0:04:19.100,0:04:21.57,Default,,0000,0000,0000,,充满了组织结构, Dialogue: 0,0:04:21.57,0:04:24.07,Default,,0000,0000,0000,,充满了各个神经元间\N纵横交错的通路。 Dialogue: 0,0:04:25.29,0:04:28.14,Default,,0000,0000,0000,,显然,拉蒙 · 卡哈尔\N有一点超前于他的时代, Dialogue: 0,0:04:28.14,0:04:30.84,Default,,0000,0000,0000,,接下来的几十年间 Dialogue: 0,0:04:30.84,0:04:32.97,Default,,0000,0000,0000,,人们对大脑的理解进展非常缓慢。 Dialogue: 0,0:04:33.46,0:04:36.29,Default,,0000,0000,0000,,但是我们已经知道,\N神经元通过电流传导信息, Dialogue: 0,0:04:36.29,0:04:39.33,Default,,0000,0000,0000,,而到二战时,我们的技术\N已取得了长足的进步, Dialogue: 0,0:04:39.33,0:04:42.16,Default,,0000,0000,0000,,可以开始在活的\N神经元细胞上做电流实验, Dialogue: 0,0:04:42.16,0:04:44.23,Default,,0000,0000,0000,,以便更好地理解它们的工作原理。 Dialogue: 0,0:04:44.63,0:04:49.04,Default,,0000,0000,0000,,而电脑也正是在\N这个时候被发明了出来, Dialogue: 0,0:04:49.04,0:04:52.20,Default,,0000,0000,0000,,它的发明是基于对大脑的模拟—— Dialogue: 0,0:04:52.20,0:04:55.27,Default,,0000,0000,0000,,也就是阿兰 · 图灵\N所称的“智能机器”理念, Dialogue: 0,0:04:55.27,0:04:57.24,Default,,0000,0000,0000,,图灵是计算机科学的开创者之一。 Dialogue: 0,0:04:57.92,0:05:02.54,Default,,0000,0000,0000,,沃伦 · 麦卡洛克(Warren McCulloch)和\N沃尔特 · 皮兹(Walter Pitts)看到了 Dialogue: 0,0:05:02.54,0:05:03.94,Default,,0000,0000,0000,,拉蒙 · 卡哈尔所画的\N大脑视觉皮层, Dialogue: 0,0:05:03.94,0:05:05.58,Default,,0000,0000,0000,,就是我给你们看的这个。 Dialogue: 0,0:05:05.58,0:05:09.95,Default,,0000,0000,0000,,这是负责处理我们视觉信息的大脑皮层。 Dialogue: 0,0:05:10.42,0:05:13.93,Default,,0000,0000,0000,,对他们来说,这看起来像一个电路图。 Dialogue: 0,0:05:14.35,0:05:18.24,Default,,0000,0000,0000,,在麦卡洛克和皮兹的电路图上, Dialogue: 0,0:05:18.24,0:05:19.56,Default,,0000,0000,0000,,有许多细节并不是那么正确。 Dialogue: 0,0:05:19.56,0:05:20.97,Default,,0000,0000,0000,,但基本概念是对的, Dialogue: 0,0:05:20.97,0:05:24.91,Default,,0000,0000,0000,,他们认为视觉皮层工作起来\N就像一系列计算机元件 Dialogue: 0,0:05:24.91,0:05:27.67,Default,,0000,0000,0000,,在同一个层级中传递信息, Dialogue: 0,0:05:27.67,0:05:29.30,Default,,0000,0000,0000,,这一点是对的。 Dialogue: 0,0:05:29.30,0:05:31.67,Default,,0000,0000,0000,,我们再聊一聊 Dialogue: 0,0:05:31.67,0:05:35.66,Default,,0000,0000,0000,,视觉信息处理模型需要做些什么。 Dialogue: 0,0:05:36.23,0:05:39.04,Default,,0000,0000,0000,,感知的基本任务就是 Dialogue: 0,0:05:39.04,0:05:43.17,Default,,0000,0000,0000,,抓取这样的图像并且告诉我们 Dialogue: 0,0:05:43.17,0:05:44.38,Default,,0000,0000,0000,,“这是一只鸟”, Dialogue: 0,0:05:44.39,0:05:47.34,Default,,0000,0000,0000,,这对我们的大脑来说非常简单。 Dialogue: 0,0:05:47.34,0:05:50.76,Default,,0000,0000,0000,,但对一台电脑来说, Dialogue: 0,0:05:50.76,0:05:53.87,Default,,0000,0000,0000,,在几年前,这还是完全不可能的事。 Dialogue: 0,0:05:53.87,0:05:55.85,Default,,0000,0000,0000,,传统的计算模式 Dialogue: 0,0:05:55.85,0:05:58.31,Default,,0000,0000,0000,,很难完成这个任务。 Dialogue: 0,0:05:59.37,0:06:01.96,Default,,0000,0000,0000,,像素、鸟的图像以及“鸟”这个词, Dialogue: 0,0:06:01.96,0:06:05.91,Default,,0000,0000,0000,,这三者之间所产生的联系, Dialogue: 0,0:06:05.91,0:06:08.79,Default,,0000,0000,0000,,本质上是在一个神经网络中各神经元 Dialogue: 0,0:06:08.79,0:06:09.90,Default,,0000,0000,0000,,相互连接的结果, Dialogue: 0,0:06:09.90,0:06:11.29,Default,,0000,0000,0000,,正如这张图所示。 Dialogue: 0,0:06:11.29,0:06:14.61,Default,,0000,0000,0000,,这种神经网络可能是生物学上的,\N存在于我们大脑视觉皮层里, Dialogue: 0,0:06:14.61,0:06:16.78,Default,,0000,0000,0000,,或者,现如今我们开始有能力 Dialogue: 0,0:06:16.78,0:06:19.19,Default,,0000,0000,0000,,在电脑上模拟这种神经网络。 Dialogue: 0,0:06:19.83,0:06:22.22,Default,,0000,0000,0000,,我们来看一下它的工作原理。 Dialogue: 0,0:06:22.22,0:06:25.66,Default,,0000,0000,0000,,可以将像素想像成第一层的神经元, Dialogue: 0,0:06:25.66,0:06:27.86,Default,,0000,0000,0000,,这实际上就是在\N眼睛内部的工作原理—— Dialogue: 0,0:06:27.86,0:06:29.62,Default,,0000,0000,0000,,是视网膜上的神经元。 Dialogue: 0,0:06:29.62,0:06:31.18,Default,,0000,0000,0000,,然后这些前馈信息 Dialogue: 0,0:06:31.18,0:06:34.53,Default,,0000,0000,0000,,通过一层层神经元往下传递, Dialogue: 0,0:06:34.53,0:06:37.62,Default,,0000,0000,0000,,这些神经元通过突触彼此连接。 Dialogue: 0,0:06:37.62,0:06:39.02,Default,,0000,0000,0000,,这个神经网络的行为 Dialogue: 0,0:06:39.02,0:06:42.29,Default,,0000,0000,0000,,是通过所有这些突触的强度来表达的, Dialogue: 0,0:06:42.29,0:06:45.58,Default,,0000,0000,0000,,也塑造了这个网络的计算性能。 Dialogue: 0,0:06:45.59,0:06:47.04,Default,,0000,0000,0000,,最终, Dialogue: 0,0:06:47.04,0:06:49.59,Default,,0000,0000,0000,,一个或者一小群神经元 Dialogue: 0,0:06:49.59,0:06:51.20,Default,,0000,0000,0000,,会亮起来,说,“鸟”。 Dialogue: 0,0:06:51.82,0:06:55.03,Default,,0000,0000,0000,,接下来我会将这三部分—— Dialogue: 0,0:06:55.03,0:06:59.71,Default,,0000,0000,0000,,输入的像素,神经网络中的突触, Dialogue: 0,0:06:59.71,0:07:01.32,Default,,0000,0000,0000,,以及“鸟”,这个输出结果—— Dialogue: 0,0:07:01.32,0:07:04.37,Default,,0000,0000,0000,,用三个变量来表示:x、w和y。 Dialogue: 0,0:07:04.85,0:07:06.69,Default,,0000,0000,0000,,在那张图片上可能会有一百万个x—— Dialogue: 0,0:07:06.69,0:07:08.62,Default,,0000,0000,0000,,代表一百万个像素点。 Dialogue: 0,0:07:08.62,0:07:11.15,Default,,0000,0000,0000,,然后有几十亿或几万亿的w, Dialogue: 0,0:07:11.15,0:07:14.55,Default,,0000,0000,0000,,代表着神经网络中所有突触的权重。 Dialogue: 0,0:07:14.55,0:07:16.52,Default,,0000,0000,0000,,只有很少数量的y, Dialogue: 0,0:07:16.52,0:07:18.39,Default,,0000,0000,0000,,代表整个网络的输出结果。 Dialogue: 0,0:07:18.39,0:07:20.11,Default,,0000,0000,0000,,“Bird(鸟)"这个单词\N只有四个字母,对吧? Dialogue: 0,0:07:21.09,0:07:24.55,Default,,0000,0000,0000,,我们假定这只是一个很简单的公式 Dialogue: 0,0:07:24.55,0:07:26.70,Default,,0000,0000,0000,,x 乘以 w 等于 y。 Dialogue: 0,0:07:26.70,0:07:28.74,Default,,0000,0000,0000,,我把乘号打上了引号, Dialogue: 0,0:07:28.74,0:07:31.10,Default,,0000,0000,0000,,因为实际的过程要复杂得多。 Dialogue: 0,0:07:31.10,0:07:34.14,Default,,0000,0000,0000,,牵涉到一系列非常复杂的数学运算。 Dialogue: 0,0:07:35.17,0:07:36.41,Default,,0000,0000,0000,,这是一个方程式, Dialogue: 0,0:07:36.42,0:07:38.15,Default,,0000,0000,0000,,有三个变量。 Dialogue: 0,0:07:38.15,0:07:40.88,Default,,0000,0000,0000,,而我们知道在一个方程式中 Dialogue: 0,0:07:40.88,0:07:44.50,Default,,0000,0000,0000,,通过两个已知数\N你就能算出另一个未知数。 Dialogue: 0,0:07:45.16,0:07:48.61,Default,,0000,0000,0000,,所以这道推论题, Dialogue: 0,0:07:48.61,0:07:51.46,Default,,0000,0000,0000,,即判断出图中是一只鸟, Dialogue: 0,0:07:51.46,0:07:52.75,Default,,0000,0000,0000,,可以这样来描述: Dialogue: 0,0:07:52.76,0:07:56.27,Default,,0000,0000,0000,,y是未知数,w跟x都是已知数。 Dialogue: 0,0:07:56.27,0:07:58.82,Default,,0000,0000,0000,,也就是神经网络和像素是已知的。 Dialogue: 0,0:07:58.82,0:08:01.62,Default,,0000,0000,0000,,实际上这是一个相当简单的问题。 Dialogue: 0,0:08:01.62,0:08:04.26,Default,,0000,0000,0000,,你只需要用2乘以3,就完事儿了。 Dialogue: 0,0:08:04.86,0:08:07.02,Default,,0000,0000,0000,,我会给你们展示我们最近\N完成的人工神经网络, Dialogue: 0,0:08:07.02,0:08:09.30,Default,,0000,0000,0000,,它的工作原理正是如此。 Dialogue: 0,0:08:09.63,0:08:12.52,Default,,0000,0000,0000,,这是在一台在手机上\N实时运行的神经网络, Dialogue: 0,0:08:12.52,0:08:15.90,Default,,0000,0000,0000,,当然,令人惊叹的是它自身的运算能力, Dialogue: 0,0:08:15.90,0:08:18.82,Default,,0000,0000,0000,,每秒钟可以进行\N几十亿甚至几万亿次的 Dialogue: 0,0:08:18.82,0:08:20.63,Default,,0000,0000,0000,,运算。 Dialogue: 0,0:08:20.63,0:08:22.30,Default,,0000,0000,0000,,你所看到的是一台手机的 Dialogue: 0,0:08:22.30,0:08:25.88,Default,,0000,0000,0000,,相机对准了一张张含有鸟的图片, Dialogue: 0,0:08:25.88,0:08:28.52,Default,,0000,0000,0000,,并且它不只能判断出,\N“是的,这是一只鸟”, Dialogue: 0,0:08:28.52,0:08:32.36,Default,,0000,0000,0000,,而且还能用这种网络\N来判断这些鸟的种类。 Dialogue: 0,0:08:32.89,0:08:34.78,Default,,0000,0000,0000,,因此在这张图片中, Dialogue: 0,0:08:34.78,0:08:38.63,Default,,0000,0000,0000,,x和w是已知的,y是未知的。 Dialogue: 0,0:08:38.63,0:08:41.11,Default,,0000,0000,0000,,当然,我省略了非常复杂的那一部分, Dialogue: 0,0:08:41.11,0:08:44.95,Default,,0000,0000,0000,,也就是我们如何判断出w? Dialogue: 0,0:08:44.95,0:08:47.22,Default,,0000,0000,0000,,为什么大脑能做出这样的判断? Dialogue: 0,0:08:47.22,0:08:49.03,Default,,0000,0000,0000,,我们是如何学会这种模式的? Dialogue: 0,0:08:49.42,0:08:52.64,Default,,0000,0000,0000,,在学习以及解出w的过程中, Dialogue: 0,0:08:52.64,0:08:55.36,Default,,0000,0000,0000,,如果我们使用简单的等式 Dialogue: 0,0:08:55.36,0:08:57.26,Default,,0000,0000,0000,,将这些都想象成数字, Dialogue: 0,0:08:57.26,0:09:00.05,Default,,0000,0000,0000,,那这道题就简单了: 6 = 2 x W, Dialogue: 0,0:09:00.05,0:09:03.39,Default,,0000,0000,0000,,那么,用6除以2就可以得出答案。 Dialogue: 0,0:09:04.00,0:09:06.22,Default,,0000,0000,0000,,现在的问题就是这个运算符号。 Dialogue: 0,0:09:06.82,0:09:07.97,Default,,0000,0000,0000,,除法—— Dialogue: 0,0:09:07.97,0:09:10.53,Default,,0000,0000,0000,,我们用除法是因为它是乘法的逆运算。 Dialogue: 0,0:09:10.53,0:09:12.52,Default,,0000,0000,0000,,但就像我刚才说的, Dialogue: 0,0:09:12.52,0:09:15.09,Default,,0000,0000,0000,,乘法表述在这里其实不太准确。 Dialogue: 0,0:09:15.09,0:09:18.41,Default,,0000,0000,0000,,这是一个非常非常\N复杂的非线性运算, Dialogue: 0,0:09:18.41,0:09:20.17,Default,,0000,0000,0000,,它没有逆运算。 Dialogue: 0,0:09:20.17,0:09:23.35,Default,,0000,0000,0000,,所以我们要找出一个不使用除号 Dialogue: 0,0:09:23.35,0:09:25.41,Default,,0000,0000,0000,,就能解出这个方程式的方法。 Dialogue: 0,0:09:25.41,0:09:27.65,Default,,0000,0000,0000,,其实非常简单。 Dialogue: 0,0:09:27.65,0:09:30.47,Default,,0000,0000,0000,,只需要使用一点代数上的小技巧, Dialogue: 0,0:09:30.47,0:09:33.40,Default,,0000,0000,0000,,将6移到等式的右边。 Dialogue: 0,0:09:33.40,0:09:35.20,Default,,0000,0000,0000,,现在我们仍然使用乘法。 Dialogue: 0,0:09:35.68,0:09:39.30,Default,,0000,0000,0000,,而这个0——我们就当它是一个误差。 Dialogue: 0,0:09:39.30,0:09:41.84,Default,,0000,0000,0000,,换句话说,如果我们\N能用正确的方法解出w, Dialogue: 0,0:09:41.84,0:09:43.50,Default,,0000,0000,0000,,那么这个误差就为0。 Dialogue: 0,0:09:43.50,0:09:45.32,Default,,0000,0000,0000,,如果我们没有找到正确的答案, Dialogue: 0,0:09:45.32,0:09:47.12,Default,,0000,0000,0000,,那么这个误差就会大于0。 Dialogue: 0,0:09:47.12,0:09:50.64,Default,,0000,0000,0000,,所以现在我们可以通过\N假设去缩小这个误差, Dialogue: 0,0:09:50.64,0:09:52.95,Default,,0000,0000,0000,,而这正是电脑所擅长的。 Dialogue: 0,0:09:52.95,0:09:54.15,Default,,0000,0000,0000,,比如你最开始假设: Dialogue: 0,0:09:54.15,0:09:54.96,Default,,0000,0000,0000,,如果w = 0呢? Dialogue: 0,0:09:54.96,0:09:56.12,Default,,0000,0000,0000,,那么误差就为6。 Dialogue: 0,0:09:56.12,0:09:58.64,Default,,0000,0000,0000,,如果w = 1呢?误差就变成了4。 Dialogue: 0,0:09:58.64,0:10:01.25,Default,,0000,0000,0000,,然后电脑就像玩游戏一样不断测试, Dialogue: 0,0:10:01.26,0:10:03.65,Default,,0000,0000,0000,,将误差降低到接近于0。 Dialogue: 0,0:10:03.65,0:10:06.96,Default,,0000,0000,0000,,这样就逐步逼近了w的值。 Dialogue: 0,0:10:06.96,0:10:10.80,Default,,0000,0000,0000,,通常来说,它不可能获得完全精确的值,\N但是经过很多步运算以后, Dialogue: 0,0:10:10.80,0:10:15.35,Default,,0000,0000,0000,,我们得到了 w = 2.999,\N已经足够精确了。 Dialogue: 0,0:10:16.30,0:10:18.16,Default,,0000,0000,0000,,以上就是这个学习过程。 Dialogue: 0,0:10:18.16,0:10:20.90,Default,,0000,0000,0000,,大家回想一下刚刚我们所做的, Dialogue: 0,0:10:20.90,0:10:25.34,Default,,0000,0000,0000,,我们用了很多已知的x和y的值, Dialogue: 0,0:10:25.34,0:10:28.79,Default,,0000,0000,0000,,通过迭代法去解出中间的w, Dialogue: 0,0:10:28.79,0:10:32.30,Default,,0000,0000,0000,,这也正是我们自己\N在学习时所使用的方法。 Dialogue: 0,0:10:32.30,0:10:34.64,Default,,0000,0000,0000,,在我们很小的时候,\N会看到很多很多图像, Dialogue: 0,0:10:34.64,0:10:37.24,Default,,0000,0000,0000,,然后有人告诉我们:\N“这个是鸟,这个不是鸟。” Dialogue: 0,0:10:37.71,0:10:39.81,Default,,0000,0000,0000,,经过一段时间的重复, Dialogue: 0,0:10:39.81,0:10:42.76,Default,,0000,0000,0000,,我们解出了w,建立起了\N神经元之间的连接。 Dialogue: 0,0:10:43.46,0:10:47.79,Default,,0000,0000,0000,,那么现在,我们有了确定的\Nx和w。再要去解出Y Dialogue: 0,0:10:47.79,0:10:49.37,Default,,0000,0000,0000,,就会非常快了。 Dialogue: 0,0:10:49.37,0:10:51.19,Default,,0000,0000,0000,,我们找到解出w的方法, Dialogue: 0,0:10:51.19,0:10:53.21,Default,,0000,0000,0000,,这是一种学习,要困难得多, Dialogue: 0,0:10:53.21,0:10:54.86,Default,,0000,0000,0000,,因为我们要用很多的训练样本, Dialogue: 0,0:10:54.86,0:10:56.82,Default,,0000,0000,0000,,去将误差最小化。 Dialogue: 0,0:10:56.82,0:11:00.05,Default,,0000,0000,0000,,一年前,我们团队的\N亚历克斯 · 莫尔德温采夫 Dialogue: 0,0:11:00.05,0:11:03.60,Default,,0000,0000,0000,,决定做一个实验,\N看如果给定已知的w和y, Dialogue: 0,0:11:03.60,0:11:05.70,Default,,0000,0000,0000,,去解出x,会发生什么。 Dialogue: 0,0:11:06.12,0:11:07.11,Default,,0000,0000,0000,,换句话说, Dialogue: 0,0:11:07.11,0:11:08.67,Default,,0000,0000,0000,,你已经知道那是一只鸟 Dialogue: 0,0:11:08.68,0:11:11.96,Default,,0000,0000,0000,,并且也有一个接受过\N鸟类识别训练的神经网络, Dialogue: 0,0:11:11.96,0:11:14.35,Default,,0000,0000,0000,,那么一只鸟的图像是怎样的呢? Dialogue: 0,0:11:15.03,0:11:20.08,Default,,0000,0000,0000,,我们发现,通过运用相同的\N将误差最小化的步骤, Dialogue: 0,0:11:20.08,0:11:23.56,Default,,0000,0000,0000,,加上一个受过鸟类识别\N训练的神经网络, Dialogue: 0,0:11:23.56,0:11:26.92,Default,,0000,0000,0000,,我们就可以得到 Dialogue: 0,0:11:30.40,0:11:31.70,Default,,0000,0000,0000,,一张含有鸟的图片。 Dialogue: 0,0:11:32.81,0:11:36.52,Default,,0000,0000,0000,,这是一张由一个进行过\N鸟类识别训练的 Dialogue: 0,0:11:36.52,0:11:38.44,Default,,0000,0000,0000,,神经网络所生成的鸟的图片, Dialogue: 0,0:11:38.44,0:11:41.91,Default,,0000,0000,0000,,仅仅是通过解出x,而不是y, Dialogue: 0,0:11:41.91,0:11:43.28,Default,,0000,0000,0000,,并且重复不断的运行。 Dialogue: 0,0:11:43.73,0:11:45.64,Default,,0000,0000,0000,,这是另外一个有趣的例子 Dialogue: 0,0:11:45.64,0:11:49.01,Default,,0000,0000,0000,,是我们团队的迈克 · 泰卡制作的 , Dialogue: 0,0:11:49.01,0:11:51.44,Default,,0000,0000,0000,,他称之为“动物大游行”。 Dialogue: 0,0:11:51.44,0:11:54.39,Default,,0000,0000,0000,,这让我想起了威廉 ·肯特里奇的作品, Dialogue: 0,0:11:54.39,0:11:56.84,Default,,0000,0000,0000,,他先画一些素描,然后擦掉, Dialogue: 0,0:11:56.84,0:11:58.13,Default,,0000,0000,0000,,再画一些素描,再擦掉, Dialogue: 0,0:11:58.13,0:11:59.28,Default,,0000,0000,0000,,用这种方法创作了一部影片。 Dialogue: 0,0:11:59.28,0:12:00.83,Default,,0000,0000,0000,,在我们这个案例中, Dialogue: 0,0:12:00.83,0:12:04.04,Default,,0000,0000,0000,,迈克在一个旨在识别和辨认 Dialogue: 0,0:12:04.04,0:12:06.19,Default,,0000,0000,0000,,不同种类动物的神经网络中 Dialogue: 0,0:12:06.19,0:12:07.44,Default,,0000,0000,0000,,将y变换成各种不同的动物。 Dialogue: 0,0:12:07.44,0:12:12.18,Default,,0000,0000,0000,,这样你就得到了这个奇特的\N动物图像的埃舍尔式变换效果。 Dialogue: 0,0:12:14.22,0:12:18.78,Default,,0000,0000,0000,,他和亚历克斯还一起尝试了 Dialogue: 0,0:12:18.78,0:12:21.62,Default,,0000,0000,0000,,将这些y降低到一个二维空间内, Dialogue: 0,0:12:21.62,0:12:25.11,Default,,0000,0000,0000,,从而将被该神经网络识别出来的 Dialogue: 0,0:12:25.11,0:12:26.82,Default,,0000,0000,0000,,所有对象放到一张图上来。 Dialogue: 0,0:12:26.83,0:12:28.89,Default,,0000,0000,0000,,通过这样的合成 Dialogue: 0,0:12:28.89,0:12:30.92,Default,,0000,0000,0000,,或者在整个表面上生成图像, Dialogue: 0,0:12:30.92,0:12:33.90,Default,,0000,0000,0000,,在表面上不断的变换y,\N你就创造出了一种图像—— Dialogue: 0,0:12:33.90,0:12:37.14,Default,,0000,0000,0000,,一个包含该神经网络能够\N分辨出来的所有对象的视觉图像。 Dialogue: 0,0:12:37.14,0:12:40.20,Default,,0000,0000,0000,,所有的动物都在这儿,\N犰狳在那个点上。 Dialogue: 0,0:12:40.92,0:12:43.08,Default,,0000,0000,0000,,你也可以用其它的神经网络\N实现类似的目的。 Dialogue: 0,0:12:43.08,0:12:46.27,Default,,0000,0000,0000,,这是一个为识别和分辨出不同面孔 Dialogue: 0,0:12:46.27,0:12:48.29,Default,,0000,0000,0000,,而设计的神经网络。 Dialogue: 0,0:12:48.29,0:12:51.57,Default,,0000,0000,0000,,这里,我们输入一个y值,代表“我”, Dialogue: 0,0:12:51.57,0:12:53.22,Default,,0000,0000,0000,,我自己的面部参数。 Dialogue: 0,0:12:53.22,0:12:55.04,Default,,0000,0000,0000,,当它在解出x的时候, Dialogue: 0,0:12:55.04,0:12:57.56,Default,,0000,0000,0000,,就生成了这张集不同视角\N于一体,相当不可思议的, Dialogue: 0,0:12:57.56,0:13:02.00,Default,,0000,0000,0000,,立体的、超现实的、迷幻版本的 Dialogue: 0,0:13:02.00,0:13:03.77,Default,,0000,0000,0000,,我的面部图像。 Dialogue: 0,0:13:03.77,0:13:06.21,Default,,0000,0000,0000,,它之所以看起来像是集不同视角于一体, Dialogue: 0,0:13:06.21,0:13:10.32,Default,,0000,0000,0000,,是因为这个神经网络被设计成将一张脸 Dialogue: 0,0:13:10.32,0:13:12.84,Default,,0000,0000,0000,,在不同姿势、不同光线之间产生的 Dialogue: 0,0:13:12.84,0:13:16.18,Default,,0000,0000,0000,,模棱两可的地方抹掉了。 Dialogue: 0,0:13:16.18,0:13:17.86,Default,,0000,0000,0000,,因此当你开始这项复原工作时, Dialogue: 0,0:13:17.86,0:13:20.69,Default,,0000,0000,0000,,如果不利用某种影像引导, Dialogue: 0,0:13:20.69,0:13:21.94,Default,,0000,0000,0000,,或者统计引导, Dialogue: 0,0:13:21.94,0:13:25.63,Default,,0000,0000,0000,,那么你就会得到一种\N令人困惑的多视角的图像, Dialogue: 0,0:13:25.63,0:13:27.07,Default,,0000,0000,0000,,因为它是模棱两可的。 Dialogue: 0,0:13:27.79,0:13:31.95,Default,,0000,0000,0000,,这就是亚历克斯在复原\N我的面部的优化流程中, Dialogue: 0,0:13:31.95,0:13:35.35,Default,,0000,0000,0000,,用他自己的脸作为\N影像引导时所得到的图像。 Dialogue: 0,0:13:36.28,0:13:38.55,Default,,0000,0000,0000,,你可以看到它还不是十分完美。 Dialogue: 0,0:13:38.55,0:13:40.27,Default,,0000,0000,0000,,我们在完善这个优化流程方面 Dialogue: 0,0:13:40.27,0:13:42.99,Default,,0000,0000,0000,,还有许多的工作要做。 Dialogue: 0,0:13:42.99,0:13:45.91,Default,,0000,0000,0000,,但是通过将我自己的脸\N作为渲染过程中的引导, Dialogue: 0,0:13:45.91,0:13:47.88,Default,,0000,0000,0000,,你已经可以得到一个\N更清晰的面孔了。 Dialogue: 0,0:13:48.89,0:13:51.35,Default,,0000,0000,0000,,你不需要完全从一块空白的画布 Dialogue: 0,0:13:51.35,0:13:52.48,Default,,0000,0000,0000,,或白噪音开始。 Dialogue: 0,0:13:52.48,0:13:53.54,Default,,0000,0000,0000,,当你在解出x时, Dialogue: 0,0:13:53.54,0:13:57.81,Default,,0000,0000,0000,,你可以从一个本身已经是\N别的图像的x开始。 Dialogue: 0,0:13:57.82,0:14:00.37,Default,,0000,0000,0000,,正如这个小小的展示那样。 Dialogue: 0,0:14:00.37,0:14:04.54,Default,,0000,0000,0000,,这是一个设计为用来将所有物品—— Dialogue: 0,0:14:04.54,0:14:07.68,Default,,0000,0000,0000,,人造结构、动物等进行分类的神经网络。 Dialogue: 0,0:14:07.68,0:14:10.29,Default,,0000,0000,0000,,我们从一张云图开始, Dialogue: 0,0:14:10.29,0:14:11.100,Default,,0000,0000,0000,,在优化过程中, Dialogue: 0,0:14:12.01,0:14:16.50,Default,,0000,0000,0000,,这个神经网络正在不停地计算\N它在云中看到了什么。 Dialogue: 0,0:14:16.93,0:14:19.33,Default,,0000,0000,0000,,你花越多的时间盯着这张图, Dialogue: 0,0:14:19.33,0:14:22.03,Default,,0000,0000,0000,,你就会在云中看到越多的东西。 Dialogue: 0,0:14:23.00,0:14:26.38,Default,,0000,0000,0000,,你也可以使用面部识别\N神经网络去产生迷幻效果, Dialogue: 0,0:14:26.38,0:14:28.20,Default,,0000,0000,0000,,然后就可以得到这种不可思议的东西。 Dialogue: 0,0:14:28.20,0:14:29.39,Default,,0000,0000,0000,,(观众笑声) Dialogue: 0,0:14:30.40,0:14:33.08,Default,,0000,0000,0000,,或者可以像迈克做的另外一个实验那样, Dialogue: 0,0:14:33.08,0:14:37.06,Default,,0000,0000,0000,,他还是利用那张云图, Dialogue: 0,0:14:37.06,0:14:40.53,Default,,0000,0000,0000,,使它幻化、再放大,\N幻化再放大,幻化再放大. Dialogue: 0,0:14:40.53,0:14:41.59,Default,,0000,0000,0000,,这样一来, Dialogue: 0,0:14:41.59,0:14:45.45,Default,,0000,0000,0000,,我想你就可以得到\N这个网络的神游状态, Dialogue: 0,0:14:45.45,0:14:49.16,Default,,0000,0000,0000,,或者某种自由联想, Dialogue: 0,0:14:49.16,0:14:51.45,Default,,0000,0000,0000,,仿佛这个网络正在吞噬自己的尾巴。 Dialogue: 0,0:14:51.46,0:14:54.84,Default,,0000,0000,0000,,因此每一张图都是\N下一张图的基础,决定了 Dialogue: 0,0:14:54.84,0:14:56.30,Default,,0000,0000,0000,,“我觉得接下来会看到什么? Dialogue: 0,0:14:56.30,0:14:59.15,Default,,0000,0000,0000,,接下来又会看到什么?\N接下来还会看到什么?” Dialogue: 0,0:14:59.49,0:15:02.47,Default,,0000,0000,0000,,我第一次公开展示这些是在西雅图, Dialogue: 0,0:15:02.47,0:15:07.93,Default,,0000,0000,0000,,为一个团队做的一次名为\N“高等教育”的讲座上—— Dialogue: 0,0:15:07.93,0:15:10.44,Default,,0000,0000,0000,,刚好就在大麻合法化之后。 Dialogue: 0,0:15:10.44,0:15:12.78,Default,,0000,0000,0000,,(观众笑声) Dialogue: 0,0:15:14.63,0:15:16.82,Default,,0000,0000,0000,,在结束我的演讲前, Dialogue: 0,0:15:16.82,0:15:21.15,Default,,0000,0000,0000,,我想再提醒各位,\N这种技术是不受限的。 Dialogue: 0,0:15:21.15,0:15:24.69,Default,,0000,0000,0000,,我给你们看了一些纯粹的视觉实例,\N因为它们看起来真的很有趣。 Dialogue: 0,0:15:24.69,0:15:27.48,Default,,0000,0000,0000,,它不是一种纯粹的视觉技术。 Dialogue: 0,0:15:27.48,0:15:29.20,Default,,0000,0000,0000,,我们的合作者,艺术家罗斯 · 古德温 Dialogue: 0,0:15:29.20,0:15:33.01,Default,,0000,0000,0000,,做了一个实验,他用相机拍了一张照片, Dialogue: 0,0:15:33.01,0:15:37.37,Default,,0000,0000,0000,,然后他背包里的电脑\N基于这张照片的内容, Dialogue: 0,0:15:37.37,0:15:39.63,Default,,0000,0000,0000,,用神经网络作了一首诗。 Dialogue: 0,0:15:39.63,0:15:42.36,Default,,0000,0000,0000,,这个作诗的神经网络已经接受过 Dialogue: 0,0:15:42.36,0:15:44.66,Default,,0000,0000,0000,,大量的20世纪诗歌的训练。 Dialogue: 0,0:15:44.66,0:15:45.87,Default,,0000,0000,0000,,其实我觉得 Dialogue: 0,0:15:45.87,0:15:47.76,Default,,0000,0000,0000,,那首诗还不赖。 Dialogue: 0,0:15:47.76,0:15:49.15,Default,,0000,0000,0000,,(观众笑声) Dialogue: 0,0:15:49.15,0:15:50.45,Default,,0000,0000,0000,,下面, Dialogue: 0,0:15:50.45,0:15:52.47,Default,,0000,0000,0000,,再回到米开朗基罗那句名言, Dialogue: 0,0:15:52.47,0:15:53.90,Default,,0000,0000,0000,,我想他是对的, Dialogue: 0,0:15:53.90,0:15:57.27,Default,,0000,0000,0000,,感知和创意是密不可分的。 Dialogue: 0,0:15:57.61,0:16:00.30,Default,,0000,0000,0000,,我们刚刚所看到的是一些 Dialogue: 0,0:16:00.30,0:16:02.61,Default,,0000,0000,0000,,完全被训练成去区分, Dialogue: 0,0:16:02.61,0:16:04.84,Default,,0000,0000,0000,,或辨别世上的不同物品, Dialogue: 0,0:16:04.84,0:16:08.07,Default,,0000,0000,0000,,能够逆向运行、成生图像的神经网络。 Dialogue: 0,0:16:08.07,0:16:09.81,Default,,0000,0000,0000,,我从中受到的启发之一就是, Dialogue: 0,0:16:09.81,0:16:12.22,Default,,0000,0000,0000,,不仅米开朗基罗真的看到了 Dialogue: 0,0:16:12.22,0:16:14.70,Default,,0000,0000,0000,,石头中的雕像, Dialogue: 0,0:16:14.70,0:16:18.34,Default,,0000,0000,0000,,而且任何的生物、任何人、任何外星人, Dialogue: 0,0:16:18.34,0:16:22.02,Default,,0000,0000,0000,,只要能够有这样的感知, Dialogue: 0,0:16:22.02,0:16:23.52,Default,,0000,0000,0000,,也就能够创造, Dialogue: 0,0:16:23.52,0:16:26.80,Default,,0000,0000,0000,,因为它们都运用了截然相同的机制。 Dialogue: 0,0:16:26.80,0:16:31.23,Default,,0000,0000,0000,,另外,我想感知和创意决不是 Dialogue: 0,0:16:31.23,0:16:32.55,Default,,0000,0000,0000,,人类所特有的。 Dialogue: 0,0:16:32.55,0:16:36.07,Default,,0000,0000,0000,,我们开始有了可以\N完成这些事的电脑模型。 Dialogue: 0,0:16:36.07,0:16:39.65,Default,,0000,0000,0000,,这应当不足为奇,因为大脑会运算。 Dialogue: 0,0:16:39.65,0:16:41.25,Default,,0000,0000,0000,,最后, Dialogue: 0,0:16:41.25,0:16:46.02,Default,,0000,0000,0000,,电脑运算最开始是作为\N设计智能机器的一种练习。 Dialogue: 0,0:16:46.02,0:16:48.51,Default,,0000,0000,0000,,它在很大程度上仿照了我们如何 Dialogue: 0,0:16:48.51,0:16:51.62,Default,,0000,0000,0000,,让机器变得智能这一理念。 Dialogue: 0,0:16:51.62,0:16:53.50,Default,,0000,0000,0000,,而我们也终于开始能够实现 Dialogue: 0,0:16:53.50,0:16:56.15,Default,,0000,0000,0000,,图灵、冯 · 诺依曼、 Dialogue: 0,0:16:56.15,0:16:57.88,Default,,0000,0000,0000,,麦卡洛克和皮兹 Dialogue: 0,0:16:57.88,0:17:00.22,Default,,0000,0000,0000,,这些先驱的一些期望了。 Dialogue: 0,0:17:00.22,0:17:04.30,Default,,0000,0000,0000,,我觉得电脑不仅仅是拿来计算, Dialogue: 0,0:17:04.30,0:17:06.48,Default,,0000,0000,0000,,或者玩游戏的。 Dialogue: 0,0:17:06.48,0:17:08.100,Default,,0000,0000,0000,,从一开始,我们就是\N仿照大脑来制造它们的。 Dialogue: 0,0:17:08.100,0:17:12.28,Default,,0000,0000,0000,,而它们也赋予了我们能够\N更好的理解我们的大脑, Dialogue: 0,0:17:12.28,0:17:13.87,Default,,0000,0000,0000,,并且拓展其潜力的能力。 Dialogue: 0,0:17:14.63,0:17:15.74,Default,,0000,0000,0000,,非常感谢。 Dialogue: 0,0:17:15.74,0:17:20.86,Default,,0000,0000,0000,,(观众掌声)