WEBVTT 00:00:00.000 --> 00:00:00.250 智能--它是什么? 00:00:04.566 --> 00:00:06.857 当我们回顾在历史上 00:00:06.857 --> 00:00:09.481 智能是如何被看待的, 00:00:09.481 --> 00:00:13.099 一个开创性的例子是 00:00:13.099 --> 00:00:16.576 艾兹格•迪杰斯特拉的著名引述, 00:00:16.576 --> 00:00:19.687 "关于一台机器能否思考的问题 00:00:19.687 --> 00:00:20.997 与关于 00:00:20.997 --> 00:00:23.968 一艘潜艇是否会游泳的问题 00:00:23.968 --> 00:00:25.758 几乎同样有趣"。 00:00:25.758 --> 00:00:29.602 当艾兹格•迪杰斯特拉 写下这句话的时候, 00:00:29.602 --> 00:00:31.656 他的用意是去批判那些 00:00:31.656 --> 00:00:34.656 早年间开辟了计算机科学的先锋, 00:00:34.656 --> 00:00:36.403 比如阿兰 · 图灵。 00:00:36.403 --> 00:00:38.902 然而,如果你回顾过去 00:00:38.902 --> 00:00:40.867 并予以思考,有哪些 00:00:40.867 --> 00:00:42.863 最有利于发展的创新, 00:00:42.863 --> 00:00:44.742 让我们有机会能够制造出 00:00:44.742 --> 00:00:46.976 会游泳的机器 00:00:46.976 --> 00:00:49.549 和会[飞]的机器, 00:00:49.549 --> 00:00:53.096 你会发现,只有通过了解 00:00:53.096 --> 00:00:55.704 游泳和飞行 00:00:55.704 --> 00:00:58.483 背后的物理机制, 00:00:58.483 --> 00:01:01.655 我们才有能力去制造这些机器。 00:01:01.655 --> 00:01:03.911 所以说,在几年前, 00:01:03.911 --> 00:01:07.160 我着手了一个项目, 试图去了解 00:01:07.160 --> 00:01:09.794 智能背后的 00:01:09.794 --> 00:01:12.562 基础物理机制。 NOTE Paragraph 00:01:12.562 --> 00:01:14.422 我们先退一步说。 00:01:14.422 --> 00:01:17.571 首先,让我们从一个思维实验开始。 00:01:17.571 --> 00:01:20.425 假装你是一个外星人, 00:01:20.425 --> 00:01:23.466 你对地球上的生物学、 00:01:23.466 --> 00:01:26.582 神经科学和智能一无所知, 00:01:26.582 --> 00:01:28.774 但你有绝佳的望远镜, 00:01:28.774 --> 00:01:31.136 因此你能观望地球, 00:01:31.136 --> 00:01:33.468 你的寿命也惊人地长, 00:01:33.468 --> 00:01:34.967 所以你可以观察地球 00:01:34.967 --> 00:01:38.409 超过数百万年,甚至几十亿年。 00:01:38.409 --> 00:01:41.424 然后你观察到一个很奇怪的现象。 00:01:41.424 --> 00:01:45.736 你观察到,几千年来, 00:01:45.736 --> 00:01:50.021 地球不断地与小行星发生碰撞 00:01:50.021 --> 00:01:52.108 直到某一刻, 00:01:52.108 --> 00:01:53.639 而在那一刻, 00:01:53.639 --> 00:01:57.831 大约对应的是公元2000年, 00:01:57.831 --> 00:01:59.547 那些在地球撞击轨道 00:01:59.547 --> 00:02:01.478 上的小行星, 00:02:01.478 --> 00:02:03.453 本该相撞 00:02:03.453 --> 00:02:05.868 但却被神秘地弹开了 00:02:05.868 --> 00:02:08.940 或者在碰到地球之前就引爆了。 00:02:08.940 --> 00:02:11.023 当然,作为地球人, 00:02:11.023 --> 00:02:12.567 我们知道其中的原因是 00:02:12.567 --> 00:02:14.323 我们正试图自我拯救。 00:02:14.323 --> 00:02:17.403 我们要防止撞击发生。 00:02:17.403 --> 00:02:19.114 但如果你是一个外星人, 00:02:19.114 --> 00:02:20.260 对这些一无所知, 00:02:20.260 --> 00:02:22.774 对地球上的智能也没有任何概念, 00:02:22.774 --> 00:02:24.502 这就迫使你去总结 00:02:24.502 --> 00:02:27.420 一种物理理论, 去解释其原因, 00:02:27.420 --> 00:02:29.958 直到在某一刻, 00:02:29.958 --> 00:02:34.407 本应摧毁一个星球表面的小行星, 00:02:34.407 --> 00:02:37.638 神秘地停止了这种行为。 00:02:37.638 --> 00:02:41.842 因此我声称这个问题 00:02:41.842 --> 00:02:45.840 与理解智能的物理本质的问题 是相同的。 NOTE Paragraph 00:02:45.840 --> 00:02:49.722 因此,在我几年前着手的 这个项目中, 00:02:49.722 --> 00:02:52.487 我研究了许多不同的线程, 00:02:52.487 --> 00:02:55.649 跨越科学界,跨越多个学科, 00:02:55.649 --> 00:02:57.541 在我看来,他们都指向 00:02:57.541 --> 00:03:00.089 一个统一的、潜在的 00:03:00.089 --> 00:03:01.670 智能机制。 00:03:01.670 --> 00:03:04.216 例如在宇宙学中, 00:03:04.216 --> 00:03:06.963 就存在着各种各样的线索, 00:03:06.963 --> 00:03:08.816 它们显示我们的宇宙就 为了智能的开发, 00:03:10.669 --> 00:03:12.523 而被精准地调试过, 00:03:12.523 --> 00:03:14.912 和特别是的对于发展 00:03:14.912 --> 00:03:16.798 世界各国 00:03:16.798 --> 00:03:20.896 去实现有最大多样化可能性的未来。 00:03:20.896 --> 00:03:23.240 在棋牌界,举个例子,围棋-- 00:03:23.240 --> 00:03:26.265 大家都记得在1997年的时候 00:03:26.265 --> 00:03:30.216 IBM制作的机器人“深蓝“打败了 世界象棋冠军加里·卡斯帕罗夫-- 00:03:30.216 --> 00:03:31.739 很少有人意识到 00:03:31.739 --> 00:03:33.757 在过去10年左右的时间里, 00:03:33.757 --> 00:03:34.955 围棋, 00:03:34.955 --> 00:03:36.911 可以说是一个更具挑战性的游戏, 00:03:36.911 --> 00:03:39.336 因为它具有更高的分支系数, 00:03:39.336 --> 00:03:41.038 也已开始屈服于 00:03:41.038 --> 00:03:42.903 电脑这个游戏对手, 00:03:42.903 --> 00:03:44.476 出于同样的原因: 00:03:44.476 --> 00:03:47.276 现在,电脑下围棋的 最佳技术方法 00:03:47.276 --> 00:03:50.972 是在下棋的过程中, 试图最大化 00:03:50.972 --> 00:03:52.986 未来的各种可能性。 00:03:52.986 --> 00:03:56.567 最后,在机器人的运动规划中, 00:03:56.567 --> 00:03:58.749 有各种各样的新颖技术, 00:03:58.749 --> 00:04:00.651 它们有试图利用 00:04:00.651 --> 00:04:03.797 机器人的能力去将 00:04:03.797 --> 00:04:05.303 未来的行动自由最大化, 00:04:05.303 --> 00:04:08.400 从而完成复杂的任务。 00:04:08.400 --> 00:04:10.755 因此,考虑所有这些不同的线程 00:04:10.755 --> 00:04:12.377 并把它们放在一起, 00:04:12.377 --> 00:04:15.017 从几年前开始我就在问, 00:04:15.017 --> 00:04:17.867 有没有一种潜在的智能机制 00:04:17.867 --> 00:04:19.540 可以让我们分解出 00:04:19.540 --> 00:04:21.314 所有这些不同的线程? 00:04:21.314 --> 00:04:25.907 是否存在一个 关于智能的公式? NOTE Paragraph 00:04:25.907 --> 00:04:29.278 而我相信答案是有。 ["F = T ∇ SΤ"] 00:04:29.278 --> 00:04:31.191 你看到的可能是 00:04:31.191 --> 00:04:34.485 我所见过最接近于 E = mc² 00:04:34.485 --> 00:04:37.315 的智慧。 00:04:37.315 --> 00:04:39.017 所以你在这里看到的 00:04:39.017 --> 00:04:41.686 是一张对应表, 00:04:41.686 --> 00:04:46.121 其中智能是一种力量,F, 00:04:46.121 --> 00:04:50.771 它的作用是为了便于将未来的 行动自由最大化。 00:04:50.771 --> 00:04:53.146 它的作用是将未来的 行动自由最大化, 00:04:53.146 --> 00:04:54.774 或是保留灵活的选择权, 00:04:54.774 --> 00:04:56.999 与一种力量 T, 00:04:56.999 --> 00:05:01.776 和有多种可能性的、 可实现的未来,S, 00:05:01.776 --> 00:05:04.326 一直到某个未来的开始, tau(希腊字母)。 00:05:04.326 --> 00:05:07.535 简而言之,智能不喜欢被困住。 00:05:07.535 --> 00:05:10.590 智能试图将未来的行动自由最大化, 00:05:10.590 --> 00:05:13.263 并保留选择权。 00:05:13.263 --> 00:05:15.696 所以,鉴于这一公式, 00:05:15.696 --> 00:05:18.228 你自然会问, 那么这些可以让你做什么? 00:05:18.228 --> 00:05:19.579 它是预测性有多高? 00:05:19.579 --> 00:05:21.714 它能否预测人类的智能水平? 00:05:21.714 --> 00:05:24.532 它能够预测人工智能吗? 00:05:24.532 --> 00:05:26.574 因此,我将要展示给你们一段视频, 00:05:26.574 --> 00:05:29.994 我认为,它会展示出 00:05:29.994 --> 00:05:32.282 单是这一个公式的 00:05:32.282 --> 00:05:34.601 一些惊人的应用。 NOTE Paragraph 00:05:34.601 --> 00:05:36.580 (视频)讲述人: 宇宙学的最近研究 00:05:36.580 --> 00:05:38.627 反应了那些产生更多混乱、 00:05:38.627 --> 00:05:42.108 或者"熵"的宇宙, 在他们的生命中 00:05:42.108 --> 00:05:44.586 应该倾向于产生更多 有利的情况, 00:05:44.586 --> 00:05:47.602 让像我们这样的智慧生物 得以存在。 00:05:47.602 --> 00:05:50.176 但假如那个在熵与智能之间 00:05:50.176 --> 00:05:52.019 暂定的宇宙链接 00:05:52.019 --> 00:05:53.790 暗示着更深层的关系呢? 00:05:53.790 --> 00:05:56.354 如果智能的行为不仅只与 00:05:56.354 --> 00:05:58.198 长期熵的生产相关, 00:05:58.198 --> 00:06:00.516 而是直接由其产生的呢? 00:06:00.516 --> 00:06:02.922 为了找到答案, 我们开发了一个软件引擎 00:06:02.922 --> 00:06:05.425 称为 Entropica, 设计的意图是将 00:06:05.425 --> 00:06:07.193 长期熵的生产最大化, 00:06:07.193 --> 00:06:09.769 无论它身在任何系统内。 00:06:09.769 --> 00:06:11.924 惊人的是,Entropica 通过了 00:06:11.924 --> 00:06:15.380 多个动物的智能测验、 玩人类的游戏、 00:06:15.380 --> 00:06:17.526 甚至在股票交易中赚钱, 00:06:17.526 --> 00:06:19.637 而且完全没有被给出那些指示。 00:06:19.637 --> 00:06:22.155 下面是一些 Entropica 的行动实例。 NOTE Paragraph 00:06:22.155 --> 00:06:25.360 就像人类站立不会跌到, 00:06:25.360 --> 00:06:26.590 这里我们可以看到 Entropica 00:06:26.590 --> 00:06:29.475 自动地使用购物车去平衡棍子。 00:06:29.475 --> 00:06:31.487 这种行为可以说是非常卓越的 00:06:31.487 --> 00:06:33.818 因为我们从未给 Entropica 设定一个目标。 00:06:33.818 --> 00:06:36.975 它自己就决定去平衡那根棍子。 00:06:36.975 --> 00:06:39.107 这种平衡能力将能应用于 00:06:39.107 --> 00:06:40.504 人形机器人 00:06:40.504 --> 00:06:43.019 和人类的辅助科技。 00:06:43.019 --> 00:06:45.020 正如一些动物可以使用 00:06:45.020 --> 00:06:46.462 环境中的物体作为工具 00:06:46.462 --> 00:06:48.449 去伸入狭窄的空间, 00:06:48.449 --> 00:06:50.331 这里我们可以看到 Entropica, 00:06:50.331 --> 00:06:52.169 同样是自主的, 00:06:52.169 --> 00:06:55.079 能够移动一个表示动物的大圆盘 00:06:55.079 --> 00:06:57.424 去把一个表示工具的小圆盘, 00:06:57.424 --> 00:07:00.195 去深入一个狭窄的空间, 00:07:00.195 --> 00:07:01.732 那里有第三个圆盘, 00:07:01.732 --> 00:07:04.704 并把第三个圆盘从它初始 的静态解放出来. 00:07:04.704 --> 00:07:06.893 这种工具的使用能力将能运用于 00:07:06.893 --> 00:07:09.252 智能制造业和农业。 00:07:09.252 --> 00:07:11.196 此外,正如其他一些动物 00:07:11.196 --> 00:07:13.892 能够合作起来同时去拉 一根绳子的两端 00:07:13.892 --> 00:07:15.945 从而释放食物, 00:07:15.945 --> 00:07:18.240 这里我们可以看到 Entropica 有能力完成 00:07:18.240 --> 00:07:20.228 这项任务的模型版本。 00:07:20.228 --> 00:07:22.750 这种合作能力能够带来有趣的影响, 00:07:22.750 --> 00:07:26.185 在经济规划和各种其他领域中。 NOTE Paragraph 00:07:26.185 --> 00:07:28.256 Entropica 可以广泛适用于 00:07:28.256 --> 00:07:30.199 各种各样的领域。 00:07:30.199 --> 00:07:32.641 例如,在这里我们看到它成功的 00:07:32.641 --> 00:07:35.200 与自己玩乒乓球游戏, 00:07:35.200 --> 00:07:37.543 说明其在游戏界的潜力。 00:07:37.543 --> 00:07:39.462 在这里我们看到 Entropica 指挥着 00:07:39.462 --> 00:07:41.301 社交网络上新的关系, 00:07:41.301 --> 00:07:44.061 在这朋友们不断的失去联系 00:07:44.061 --> 00:07:46.917 并成功地保持有效的网络连接。 00:07:46.917 --> 00:07:49.215 这种相同的网络指挥能力 00:07:49.215 --> 00:07:51.543 在医疗保健、能源、和智能方面 00:07:51.543 --> 00:07:54.775 都有相关的应用。 00:07:54.775 --> 00:07:56.860 这里我们可以看到 Entropica 00:07:56.860 --> 00:07:58.346 指挥一支舰队的路径, 00:07:58.346 --> 00:08:01.521 成功地发现并利用巴拿马运河, 00:08:01.521 --> 00:08:03.979 然后将其范围从大西洋到太平洋 00:08:03.979 --> 00:08:05.508 全球性地扩大。 00:08:05.508 --> 00:08:07.235 同样的,Entropica 00:08:07.235 --> 00:08:08.855 可以广泛地适用于 00:08:08.855 --> 00:08:14.157 自主防御、 物流和运输地应用。 NOTE Paragraph 00:08:14.173 --> 00:08:16.203 最后,在这里我们看到 Entropica 00:08:16.203 --> 00:08:18.926 自主地发现和执行 00:08:18.926 --> 00:08:20.993 一个低买高卖的策略, 00:08:20.993 --> 00:08:23.171 这是在模拟的范围交易股票上, 00:08:23.171 --> 00:08:25.502 它成功地将其管理的资产 00:08:25.502 --> 00:08:26.926 成指数升涨。 00:08:26.926 --> 00:08:28.234 这种风险管理的能力 00:08:28.234 --> 00:08:30.721 将在金融和保险领域 00:08:30.721 --> 00:08:34.049 有广泛的应用。 NOTE Paragraph 00:08:34.049 --> 00:08:36.140 阿历克斯•维斯纳-格罗斯: 你刚看到的 00:08:36.140 --> 00:08:40.532 是各种具有代表性的人类智能 00:08:40.532 --> 00:08:42.289 的认知行为, 00:08:42.289 --> 00:08:45.120 例如工具的使用、直立行走 00:08:45.120 --> 00:08:47.149 和社会合作, 00:08:47.149 --> 00:08:50.121 它们都遵循一个公式, 00:08:50.121 --> 00:08:52.053 该公式所驱动的系统 00:08:52.053 --> 00:08:55.964 是要将其未来的行动自由最大化。 NOTE Paragraph 00:08:55.964 --> 00:08:58.971 现在,这里存在一个深刻的讽刺。 00:08:58.971 --> 00:09:00.995 回到最初, 00:09:00.995 --> 00:09:04.268 机器人这个术语的用法, 00:09:04.268 --> 00:09:07.171 "RUR,"这出戏, 00:09:07.171 --> 00:09:09.406 总存在一种概念就是 00:09:09.406 --> 00:09:12.632 如果我们开发了机器智能 00:09:12.632 --> 00:09:15.659 就会产生一个人工智能的叛变。 00:09:15.659 --> 00:09:19.210 机器会奋起反抗我们。 00:09:19.210 --> 00:09:21.529 这项工作的主要成果之一 00:09:21.529 --> 00:09:24.298 就是也许这几十年间, 00:09:24.298 --> 00:09:27.274 我们对于人工智能的叛变 的整个概念 00:09:27.274 --> 00:09:29.285 是颠倒的。 00:09:29.285 --> 00:09:32.564 机器不是先有了智慧 00:09:32.564 --> 00:09:34.579 然后才变得狂妄 00:09:34.579 --> 00:09:36.803 并试图接管世界的。 00:09:36.803 --> 00:09:38.237 其实几乎是相反的, 00:09:38.237 --> 00:09:41.143 那种迫切的欲望, 00:09:41.143 --> 00:09:43.404 想要控制所有未来的所有可能 00:09:43.404 --> 00:09:45.522 是比智能更基本的 00:09:45.522 --> 00:09:46.885 一个原则, 00:09:46.885 --> 00:09:50.585 综合智能事实上可能是从 00:09:50.585 --> 00:09:54.144 这种控制欲中直接产生的, 00:09:54.144 --> 00:09:58.329 而不是反之。 NOTE Paragraph 00:09:58.329 --> 00:10:02.098 另一个重要的成果是寻找目标。 00:10:02.098 --> 00:10:06.458 我经常被问道, 寻找目标的能力 00:10:06.458 --> 00:10:08.078 怎么会遵循这种框架结构呢? 00:10:08.078 --> 00:10:11.106 答案是,寻找目标的能力 00:10:11.106 --> 00:10:12.988 将直接遵循它, 00:10:12.988 --> 00:10:14.822 道理是这样的: 00:10:14.822 --> 00:10:17.687 就像你要穿过一条隧道, 00:10:17.687 --> 00:10:20.192 你未来道路空间中的一个瓶颈, 00:10:20.192 --> 00:10:22.063 为了在以后实现许多 00:10:22.063 --> 00:10:24.084 其他的各种目标, 00:10:24.084 --> 00:10:26.456 或者就像你会投资 00:10:26.456 --> 00:10:28.243 于金融证券, 00:10:28.243 --> 00:10:30.480 减少你的短期流动性 00:10:30.480 --> 00:10:32.880 从而长远的增加你的财富, 00:10:32.880 --> 00:10:35.217 目标的寻求直接涌现于 00:10:35.217 --> 00:10:36.946 长期的驱动, 00:10:36.946 --> 00:10:40.983 为了增加未来的行动自由。 NOTE Paragraph 00:10:40.983 --> 00:10:44.511 最后,理查德 · 费曼, 这位著名的物理学家, 00:10:44.511 --> 00:10:48.183 曾经写道, 如果人类文明被摧毁 00:10:48.183 --> 00:10:50.076 并且你只能将一个概念 00:10:50.076 --> 00:10:51.447 传承给我们的后代, 00:10:51.447 --> 00:10:53.754 来帮助他们重建文明, 00:10:53.754 --> 00:10:55.440 这个概念应该是 00:10:55.440 --> 00:10:57.292 我们身边的一切物质 00:10:57.292 --> 00:10:59.615 都是由微小的元素组成的, 00:10:59.615 --> 00:11:02.123 它们之间距离远的时候 会相互吸引, 00:11:02.123 --> 00:11:05.453 但在靠的很近时 它们会互相排斥。 00:11:05.453 --> 00:11:07.234 我与这句话等同的声明, 00:11:07.234 --> 00:11:08.502 来传递给后代, 00:11:08.502 --> 00:11:11.214 帮助他们建立人工智能 00:11:11.214 --> 00:11:14.163 或是帮助他们理解 人类的智慧, 00:11:14.163 --> 00:11:15.430 是如下的话: 00:11:15.430 --> 00:11:17.483 智能应该被看作是 00:11:17.483 --> 00:11:18.896 一个物理过程, 00:11:18.896 --> 00:11:21.861 它试图将未来的行动自由最大化 00:11:21.861 --> 00:11:25.477 并且避免在自己的未来中的约束。 NOTE Paragraph 00:11:25.477 --> 00:11:26.835 非常感谢。 NOTE Paragraph 00:11:26.835 --> 00:11:30.835 (掌声)