WEBVTT 00:00:00.954 --> 00:00:04.937 我和我的同事对移动圆点 背后的科学非常着迷。 00:00:04.937 --> 00:00:06.157 那么这些小圆点是什么呢? 00:00:06.157 --> 00:00:07.418 就是我们自己。 00:00:07.418 --> 00:00:12.351 我们在家里,办公室里来回走动, 00:00:12.351 --> 00:00:14.957 也在世界各地旅行和购物。 00:00:14.958 --> 00:00:18.878 如果我们能弄清这些移动, 00:00:18.878 --> 00:00:22.288 并从中发现规律,意义并提出见解, 不是一件很棒的事吗? 00:00:22.288 --> 00:00:24.884 很幸运的是, 我们生活在这么一个时代, 00:00:24.884 --> 00:00:28.825 我们非常擅长捕捉关于自身的信息。 00:00:28.825 --> 00:00:32.464 不管是通过传感器,视频,或软件应用, 00:00:32.464 --> 00:00:35.303 我们都能详尽地追踪到个人移动的轨迹。 NOTE Paragraph 00:00:36.092 --> 00:00:41.108 这就让我们发现, 最佳的数据来源之一 00:00:41.108 --> 00:00:42.356 就是体育运动。 00:00:42.682 --> 00:00:47.969 因此无论是篮球、棒球、橄榄球或足球, 00:00:47.969 --> 00:00:52.095 我们都可以在场馆内, 甚至运动员身上装上设备来追踪 00:00:52.095 --> 00:00:53.828 他们每个时刻的运动数据。 00:00:53.828 --> 00:00:58.178 所以我们要做的 ——你们大概已经猜到了—— 00:00:58.178 --> 00:01:00.161 就是把运动员的移动 00:01:00.161 --> 00:01:01.587 转化成圆点的移动。 NOTE Paragraph 00:01:01.946 --> 00:01:06.854 所以我们收集了不计其数的移动小圆点, 00:01:06.854 --> 00:01:09.436 就像多数原始数据一样, 难以处理,也没什么趣味。 00:01:09.436 --> 00:01:13.249 但数据里面蕴藏着, 比如篮球教练想知道的事情。 00:01:13.249 --> 00:01:17.233 但问题是,除非教练们把每场比赛里 每一秒数据都记下来再去思考, 00:01:17.233 --> 00:01:19.806 否则他们没法从中得到想要的信息。 00:01:19.806 --> 00:01:21.764 人类大脑无法做到这件事, 00:01:21.764 --> 00:01:23.068 但机器没问题。 00:01:23.661 --> 00:01:27.381 然而,机器没办法自己 以教练的视角去看一场比赛。 00:01:27.381 --> 00:01:30.234 直到现在,我们做到了。 00:01:30.234 --> 00:01:32.651 那么, 我们让机器去观察些什么呢? NOTE Paragraph 00:01:33.569 --> 00:01:35.416 先从简单的开始。 00:01:35.416 --> 00:01:39.219 我们先教会它传球、投篮和篮板球, 00:01:39.219 --> 00:01:41.794 这类普通球迷也知道的事。 00:01:41.794 --> 00:01:44.640 然后我们开始教它一些 稍复杂点的事情, 00:01:44.640 --> 00:01:49.382 比如落位背打、挡拆和拉开单打。 00:01:49.382 --> 00:01:53.590 你们如果不了解这些名词, 没关系。打球的人大都了如指掌。 00:01:53.590 --> 00:01:58.940 迄今为止,我们已经能够让机器理解 00:01:58.940 --> 00:02:02.037 下掩护和无球掩护这类复杂的, 00:02:02.037 --> 00:02:04.777 只有专业人士才懂的战术。 00:02:04.777 --> 00:02:09.159 于是我们已经教会电脑用 教练的视角去观察数据了。 NOTE Paragraph 00:02:10.009 --> 00:02:11.866 我们是怎么做到的呢? 00:02:12.511 --> 00:02:15.603 如果我让一个教练讲解挡拆, 00:02:15.603 --> 00:02:17.177 我会得到一个定义, 00:02:17.177 --> 00:02:21.033 如果我把这个定义编码成一个算法 估计会惨不忍睹。 00:02:21.033 --> 00:02:25.318 挡拆就是四个球员之间的舞蹈, 00:02:25.318 --> 00:02:27.240 两人进攻,两人防守。 00:02:27.486 --> 00:02:29.124 大概是这么个过程: 00:02:29.128 --> 00:02:31.691 一个没有带球的进攻球员 00:02:31.691 --> 00:02:34.868 跑向持球的防守队员, 00:02:34.868 --> 00:02:36.045 站在那里待一会儿, NOTE Paragraph 00:02:36.045 --> 00:02:39.566 然后他们一起移动(制造机会), 嗒哒,这就是挡拆。 NOTE Paragraph 00:02:39.566 --> 00:02:41.805 (笑声) NOTE Paragraph 00:02:41.805 --> 00:02:44.287 这也是个糟糕的算法实例。 00:02:44.913 --> 00:02:49.297 如果那个干扰的球员—— 或者叫掩护者—— 00:02:49.297 --> 00:02:52.144 只是跑过来干扰一下而不停下, 00:02:52.144 --> 00:02:53.939 这可能就不是挡拆了。 00:02:54.560 --> 00:02:58.469 就算他停下来, 但停的位置不够接近, 00:02:58.469 --> 00:03:00.290 那也不算是挡拆。 00:03:00.642 --> 00:03:03.909 或者,就算他足够近,而且停下来, 00:03:03.909 --> 00:03:07.227 但他是在篮下完成的 那也不算挡拆。 00:03:07.462 --> 00:03:09.606 或者我可能错了, 这些都是挡拆。 00:03:09.606 --> 00:03:14.522 是否是挡拆要根据发生的时间、 球员间距、位置而定, 00:03:14.522 --> 00:03:16.097 这些都很难去界定。 00:03:16.579 --> 00:03:21.483 幸运的是,有了机器学习技术, 我们就能超越自身的能力 00:03:21.483 --> 00:03:23.340 来描述我们已知的事物。 NOTE Paragraph 00:03:23.340 --> 00:03:25.764 这个技术要如何实现呢? 举个例子: 00:03:25.764 --> 00:03:28.589 我们对机器说, “早上好,机器。 00:03:29.077 --> 00:03:32.436 这儿有些挡拆例子,还有一些不是。 00:03:32.720 --> 00:03:35.092 你来找出不同点吧。” 00:03:35.092 --> 00:03:38.873 这其中的关键是电脑能找出 区别两者的特征来。 00:03:38.873 --> 00:03:40.710 所以如果我要教会机器 00:03:40.710 --> 00:03:41.835 辨别苹果和橘子, 00:03:41.835 --> 00:03:44.554 我可能会说: “不妨用颜色和形状来区分吧?” 00:03:44.554 --> 00:03:47.511 而目前要解决的问题就是, 要区分事物的特征是什么? 00:03:47.511 --> 00:03:48.852 电脑需要掌握的整个 00:03:48.852 --> 00:03:52.531 移动圆点世界的关键特征是什么? 00:03:52.531 --> 00:03:57.378 搞清楚所有这些相对位置、 绝对位置、距离、时机、 00:03:57.378 --> 00:03:59.261 速率之间的关系—— 00:03:59.440 --> 00:04:04.408 就是移动圆点科学的真正关键所在, 换成专业术语, 00:04:04.408 --> 00:04:07.926 我们喜欢称之为:时空模式识别。 00:04:07.926 --> 00:04:10.823 因为首先,你要让它听起来 很难懂,很专业—— 00:04:10.827 --> 00:04:12.415 因为事实的确如此。 NOTE Paragraph 00:04:12.415 --> 00:04:15.515 对于NBA教练们来说,判断是否是 00:04:15.515 --> 00:04:17.261 挡拆并不是关键, 00:04:17.261 --> 00:04:19.531 而这个挡拆是怎么发生的 才是他们关注的。 00:04:19.531 --> 00:04:22.677 为何教练们如此关心这一点? 这儿我要解释一下。 00:04:22.677 --> 00:04:24.396 在现代的篮球比赛中, 00:04:24.396 --> 00:04:27.075 挡拆几乎是最重要的战术。 00:04:27.075 --> 00:04:29.239 了解如何使用以及怎样防守挡拆, 00:04:29.239 --> 00:04:32.429 基本上是比赛输赢的关键。 00:04:32.429 --> 00:04:36.198 因此挡拆的步伐多种多样, 00:04:36.198 --> 00:04:39.830 能够识别这些不同的形式 是非常重要的, 00:04:39.830 --> 00:04:42.288 这就是为什么我们对 机器的智能性要求相当高。 NOTE Paragraph 00:04:42.288 --> 00:04:44.058 举个例子。 00:04:44.058 --> 00:04:45.971 这儿有两个进攻队员和 两个防守队员, 00:04:45.971 --> 00:04:47.937 他们准备开始实施挡拆。 00:04:47.937 --> 00:04:52.100 那么持球人既可以选择利用挡拆, 也可以放弃挡拆, 00:04:52.100 --> 00:04:55.107 他的队友可以拆向篮下, 或撤到一个无人盯防的空位。 00:04:55.111 --> 00:04:58.081 防守持球者的人可以上前绕过掩护, 或者从后方绕过掩护。 00:04:58.081 --> 00:05:02.716 而他的队友则可以探出补防,或保持 近距离防守,亦或者向后消极防守。 00:05:02.716 --> 00:05:05.348 两个防守球员也可以换防,或者包夹。 00:05:05.352 --> 00:05:08.101 一开始的时候我也不是很懂这些, 00:05:08.101 --> 00:05:11.805 如果每个人都能沿着箭头方向移动, 事情就好办多了。 00:05:11.805 --> 00:05:15.767 这会让我们的工作简单很多, 但往往这些移动非常杂乱。 00:05:15.767 --> 00:05:20.995 球场上会发生很多突然的变动, 要在查准率和查全率方面 00:05:20.995 --> 00:05:22.622 准确识别这些变化 00:05:22.622 --> 00:05:24.780 是相当困难的, 00:05:24.780 --> 00:05:28.386 但只有这样, 才能让专业教练相信你的技术。 00:05:28.386 --> 00:05:31.470 尽管在准确的时空特性识别上 困难重重, 00:05:31.470 --> 00:05:33.078 我们还是成功地做到了。 NOTE Paragraph 00:05:33.078 --> 00:05:37.245 教练相信我们的机器 能够识别这些变化。 00:05:37.478 --> 00:05:40.975 目前,我们已经推出了 相关的识别软件,几乎每个 00:05:40.975 --> 00:05:42.758 觊觎今年NBA总冠军的球队, 00:05:42.758 --> 00:05:47.074 都在使用我们的这款软件, 其功能就是通过机器 00:05:47.074 --> 00:05:49.868 识别篮球领域的移动。 00:05:49.872 --> 00:05:54.999 不仅如此, 我们还对如何改善战术提供建议, 00:05:54.999 --> 00:05:58.481 并帮助球队赢得过重要的比赛。 00:05:58.481 --> 00:06:01.761 能够让联盟中执教30年的 老教练愿意听取 00:06:01.761 --> 00:06:05.248 机器提供的意见,这太让人激动了。 00:06:05.874 --> 00:06:08.334 不仅仅局限于挡拆, 更让我们兴奋的是 00:06:08.334 --> 00:06:10.444 我们让电脑从简单的事情着手, 00:06:10.444 --> 00:06:12.252 逐渐学会了更复杂的事物, 00:06:12.252 --> 00:06:14.057 如今它已经掌握了丰富的知识。 00:06:14.057 --> 00:06:17.452 老实说,我不大明白它是怎么做到的, 00:06:17.452 --> 00:06:21.211 不过就算比我聪明也没什么特别的, 00:06:21.211 --> 00:06:24.879 但我们在想, 机器能否比教练懂得更多呢? 00:06:24.879 --> 00:06:26.938 它能比人类懂得更多吗? 00:06:26.938 --> 00:06:28.697 事实上,答案是肯定的。 NOTE Paragraph 00:06:28.697 --> 00:06:31.288 教练想让球员投出好球。 00:06:31.288 --> 00:06:32.787 所以如果我站在篮筐旁边, 00:06:32.787 --> 00:06:34.707 周围没人,这就是好的投篮时机。 00:06:34.707 --> 00:06:39.031 如果我站得远,而且被对方包围住, 通常来讲这球投不进。 00:06:39.031 --> 00:06:44.227 但我们无法定量衡量这个“好”有多好, “差”有多差, 00:06:44.227 --> 00:06:45.359 但现在不同了。 NOTE Paragraph 00:06:45.771 --> 00:06:48.773 同样,我们能做的就是利用时空特性 00:06:48.773 --> 00:06:50.277 来分析每次投篮。 00:06:50.277 --> 00:06:53.326 我们可以看到:在哪里投篮? 投篮的角度是多少? 00:06:53.326 --> 00:06:55.816 防守方的站位? 他们间的距离, 00:06:55.816 --> 00:06:57.011 以及角度如何? 00:06:57.011 --> 00:07:00.518 防守球员不止一名的情况下, 我们能够通过观察球员的移动 00:07:00.518 --> 00:07:01.905 来预测投篮类型。 00:07:01.905 --> 00:07:05.983 我们可以根据他们的速度 建立一个模型, 00:07:05.983 --> 00:07:10.199 预测在这些情况下,进球的可能性。 00:07:10.199 --> 00:07:12.128 为什么这一点很重要? 00:07:12.128 --> 00:07:14.945 因为我们可以通过分析投篮 这一单一行为得到 00:07:14.945 --> 00:07:17.583 不同以往的两种信息: 00:07:17.583 --> 00:07:20.704 投篮的质量,以及投手的质量。 00:07:21.680 --> 00:07:24.992 我们可以看一下这个气泡图, 没有气泡图,还算什么TED呢? NOTE Paragraph 00:07:24.992 --> 00:07:26.010 (笑声) NOTE Paragraph 00:07:26.010 --> 00:07:27.355 这些气泡都是NBA球员。 00:07:27.355 --> 00:07:30.333 大小代表球员的体型, 颜色代表他们的位置。 00:07:30.333 --> 00:07:32.609 x轴代表投篮的命中率。 00:07:32.609 --> 00:07:34.622 靠左的球员偏向勉强投篮, 00:07:34.622 --> 00:07:37.205 靠右的球员会在有空当时才出手。 00:07:37.205 --> 00:07:39.301 Y轴代表的是投篮质量。 00:07:39.301 --> 00:07:41.731 好投手在上面,较差的在下面。 00:07:41.731 --> 00:07:43.621 举个例子,有一个球员的 00:07:43.621 --> 00:07:45.718 投篮命中率是47%, 00:07:45.718 --> 00:07:47.357 以前你只能知道这么多。 00:07:47.357 --> 00:07:52.245 但如今,我能告诉你NBA球员投篮的 00:07:52.245 --> 00:07:54.154 平均命中率是49%, 00:07:54.154 --> 00:07:55.888 他还低了两个百分点。 00:07:56.266 --> 00:08:00.781 因为我们要在众多47%的 球员中选择一个。 00:08:01.714 --> 00:08:04.343 那么重点就在于要搞清楚 00:08:04.343 --> 00:08:08.227 让你支付了一大笔美金的人 00:08:08.227 --> 00:08:11.362 到底是个经常勉强投篮的神投手, 00:08:11.362 --> 00:08:13.743 还是一个愿意空位出手的差投手。 00:08:15.130 --> 00:08:18.513 机器分析不只改变了 我们对球员的看法, 00:08:18.513 --> 00:08:20.375 也改变了我们看待比赛的方式。 NOTE Paragraph 00:08:20.375 --> 00:08:24.164 几年前有一场很激烈的NBA总决赛, 00:08:24.164 --> 00:08:27.309 迈阿密落后三分,只剩20秒了。 00:08:27.309 --> 00:08:29.108 他们将要失去总冠军了。 00:08:29.108 --> 00:08:32.743 一位叫勒布朗詹姆斯的年轻人 上去想投个三分追平。 00:08:32.743 --> 00:08:33.745 但他没投中。 00:08:33.745 --> 00:08:35.802 他的队友克里斯波什拿到篮板, 00:08:35.802 --> 00:08:37.789 传给另一个队友雷阿伦。 00:08:37.789 --> 00:08:40.058 他投中了个三分,比赛进入加时。 00:08:40.058 --> 00:08:42.072 最后他们赢了比赛,得了总冠军。 00:08:42.072 --> 00:08:44.966 这是篮球比赛中 最激动人心的时刻之一。 00:08:45.438 --> 00:08:48.801 而我们能知道每个球员在每一刻的 00:08:48.801 --> 00:08:49.869 投篮命中率 00:08:49.869 --> 00:08:52.143 以及抢到篮板的可能性, 00:08:52.143 --> 00:08:56.526 这种能力是前所未有的。 00:08:57.618 --> 00:09:00.326 有点可惜, 我无法给大家展示这个精彩片段。 00:09:00.326 --> 00:09:04.737 但为了在座的各位,我们在三周前的 00:09:04.737 --> 00:09:07.283 篮球周赛上重塑了那经典一刻。 NOTE Paragraph 00:09:07.283 --> 00:09:09.606 (笑声) NOTE Paragraph 00:09:09.606 --> 00:09:13.213 我们也重新加入了 电脑追踪数据的演示。 00:09:13.213 --> 00:09:17.398 这就是我和同事们, 在洛杉矶的唐人街, 00:09:17.398 --> 00:09:19.102 我们每周都会去打球的公园, 00:09:19.102 --> 00:09:21.357 我们在重塑雷阿伦时刻, 00:09:21.357 --> 00:09:24.050 所有的轨迹都与之相关。 00:09:24.772 --> 00:09:26.339 就是这个投篮。 00:09:26.339 --> 00:09:28.869 你们会看到这一经典时刻, 00:09:28.869 --> 00:09:31.510 以及这一刻背后都发生了什么。 00:09:31.510 --> 00:09:35.224 唯一的不同就是 我们取代了专业球员, 00:09:35.224 --> 00:09:37.830 而我取代了专业讲解员。 00:09:37.830 --> 00:09:39.337 大家请见谅。 NOTE Paragraph 00:09:41.153 --> 00:09:42.303 迈阿密。 00:09:42.671 --> 00:09:43.821 落后三分。 00:09:44.107 --> 00:09:45.257 还有20秒。 00:09:47.385 --> 00:09:48.583 杰夫带球。 00:09:50.656 --> 00:09:52.191 约什接球,三分出手! NOTE Paragraph 00:09:52.631 --> 00:09:54.480 [计算命中率] NOTE Paragraph 00:09:55.278 --> 00:09:56.428 [投篮质量] NOTE Paragraph 00:09:57.048 --> 00:09:58.833 [篮板球概率] NOTE Paragraph 00:10:00.373 --> 00:10:01.576 进不了! NOTE Paragraph 00:10:01.576 --> 00:10:03.016 [篮板球概率] NOTE Paragraph 00:10:03.777 --> 00:10:04.997 诺尔的篮板。 00:10:04.997 --> 00:10:06.207 传回给达丽亚。 NOTE Paragraph 00:10:06.509 --> 00:10:09.874 [投篮质量] NOTE Paragraph 00:10:10.676 --> 00:10:12.356 球进了——三分! 00:10:12.356 --> 00:10:14.517 打平了,还剩5秒。 00:10:14.880 --> 00:10:16.558 观众们沸腾了! NOTE Paragraph 00:10:16.558 --> 00:10:18.211 (笑声) NOTE Paragraph 00:10:18.211 --> 00:10:19.782 真实情况大概就是这样。 NOTE Paragraph 00:10:19.782 --> 00:10:20.761 (掌声) NOTE Paragraph 00:10:20.761 --> 00:10:21.940 差不多。 NOTE Paragraph 00:10:21.940 --> 00:10:23.681 (掌声) 00:10:24.121 --> 00:10:29.579 在NBA有9%的概率 会发生这样的时刻, 00:10:29.579 --> 00:10:31.920 我们知道的还有很多。 00:10:31.920 --> 00:10:35.455 我是不会告诉你们 我们尝试了多少次才成功的。 NOTE Paragraph 00:10:35.455 --> 00:10:37.246 (笑声) NOTE Paragraph 00:10:37.246 --> 00:10:39.006 好吧,我还是说吧,四次。 NOTE Paragraph 00:10:39.006 --> 00:10:40.051 (笑声) NOTE Paragraph 00:10:40.051 --> 00:10:41.656 达丽亚,三分球还得努力啊。 NOTE Paragraph 00:10:41.656 --> 00:10:45.884 但那段视频以及我们对 00:10:45.884 --> 00:10:50.652 每场NBA比赛的细微观察 并不是重点。 00:10:50.652 --> 00:10:55.088 事实上,你无需组建 一个专业团队才能追踪移动。 00:10:55.088 --> 00:10:58.524 你也无需成为专业运动员 去理解那些移动。 NOTE Paragraph 00:10:58.524 --> 00:11:02.622 而且,这不仅限于运动, 因为我们无时不刻不在移动。 00:11:03.654 --> 00:11:06.023 我们在家里, 00:11:09.428 --> 00:11:11.083 在办公室里来回走动, 00:11:12.238 --> 00:11:14.928 我们也在世界各地 00:11:17.318 --> 00:11:18.571 各个城市 00:11:20.065 --> 00:11:21.683 购物旅行。 00:11:23.270 --> 00:11:25.615 我们能发现什么? 我们能学到什么? 00:11:25.615 --> 00:11:27.954 或许,除了识别挡拆, 00:11:27.954 --> 00:11:30.912 机器还能识别某些时刻, 00:11:30.912 --> 00:11:33.061 让我知道我女儿何时 迈出她的第一步。 00:11:33.061 --> 00:11:35.571 她现在随时都有可能学会走路。 NOTE Paragraph 00:11:36.140 --> 00:11:40.307 或许我们能合理地利用我们的建筑物, 更加好地规划我们的城市。 00:11:40.307 --> 00:11:44.565 我相信随着移动圆点这一科学的发展, 00:11:44.565 --> 00:11:48.202 我们能更好地移动, 更智能地移动,一路向前。 NOTE Paragraph 00:11:48.607 --> 00:11:49.866 谢谢大家。 NOTE Paragraph 00:11:49.866 --> 00:11:54.865 (掌声)