0:00:00.954,0:00:04.937 我和我的同事对移动圆点[br]背后的科学非常着迷。 0:00:04.937,0:00:06.157 那么这些小圆点是什么呢? 0:00:06.157,0:00:07.418 就是我们自己。 0:00:07.418,0:00:12.351 我们在家里,办公室里来回走动, 0:00:12.351,0:00:14.957 也在世界各地旅行和购物。 0:00:14.958,0:00:18.878 如果我们能弄清这些移动, 0:00:18.878,0:00:22.288 并从中发现规律,意义并提出见解,[br]不是一件很棒的事吗? 0:00:22.288,0:00:24.884 很幸运的是,[br]我们生活在这么一个时代, 0:00:24.884,0:00:28.825 我们非常擅长捕捉关于自身的信息。 0:00:28.825,0:00:32.464 不管是通过传感器,视频,或软件应用, 0:00:32.464,0:00:35.303 我们都能详尽地追踪到个人移动的轨迹。 0:00:36.092,0:00:41.108 这就让我们发现,[br]最佳的数据来源之一 0:00:41.108,0:00:42.356 就是体育运动。 0:00:42.682,0:00:47.969 因此无论是篮球、棒球、橄榄球或足球, 0:00:47.969,0:00:52.095 我们都可以在场馆内,[br]甚至运动员身上装上设备来追踪 0:00:52.095,0:00:53.828 他们每个时刻的运动数据。 0:00:53.828,0:00:58.178 所以我们要做的[br]——你们大概已经猜到了—— 0:00:58.178,0:01:00.161 就是把运动员的移动 0:01:00.161,0:01:01.587 转化成圆点的移动。 0:01:01.946,0:01:06.854 所以我们收集了不计其数的移动小圆点, 0:01:06.854,0:01:09.436 就像多数原始数据一样,[br]难以处理,也没什么趣味。 0:01:09.436,0:01:13.249 但数据里面蕴藏着,[br]比如篮球教练想知道的事情。 0:01:13.249,0:01:17.233 但问题是,除非教练们把每场比赛里[br]每一秒数据都记下来再去思考, 0:01:17.233,0:01:19.806 否则他们没法从中得到想要的信息。 0:01:19.806,0:01:21.764 人类大脑无法做到这件事, 0:01:21.764,0:01:23.068 但机器没问题。 0:01:23.661,0:01:27.381 然而,机器没办法自己[br]以教练的视角去看一场比赛。 0:01:27.381,0:01:30.234 直到现在,我们做到了。 0:01:30.234,0:01:32.651 那么,[br]我们让机器去观察些什么呢? 0:01:33.569,0:01:35.416 先从简单的开始。 0:01:35.416,0:01:39.219 我们先教会它传球、投篮和篮板球, 0:01:39.219,0:01:41.794 这类普通球迷也知道的事。 0:01:41.794,0:01:44.640 然后我们开始教它一些[br]稍复杂点的事情, 0:01:44.640,0:01:49.382 比如落位背打、挡拆和拉开单打。 0:01:49.382,0:01:53.590 你们如果不了解这些名词,[br]没关系。打球的人大都了如指掌。 0:01:53.590,0:01:58.940 迄今为止,我们已经能够让机器理解 0:01:58.940,0:02:02.037 下掩护和无球掩护这类复杂的, 0:02:02.037,0:02:04.777 只有专业人士才懂的战术。 0:02:04.777,0:02:09.159 于是我们已经教会电脑用[br]教练的视角去观察数据了。 0:02:10.009,0:02:11.866 我们是怎么做到的呢? 0:02:12.511,0:02:15.603 如果我让一个教练讲解挡拆, 0:02:15.603,0:02:17.177 我会得到一个定义, 0:02:17.177,0:02:21.033 如果我把这个定义编码成一个算法[br]估计会惨不忍睹。 0:02:21.033,0:02:25.318 挡拆就是四个球员之间的舞蹈, 0:02:25.318,0:02:27.240 两人进攻,两人防守。 0:02:27.486,0:02:29.124 大概是这么个过程: 0:02:29.128,0:02:31.691 一个没有带球的进攻球员 0:02:31.691,0:02:34.868 跑向持球的防守队员, 0:02:34.868,0:02:36.045 站在那里待一会儿, 0:02:36.045,0:02:39.566 然后他们一起移动(制造机会),[br]嗒哒,这就是挡拆。 0:02:39.566,0:02:41.805 (笑声) 0:02:41.805,0:02:44.287 这也是个糟糕的算法实例。 0:02:44.913,0:02:49.297 如果那个干扰的球员——[br]或者叫掩护者—— 0:02:49.297,0:02:52.144 只是跑过来干扰一下而不停下, 0:02:52.144,0:02:53.939 这可能就不是挡拆了。 0:02:54.560,0:02:58.469 就算他停下来,[br]但停的位置不够接近, 0:02:58.469,0:03:00.290 那也不算是挡拆。 0:03:00.642,0:03:03.909 或者,就算他足够近,而且停下来, 0:03:03.909,0:03:07.227 但他是在篮下完成的[br]那也不算挡拆。 0:03:07.462,0:03:09.606 或者我可能错了,[br]这些都是挡拆。 0:03:09.606,0:03:14.522 是否是挡拆要根据发生的时间、[br]球员间距、位置而定, 0:03:14.522,0:03:16.097 这些都很难去界定。 0:03:16.579,0:03:21.483 幸运的是,有了机器学习技术,[br]我们就能超越自身的能力 0:03:21.483,0:03:23.340 来描述我们已知的事物。 0:03:23.340,0:03:25.764 这个技术要如何实现呢?[br]举个例子: 0:03:25.764,0:03:28.589 我们对机器说,[br]“早上好,机器。 0:03:29.077,0:03:32.436 这儿有些挡拆例子,还有一些不是。 0:03:32.720,0:03:35.092 你来找出不同点吧。” 0:03:35.092,0:03:38.873 这其中的关键是电脑能找出[br]区别两者的特征来。 0:03:38.873,0:03:40.710 所以如果我要教会机器 0:03:40.710,0:03:41.835 辨别苹果和橘子, 0:03:41.835,0:03:44.554 我可能会说:[br]“不妨用颜色和形状来区分吧?” 0:03:44.554,0:03:47.511 而目前要解决的问题就是,[br]要区分事物的特征是什么? 0:03:47.511,0:03:48.852 电脑需要掌握的整个 0:03:48.852,0:03:52.531 移动圆点世界的关键特征是什么? 0:03:52.531,0:03:57.378 搞清楚所有这些相对位置、[br]绝对位置、距离、时机、 0:03:57.378,0:03:59.261 速率之间的关系—— 0:03:59.440,0:04:04.408 就是移动圆点科学的真正关键所在,[br]换成专业术语, 0:04:04.408,0:04:07.926 我们喜欢称之为:时空模式识别。 0:04:07.926,0:04:10.823 因为首先,你要让它听起来[br]很难懂,很专业—— 0:04:10.827,0:04:12.415 因为事实的确如此。 0:04:12.415,0:04:15.515 对于NBA教练们来说,判断是否是 0:04:15.515,0:04:17.261 挡拆并不是关键, 0:04:17.261,0:04:19.531 而这个挡拆是怎么发生的[br]才是他们关注的。 0:04:19.531,0:04:22.677 为何教练们如此关心这一点?[br]这儿我要解释一下。 0:04:22.677,0:04:24.396 在现代的篮球比赛中, 0:04:24.396,0:04:27.075 挡拆几乎是最重要的战术。 0:04:27.075,0:04:29.239 了解如何使用以及怎样防守挡拆, 0:04:29.239,0:04:32.429 基本上是比赛输赢的关键。 0:04:32.429,0:04:36.198 因此挡拆的步伐多种多样, 0:04:36.198,0:04:39.830 能够识别这些不同的形式[br]是非常重要的, 0:04:39.830,0:04:42.288 这就是为什么我们对[br]机器的智能性要求相当高。 0:04:42.288,0:04:44.058 举个例子。 0:04:44.058,0:04:45.971 这儿有两个进攻队员和[br]两个防守队员, 0:04:45.971,0:04:47.937 他们准备开始实施挡拆。 0:04:47.937,0:04:52.100 那么持球人既可以选择利用挡拆,[br]也可以放弃挡拆, 0:04:52.100,0:04:55.107 他的队友可以拆向篮下,[br]或撤到一个无人盯防的空位。 0:04:55.111,0:04:58.081 防守持球者的人可以上前绕过掩护,[br]或者从后方绕过掩护。 0:04:58.081,0:05:02.716 而他的队友则可以探出补防,或保持[br]近距离防守,亦或者向后消极防守。 0:05:02.716,0:05:05.348 两个防守球员也可以换防,或者包夹。 0:05:05.352,0:05:08.101 一开始的时候我也不是很懂这些, 0:05:08.101,0:05:11.805 如果每个人都能沿着箭头方向移动,[br]事情就好办多了。 0:05:11.805,0:05:15.767 这会让我们的工作简单很多,[br]但往往这些移动非常杂乱。 0:05:15.767,0:05:20.995 球场上会发生很多突然的变动,[br]要在查准率和查全率方面 0:05:20.995,0:05:22.622 准确识别这些变化 0:05:22.622,0:05:24.780 是相当困难的, 0:05:24.780,0:05:28.386 但只有这样,[br]才能让专业教练相信你的技术。 0:05:28.386,0:05:31.470 尽管在准确的时空特性识别上[br]困难重重, 0:05:31.470,0:05:33.078 我们还是成功地做到了。 0:05:33.078,0:05:37.245 教练相信我们的机器[br]能够识别这些变化。 0:05:37.478,0:05:40.975 目前,我们已经推出了[br]相关的识别软件,几乎每个 0:05:40.975,0:05:42.758 觊觎今年NBA总冠军的球队, 0:05:42.758,0:05:47.074 都在使用我们的这款软件,[br]其功能就是通过机器 0:05:47.074,0:05:49.868 识别篮球领域的移动。 0:05:49.872,0:05:54.999 不仅如此,[br]我们还对如何改善战术提供建议, 0:05:54.999,0:05:58.481 并帮助球队赢得过重要的比赛。 0:05:58.481,0:06:01.761 能够让联盟中执教30年的[br]老教练愿意听取 0:06:01.761,0:06:05.248 机器提供的意见,这太让人激动了。 0:06:05.874,0:06:08.334 不仅仅局限于挡拆,[br]更让我们兴奋的是 0:06:08.334,0:06:10.444 我们让电脑从简单的事情着手, 0:06:10.444,0:06:12.252 逐渐学会了更复杂的事物, 0:06:12.252,0:06:14.057 如今它已经掌握了丰富的知识。 0:06:14.057,0:06:17.452 老实说,我不大明白它是怎么做到的, 0:06:17.452,0:06:21.211 不过就算比我聪明也没什么特别的, 0:06:21.211,0:06:24.879 但我们在想,[br]机器能否比教练懂得更多呢? 0:06:24.879,0:06:26.938 它能比人类懂得更多吗? 0:06:26.938,0:06:28.697 事实上,答案是肯定的。 0:06:28.697,0:06:31.288 教练想让球员投出好球。 0:06:31.288,0:06:32.787 所以如果我站在篮筐旁边, 0:06:32.787,0:06:34.707 周围没人,这就是好的投篮时机。 0:06:34.707,0:06:39.031 如果我站得远,而且被对方包围住,[br]通常来讲这球投不进。 0:06:39.031,0:06:44.227 但我们无法定量衡量这个“好”有多好,[br]“差”有多差, 0:06:44.227,0:06:45.359 但现在不同了。 0:06:45.771,0:06:48.773 同样,我们能做的就是利用时空特性 0:06:48.773,0:06:50.277 来分析每次投篮。 0:06:50.277,0:06:53.326 我们可以看到:在哪里投篮?[br]投篮的角度是多少? 0:06:53.326,0:06:55.816 防守方的站位?[br]他们间的距离, 0:06:55.816,0:06:57.011 以及角度如何? 0:06:57.011,0:07:00.518 防守球员不止一名的情况下,[br]我们能够通过观察球员的移动 0:07:00.518,0:07:01.905 来预测投篮类型。 0:07:01.905,0:07:05.983 我们可以根据他们的速度[br]建立一个模型, 0:07:05.983,0:07:10.199 预测在这些情况下,进球的可能性。 0:07:10.199,0:07:12.128 为什么这一点很重要? 0:07:12.128,0:07:14.945 因为我们可以通过分析投篮[br]这一单一行为得到 0:07:14.945,0:07:17.583 不同以往的两种信息: 0:07:17.583,0:07:20.704 投篮的质量,以及投手的质量。 0:07:21.680,0:07:24.992 我们可以看一下这个气泡图,[br]没有气泡图,还算什么TED呢? 0:07:24.992,0:07:26.010 (笑声) 0:07:26.010,0:07:27.355 这些气泡都是NBA球员。 0:07:27.355,0:07:30.333 大小代表球员的体型,[br]颜色代表他们的位置。 0:07:30.333,0:07:32.609 x轴代表投篮的命中率。 0:07:32.609,0:07:34.622 靠左的球员偏向勉强投篮, 0:07:34.622,0:07:37.205 靠右的球员会在有空当时才出手。 0:07:37.205,0:07:39.301 Y轴代表的是投篮质量。 0:07:39.301,0:07:41.731 好投手在上面,较差的在下面。 0:07:41.731,0:07:43.621 举个例子,有一个球员的 0:07:43.621,0:07:45.718 投篮命中率是47%, 0:07:45.718,0:07:47.357 以前你只能知道这么多。 0:07:47.357,0:07:52.245 但如今,我能告诉你NBA球员投篮的 0:07:52.245,0:07:54.154 平均命中率是49%, 0:07:54.154,0:07:55.888 他还低了两个百分点。 0:07:56.266,0:08:00.781 因为我们要在众多47%的[br]球员中选择一个。 0:08:01.714,0:08:04.343 那么重点就在于要搞清楚 0:08:04.343,0:08:08.227 让你支付了一大笔美金的人 0:08:08.227,0:08:11.362 到底是个经常勉强投篮的神投手, 0:08:11.362,0:08:13.743 还是一个愿意空位出手的差投手。 0:08:15.130,0:08:18.513 机器分析不只改变了[br]我们对球员的看法, 0:08:18.513,0:08:20.375 也改变了我们看待比赛的方式。 0:08:20.375,0:08:24.164 几年前有一场很激烈的NBA总决赛, 0:08:24.164,0:08:27.309 迈阿密落后三分,只剩20秒了。 0:08:27.309,0:08:29.108 他们将要失去总冠军了。 0:08:29.108,0:08:32.743 一位叫勒布朗詹姆斯的年轻人[br]上去想投个三分追平。 0:08:32.743,0:08:33.745 但他没投中。 0:08:33.745,0:08:35.802 他的队友克里斯波什拿到篮板, 0:08:35.802,0:08:37.789 传给另一个队友雷阿伦。 0:08:37.789,0:08:40.058 他投中了个三分,比赛进入加时。 0:08:40.058,0:08:42.072 最后他们赢了比赛,得了总冠军。 0:08:42.072,0:08:44.966 这是篮球比赛中[br]最激动人心的时刻之一。 0:08:45.438,0:08:48.801 而我们能知道每个球员在每一刻的 0:08:48.801,0:08:49.869 投篮命中率 0:08:49.869,0:08:52.143 以及抢到篮板的可能性, 0:08:52.143,0:08:56.526 这种能力是前所未有的。 0:08:57.618,0:09:00.326 有点可惜,[br]我无法给大家展示这个精彩片段。 0:09:00.326,0:09:04.737 但为了在座的各位,我们在三周前的 0:09:04.737,0:09:07.283 篮球周赛上重塑了那经典一刻。 0:09:07.283,0:09:09.606 (笑声) 0:09:09.606,0:09:13.213 我们也重新加入了[br]电脑追踪数据的演示。 0:09:13.213,0:09:17.398 这就是我和同事们,[br]在洛杉矶的唐人街, 0:09:17.398,0:09:19.102 我们每周都会去打球的公园, 0:09:19.102,0:09:21.357 我们在重塑雷阿伦时刻, 0:09:21.357,0:09:24.050 所有的轨迹都与之相关。 0:09:24.772,0:09:26.339 就是这个投篮。 0:09:26.339,0:09:28.869 你们会看到这一经典时刻, 0:09:28.869,0:09:31.510 以及这一刻背后都发生了什么。 0:09:31.510,0:09:35.224 唯一的不同就是[br]我们取代了专业球员, 0:09:35.224,0:09:37.830 而我取代了专业讲解员。 0:09:37.830,0:09:39.337 大家请见谅。 0:09:41.153,0:09:42.303 迈阿密。 0:09:42.671,0:09:43.821 落后三分。 0:09:44.107,0:09:45.257 还有20秒。 0:09:47.385,0:09:48.583 杰夫带球。 0:09:50.656,0:09:52.191 约什接球,三分出手! 0:09:52.631,0:09:54.480 [计算命中率] 0:09:55.278,0:09:56.428 [投篮质量] 0:09:57.048,0:09:58.833 [篮板球概率] 0:10:00.373,0:10:01.576 进不了! 0:10:01.576,0:10:03.016 [篮板球概率] 0:10:03.777,0:10:04.997 诺尔的篮板。 0:10:04.997,0:10:06.207 传回给达丽亚。 0:10:06.509,0:10:09.874 [投篮质量] 0:10:10.676,0:10:12.356 球进了——三分! 0:10:12.356,0:10:14.517 打平了,还剩5秒。 0:10:14.880,0:10:16.558 观众们沸腾了! 0:10:16.558,0:10:18.211 (笑声) 0:10:18.211,0:10:19.782 真实情况大概就是这样。 0:10:19.782,0:10:20.761 (掌声) 0:10:20.761,0:10:21.940 差不多。 0:10:21.940,0:10:23.681 (掌声) 0:10:24.121,0:10:29.579 在NBA有9%的概率[br]会发生这样的时刻, 0:10:29.579,0:10:31.920 我们知道的还有很多。 0:10:31.920,0:10:35.455 我是不会告诉你们[br]我们尝试了多少次才成功的。 0:10:35.455,0:10:37.246 (笑声) 0:10:37.246,0:10:39.006 好吧,我还是说吧,四次。 0:10:39.006,0:10:40.051 (笑声) 0:10:40.051,0:10:41.656 达丽亚,三分球还得努力啊。 0:10:41.656,0:10:45.884 但那段视频以及我们对 0:10:45.884,0:10:50.652 每场NBA比赛的细微观察[br]并不是重点。 0:10:50.652,0:10:55.088 事实上,你无需组建[br]一个专业团队才能追踪移动。 0:10:55.088,0:10:58.524 你也无需成为专业运动员[br]去理解那些移动。 0:10:58.524,0:11:02.622 而且,这不仅限于运动,[br]因为我们无时不刻不在移动。 0:11:03.654,0:11:06.023 我们在家里, 0:11:09.428,0:11:11.083 在办公室里来回走动, 0:11:12.238,0:11:14.928 我们也在世界各地 0:11:17.318,0:11:18.571 各个城市 0:11:20.065,0:11:21.683 购物旅行。 0:11:23.270,0:11:25.615 我们能发现什么?[br]我们能学到什么? 0:11:25.615,0:11:27.954 或许,除了识别挡拆, 0:11:27.954,0:11:30.912 机器还能识别某些时刻, 0:11:30.912,0:11:33.061 让我知道我女儿何时[br]迈出她的第一步。 0:11:33.061,0:11:35.571 她现在随时都有可能学会走路。 0:11:36.140,0:11:40.307 或许我们能合理地利用我们的建筑物,[br]更加好地规划我们的城市。 0:11:40.307,0:11:44.565 我相信随着移动圆点这一科学的发展, 0:11:44.565,0:11:48.202 我们能更好地移动,[br]更智能地移动,一路向前。 0:11:48.607,0:11:49.866 谢谢大家。 0:11:49.866,0:11:54.865 (掌声)