WEBVTT 00:00:01.280 --> 00:00:05.120 今天的计算机算法, 正在使用类似人类的智能, 00:00:05.120 --> 00:00:09.946 大规模的执行具有高精度的, 不可思议的任务。 00:00:09.946 --> 00:00:13.896 而这种计算机智能,通常被称为AI, 00:00:13.896 --> 00:00:15.786 或“人工智能”。 00:00:15.786 --> 00:00:19.960 人工智能有望在未来对我们的生活 产生令人难以置信的影响。 00:00:20.880 --> 00:00:24.916 然而今天,在检测和诊断 几种危及生命的疾病, 00:00:24.916 --> 00:00:28.386 比如传染病和癌症时, 00:00:28.386 --> 00:00:30.720 我们仍然面临着大量的挑战。 00:00:32.000 --> 00:00:34.346 每年,数以千计的病人 00:00:34.346 --> 00:00:37.120 因患上肝癌和口腔癌失去生命。 NOTE Paragraph 00:00:37.880 --> 00:00:40.560 帮助病人最好的方式 00:00:40.560 --> 00:00:44.920 就是对这些疾病进行 早期检测和诊断。 00:00:45.880 --> 00:00:50.040 那么,今天我们如何检测这些疾病? AI可以提供帮助吗? 00:00:51.920 --> 00:00:55.546 对于不幸被怀疑 患有这些疾病的患者, 00:00:55.546 --> 00:00:58.286 专家医师会先要求他们照射 00:00:58.286 --> 00:01:00.890 非常昂贵的医疗图像, 00:01:00.890 --> 00:01:04.990 例如荧光成像,CT,MRI等。 00:01:04.990 --> 00:01:07.326 收集到这些图像之后, 00:01:07.326 --> 00:01:11.880 另一位专家医师会进行诊断, 并与患者交流。 00:01:12.520 --> 00:01:15.986 显而易见,这是个 非常耗费资源的过程, 00:01:15.986 --> 00:01:20.436 需要两位专家医师 和昂贵的医学图像技术。 00:01:20.440 --> 00:01:23.510 这在发展中国家被认为并不实用, 00:01:23.510 --> 00:01:26.920 事实上,在许多 工业化国家也是如此。 NOTE Paragraph 00:01:27.760 --> 00:01:30.640 那么,我们能够用 人工智能解决这个问题吗? 00:01:31.840 --> 00:01:35.936 今天,如果使用传统的 人工智能架构 00:01:35.936 --> 00:01:37.140 来解决这个问题, 00:01:37.140 --> 00:01:38.626 我可能需要1万张—— 00:01:38.626 --> 00:01:42.640 我重复一次,我首先需要 生成1万张这种非常昂贵的 00:01:42.640 --> 00:01:44.060 医学图像。 00:01:44.060 --> 00:01:47.036 之后,我会去找一位专业医师 00:01:47.036 --> 00:01:49.500 为我分析这些图像。 00:01:49.500 --> 00:01:51.640 利用这两条信息, 00:01:51.640 --> 00:01:55.320 我可以训练标准的深度神经网络, 或深度学习网络 00:01:55.320 --> 00:01:57.516 对患者进行诊断。 00:01:57.516 --> 00:01:59.250 与第一步相似, 00:01:59.250 --> 00:02:01.417 传统人工智能方法 00:02:01.417 --> 00:02:02.906 遭遇了同样的问题: 00:02:02.906 --> 00:02:07.440 那就是需要大量的数据、 专家医师和专业的医疗图像技术。 NOTE Paragraph 00:02:08.344 --> 00:02:12.634 我们是否能够创造出一种 规模更大、更有效率、 00:02:12.634 --> 00:02:15.960 同时更有价值的人工智能架构, 00:02:15.960 --> 00:02:19.016 来解决我们今天面临的 这些重要的问题呢? 00:02:19.016 --> 00:02:22.312 而这就是我们的团队 在MIT媒体实验室所研究的内容。 00:02:22.312 --> 00:02:26.134 我们开发了各种新型AI架构, 00:02:26.134 --> 00:02:29.440 来解决一些我们当今 在医疗图像和临床试验中 00:02:29.440 --> 00:02:31.770 面临的最重要的挑战。 NOTE Paragraph 00:02:32.480 --> 00:02:35.520 在我今天分享的例子中, 包括了我们的两个目标。 00:02:35.520 --> 00:02:38.536 第一个目标,是减少 用来训练人工智能算法 00:02:38.536 --> 00:02:41.780 所需要的图片数量。 00:02:41.780 --> 00:02:43.976 第二个目标——更大的志向, 00:02:43.976 --> 00:02:47.690 我们希望让患者减少使用昂贵的 00:02:47.690 --> 00:02:48.880 医疗图像技术。 00:02:48.880 --> 00:02:50.160 那么我们是怎样做的? NOTE Paragraph 00:02:50.920 --> 00:02:52.166 我们的第一个目标, 00:02:52.166 --> 00:02:54.130 相比于传统AI 00:02:54.130 --> 00:02:57.240 从成千上万张昂贵的医疗图像开始, 00:02:57.240 --> 00:02:59.310 我们选择从单张图像开始。 00:02:59.310 --> 00:03:03.120 根据这张图片, 我和我的团队想出了 00:03:03.120 --> 00:03:05.890 一种非常聪明的方法 来提取数十亿个信息包。 00:03:05.890 --> 00:03:09.686 这些信息包包含颜色、像素、形态 00:03:09.686 --> 00:03:12.160 和疾病呈现在医疗图像上的效果。 00:03:12.160 --> 00:03:16.566 这样一来,我们就将一张图像 转换成了数十亿个训练数据点, 00:03:16.566 --> 00:03:20.136 需要训练的数据量就大大减少了。 NOTE Paragraph 00:03:20.136 --> 00:03:21.304 第二个目标, 00:03:21.304 --> 00:03:25.210 是减少对患者使用医疗图像技术。 00:03:25.210 --> 00:03:28.060 最开始,我们会从 数码单反相机或手机中 00:03:28.060 --> 00:03:32.450 获取一张标准的白色光线照片。 00:03:32.450 --> 00:03:34.930 然后,还记得那 数十亿个信息包吗? 00:03:34.930 --> 00:03:38.460 将这些医疗图像的信息包 覆盖在这张图片上, 00:03:38.460 --> 00:03:41.040 这时我们就创建了一张合成图像。 00:03:41.480 --> 00:03:44.760 令人惊讶的是,我们只需要50张—— 00:03:44.760 --> 00:03:46.110 强调一下,仅仅50张—— 00:03:46.110 --> 00:03:50.000 这些复合图像, 就能训练我们的算法提高效率。 NOTE Paragraph 00:03:50.680 --> 00:03:52.066 总结一下我们的方法, 00:03:52.066 --> 00:03:55.180 区别于用1万张昂贵的 医疗图像训练AI算法, 00:03:55.180 --> 00:03:58.240 我们使用了一种全新的方式, 00:03:58.240 --> 00:04:02.510 只需要将数码相机或手机拍摄的 00:04:02.510 --> 00:04:05.096 50张高分辨率的标准照片, 00:04:05.096 --> 00:04:06.640 即可提供诊断。 00:04:06.640 --> 00:04:07.840 更重要的是, 00:04:07.840 --> 00:04:11.000 在未来,甚至现在, 我们的算法可以接受 00:04:11.000 --> 00:04:13.850 一些病人自己拍摄的白光照片, 00:04:13.850 --> 00:04:16.320 来替代昂贵的医疗图像技术。 NOTE Paragraph 00:04:17.120 --> 00:04:20.180 我相信,我们已经准备好 进入这样一个时代, 00:04:20.180 --> 00:04:22.160 人工智能 00:04:22.160 --> 00:04:24.730 正在对我们的未来产生 不可思议的影响。 00:04:24.730 --> 00:04:27.210 我也认为相比拥有丰富数据 00:04:27.210 --> 00:04:30.046 但应用困难的传统AI, 00:04:30.046 --> 00:04:31.560 我们应该不断思考 00:04:31.560 --> 00:04:34.610 非传统的人工智能架构。 00:04:34.610 --> 00:04:36.560 它们能够接受少量数据, 00:04:36.560 --> 00:04:39.510 并解决一些今天 我们所面临的重要问题, 00:04:39.510 --> 00:04:40.810 特别是在医疗健康方面。 NOTE Paragraph 00:04:40.810 --> 00:04:42.030 非常感谢。 NOTE Paragraph 00:04:42.030 --> 00:04:45.920 (掌声)