1 00:00:01,280 --> 00:00:05,120 今天的计算机算法, 正在使用类似人类的智能, 2 00:00:05,120 --> 00:00:09,946 大规模的执行具有高精度的, 不可思议的任务。 3 00:00:09,946 --> 00:00:13,896 而这种计算机智能,通常被称为AI, 4 00:00:13,896 --> 00:00:15,786 或“人工智能”。 5 00:00:15,786 --> 00:00:19,960 人工智能有望在未来对我们的生活 产生令人难以置信的影响。 6 00:00:20,880 --> 00:00:24,916 然而今天,在检测和诊断 几种危及生命的疾病, 7 00:00:24,916 --> 00:00:28,386 比如传染病和癌症时, 8 00:00:28,386 --> 00:00:30,720 我们仍然面临着大量的挑战。 9 00:00:32,000 --> 00:00:34,346 每年,数以千计的病人 10 00:00:34,346 --> 00:00:37,120 因患上肝癌和口腔癌失去生命。 11 00:00:37,880 --> 00:00:40,560 帮助病人最好的方式 12 00:00:40,560 --> 00:00:44,920 就是对这些疾病进行 早期检测和诊断。 13 00:00:45,880 --> 00:00:50,040 那么,今天我们如何检测这些疾病? AI可以提供帮助吗? 14 00:00:51,920 --> 00:00:55,546 对于不幸被怀疑 患有这些疾病的患者, 15 00:00:55,546 --> 00:00:58,286 专家医师会先要求他们照射 16 00:00:58,286 --> 00:01:00,890 非常昂贵的医疗图像, 17 00:01:00,890 --> 00:01:04,990 例如荧光成像,CT,MRI等。 18 00:01:04,990 --> 00:01:07,326 收集到这些图像之后, 19 00:01:07,326 --> 00:01:11,880 另一位专家医师会进行诊断, 并与患者交流。 20 00:01:12,520 --> 00:01:15,986 显而易见,这是个 非常耗费资源的过程, 21 00:01:15,986 --> 00:01:20,436 需要两位专家医师 和昂贵的医学图像技术。 22 00:01:20,440 --> 00:01:23,510 这在发展中国家被认为并不实用, 23 00:01:23,510 --> 00:01:26,920 事实上,在许多 工业化国家也是如此。 24 00:01:27,760 --> 00:01:30,640 那么,我们能够用 人工智能解决这个问题吗? 25 00:01:31,840 --> 00:01:35,936 今天,如果使用传统的 人工智能架构 26 00:01:35,936 --> 00:01:37,140 来解决这个问题, 27 00:01:37,140 --> 00:01:38,626 我可能需要1万张—— 28 00:01:38,626 --> 00:01:42,640 我重复一次,我首先需要 生成1万张这种非常昂贵的 29 00:01:42,640 --> 00:01:44,060 医学图像。 30 00:01:44,060 --> 00:01:47,036 之后,我会去找一位专业医师 31 00:01:47,036 --> 00:01:49,500 为我分析这些图像。 32 00:01:49,500 --> 00:01:51,640 利用这两条信息, 33 00:01:51,640 --> 00:01:55,320 我可以训练标准的深度神经网络, 或深度学习网络 34 00:01:55,320 --> 00:01:57,516 对患者进行诊断。 35 00:01:57,516 --> 00:01:59,250 与第一步相似, 36 00:01:59,250 --> 00:02:01,417 传统人工智能方法 37 00:02:01,417 --> 00:02:02,906 遭遇了同样的问题: 38 00:02:02,906 --> 00:02:07,440 那就是需要大量的数据、 专家医师和专业的医疗图像技术。 39 00:02:08,344 --> 00:02:12,634 我们是否能够创造出一种 规模更大、更有效率、 40 00:02:12,634 --> 00:02:15,960 同时更有价值的人工智能架构, 41 00:02:15,960 --> 00:02:19,016 来解决我们今天面临的 这些重要的问题呢? 42 00:02:19,016 --> 00:02:22,312 而这就是我们的团队 在MIT媒体实验室所研究的内容。 43 00:02:22,312 --> 00:02:26,134 我们开发了各种新型AI架构, 44 00:02:26,134 --> 00:02:29,440 来解决一些我们当今 在医疗图像和临床试验中 45 00:02:29,440 --> 00:02:31,770 面临的最重要的挑战。 46 00:02:32,480 --> 00:02:35,520 在我今天分享的例子中, 包括了我们的两个目标。 47 00:02:35,520 --> 00:02:38,536 第一个目标,是减少 用来训练人工智能算法 48 00:02:38,536 --> 00:02:41,780 所需要的图片数量。 49 00:02:41,780 --> 00:02:43,976 第二个目标——更大的志向, 50 00:02:43,976 --> 00:02:47,690 我们希望让患者减少使用昂贵的 51 00:02:47,690 --> 00:02:48,880 医疗图像技术。 52 00:02:48,880 --> 00:02:50,160 那么我们是怎样做的? 53 00:02:50,920 --> 00:02:52,166 我们的第一个目标, 54 00:02:52,166 --> 00:02:54,130 相比于传统AI 55 00:02:54,130 --> 00:02:57,240 从成千上万张昂贵的医疗图像开始, 56 00:02:57,240 --> 00:02:59,310 我们选择从单张图像开始。 57 00:02:59,310 --> 00:03:03,120 根据这张图片, 我和我的团队想出了 58 00:03:03,120 --> 00:03:05,890 一种非常聪明的方法 来提取数十亿个信息包。 59 00:03:05,890 --> 00:03:09,686 这些信息包包含颜色、像素、形态 60 00:03:09,686 --> 00:03:12,160 和疾病呈现在医疗图像上的效果。 61 00:03:12,160 --> 00:03:16,566 这样一来,我们就将一张图像 转换成了数十亿个训练数据点, 62 00:03:16,566 --> 00:03:20,136 需要训练的数据量就大大减少了。 63 00:03:20,136 --> 00:03:21,304 第二个目标, 64 00:03:21,304 --> 00:03:25,210 是减少对患者使用医疗图像技术。 65 00:03:25,210 --> 00:03:28,060 最开始,我们会从 数码单反相机或手机中 66 00:03:28,060 --> 00:03:32,450 获取一张标准的白色光线照片。 67 00:03:32,450 --> 00:03:34,930 然后,还记得那 数十亿个信息包吗? 68 00:03:34,930 --> 00:03:38,460 将这些医疗图像的信息包 覆盖在这张图片上, 69 00:03:38,460 --> 00:03:41,040 这时我们就创建了一张合成图像。 70 00:03:41,480 --> 00:03:44,760 令人惊讶的是,我们只需要50张—— 71 00:03:44,760 --> 00:03:46,110 强调一下,仅仅50张—— 72 00:03:46,110 --> 00:03:50,000 这些复合图像, 就能训练我们的算法提高效率。 73 00:03:50,680 --> 00:03:52,066 总结一下我们的方法, 74 00:03:52,066 --> 00:03:55,180 区别于用1万张昂贵的 医疗图像训练AI算法, 75 00:03:55,180 --> 00:03:58,240 我们使用了一种全新的方式, 76 00:03:58,240 --> 00:04:02,510 只需要将数码相机或手机拍摄的 77 00:04:02,510 --> 00:04:05,096 50张高分辨率的标准照片, 78 00:04:05,096 --> 00:04:06,640 即可提供诊断。 79 00:04:06,640 --> 00:04:07,840 更重要的是, 80 00:04:07,840 --> 00:04:11,000 在未来,甚至现在, 我们的算法可以接受 81 00:04:11,000 --> 00:04:13,850 一些病人自己拍摄的白光照片, 82 00:04:13,850 --> 00:04:16,320 来替代昂贵的医疗图像技术。 83 00:04:17,120 --> 00:04:20,180 我相信,我们已经准备好 进入这样一个时代, 84 00:04:20,180 --> 00:04:22,160 人工智能 85 00:04:22,160 --> 00:04:24,730 正在对我们的未来产生 不可思议的影响。 86 00:04:24,730 --> 00:04:27,210 我也认为相比拥有丰富数据 87 00:04:27,210 --> 00:04:30,046 但应用困难的传统AI, 88 00:04:30,046 --> 00:04:31,560 我们应该不断思考 89 00:04:31,560 --> 00:04:34,610 非传统的人工智能架构。 90 00:04:34,610 --> 00:04:36,560 它们能够接受少量数据, 91 00:04:36,560 --> 00:04:39,510 并解决一些今天 我们所面临的重要问题, 92 00:04:39,510 --> 00:04:40,810 特别是在医疗健康方面。 93 00:04:40,810 --> 00:04:42,030 非常感谢。 94 00:04:42,030 --> 00:04:45,920 (掌声)