0:00:13.961,0:00:17.095 大家好,我是乔,一位编码诗人, 0:00:17.119,0:00:22.112 正致力阻止一股正崛起的未知力量, 0:00:22.136,0:00:24.992 我称这种力量为“代码凝视”, 0:00:25.016,0:00:28.325 也是我给“算法偏见”起的别名。 0:00:28.349,0:00:32.649 算法偏见与人类的偏见一样,[br]都会产生不公。 0:00:32.673,0:00:38.623 但是,算法就像病毒一样,[br]会使偏见大规模的传播 0:00:38.623,0:00:40.863 且速度特别快。 0:00:40.863,0:00:44.426 算法偏见也会导致排斥现象 0:00:44.426,0:00:47.426 以及差别对待。 0:00:47.426,0:00:49.487 让我向你展示一下: 0:00:49.580,0:00:50.682 (视频) 0:00:50.682,0:00:53.242 Joy: 你好,镜头![br]我的脸在这儿。 0:00:53.242,0:00:55.107 你能识别我的脸吗? 0:00:55.131,0:00:56.756 摘掉眼镜呢? 0:00:58.461,0:01:00.207 你可以识别她的脸。 0:01:01.084,0:01:02.691 但我的脸呢? 0:01:05.584,0:01:06.764 (笑声) 0:01:07.078,0:01:10.657 我带上了面具,[br]你能识别我的面具吗? 0:01:11.914,0:01:14.279 这到底是怎么一回事? 0:01:14.303,0:01:17.444 为什么我要坐在电脑面前 0:01:17.468,0:01:18.892 戴着白色面具, 0:01:18.916,0:01:22.566 试着让一台廉价的网络摄像机识别我呢? 0:01:22.590,0:01:26.449 当我不作为编码诗人[br]与代码凝视作斗争时, 0:01:26.449,0:01:29.721 我是MIT媒体实验室的一个研究生, 0:01:29.745,0:01:34.662 我有机会参加各种异想天开的项目, 0:01:34.686,0:01:36.713 包括 Aspire Mirror, 0:01:36.737,0:01:41.871 它是我做的一个项目,[br]可以将数码面具投射在我的映像上。 0:01:41.895,0:01:44.245 在早晨,如果我想感受充满力量的感觉, 0:01:44.269,0:01:45.703 我可以带上一个狮子面具。 0:01:45.727,0:01:49.223 如果我想给自己打打气,[br]屏幕上会显示一句名言。 0:01:49.247,0:01:52.236 我使用了通用面部识别软件 0:01:52.260,0:01:53.611 来建立这个系统, 0:01:53.635,0:01:59.412 但是我发现它真的很难测试, [br]除非我戴一个白色面具。 0:01:59.722,0:02:04.068 不幸的是,[br]之前我也遇到过类似的问题。 0:02:04.092,0:02:08.435 当我还是个本科生时,[br]在佐治亚理工大学学习计算机科学, 0:02:08.459,0:02:10.514 我曾研究社交机器人, 0:02:10.538,0:02:14.315 我的任务之一是和机器人玩躲猫猫, 0:02:14.339,0:02:16.272 一个简单的轮次游戏 0:02:16.296,0:02:20.617 参与者需要先遮住自己的脸,[br]然后喊“躲猫猫!”露出脸。 0:02:20.741,0:02:25.170 问题是,如果看不见对方[br]这个游戏就玩不成了。 0:02:25.194,0:02:27.693 我的机器人看不见我。 0:02:27.717,0:02:31.667 但我借用室友的脸完成了这个项目, 0:02:31.691,0:02:33.071 提交了功课, 0:02:33.095,0:02:36.848 想着,总有别人会解决这个问题的。 0:02:37.499,0:02:39.502 不久之后, 0:02:39.526,0:02:43.685 我在香港参加一个创业竞赛。 0:02:44.169,0:02:46.283 主办方决定带领所有参赛者 0:02:46.283,0:02:49.283 去参观当地的初创企业。 0:02:49.283,0:02:52.022 其中一个有一个社交机器人, 0:02:52.022,0:02:53.934 他们决定做一个演示。 0:02:53.958,0:02:56.938 机器识别了每个人的脸,[br]终于轮到我了, 0:02:56.962,0:02:58.885 也许你们可以猜到。 0:02:58.909,0:03:01.874 它不能识别我的脸。 0:03:01.898,0:03:04.409 我问开发者到底是怎么回事, 0:03:04.433,0:03:09.966 发现我们用的是[br]一样的通用面部识别软件。 0:03:09.990,0:03:11.640 绕了半个世界, 0:03:11.664,0:03:14.216 我明白了算法偏见的传播速度 0:03:14.216,0:03:18.710 与从网络下载文件一样快。 0:03:19.575,0:03:22.651 那到底发生了什么呢?[br]为什么我的脸不能被识别呢? 0:03:22.675,0:03:26.031 我们必须看看人们[br]是怎么给机器设置视觉。 0:03:26.055,0:03:29.464 计算机视觉利用机器学习 0:03:29.488,0:03:31.368 来识别人脸。 0:03:31.392,0:03:35.289 你需要创造一个人脸样本训练集。 0:03:35.313,0:03:38.131 这是一张脸。这也是一张脸。[br]这不是一张脸。 0:03:38.155,0:03:42.674 通过长时间的训练,[br]你可以教计算机如何识别人脸。 0:03:42.698,0:03:46.687 但是,如果训练集中的脸没有多样化, 0:03:46.711,0:03:50.060 一张与所建范围内的样本[br]有所不同的脸 0:03:50.084,0:03:51.733 将很难被识别。 0:03:51.757,0:03:53.720 这就是发生在我身上的事情。 0:03:53.744,0:03:56.126 不用担心,还有一些好消息。 0:03:56.150,0:03:58.921 训练集不是凭空而有的, 0:03:58.945,0:04:00.733 我们可以创造它们。 0:04:00.757,0:04:04.933 所以,我们有机会[br]去创造一个全面完善的训练集, 0:04:04.957,0:04:08.781 来反应更丰富的人物肖像。 0:04:08.805,0:04:11.026 你们已经看到了我的例子: 0:04:11.050,0:04:12.818 我是如何通过社交机器人 0:04:12.842,0:04:17.453 发现算法偏见产生排斥现象。 0:04:17.477,0:04:22.292 算法偏见也会导致差别对待。 0:04:23.267,0:04:24.720 在美国, 0:04:24.744,0:04:28.942 警察机关正在使用人脸识别软件 0:04:28.966,0:04:31.425 来打击犯罪。 0:04:31.449,0:04:33.462 乔治敦法学院发表了一份报告: 0:04:33.486,0:04:40.249 美国成年人,大约一亿一千七百万人, 0:04:40.273,0:04:43.807 其中的二分之一的人的脸[br]在于人脸识别网络中。 0:04:43.831,0:04:48.383 警察机关可以不受约束得[br]使用这些网络, 0:04:48.407,0:04:52.693 使用尚未被审查过准确性的算法。 0:04:52.717,0:04:56.581 然而,人脸识别并非万无一失, 0:04:56.605,0:05:00.784 准确标明人脸仍旧是个挑战。 0:05:00.808,0:05:02.570 你可能在Facebook上见过这个 0:05:02.594,0:05:05.582 我和我的朋友总是觉得好笑:[br]当我们看见其他人名 0:05:05.606,0:05:08.064 被错误标识在我们的照片中。 0:05:08.088,0:05:13.679 但是错误识别一个嫌疑犯[br]可不是闹着玩的事, 0:05:13.703,0:05:16.530 侵犯公民自由也并非儿戏。 0:05:16.554,0:05:19.759 机器学习正被用于面部识别, 0:05:19.783,0:05:24.288 也被用于计算机视觉之外的领域。 0:05:25.096,0:05:29.112 在《数学毁灭性武器》一书中[br](Weapons of Math Destruction") 0:05:29.136,0:05:35.817 作者兼数据科学家Cathy O'Neil [br]谈论到崛起的数学毁灭性武器—— 0:05:35.841,0:05:40.194 既神秘又具有破坏性的算法[br]被广泛使用, 0:05:40.218,0:05:43.182 人们越来越依靠它们来做出决定 0:05:43.206,0:05:46.383 影响我们生活的各个方面。 0:05:46.407,0:05:48.277 谁将被雇用或解雇呢? 0:05:48.301,0:05:50.413 你能拿到那笔借贷?[br]你上的了保险了吗? 0:05:50.437,0:05:53.940 你被心仪的大学录取了吗? 0:05:53.964,0:05:57.473 你我在同一购物平台上[br]购买的同一产品 0:05:57.497,0:05:59.939 价格是否一样呢? 0:05:59.963,0:06:03.722 执法部门也正开始使用机器学习 0:06:03.746,0:06:06.035 用于预测警务。 0:06:06.059,0:06:09.553 一些法官使用机器生成的[br]风险分数来判定 0:06:09.577,0:06:13.979 犯人会在监狱里待多久。 0:06:14.003,0:06:16.457 我们必须再三思考这些决策。 0:06:16.481,0:06:17.663 他们真的公平吗? 0:06:17.687,0:06:20.577 正如我们所见那样, 0:06:20.601,0:06:23.975 算法偏见不总能得出公平的结果。 0:06:23.999,0:06:25.963 那我们可以做些什么呢? 0:06:25.987,0:06:29.667 我们可以开始思考[br]如何创造更具包容性的代码 0:06:29.691,0:06:32.681 并且采用具有包容性的代码实践。 0:06:32.705,0:06:35.014 编码由人而起。 0:06:35.538,0:06:37.499 谁编写项目代码非常重要。 0:06:37.523,0:06:41.642 我们有与不同的人一起[br]组建多样性的团队, 0:06:41.666,0:06:44.077 相互检查出对方的盲点吗? 0:06:44.101,0:06:47.646 在技术方面,如何编写代码也非常重要。 0:06:47.670,0:06:51.321 我们在开发系统时是否考虑到了公平性? 0:06:51.345,0:06:54.258 最后,我们编程的原因也很重要。 0:06:54.615,0:06:59.698 我们已使用计算机工具[br]解锁了巨大财富。 0:06:59.722,0:07:04.169 现在,我们有机会用它[br]来实现更好的平等, 0:07:04.193,0:07:07.123 前提是,优先考虑社会变革 0:07:07.147,0:07:09.317 而非在事后想到。 0:07:09.838,0:07:14.360 这些也是“译码运动” 的三条准则:[br](Incoding Movement) 0:07:14.384,0:07:16.036 谁编写代码很重要。 0:07:16.060,0:07:17.603 如何编写项目代码很重要。 0:07:17.627,0:07:19.650 为什么要编写项目代码也很重要。 0:07:19.674,0:07:22.773 在”译码运动“中,我们可以开始思考 0:07:22.797,0:07:25.961 如何建立能够识别偏见的平台, 0:07:25.985,0:07:29.063 通过收集人们的经历[br]例如我之前所提到的, 0:07:29.087,0:07:32.157 我们也需要审查现有软件。 0:07:32.181,0:07:35.946 我们也可以开始创造[br]更具包容性的训练集。 0:07:35.970,0:07:38.773 想象一个”全民自拍“活动 0:07:38.797,0:07:42.192 你我的加入可以帮助开发者[br]测试和创建 0:07:42.192,0:07:44.569 更具包容性的训练集。 0:07:45.132,0:07:47.960 我们也可以开始从道德上思考 0:07:47.984,0:07:53.375 我们发展的科技的社会影响。 0:07:53.399,0:07:55.792 为了开展“译码运动”, 0:07:55.816,0:07:58.663 我推出了“算法正义联盟” 0:07:58.687,0:08:04.559 任何一个关心平等的人[br]都可以帮助打击“代码凝视”。 0:08:04.583,0:08:07.879 在codedgaze.com,[br]你可以举报算法偏见、 0:08:07.903,0:08:10.348 请求审核、[br]成为一名测试者、 0:08:10.372,0:08:13.143 参与话题讨论: 0:08:13.167,0:08:15.454 #代码凝视。 0:08:16.572,0:08:19.059 我邀请您与我一起 0:08:19.083,0:08:22.802 创造一个科技服务全民的世界, 0:08:22.826,0:08:24.723 不仅仅是部分人, 0:08:24.747,0:08:29.395 一个重视包容和社会变革的世界。 0:08:29.419,0:08:30.594 谢谢。 0:08:30.618,0:08:35.912 (掌声) 0:08:41.435,0:08:44.649 最后,我有个问题: 0:08:44.649,0:08:47.218 你是否会和我一同战斗? 0:08:47.558,0:08:48.843 (笑声) 0:08:48.843,0:08:50.750 (掌声)