WEBVTT 00:00:00.000 --> 00:00:02.000 光阴似箭 00:00:02.000 --> 00:00:04.000 差不多是20年前 00:00:04.000 --> 00:00:08.000 当我想重新构造我们使用信息 00:00:08.000 --> 00:00:11.000 协同工作方式的时候 - 我发明了万维网 00:00:11.000 --> 00:00:14.000 20年过去了,现在,在TED 00:00:14.000 --> 00:00:18.000 我请求你们帮助创建新的架构 NOTE Paragraph 00:00:19.000 --> 00:00:23.000 回到1989年 00:00:23.000 --> 00:00:26.000 我在备忘录中建议使用一种全球的超链接系统 00:00:26.000 --> 00:00:29.000 几乎没有什么人在真正用它 00:00:29.000 --> 00:00:33.000 但是,18个月后 - 革新就是这么开始的 00:00:33.000 --> 00:00:37.000 18个月后,老板说,我可以兼职做这件事 00:00:37.000 --> 00:00:39.000 做一种游戏性质的项目 00:00:39.000 --> 00:00:41.000 就拿我们新买来的电脑 00:00:41.000 --> 00:00:44.000 他给了我些时间写代码实现 00:00:44.000 --> 00:00:49.000 我草拟了下HTML应该是什么样子 00:00:49.000 --> 00:00:52.000 超文本协议 - HTTP - 00:00:52.000 --> 00:00:55.000 关于URLs 的想法 - 事物的名称 00:00:55.000 --> 00:00:57.000 这些事物都是以HTTP开头命名的 00:00:57.000 --> 00:00:59.000 我完成了代码并发布出来。 NOTE Paragraph 00:00:59.000 --> 00:01:01.000 我为什么要这么做? 00:01:01.000 --> 00:01:03.000 这是一个充满挫败感的过程 00:01:03.000 --> 00:01:07.000 我感到很挫败 - 因为我作为名软件工程师 00:01:07.000 --> 00:01:09.000 工作在这个令人兴奋的超大的实验室中 00:01:09.000 --> 00:01:11.000 很多人从世界各地来到这里 00:01:11.000 --> 00:01:14.000 他们的电脑各不相同 00:01:14.000 --> 00:01:17.000 数据格式各不相同 00:01:17.000 --> 00:01:19.000 文件系统各不相同 00:01:19.000 --> 00:01:22.000 所以,这其中有很大的差异性 00:01:22.000 --> 00:01:24.000 如果我想建立一点点东西 00:01:24.000 --> 00:01:26.000 在这些差异性很大的电脑上 00:01:26.000 --> 00:01:30.000 我要找一些数据,我不得不连接到一些新的机器 00:01:30.000 --> 00:01:32.000 运行一些新的程序 00:01:32.000 --> 00:01:37.000 以便我能在新的数据格式中找到一些信息 00:01:37.000 --> 00:01:39.000 这些都是不兼容的 00:01:39.000 --> 00:01:41.000 这非常令人沮丧 00:01:41.000 --> 00:01:43.000 这种挫败感却正显示出这个项目的潜力所在 NOTE Paragraph 00:01:43.000 --> 00:01:46.000 事实上,这些磁盘里全是文件 00:01:46.000 --> 00:01:49.000 所以如果你仅仅把他们 00:01:49.000 --> 00:01:54.000 想象成天空中某些大型虚拟文件系统的一部分 00:01:54.000 --> 00:01:56.000 比如Internet 00:01:56.000 --> 00:01:58.000 生活就会简单得多 00:01:58.000 --> 00:02:02.000 这样,一旦你有了这样的想法 00:02:02.000 --> 00:02:04.000 即使人们并没有读到你的备忘录 00:02:04.000 --> 00:02:07.000 事实上他读到了,因为在他死后,在他的草稿拷贝中 00:02:07.000 --> 00:02:10.000 他用铅笔在角落写到“模糊,但是令人兴奋”。 NOTE Paragraph 00:02:10.000 --> 00:02:12.000 (笑声) NOTE Paragraph 00:02:12.000 --> 00:02:16.000 但一般情况下,很难有这样的想法 – 的确很难解释 00:02:16.000 --> 00:02:18.000 网络是什么样的 00:02:18.000 --> 00:02:20.000 现在都很难向人们解释,更别提当初了 00:02:20.000 --> 00:02:23.000 但是 - 对,当TED开始时,那时没有网络 00:02:23.000 --> 00:02:26.000 所以像点击这样的事情含义是不同的 00:02:26.000 --> 00:02:28.000 我现在可以向某人展示一大堆超链接 00:02:28.000 --> 00:02:30.000 某个包含链接的网页 00:02:30.000 --> 00:02:34.000 我们点击一个链接,然后bing -- 就会转到另一个超链接的页面 00:02:34.000 --> 00:02:36.000 没什么令人印象深刻的 00:02:36.000 --> 00:02:39.000 我们已经见到,通过超链接找到CD-ROMs中的内容 00:02:39.000 --> 00:02:42.000 困难的是把它们想象出来 00:02:42.000 --> 00:02:46.000 所以,想象那个链接可以到 00:02:46.000 --> 00:02:48.000 任何实际的你能想象得到的文件 00:02:49.000 --> 00:02:53.000 好的,这个跳跃对于人们是很难做到的 00:02:53.000 --> 00:02:55.000 然而,一些人做到了 00:02:55.000 --> 00:02:58.000 尽管很难解释,但是这是一场草根运动 00:02:59.000 --> 00:03:03.000 这正是使它好玩的地方 00:03:03.000 --> 00:03:05.000 也是最令人激动人心的事情 00:03:05.000 --> 00:03:07.000 不是技术,不是人们用它所做的东西 00:03:07.000 --> 00:03:09.000 而是实际的交流,所有这些人的思想汇聚 00:03:09.000 --> 00:03:11.000 在一起,发送电子邮件 00:03:11.000 --> 00:03:13.000 这是那时的情况 NOTE Paragraph 00:03:13.000 --> 00:03:16.000 你知道吗?有趣的是,现在跟那时候又有点像了 00:03:16.000 --> 00:03:18.000 我问每一个人,他们或多或少都发布过文档 00:03:18.000 --> 00:03:21.000 我说“你能把你的文档放到网络上吗?” 00:03:21.000 --> 00:03:24.000 然后,你做了 00:03:24.000 --> 00:03:25.000 谢谢 00:03:25.000 --> 00:03:27.000 这已经是一场疾风,不是吗? 00:03:27.000 --> 00:03:29.000 我的意思是,它已经非常有趣 00:03:29.000 --> 00:03:31.000 因为我们发现,网络上发生的事情似乎 00:03:31.000 --> 00:03:33.000 已经把我们吹到了一边 00:03:33.000 --> 00:03:35.000 现在它的功能得比我们想象的还多 00:03:35.000 --> 00:03:37.000 最初的设计只是想把文档放在一起 00:03:37.000 --> 00:03:39.000 在我们最初开始使用网络时 00:03:39.000 --> 00:03:42.000 现在我想让你把你的数据放在网上 00:03:42.000 --> 00:03:46.000 还是有巨大的可释放潜力 00:03:46.000 --> 00:03:48.000 也有很大的挫败感 00:03:48.000 --> 00:03:52.000 因为我们从网上得到的数据不是我们想要的数据 NOTE Paragraph 00:03:52.000 --> 00:03:54.000 你说的数据是什么?文档和数据之间有什么区别? 00:03:54.000 --> 00:03:57.000 文档是你阅读的东西 00:03:57.000 --> 00:04:00.000 或多或少,你都读过,你可以追踪他们的链接,就是这样 00:04:00.000 --> 00:04:02.000 数据—你可以通过一台电脑使用各种数据 00:04:02.000 --> 00:04:08.000 谁在这里或者其他地方听过汉斯罗素玲的演讲? 00:04:08.000 --> 00:04:12.000 一个伟大的 – 很多人已经看过了 – 00:04:12.000 --> 00:04:14.000 一个伟大的TED演讲 00:04:14.000 --> 00:04:16.000 汉斯在他的演示文档中 00:04:16.000 --> 00:04:21.000 使用不同的颜色表示不同的国家 00:04:21.000 --> 00:04:24.000 他在一个轴上显示收入水平 00:04:24.000 --> 00:04:27.000 同时他用动画按年份显示婴儿死亡率 00:04:27.000 --> 00:04:31.000 他使用这些数据完成了一场演讲, 00:04:31.000 --> 00:04:34.000 这个演讲打破了很多人 00:04:34.000 --> 00:04:38.000 对发展中国家经济的神话 NOTE Paragraph 00:04:38.000 --> 00:04:40.000 他展示了一个类似的幻灯片 00:04:40.000 --> 00:04:42.000 数据都被埋在地下 00:04:42.000 --> 00:04:45.000 对,数据是这些棕色的、无趣的四方盒子 00:04:45.000 --> 00:04:47.000 我们就是这样看待数据的,不是吗? 00:04:47.000 --> 00:04:50.000 因为,你不能漫无目的地使用数据 00:04:50.000 --> 00:04:54.000 但事实上,数据驱动了我们的生活 00:04:54.000 --> 00:04:57.000 因为某些人使用了数据并且做了些事情 00:04:57.000 --> 00:04:59.000 在这个例子中,汉斯将数据放到了一起 00:04:59.000 --> 00:05:04.000 汉斯在美国网站找到各种数据和事物 00:05:04.000 --> 00:05:06.000 他把数据放到了一起 00:05:06.000 --> 00:05:09.000 将它们组合起来使之比原始数据有趣得多 00:05:09.000 --> 00:05:14.000 然后把数据放到这个软件中 00:05:14.000 --> 00:05:16.000 这个软件我觉得是他儿子开发的 00:05:16.000 --> 00:05:19.000 最终他做出了这个美妙的演示 00:05:19.000 --> 00:05:21.000 最后汉斯说道 00:05:21.000 --> 00:05:25.000 “瞧,有大量的数据是非常重要的” 00:05:25.000 --> 00:05:28.000 我高兴地看到在昨天的晚会上 00:05:28.000 --> 00:05:32.000 他仍然强烈地表示“有大量数据是非常重要的” NOTE Paragraph 00:05:32.000 --> 00:05:34.000 现在我想让大家想的是 00:05:34.000 --> 00:05:38.000 不仅仅是两条数据间的连接,或者像他所说的那样六条数据 00:05:38.000 --> 00:05:43.000 而是这个世界上任何人 00:05:43.000 --> 00:05:45.000 都把数据和可以虚拟化的一切内容放到网络上 00:05:45.000 --> 00:05:47.000 然后把它们称为关联数据 00:05:47.000 --> 00:05:49.000 这个技术就是关联数据,它是极其简单的 00:05:49.000 --> 00:05:53.000 如果你想把什么东西放在网络,有三条规则 00:05:53.000 --> 00:05:56.000 第一条规则是,需要有HTTP的名字 00:05:56.000 --> 00:05:58.000 那些东西要以http:开头 00:05:58.000 --> 00:06:02.000 我们现在不仅对文档这样用 00:06:02.000 --> 00:06:04.000 对文档描述的事物也这样用 00:06:04.000 --> 00:06:06.000 我们对人物、地点 00:06:06.000 --> 00:06:10.000 产品,事件等都这样用 00:06:10.000 --> 00:06:14.000 所有概念化的东西现在都以HTTP开头命名 NOTE Paragraph 00:06:14.000 --> 00:06:19.000 第二条规则,如果我有一个HTTP名称,然后我根据它在网络上进行查找 00:06:19.000 --> 00:06:21.000 我可以从网上获取数据 00:06:21.000 --> 00:06:23.000 通过HTTP协议 00:06:23.000 --> 00:06:26.000 我将得到一些标准的格式化数据 00:06:26.000 --> 00:06:31.000 这些有用数据或许是关于人们希望了解 00:06:31.000 --> 00:06:33.000 某个事物或者事件的 00:06:33.000 --> 00:06:35.000 事件的主人公是谁?关于这个人的所有信息 00:06:35.000 --> 00:06:37.000 他们什么时候生的,等等 00:06:37.000 --> 00:06:39.000 所以,第二条规则就是我通过HTTP获得了重要的数据 NOTE Paragraph 00:06:39.000 --> 00:06:43.000 第三条规则是,我得到的信息 00:06:43.000 --> 00:06:46.000 不仅仅是某人的身高、体重和出生日期 00:06:46.000 --> 00:06:48.000 还有数据间的关系 00:06:48.000 --> 00:06:50.000 数据是有联系的 00:06:50.000 --> 00:06:52.000 很有趣,数据是有联系的 00:06:52.000 --> 00:06:56.000 这个人出生在柏林,柏林在德国 00:06:56.000 --> 00:06:59.000 当数据有联系时,无论何时它表现出这种联系 00:06:59.000 --> 00:07:02.000 另一件与之有联系的事物 00:07:02.000 --> 00:07:06.000 就以HTTP开头命名 00:07:06.000 --> 00:07:08.000 所以,我可以直接去找那件事 00:07:08.000 --> 00:07:11.000 比如,我查一个人 -- 我查他出生的城市 00:07:11.000 --> 00:07:14.000 这个城市的所在区域,城市的城镇 00:07:14.000 --> 00:07:17.000 人口等等 00:07:17.000 --> 00:07:19.000 这样我就能浏览这些信息 NOTE Paragraph 00:07:19.000 --> 00:07:21.000 真的,就是这样 00:07:21.000 --> 00:07:23.000 这就是关联数据 00:07:23.000 --> 00:07:26.000 我多年前在一篇文章中给它命名为“关联数据” 00:07:26.000 --> 00:07:30.000 之后不久,有些事开始发生了 00:07:30.000 --> 00:07:34.000 关联数据的想法就像我们得到了很多很多 00:07:34.000 --> 00:07:36.000 类似汉斯拥有的盒子 00:07:36.000 --> 00:07:38.000 很多很多的事物开始发芽生长 00:07:38.000 --> 00:07:41.000 它带给我们相当多的植物 00:07:41.000 --> 00:07:43.000 不仅仅是一个根供给一个植物 00:07:43.000 --> 00:07:46.000 对于这的每一个植物,无论它是什么 00:07:46.000 --> 00:07:49.000 一个演示,一个分析,某些人查看数据的样式 00:07:49.000 --> 00:07:52.000 它们都着眼于所有的数据 00:07:52.000 --> 00:07:54.000 并且它们把数据联系起来 00:07:54.000 --> 00:07:56.000 关于数据真正重要的是 00:07:56.000 --> 00:07:58.000 你把很多东西联系起来,数据就更加有价值 NOTE Paragraph 00:07:58.000 --> 00:08:00.000 所以,关联数据 00:08:00.000 --> 00:08:02.000 由此而来 00:08:02.000 --> 00:08:06.000 很快,来自柏林自由大学的克里斯拜泽 00:08:06.000 --> 00:08:08.000 做为第一人把有趣的东西放在一起 00:08:08.000 --> 00:08:10.000 他注意到维基百科 00:08:10.000 --> 00:08:13.000 一部在线百科全书 00:08:13.000 --> 00:08:15.000 有很多有趣的文档 00:08:15.000 --> 00:08:19.000 在这些文档中,有些小方格子和小盒子 00:08:19.000 --> 00:08:22.000 在许多信息盒子中,就是数据 00:08:22.000 --> 00:08:26.000 他写了 一个程序将数据从维基百科中提取出来 00:08:26.000 --> 00:08:28.000 然后将它放到关联数据的blob(二进制大对象)中 00:08:28.000 --> 00:08:31.000 在网络上,被他称之为dbpedia(数据库百科) 00:08:31.000 --> 00:08:35.000 这张幻灯片中部蓝色的blob表示Dbpedia 00:08:35.000 --> 00:08:37.000 如果你去找柏林 00:08:37.000 --> 00:08:39.000 你会发现还有其他的数据 00:08:39.000 --> 00:08:42.000 也有柏林的信息,它们被联系到了一起 00:08:42.000 --> 00:08:45.000 所以,如果你要从dbpedia中摘出关于柏林的数据 00:08:45.000 --> 00:08:47.000 你也最终会摘出其他内容 00:08:47.000 --> 00:08:50.000 令人兴奋的事情是它正在成长 00:08:50.000 --> 00:08:52.000 这又是一个草根做的事情,对吗? NOTE Paragraph 00:08:52.000 --> 00:08:55.000 让我们多想想数据 00:08:55.000 --> 00:08:58.000 数据实际上来源于很多很多不同的形式 00:08:58.000 --> 00:09:01.000 想想网络的多样性,很重要的一点 00:09:01.000 --> 00:09:04.000 网络允许你将各式各样的数据放在一起 00:09:04.000 --> 00:09:06.000 说到数据,我能说出各种各样的数据 00:09:07.000 --> 00:09:11.000 我们可以说政府数据,企业数据真的很重要 00:09:11.000 --> 00:09:14.000 还有科学数据,个人数据 00:09:14.000 --> 00:09:16.000 天气数据,关于事件的数据 00:09:16.000 --> 00:09:20.000 关于谈话的数据,还有新闻和各种类似的东西 00:09:20.000 --> 00:09:23.000 我只提到了一小部分数据 00:09:23.000 --> 00:09:25.000 你们就可以看出其多样性 00:09:25.000 --> 00:09:29.000 所以你可以看到其中的潜力 NOTE Paragraph 00:09:29.000 --> 00:09:31.000 让我们从政府数据说起 00:09:31.000 --> 00:09:33.000 让我们从政府数据说起 00:09:33.000 --> 00:09:38.000 美国的政府数据将在互联网上被应用 00:09:38.000 --> 00:09:40.000 以一种可访问的形式 00:09:40.000 --> 00:09:42.000 美国的政府数据将在互联网上以一种可访问的形式被应用 00:09:42.000 --> 00:09:44.000 这非常重要,难道不是吗? 00:09:44.000 --> 00:09:47.000 不仅仅是为了透明性,透明性对政府很重要 00:09:47.000 --> 00:09:50.000 尤其是从政府部门出来的数据更重要 00:09:50.000 --> 00:09:55.000 想想有多少关系到在美国如何生活的数据 00:09:55.000 --> 00:09:57.000 它的确很有用,很有价值 00:09:57.000 --> 00:09:59.000 我可以把它用在我的公司 00:09:59.000 --> 00:10:01.000 我可以像个小孩子般把它用在我的家庭作业中 00:10:01.000 --> 00:10:04.000 所以,我们谈论的是让世界变得更好 00:10:04.000 --> 00:10:06.000 通过将这些数据变得更有用 NOTE Paragraph 00:10:06.000 --> 00:10:10.000 事实上,如果你们在负责 - 如果你知道一些数据 00:10:10.000 --> 00:10:12.000 关于政府的, 你经常会发现 00:10:12.000 --> 00:10:15.000 有些人,他们会被这些数据所吸引 00:10:15.000 --> 00:10:18.000 Hans称之为数据库拥抱 00:10:18.000 --> 00:10:20.000 你拥抱你的数据库,你不会放它走 00:10:20.000 --> 00:10:22.000 直到你为它建立了一个漂亮的网站 00:10:22.000 --> 00:10:24.000 嗯,我想建议的是,除了建一个漂亮的网站 00:10:24.000 --> 00:10:26.000 是的,建一个漂亮的网站 00:10:26.000 --> 00:10:28.000 我没说不要建一个漂亮的网站 00:10:28.000 --> 00:10:31.000 建一个漂亮的网站,首先 00:10:31.000 --> 00:10:34.000 要给我们纯粹的数据 00:10:34.000 --> 00:10:36.000 我们要的是数据 00:10:36.000 --> 00:10:38.000 我们要纯粹的数据 00:10:38.000 --> 00:10:41.000 好,现在我们不得不要求原始数据了 00:10:41.000 --> 00:10:43.000 我要请你们练习一下,好吗? 00:10:43.000 --> 00:10:44.000 请说“原始” NOTE Paragraph 00:10:44.000 --> 00:10:45.000 原始 NOTE Paragraph 00:10:45.000 --> 00:10:46.000 请说“数据” NOTE Paragraph 00:10:46.000 --> 00:10:47.000 数据 NOTE Paragraph 00:10:47.000 --> 00:10:48.000 请说‘现在“ NOTE Paragraph 00:10:48.000 --> 00:10:49.000 现在 NOTE Paragraph 00:10:49.000 --> 00:10:51.000 好,原始数据现在! NOTE Paragraph 00:10:51.000 --> 00:10:53.000 原始数据现在! NOTE Paragraph 00:10:53.000 --> 00:10:57.000 这样练习是非常重要的 00:10:57.000 --> 00:10:59.000 因为你不知道那些拥有数据的人 00:10:59.000 --> 00:11:03.000 有多少理由拒绝将数据给你,甚至你作为一个纳税人是为此付了钱的 00:11:03.000 --> 00:11:05.000 这不仅仅存在于美国,全世界都一样 00:11:05.000 --> 00:11:08.000 也不仅仅在政府,当然也存在于企业。 NOTE Paragraph 00:11:08.000 --> 00:11:11.000 我还想再谈谈关于数据的其他想法 00:11:11.000 --> 00:11:16.000 在TED,我们一直关注于 00:11:16.000 --> 00:11:21.000 人类社会目前所面临的巨大问题 00:11:21.000 --> 00:11:24.000 癌症治疗,了解阿尔茨海默病 00:11:24.000 --> 00:11:27.000 了解经济好让它稳定点 00:11:27.000 --> 00:11:29.000 了解世界是如何运转的 00:11:29.000 --> 00:11:31.000 那些致力于解决这些问题的科学家 00:11:31.000 --> 00:11:33.000 他们脑海中有些还不成熟的想法 00:11:33.000 --> 00:11:36.000 他们试图在网络上与他人交流 00:11:36.000 --> 00:11:39.000 但是现状是很多人类的知识 00:11:39.000 --> 00:11:42.000 现在都在数据库中,放在他们的电脑里 00:11:42.000 --> 00:11:45.000 现在实际上也没被共享 NOTE Paragraph 00:11:45.000 --> 00:11:48.000 事实上,我就从一个方面来说明 - 00:11:48.000 --> 00:11:50.000 如果你在研究阿尔茨海默病,以此为例, 00:11:50.000 --> 00:11:53.000 以药物发现为例 -- 这个领域具有相当多的刚刚出现的关联数据 00:11:53.000 --> 00:11:55.000 因为这个领域的科学家们意识到 00:11:55.000 --> 00:11:58.000 关联数据是一种很好的方法,可以帮助他们摆脱数据孤岛 00:11:58.000 --> 00:12:02.000 因为他们在一个数据库中建立了基因图组 00:12:02.000 --> 00:12:05.000 他们在另一个数据库中建立蛋白质数据 00:12:05.000 --> 00:12:08.000 现在,他们将基因图组和蛋白质数据形成了关联数据 00:12:08.000 --> 00:12:11.000 他们可以问排序的问题,也许你不会问 00:12:11.000 --> 00:12:13.000 我不会问,但是他们会 00:12:13.000 --> 00:12:15.000 哪些蛋白质参与信号转导 00:12:15.000 --> 00:12:17.000 并且也和锥体神经元相关? 00:12:17.000 --> 00:12:20.000 当你将这个问题放到Google上搜索 00:12:20.000 --> 00:12:23.000 自然没有回答结果的页面 00:12:23.000 --> 00:12:25.000 因为之前没有人问过这样的问题 00:12:25.000 --> 00:12:27.000 虽然你得到了223,000个结果 00:12:27.000 --> 00:12:29.000 但是没有一个你用得上 00:12:29.000 --> 00:12:32.000 但是没有一个你用得上 -- 现在他们已经被放到了一起 00:12:32.000 --> 00:12:36.000 命中32个结果,每一个结果都是与特征相关的蛋白质 00:12:36.000 --> 00:12:38.000 并且你可以看到 00:12:38.000 --> 00:12:41.000 做为一个科学家, 询问那些问题的能力 00:12:41.000 --> 00:12:43.000 那些问题基本上都是跨学科的问题 00:12:43.000 --> 00:12:46.000 是真正的C-change 00:12:46.000 --> 00:12:48.000 这是非常非常重要的 00:12:48.000 --> 00:12:50.000 科学家们那时完全陷入了困境 00:12:50.000 --> 00:12:55.000 因为其他科学家搜集的数据,其价值被锁起来了 00:12:55.000 --> 00:12:58.000 我们需要将之解锁,以便处理那些大问题 NOTE Paragraph 00:12:58.000 --> 00:13:02.000 现在,如果我继续像这样讲 00:13:02.000 --> 00:13:05.000 和你没有一点关系 00:13:05.000 --> 00:13:07.000 但是,这种想法并不对 00:13:07.000 --> 00:13:09.000 事实上,数据关乎我们的生活 00:13:09.000 --> 00:13:12.000 你刚刚登陆了你的社会化网络站点 00:13:12.000 --> 00:13:14.000 你最喜欢的一个,你说“这是我朋友” 00:13:14.000 --> 00:13:17.000 叮!联系,数据 00:13:17.000 --> 00:13:20.000 你说“这副照片,是这个人的” 00:13:20.000 --> 00:13:23.000 叮!那是数据。数据,数据,数据 00:13:23.000 --> 00:13:25.000 每次你在社会化网络上做的事 00:13:25.000 --> 00:13:29.000 社会化网络站点就获取数据并利用它 00:13:29.000 --> 00:13:33.000 重新设计数据的目的是为了让这个站点的其他人过得更有趣 00:13:33.000 --> 00:13:35.000 但是,当你上另一个关联数据网站 00:13:35.000 --> 00:13:38.000 假设是一个旅游网站 00:13:38.000 --> 00:13:41.000 你说“我想把这张照片发给那个组里的所有人” 00:13:41.000 --> 00:13:43.000 但你却无法翻过这些墙 00:13:43.000 --> 00:13:45.000 经济学家曾经写了一篇关于这个问题的文章,并且许多人也发了相关博文表示出 00:13:45.000 --> 00:13:46.000 巨大的挫败感 00:13:46.000 --> 00:13:48.000 打破孤岛的方式是实现互操作 00:13:48.000 --> 00:13:50.000 在这些社交网络之间 00:13:50.000 --> 00:13:52.000 我们需要通过关联数据做这件事 NOTE Paragraph 00:13:52.000 --> 00:13:55.000 最后一种我将要谈到的数据,也许是最令人激动的 00:13:55.000 --> 00:13:58.000 在我来这之前,我通过OpenStreetMap查找了一下 00:13:58.000 --> 00:14:00.000 OpenStreetMap是一个地图,但同样也是一个维基 00:14:00.000 --> 00:14:03.000 放大这个方块,这是一个剧场 -- 就是我们现在所处的地方 -- 00:14:03.000 --> 00:14:05.000 特伦斯剧场(位于长滩市,加利福尼亚)。它现在还没有被标上名字 00:14:05.000 --> 00:14:07.000 所以我可以到编辑模式,选择剧场 00:14:07.000 --> 00:14:12.000 然后在底下填上名字,然后保存它 00:14:12.000 --> 00:14:15.000 现在你再去访问OpenStreetMap.org 00:14:15.000 --> 00:14:18.000 你找到这个地方,你会发现它现在有名字了 00:14:18.000 --> 00:14:20.000 这都是我做的 00:14:20.000 --> 00:14:22.000 我在地图上标的,刚刚做的 00:14:22.000 --> 00:14:24.000 我把它标注在那里。嗨,你知道吗 00:14:24.000 --> 00:14:27.000 如果除了我,每个人都在这个地图上标注一点 00:14:27.000 --> 00:14:30.000 将会产生难以置信的资源 00:14:30.000 --> 00:14:33.000 因为其他每个人都做了 00:14:33.000 --> 00:14:36.000 这就是关联数据 00:14:36.000 --> 00:14:39.000 每个人都做一点 00:14:39.000 --> 00:14:42.000 生成一点内容,然后把它们连接起来 00:14:42.000 --> 00:14:45.000 关联数据就是这样工作的 00:14:45.000 --> 00:14:49.000 你做一些,每个人都做一些 00:14:49.000 --> 00:14:53.000 也许你的数据在关联数据中只是很小一部分 00:14:53.000 --> 00:14:56.000 但你知道你需要它 00:14:56.000 --> 00:14:58.000 我们已经在实践了 NOTE Paragraph 00:14:58.000 --> 00:15:02.000 关联数据 -- 是非常巨大的 00:15:02.000 --> 00:15:05.000 我只能告诉你很小一部分 00:15:05.000 --> 00:15:07.000 我们生活的每个方面 00:15:07.000 --> 00:15:10.000 工作和快乐的每个方面 00:15:10.000 --> 00:15:13.000 不管是数据出处的有多少 00:15:13.000 --> 00:15:16.000 关键是把它联系起来 00:15:16.000 --> 00:15:19.000 当你把数据联系起来 00:15:19.000 --> 00:15:22.000 你能从这样的方式中获取在网络或文档中无法获取的能量 00:15:22.000 --> 00:15:26.000 你能从中得到巨大的能量 00:15:26.000 --> 00:15:29.000 现在我们处在一个阶段 00:15:29.000 --> 00:15:33.000 我们必须要做的阶段 -- 那些认为这是个伟大想法的人们 00:15:33.000 --> 00:15:36.000 而且所有人 -- 我想在TED的大部分人 00:15:36.000 --> 00:15:38.000 他们做事情并不是为了要使投资得到立即的回报 00:15:38.000 --> 00:15:41.000 因为只有当每个人都这么做了才会有所回报 00:15:41.000 --> 00:15:45.000 他们将会这么做,因为他们是那类人 00:15:45.000 --> 00:15:48.000 那类希望每个人都参与进来而让事情变好的人 00:15:48.000 --> 00:15:50.000 OK,这就是关联数据 00:15:50.000 --> 00:15:52.000 我希望你参与 00:15:52.000 --> 00:15:54.000 我希望你需要它 00:15:54.000 --> 00:15:56.000 我也认为这个想法值得宣扬 NOTE Paragraph 00:15:56.000 --> 00:15:57.000 谢谢 NOTE Paragraph 00:15:57.000 --> 00:16:00.000 谢谢