上世纪后半叶,全然是一个 被科学革命所定义的时代: 软件革命。 在一种硅半导体材料上 对电子进行编程的能力 使得我们许多人曾无法想象的 科技、公司和行业变为可能。 这如今已彻底改变了 世界运作的方式。 不过,本世纪上半叶 将要被一个 崭新的软件革命所转化: 生物软件革命。 在一种名为生物的材料上 对生物化学进行编程的能力 将会支持这一革命。 如此一来, 我们将能够利用生物特征 去开发新型疗法, 去修复受损组织, 去重编缺陷细胞, 甚至利用生物化学 构建一个可编程的操作系统。 如果我们能实现它—— 而且我们确实需要实现它—— 其影响将会如此巨大, 以至于第一个软件革命, 相比之下,会变得微不足道。 这是因为生物软件 可以变革整个医疗, 农业和能源领域, 以及那些被 IT 人员掌控的部门。 想象一下可编程植物: 能够更有效进行固氮, 或可以抵御新型真菌病原体, 甚至能够将农作物编程为 多年生而非一年生, 使你的年产量可以翻倍。 这会改变农业, 同时改变全球不断增长的 粮食需求的方法。 或想象可编程的免疫力, 设计并利用能够指导 你免疫系统的分子设备 去检测、根除,甚至预防疾病。 这将改变医疗, 同时改变我们试图保持 不断增长且老龄化的人口健康的方法。 我们已经拥有很多 能让生物软件成为现实的工具。 我们能使用 CRISPR 技术 精确编辑基因。 我们能每次重写一个遗传密码。 我们甚至能利用 DNA 开发一个合成电路。 但是摸索出 如何且何时使用这些工具 依旧是一个试错的过程。 它要求极高的专业性 和多年的领域专精。 而且实验方法难以发现, 往往更是难以复制。 在生物领域,我们倾向 仅专注于局部, 但我们都知道有些东西,例如飞行, 单就羽毛进行研究, 是无法理解其原理的。 所以生物编程还未能像 电脑编程那样简单。 更糟糕的是, 生物系统和你我 每天编写的工程系统 几乎毫无相似之处。 相比工程系统, 生物系统能自我生产、 自我组织, 并以分子规模运作。 这些分子层级的相互作用 通常会导致稳健的宏观规模输出, 它甚至可以自我修复。 试想家中一盆不起眼的植物, 比如你家壁炉台上的那盆 你老是忘记浇水的植物。 尽管你会忘记, 那盆植物每天都需要醒来 并思考如何分配它所有的资源。 它是生长、进行光合作用、 产生种子,还是开花? 这是这盆植物所需要做出的决定。 但一盆植物没有大脑来弄清这件事。 这需要其叶片上细胞的帮助。 它们需要针对环境做出反应, 并且做出影响整盆植物的决定。 所以在那些叶片细胞中 必定要有一个运行的程序, 一个能响应输入信号与提示, 以及调整细胞行为的程序。 之后,那些程序 必须以分布式运行, 覆盖每一个细胞单元, 从而进行协作 让植物茁壮成长。 如果我们能够了解那些生物程序, 如果我们能够明白那些生物计算, 这将会转变我们对细胞 的行为方式和行为原因的 理解能力。 因为,如果我们了解那些程序, 当出现问题时, 我们可以为它们排错。 或我们可以向它们学习 如何设计这样 能充分利用生物化学 计算能力的合成电路。 我对这个想法的热情, 让我进入了 数学、计算机科学 和生物学的交叉领域。 工作中,我专注于一个概念: 生物学计算。 这代表着不断询问 细胞在计算什么, 以及我们如何能 解开这些生物程序的奥秘? 我开始和微软研究院与剑桥大学 的一些出色的合作人士 一起询问这些问题, 我们想要了解 在一种独特细胞中 运行的生物程序: 胚胎干细胞( ES 细胞)。 这些细胞很独特,因为它们 非常稚嫩(即未高度分化)。 它们能够分化 为它们想要变成的东西: 一个脑细胞,一个心脏细胞, 一个骨细胞,一个肺细胞, 任何一种成熟细胞。 这一稚嫩状态让这些细胞 变得与众不同, 但也激发了科学界的想象力。 科学家们意识到, 如果我们能挖掘这一特性的潜力, 我们将会拥有一个 强大的医疗工具。 如果我们能搞清 这些细胞是如何决定 自己要发育为何种细胞的, 我们或许能够利用 ES 细胞的这一能力, 生成我们需要的细胞, 来修复携带疾病的或受损的组织。 但这一愿景的实现存在着挑战, 不仅是因为这些特定细胞 在受孕的 6 天后才出现, 之后大约在 1 天内,就会消失。 它们走上了不同的道路, 共同形成成年人体 的所有结构和器官。 但事实证明,细胞的命运 比我们所想象的更具有可塑性。 大概在 13 年前,一些科学家们 展示了一些极具革命性的东西: 通过把少量基因导入成熟细胞, 例如你的一个皮肤细胞, 你可以把这个成熟细胞 转化回未分化状态。 这一过程被称为“重编程”。 这让我们联想到 “干细胞乌托邦”, 这种能力可以采集 患者自身的细胞样本, 将其转化回未分化的原始形态, 并使用那些细胞 制造患者可能需要的细胞, 不论是脑细胞,还是心脏细胞。 但在过去的 10 年, 搞清楚如何改变细胞命运 仍然是一个试错的过程。 即使是在那些我们已经发现了 成功实验方法的情况下, 它们仍旧低效, 而且我们缺少关于 它们如何以及为何运作的基本理解。 如果你能摸清如何把一个干细胞 诱导为一个心脏细胞, 你依然不知道如何把一个干细胞 诱导为一个脑细胞。 所以我们想要了解 在 ES 细胞中运行的生物程序, 而且,了解该生物系统中 所运行的计算 始于提出一个极为简单的问题: 这个系统到底需要做什么? 计算机科学实际上已有一套策略 来执行软件和硬件的功能。 当你编写程序时, 你用代码编写了一个软件, 你希望这个软件能够正确运行, 你希望它具备完善的功能与性能, 能防止错误, 做到这些的成本很高。 所以当一个开发者编写程序时, 他们能编写出一套技术规范。 这些是你的程序应该做的“工作”。 或许它能比较两个数的大小, 或将数字进行正序排序。 这样的技术存在: 允许我们自动检查 我们的代码是否符合技术规范, 程序是否在完成它的本职工作。 于是我们的想法很类似, 实验观察值,也就是 我们在实验室中测量的东西, 符合生物编程本职工作中 怎样的技术规范? 所以我们只需要找到一个方法 来编译这个新型的技术规范。 比方说,你在实验室忙活了很久, 你一直在测量基因, 发现如果基因 A 是活跃的, 那么基因 B 或 C 也会看似活跃。 如果我们能用一种逻辑语言, 就可以将这种观察 编写为一种数学表达: 如果 A ,那么 B 或 C 。 这是一个非常简单的例子, 只是为了解释清楚我的意思。 我们可以编译很多丰富的表达, 在多个不同的实验中, 随着时间的推移,这些表达可以捕捉 多种基因或蛋白质的行为。 运用这种方法, 把我们的观察值 编译为一种数学表达, 现在有可能测试这些观察结果 是否可以从基因相互作用 的程序中得到。 我们开发了一个工具 来实现这个目的。 我们能用这个工具 将观察值编译为 数学表达。 该工具能让我们发现可以解释 所有原因的遗传程序。 之后,我们运用这个方法 来揭示 ES 细胞中运行的遗传程序, 来看看我们是否能理解 如何诱导未分化状态的细胞。 这个工具实际上是建立在 经常被部署在世界各地 用于传统的软件验证 的解算器上的。 我们从一套将近有 50 个 不同的技术规范开始, 这些是我们从对 ES 细胞的 实验观察值中得出的。 利用这个工具, 通过编译这些观察值, 我们能够揭开第一个 能够解释所有分子的程序。 这本身听着是一种壮举,是吧? 将所有的观察值协调到一起, 不是那种你可以 在信封背面做的事情, 即使你有一个很大的信封。 因为我们有着这样的理解, 我们能够再进一步。 我们能够用这个程序 在尚未测试的条件下, 来预测这个细胞可能会做什么。 我们能够在硅上探索该程序。 所以我们行动了起来: 我们依据实验室检测值 生成了预测, 并发现该程序非常具有可预测性。 它告诉我们如何能够 加速细胞返回未分化状态的过程, 使之快速且有效。 它告诉我们 可以针对哪些基因进行操作, 又有哪些基因会阻碍这一过程。 我们甚至发现了一个 能够预测基因开启顺序的程序。 这个方法让我们得以 揭秘细胞行为的动态。 我们开发的不只是一种 仅限于干细胞生物的方法。 相反,这能帮助我们理解 在遗传相互作用的环境下 细胞内在的计算程序。 所以这其实只是拼图中的一块。 该领域急需开发新方法 来更广泛地在不同层次上 了解生物计算, 从 DNA 到细胞间的信息流。 只有这样的变革性理解 才能够使我们以可预测和可靠 的方式利用生物学。 但是对于编程生物学, 我们也将需要开发 允许实验人员和计算科学家 使用的工具和语言 来设计生物函数, 并将这些设计编译成 细胞的机器代码, 也就是它的生物化学, 这样我们就可以构建这些结构。 这就类似于一个 活的生物软件编译器, 我非常自豪能成为 微软开发此类软件团队的一员。 尽管,说这是一个 很大的挑战有点轻描淡写, 但如果能实现, 这将会成为 软件和湿件最后的桥梁。 但更广泛地说,如果我们 能够将其转变为真正的跨学科领域, 编程生物学才会变成可能。 这需要我们搭建起 物理与生命科学的桥梁, 来自相关学术背景的科学家们 需要能够利用共同语言进行合作, 并分享共同的科学问题。 长远来看,值得记住的是: 当我们第一次开始 在硅微芯片上编程时, 几乎无法想象有一天会出现 我们如今每天都需要打交道的 那些大型软件公司和技术。 如果我们现在开始思考 由计算生物学支持的科技潜能, 我们将会看到为实现这一目标 一路上需要做出的努力。 如今存在一种令人警醒的想法: 这种科技可能会被滥用。 如果我们愿意探讨 编程免疫细胞的潜力, 我们也应该考虑到 改造后的细菌成功躲避 那些免疫细胞的可能。 可能有些人打算从事这方面的研究。 关于这个话题也存在 一个令人欣慰的想法—— 科学家大概不这么认为—— 生物太脆弱,在工作中难以把控。 所以编程生物学不会 进入你的生活。 但因为我们才刚起步, 所以我们可以 大胆且谨慎的往前走。 我们可以事先提出难题, 我们可以采取必要的保护措施, 同时,作为其中的一部分, 还需要思考我们的道德标准, 我们将需要思考那些生物函数 实行的界限。 所以其中的生物伦理学研究 将被优先考虑。 在令人激动的科学创新中, 这个话题不能屈居第二。 但我们这场旅行的最终目的地 将会是突破性的应用 以及突破性行业, 从农业,医疗,到能源和材料, 甚至计算机技术本身。 试想,有一天,我们能 使用终极绿色能源 为地球提供可持续的动力, 因为我们已经能够模仿植物 在千年前发现的东西: 如何利用我们现有太阳能电池 无法比拟的效率来利用太阳能。 如果我们能理解 让植物高效吸收太阳光的 量子相互作用的程序, 我们或许能将其编译为 能够为太阳能电池提供 更好材料的合成 DNA 电路。 现在有一些团队和科学家 正着手于解决这个课题的基本问题, 如果这个课题能获得 足够的关注和正确的投资, 在未来的 10 或 15 年内, 或许就有可能实现。 我们正处在科技革新的开端。 了解这种古老的生物计算类型 是关键的第一步。 如果我们能意识到这件事, 就将进入一个拥有 能够运行生物软件 的操作系统的时代。 非常感谢。 (掌声)