上個世紀的後半 全由一場科技革命所定義: 軟體革命。 能在矽材料上編寫電子程式的能力, 讓許多我們過去難以想像的 技術、公司和行業變為可能, 如今已從根本改變世界運作的方式。 不過本世紀的前半段 將被一場新的軟體革命轉變: 生物軟體革命。 促成這場革命的 將是在生物材料上 編寫生物化學的能力。 這讓我們能利用生物的特性 來產生新療法, 以修復受損的組織; 重新編寫有瑕疵的細胞; 甚至創造可編寫的 生物化學作業系統。 若能了解這一點—— 我們的確需要了解這一點—— 它的影響會大到 讓第一場軟體革命相形失色。 那是因為生物軟體會轉變整個醫界、 農業界,和能源界, 會讓那些 IT 主宰的部門 顯得無足輕重。 想像可編寫的植物能更效率地固氮, 能抵抗新興的菌類病原體, 甚至能把一年生的作物 編寫成多年生, 使年產量加倍, 那就會轉變農業, 確保不斷成長的全球人口 都有食物可吃。 或可想像編寫免疫力, 設計利用分子裝置來引導免疫系統 去偵測、根除,甚至預防疾病。 這會轉變醫學, 確保不斷成長和老化的人口 能夠維持健康。 目前已有許多工具 能讓生物軟體成真。 我們能用 CRISPR 精確地編輯基因; 我們能夠重寫基因編碼, 一次重寫一個鹼基; 我們甚至能用 DNA 做成能運作的合成電路。 至於弄明白如何、何時使用這些工具 則仍處於試誤的過程中, 需要很深的知識技術 和多年的專門化, 而實驗操作方法難以發現, 通常也難以重現。 我們通常傾向於聚焦在 生物學的「組件」, 但我們都知道, 要了解飛行不能只研究羽毛。 因此,編寫生物學程式 仍不如編寫計算機程式那樣簡單。 更糟糕的是, 生命系統在很大程度上 與你我每天編寫的工程系統 毫無相似之處。 與工程系統相反, 生命系統自我生成、自我組織, 以「分子」的規模運作。 這些分子層級的相互作用 通常導致大規模宏觀的輸出, 甚至能自我修復。 例如,試想不起眼的室內植物, 就像那放在家裡壁爐上 卻一直忘記澆水的植物。 儘管被你忽略了, 它每天仍必須弄清楚如何分配資源: 要生長、行光合作用、 結子,還是開花? 這必須考量整個有機體來做決定。 但植物沒大腦來解決這些問題, 必須依賴葉子上的細胞, 細胞必須對環境做出反應 和做出影響整株植物的決策。 因此,這些細胞裡 必定跑著某種程式, 該程式回應輸入的信號, 提示和調整該細胞即將執行的操作。 而這些程式必須 分佈在各個細胞間執行, 彼此協調, 以便使植物生長繁衍。 若能理解這些生物的程式, 若能理解生物的運算, 就會改變我們對細胞 如何、為何執行其工作的理解能力。 一旦了解這些程式, 我們就可以在出問題時偵錯; 可以向它們學習如何設計 真正利用生物化學 運算能力的合成電路。 對這想法的熱情引領我進入 與數學、計算機科學 和生物學介面的研究領域。 我的工作專注於以生物運算的概念。 這意味著探詢細胞如何運算, 與如何揭露這些生物的程式? 我開始與一些微軟研究所 和劍橋大學的傑出人士 合作提出這些問題, 我們一起,想了解 在「胚胎幹細胞」 這種獨特類型的細胞中 運行的生物程式。 這些細胞格非常獨特, 因為它們處於稚年。 它們可以變成任何東西: 腦細胞、心臟細胞、 骨細胞、肺細胞, 任何成年細胞類型。 稚年使它們與眾不同, 也激發了科學界的想像力, 科學家意識到, 如果能挖掘這種潛力, 我們將擁有強大的醫學工具。 如果能弄清楚這些細胞 如何決定成為哪一類型的細胞, 或許我們能控制、 利用它們生成新細胞 來修復罹病或受損的組織。 但要實現此一願景面對著挑戰, 尤其是因為這些特殊的細胞 在受孕後僅六天就出現了。 然後一天左右就消失了, 踏上構成成年人人體的 各個結構和器官的不同途徑。 但事實上細胞的命運 比我們想像的要可塑得多。 大約 13 年前,有些科學家 展示真正具有革命意義的東西。 通過將少量基因插入成年細胞, 例如皮膚的細胞, 可以將該細胞轉回稚年狀態。 這個實際上稱為「重新編寫」的過程 使我們能夠想像幹細胞的完美世界, 能採集患者自身細胞的樣本, 將其轉回稚年狀態, 利用它們製造新細胞, 無論患者需要的是腦細胞、 心臟細胞,還是其他細胞。 但是過去的十年左右, 弄清楚如何改變細胞的命運 仍然是個反複試驗的過程。 即使我們發現若干成功的實驗案例, 其效率仍然低下, 我們對其如何、為何起作用 缺乏基本的了解。 明白把幹細胞轉變為心臟細胞的方法 是無法把幹細胞轉變為腦細胞的。 因此我們想了解 在胚胎幹細胞中運行的生物程式。 了解生物系統執行的運算 首先要問個簡單的問題: 系統實際上必須做什麼? 如今計算機科學實際上有一套策略 來處理軟體和硬體的功能。 我們編寫軟體程式, 希望該軟體能夠正確運行, 具備性能和功能, 還要防錯。 錯誤會造成重大的損失。 因此開發人員編寫程式時 會寫下一組規格, 列出程式應該做些什麼。 也許該比較兩個數字的大小, 或依大小排列。 現有的技術能夠自動檢查 是否滿足了我們所列的規範, 該程式是否執行了應做的工作。 因此,我們的想法是以同樣的方式 將實驗室中量得的實驗觀察結果 對應規範生物程式應該做些什麼。 因此,我們只需想出 這種新型規範的編碼方法即可。 假設你一直在實驗室裡 忙著測量基因, 發現如果基因 A 處於活動狀態, 那麼基因 B 或基因 C 似乎處於活動狀態。 如果用邏輯語言, 則能將該觀察結果表達為數學式: 若 A,則 B 或 C。 這是一個非常簡單的例子, 只為了說明這一點。 我們能編碼真正豐富的表達式, 實際用在多個不同的實驗中, 表達多個基因或蛋白質 隨時間進程展現的行為。 因此,通過以這種方式 將我們的觀察結果 轉化為數學表達式, 就有可能測試這些觀察結果 是否能經由基因的相互作用而產生。 我們開發一種工具來做。 我們能用此工具 將觀察結果編碼為數學表達式, 該工具將使我們能發現 可以解釋所有現象的基因程式。 然後用這種方法來揭示 在胚胎幹細胞內部運行的基因程式, 試圖理解如何誘導出稚年的狀態。 該工具實際上是基於 部署於全球的通用常規 軟體驗證的求解器構建的。 我們從對胚胎幹細胞的實驗觀察中 生成的近 50 種不同規格開始。 通過在此工具中 對這些觀察結果進行編碼, 我們得以發現第一個 能解釋所有觀察結果的分子程式。 這本身就是一種壯舉,對吧? 能夠協調所有這些不同的觀察結果, 那是再怎麼大的信封背面 都算不出來的。 因為已經有了這理解, 我們能再前進一步。 我們能用該程式來預測 在尚未測試的條件下 該細胞可能會做什麼。 我們可以在計算機上探索該程式。 那正是我們做的: 生成在實驗室中測試過的預測, 發現該程式具有很高的預測性。 它告訴我們如何加速進程 才能快速有效地回到稚年狀態。 它告訴應該操作哪些基因; 哪些基因可能阻礙過程。 程式甚至預測了基因開啟的順序。 這方法確實使我們能夠揭示 細胞的動態進行過程。 我們開發的並不是 針對幹細胞生物學的特定方法, 而是使我們能夠 在基因相互作用的背景下 理解細胞正在執行的運算。 因此,實際上這只是個構建模塊。 這領域迫切需要開發新的方法, 更廣泛、不同層次地理解生物運算, 從 DNA 到細胞之間的信息流。 只有這種變革性的理解 才能使我們以可預測 和可靠的方式利用生物學。 但是為要編寫生物學, 我們還需要開發各種工具和語言, 使實驗人員和計算科學家 都可以設計生物學功能, 並將這些設計編譯為 細胞的機器代碼和生物化學, 就可以建造那些結構。 這類似於生物軟體編譯器, 我很自豪能成為 微軟致力於開發 生物軟體團隊的一員。 雖然說這是個巨大的挑戰 有點輕描淡寫, 但是如果實現了, 那將是軟體和濕體之間的最終橋樑。 從更廣泛的意義上講, 只有轉變為真正的跨學科領域, 才有可能編寫生物程式。 這需要我們在物理科學 和生命科學之間架起橋樑, 而其中每個學科的科學家 得要能以共通的語言一起工作 和共享科學問題。 從長遠來看,值得記住的是 當初我們首次編寫矽微晶片時, 幾乎無法想像 許多現今你我天天用到的 巨型軟體公司和技術。 如果現在開始考慮 由計算生物學實現的技術的潛力, 我們將看到為實現這一目標 所需要採取的一些步驟。 有個警醒的想法 認為這種技術可能會被濫用。 如果要談編寫免疫細胞的潛力, 我們還應該考慮 設計細菌逃避免疫的潛力。 可能有人願意這樣做。 一個令人放心的想法是—— 科學家不那麼容易放心—— 生物研究很脆弱,不好弄。 生物程式不是能躲在後院 工具間裡編寫得出的。 由於才剛起步, 我們能睜大眼睛向前邁進。 我們能預先提出困難的問題, 能採取必要的保障措施。 得要考慮道德規範, 得要考慮限制實現生物功能的範圍。 因此其中一部分 必須將生物倫理學 研究作為優先事項, 不能在科學創新的激情中 將其降為第二。 但是最終的獎賞, 也是此旅程的最終目的地, 將是應用和產業的大突破, 在農業、醫藥、能源、材料, 乃至計算本身領域的大突破。 想像有一天我們能夠在地球上 利用植物終極永續的綠色能源, 如果能夠模仿植物 在幾千年前已經會了的方法—— 如何有效地利用太陽能, 目前的太陽能電池無法有效辦到—— 如果理解植物高效吸收陽光的 量子相互作用程式, 我們也許可以將其轉化為 構建合成的 DNA 電路, 從而為更好的太陽能電池提供材料。 現有團隊和科學家致力於此一基礎, 倘若得到正確的關注和投資, 或許能在十或十五年內實現。 因此我們正處於技術革命的起點。 了解這古老的生物運算類型 是關鍵的第一步。 若能意識到這一點, 我們即將進入運行 實時生物軟體作業系統的時代。 非常感謝。 (掌聲)