1 00:00:00,750 --> 00:00:02,989 上個世紀的後半 2 00:00:02,989 --> 00:00:07,282 全由一場科技革命所定義: 3 00:00:07,306 --> 00:00:08,741 軟體革命。 4 00:00:09,313 --> 00:00:14,121 能在矽材料上編寫電子程式的能力, 5 00:00:14,145 --> 00:00:17,218 讓許多我們過去難以想像的 6 00:00:17,242 --> 00:00:21,219 技術、公司和行業變為可能, 7 00:00:21,243 --> 00:00:25,158 如今已從根本改變世界運作的方式。 8 00:00:26,158 --> 00:00:28,079 不過本世紀的前半段 9 00:00:28,103 --> 00:00:32,081 將被一場新的軟體革命轉變: 10 00:00:32,105 --> 00:00:34,540 生物軟體革命。 11 00:00:34,921 --> 00:00:37,015 促成這場革命的 12 00:00:37,015 --> 00:00:41,290 將是在生物材料上 編寫生物化學的能力。 13 00:00:41,314 --> 00:00:45,455 這讓我們能利用生物的特性 14 00:00:45,479 --> 00:00:48,135 來產生新療法, 15 00:00:48,159 --> 00:00:50,027 以修復受損的組織; 16 00:00:50,051 --> 00:00:52,776 重新編寫有瑕疵的細胞; 17 00:00:52,800 --> 00:00:57,354 甚至創造可編寫的 生物化學作業系統。 18 00:00:58,420 --> 00:01:01,993 若能了解這一點—— 我們的確需要了解這一點—— 19 00:01:02,017 --> 00:01:04,179 它的影響會大到 20 00:01:04,203 --> 00:01:08,080 讓第一場軟體革命相形失色。 21 00:01:08,104 --> 00:01:12,338 那是因為生物軟體會轉變整個醫界、 22 00:01:12,362 --> 00:01:13,921 農業界,和能源界, 23 00:01:13,945 --> 00:01:17,773 會讓那些 IT 主宰的部門 顯得無足輕重。 24 00:01:18,812 --> 00:01:22,986 想像可編寫的植物能更效率地固氮, 25 00:01:23,010 --> 00:01:25,915 能抵抗新興的菌類病原體, 26 00:01:25,939 --> 00:01:29,476 甚至能把一年生的作物 編寫成多年生, 27 00:01:29,500 --> 00:01:31,768 使年產量加倍, 28 00:01:31,792 --> 00:01:33,890 那就會轉變農業, 29 00:01:33,914 --> 00:01:38,018 確保不斷成長的全球人口 都有食物可吃。 30 00:01:38,794 --> 00:01:41,056 或可想像編寫免疫力, 31 00:01:41,080 --> 00:01:45,318 設計利用分子裝置來引導免疫系統 32 00:01:45,342 --> 00:01:49,172 去偵測、根除,甚至預防疾病。 33 00:01:49,196 --> 00:01:50,767 這會轉變醫學, 34 00:01:50,791 --> 00:01:54,280 確保不斷成長和老化的人口 能夠維持健康。 35 00:01:55,501 --> 00:01:59,704 目前已有許多工具 能讓生物軟體成真。 36 00:01:59,728 --> 00:02:02,075 我們能用 CRISPR 精確地編輯基因; 37 00:02:02,099 --> 00:02:05,182 我們能夠重寫基因編碼, 一次重寫一個鹼基; 38 00:02:05,206 --> 00:02:09,642 我們甚至能用 DNA 做成能運作的合成電路。 39 00:02:10,428 --> 00:02:12,897 至於弄明白如何、何時使用這些工具 40 00:02:12,921 --> 00:02:15,343 則仍處於試誤的過程中, 41 00:02:15,367 --> 00:02:19,027 需要很深的知識技術 和多年的專門化, 42 00:02:19,051 --> 00:02:22,088 而實驗操作方法難以發現, 43 00:02:22,112 --> 00:02:24,694 通常也難以重現。 44 00:02:25,256 --> 00:02:29,729 我們通常傾向於聚焦在 生物學的「組件」, 45 00:02:29,753 --> 00:02:30,946 但我們都知道, 46 00:02:30,960 --> 00:02:34,249 要了解飛行不能只研究羽毛。 47 00:02:34,846 --> 00:02:39,367 因此,編寫生物學程式 仍不如編寫計算機程式那樣簡單。 48 00:02:39,391 --> 00:02:41,069 更糟糕的是, 49 00:02:41,093 --> 00:02:45,103 生命系統在很大程度上 與你我每天編寫的工程系統 50 00:02:45,127 --> 00:02:47,223 毫無相似之處。 51 00:02:47,691 --> 00:02:49,637 與工程系統相反, 52 00:02:49,637 --> 00:02:53,297 生命系統自我生成、自我組織, 53 00:02:53,321 --> 00:02:55,008 以「分子」的規模運作。 54 00:02:55,032 --> 00:02:57,168 這些分子層級的相互作用 55 00:02:57,192 --> 00:03:00,210 通常導致大規模宏觀的輸出, 56 00:03:00,234 --> 00:03:02,954 甚至能自我修復。 57 00:03:04,256 --> 00:03:07,250 例如,試想不起眼的室內植物, 58 00:03:07,274 --> 00:03:09,461 就像那放在家裡壁爐上 59 00:03:09,485 --> 00:03:11,272 卻一直忘記澆水的植物。 60 00:03:11,749 --> 00:03:13,885 儘管被你忽略了, 61 00:03:13,885 --> 00:03:18,135 它每天仍必須弄清楚如何分配資源: 62 00:03:18,159 --> 00:03:21,730 要生長、行光合作用、 結子,還是開花? 63 00:03:21,754 --> 00:03:25,693 這必須考量整個有機體來做決定。 64 00:03:25,717 --> 00:03:29,198 但植物沒大腦來解決這些問題, 65 00:03:29,222 --> 00:03:31,939 必須依賴葉子上的細胞, 66 00:03:31,963 --> 00:03:33,866 細胞必須對環境做出反應 67 00:03:33,890 --> 00:03:36,539 和做出影響整株植物的決策。 68 00:03:36,563 --> 00:03:40,551 因此,這些細胞裡 必定跑著某種程式, 69 00:03:40,575 --> 00:03:42,868 該程式回應輸入的信號, 70 00:03:42,868 --> 00:03:45,656 提示和調整該細胞即將執行的操作。 71 00:03:45,679 --> 00:03:48,926 而這些程式必須 分佈在各個細胞間執行, 72 00:03:48,950 --> 00:03:50,517 彼此協調, 73 00:03:50,541 --> 00:03:54,434 以便使植物生長繁衍。 74 00:03:55,675 --> 00:03:58,991 若能理解這些生物的程式, 75 00:03:59,015 --> 00:04:02,137 若能理解生物的運算, 76 00:04:02,137 --> 00:04:04,834 就會改變我們對細胞 77 00:04:04,834 --> 00:04:07,668 如何、為何執行其工作的理解能力。 78 00:04:08,152 --> 00:04:09,919 一旦了解這些程式, 79 00:04:09,933 --> 00:04:12,296 我們就可以在出問題時偵錯; 80 00:04:12,320 --> 00:04:14,753 可以向它們學習如何設計 81 00:04:14,767 --> 00:04:21,011 真正利用生物化學 運算能力的合成電路。 82 00:04:22,407 --> 00:04:25,490 對這想法的熱情引領我進入 83 00:04:25,490 --> 00:04:29,080 與數學、計算機科學 和生物學介面的研究領域。 84 00:04:29,104 --> 00:04:33,830 我的工作專注於以生物運算的概念。 85 00:04:34,334 --> 00:04:37,476 這意味著探詢細胞如何運算, 86 00:04:37,500 --> 00:04:41,017 與如何揭露這些生物的程式? 87 00:04:41,760 --> 00:04:45,517 我開始與一些微軟研究所 和劍橋大學的傑出人士 88 00:04:45,541 --> 00:04:48,112 合作提出這些問題, 89 00:04:48,136 --> 00:04:50,419 我們一起,想了解 90 00:04:50,443 --> 00:04:54,620 在「胚胎幹細胞」 這種獨特類型的細胞中 91 00:04:54,644 --> 00:04:56,538 運行的生物程式。 92 00:04:57,136 --> 00:05:00,296 這些細胞格非常獨特, 因為它們處於稚年。 93 00:05:00,320 --> 00:05:02,488 它們可以變成任何東西: 94 00:05:02,512 --> 00:05:05,077 腦細胞、心臟細胞、 骨細胞、肺細胞, 95 00:05:05,101 --> 00:05:06,998 任何成年細胞類型。 96 00:05:07,022 --> 00:05:08,699 稚年使它們與眾不同, 97 00:05:08,723 --> 00:05:11,737 也激發了科學界的想像力, 98 00:05:11,737 --> 00:05:15,011 科學家意識到, 如果能挖掘這種潛力, 99 00:05:15,035 --> 00:05:17,386 我們將擁有強大的醫學工具。 100 00:05:17,917 --> 00:05:19,738 如果能弄清楚這些細胞 101 00:05:19,752 --> 00:05:22,693 如何決定成為哪一類型的細胞, 102 00:05:22,717 --> 00:05:25,567 或許我們能控制、 利用它們生成新細胞 103 00:05:25,581 --> 00:05:28,984 來修復罹病或受損的組織。 104 00:05:29,794 --> 00:05:32,724 但要實現此一願景面對著挑戰, 105 00:05:32,748 --> 00:05:35,512 尤其是因為這些特殊的細胞 106 00:05:35,536 --> 00:05:38,825 在受孕後僅六天就出現了。 107 00:05:38,826 --> 00:05:40,881 然後一天左右就消失了, 108 00:05:40,905 --> 00:05:45,926 踏上構成成年人人體的 各個結構和器官的不同途徑。 109 00:05:47,770 --> 00:05:52,219 但事實上細胞的命運 比我們想像的要可塑得多。 110 00:05:52,310 --> 00:05:56,631 大約 13 年前,有些科學家 展示真正具有革命意義的東西。 111 00:05:57,393 --> 00:06:01,739 通過將少量基因插入成年細胞, 112 00:06:01,763 --> 00:06:03,527 例如皮膚的細胞, 113 00:06:03,551 --> 00:06:07,510 可以將該細胞轉回稚年狀態。 114 00:06:07,534 --> 00:06:10,709 這個實際上稱為「重新編寫」的過程 115 00:06:10,733 --> 00:06:14,092 使我們能夠想像幹細胞的完美世界, 116 00:06:14,116 --> 00:06:17,757 能採集患者自身細胞的樣本, 117 00:06:17,781 --> 00:06:20,141 將其轉回稚年狀態, 118 00:06:20,165 --> 00:06:21,855 利用它們製造新細胞, 119 00:06:21,855 --> 00:06:25,394 無論患者需要的是腦細胞、 心臟細胞,還是其他細胞。 120 00:06:26,541 --> 00:06:28,306 但是過去的十年左右, 121 00:06:28,330 --> 00:06:31,374 弄清楚如何改變細胞的命運 122 00:06:31,398 --> 00:06:33,550 仍然是個反複試驗的過程。 123 00:06:33,911 --> 00:06:38,419 即使我們發現若干成功的實驗案例, 124 00:06:38,443 --> 00:06:39,910 其效率仍然低下, 125 00:06:39,934 --> 00:06:44,172 我們對其如何、為何起作用 缺乏基本的了解。 126 00:06:44,650 --> 00:06:47,655 明白把幹細胞轉變為心臟細胞的方法 127 00:06:47,679 --> 00:06:51,683 是無法把幹細胞轉變為腦細胞的。 128 00:06:52,633 --> 00:06:54,384 因此我們想了解 129 00:06:54,384 --> 00:06:58,035 在胚胎幹細胞中運行的生物程式。 130 00:06:58,059 --> 00:07:01,565 了解生物系統執行的運算 131 00:07:01,589 --> 00:07:05,842 首先要問個簡單的問題: 132 00:07:05,866 --> 00:07:09,222 系統實際上必須做什麼? 133 00:07:09,838 --> 00:07:12,688 如今計算機科學實際上有一套策略 134 00:07:12,712 --> 00:07:16,539 來處理軟體和硬體的功能。 135 00:07:16,563 --> 00:07:19,223 我們編寫軟體程式, 136 00:07:19,247 --> 00:07:21,247 希望該軟體能夠正確運行, 137 00:07:21,271 --> 00:07:23,061 具備性能和功能, 138 00:07:23,085 --> 00:07:24,302 還要防錯。 139 00:07:24,326 --> 00:07:26,144 錯誤會造成重大的損失。 140 00:07:26,168 --> 00:07:28,010 因此開發人員編寫程式時 141 00:07:28,034 --> 00:07:30,304 會寫下一組規格, 142 00:07:30,328 --> 00:07:32,199 列出程式應該做些什麼。 143 00:07:32,223 --> 00:07:34,491 也許該比較兩個數字的大小, 144 00:07:34,515 --> 00:07:36,307 或依大小排列。 145 00:07:37,037 --> 00:07:41,732 現有的技術能夠自動檢查 146 00:07:41,756 --> 00:07:44,134 是否滿足了我們所列的規範, 147 00:07:44,158 --> 00:07:46,791 該程式是否執行了應做的工作。 148 00:07:47,266 --> 00:07:50,122 因此,我們的想法是以同樣的方式 149 00:07:50,146 --> 00:07:53,214 將實驗室中量得的實驗觀察結果 150 00:07:53,238 --> 00:07:58,271 對應規範生物程式應該做些什麼。 151 00:07:58,769 --> 00:08:00,645 因此,我們只需想出 152 00:08:00,669 --> 00:08:03,852 這種新型規範的編碼方法即可。 153 00:08:04,594 --> 00:08:07,758 假設你一直在實驗室裡 忙著測量基因, 154 00:08:07,758 --> 00:08:10,708 發現如果基因 A 處於活動狀態, 155 00:08:10,732 --> 00:08:14,120 那麼基因 B 或基因 C 似乎處於活動狀態。 156 00:08:14,678 --> 00:08:17,260 如果用邏輯語言, 157 00:08:17,264 --> 00:08:20,657 則能將該觀察結果表達為數學式: 158 00:08:21,125 --> 00:08:23,453 若 A,則 B 或 C。 159 00:08:24,242 --> 00:08:26,696 這是一個非常簡單的例子, 160 00:08:26,720 --> 00:08:28,177 只為了說明這一點。 161 00:08:28,177 --> 00:08:31,411 我們能編碼真正豐富的表達式, 162 00:08:31,411 --> 00:08:34,394 實際用在多個不同的實驗中, 163 00:08:34,394 --> 00:08:38,148 表達多個基因或蛋白質 隨時間進程展現的行為。 164 00:08:38,521 --> 00:08:40,477 因此,通過以這種方式 165 00:08:40,477 --> 00:08:43,164 將我們的觀察結果 轉化為數學表達式, 166 00:08:43,188 --> 00:08:45,916 就有可能測試這些觀察結果 167 00:08:45,916 --> 00:08:51,364 是否能經由基因的相互作用而產生。 168 00:08:52,063 --> 00:08:54,619 我們開發一種工具來做。 169 00:08:54,643 --> 00:08:56,142 我們能用此工具 170 00:08:56,142 --> 00:08:58,956 將觀察結果編碼為數學表達式, 171 00:08:58,980 --> 00:09:01,200 該工具將使我們能發現 172 00:09:01,200 --> 00:09:04,152 可以解釋所有現象的基因程式。 173 00:09:05,481 --> 00:09:07,761 然後用這種方法來揭示 174 00:09:07,785 --> 00:09:11,868 在胚胎幹細胞內部運行的基因程式, 175 00:09:11,892 --> 00:09:15,761 試圖理解如何誘導出稚年的狀態。 176 00:09:16,105 --> 00:09:18,057 該工具實際上是基於 177 00:09:18,081 --> 00:09:22,847 部署於全球的通用常規 軟體驗證的求解器構建的。 178 00:09:23,630 --> 00:09:27,321 我們從對胚胎幹細胞的實驗觀察中 179 00:09:27,345 --> 00:09:31,851 生成的近 50 種不同規格開始。 180 00:09:31,875 --> 00:09:34,511 通過在此工具中 對這些觀察結果進行編碼, 181 00:09:34,535 --> 00:09:36,500 我們得以發現第一個 182 00:09:36,500 --> 00:09:39,705 能解釋所有觀察結果的分子程式。 183 00:09:40,309 --> 00:09:42,822 這本身就是一種壯舉,對吧? 184 00:09:42,846 --> 00:09:45,748 能夠協調所有這些不同的觀察結果, 185 00:09:45,772 --> 00:09:51,279 那是再怎麼大的信封背面 都算不出來的。 186 00:09:52,190 --> 00:09:54,021 因為已經有了這理解, 187 00:09:54,021 --> 00:09:55,454 我們能再前進一步。 188 00:09:55,454 --> 00:09:57,550 我們能用該程式來預測 189 00:09:57,550 --> 00:10:01,429 在尚未測試的條件下 該細胞可能會做什麼。 190 00:10:01,453 --> 00:10:03,854 我們可以在計算機上探索該程式。 191 00:10:04,735 --> 00:10:05,982 那正是我們做的: 192 00:10:06,006 --> 00:10:09,186 生成在實驗室中測試過的預測, 193 00:10:09,210 --> 00:10:12,242 發現該程式具有很高的預測性。 194 00:10:12,266 --> 00:10:14,891 它告訴我們如何加速進程 195 00:10:14,915 --> 00:10:17,975 才能快速有效地回到稚年狀態。 196 00:10:17,999 --> 00:10:20,569 它告訴應該操作哪些基因; 197 00:10:20,593 --> 00:10:23,217 哪些基因可能阻礙過程。 198 00:10:23,241 --> 00:10:28,047 程式甚至預測了基因開啟的順序。 199 00:10:28,980 --> 00:10:31,650 這方法確實使我們能夠揭示 200 00:10:31,650 --> 00:10:34,546 細胞的動態進行過程。 201 00:10:35,728 --> 00:10:37,089 我們開發的並不是 202 00:10:37,089 --> 00:10:39,370 針對幹細胞生物學的特定方法, 203 00:10:39,394 --> 00:10:43,182 而是使我們能夠 在基因相互作用的背景下 204 00:10:43,182 --> 00:10:46,231 理解細胞正在執行的運算。 205 00:10:46,666 --> 00:10:48,954 因此,實際上這只是個構建模塊。 206 00:10:48,978 --> 00:10:51,663 這領域迫切需要開發新的方法, 207 00:10:51,687 --> 00:10:55,774 更廣泛、不同層次地理解生物運算, 208 00:10:55,797 --> 00:10:59,926 從 DNA 到細胞之間的信息流。 209 00:10:59,950 --> 00:11:02,747 只有這種變革性的理解 210 00:11:02,771 --> 00:11:07,757 才能使我們以可預測 和可靠的方式利用生物學。 211 00:11:09,029 --> 00:11:10,611 但是為要編寫生物學, 212 00:11:10,655 --> 00:11:14,090 我們還需要開發各種工具和語言, 213 00:11:14,114 --> 00:11:17,522 使實驗人員和計算科學家 214 00:11:17,546 --> 00:11:20,043 都可以設計生物學功能, 215 00:11:20,067 --> 00:11:24,786 並將這些設計編譯為 細胞的機器代碼和生物化學, 216 00:11:24,801 --> 00:11:27,063 就可以建造那些結構。 217 00:11:27,309 --> 00:11:30,982 這類似於生物軟體編譯器, 218 00:11:30,982 --> 00:11:32,286 我很自豪能成為 219 00:11:32,286 --> 00:11:34,898 微軟致力於開發 生物軟體團隊的一員。 220 00:11:35,366 --> 00:11:38,162 雖然說這是個巨大的挑戰 有點輕描淡寫, 221 00:11:38,162 --> 00:11:39,789 但是如果實現了, 222 00:11:39,813 --> 00:11:43,522 那將是軟體和濕體之間的最終橋樑。 223 00:11:45,006 --> 00:11:46,791 從更廣泛的意義上講, 224 00:11:46,791 --> 00:11:52,369 只有轉變為真正的跨學科領域, 才有可能編寫生物程式。 225 00:11:52,748 --> 00:11:55,700 這需要我們在物理科學 和生命科學之間架起橋樑, 226 00:11:55,724 --> 00:11:57,991 而其中每個學科的科學家 227 00:11:58,015 --> 00:12:00,746 得要能以共通的語言一起工作 228 00:12:00,770 --> 00:12:03,335 和共享科學問題。 229 00:12:04,757 --> 00:12:06,753 從長遠來看,值得記住的是 230 00:12:06,753 --> 00:12:08,750 當初我們首次編寫矽微晶片時, 231 00:12:08,774 --> 00:12:10,020 幾乎無法想像 232 00:12:10,020 --> 00:12:12,690 許多現今你我天天用到的 233 00:12:12,690 --> 00:12:15,918 巨型軟體公司和技術。 234 00:12:16,446 --> 00:12:18,147 如果現在開始考慮 235 00:12:18,147 --> 00:12:21,927 由計算生物學實現的技術的潛力, 236 00:12:21,951 --> 00:12:26,136 我們將看到為實現這一目標 所需要採取的一些步驟。 237 00:12:27,231 --> 00:12:29,093 有個警醒的想法 238 00:12:29,093 --> 00:12:31,855 認為這種技術可能會被濫用。 239 00:12:32,138 --> 00:12:35,543 如果要談編寫免疫細胞的潛力, 240 00:12:35,543 --> 00:12:37,479 我們還應該考慮 241 00:12:37,495 --> 00:12:40,284 設計細菌逃避免疫的潛力。 242 00:12:40,682 --> 00:12:42,769 可能有人願意這樣做。 243 00:12:43,506 --> 00:12:45,818 一個令人放心的想法是—— 244 00:12:45,818 --> 00:12:47,541 科學家不那麼容易放心—— 245 00:12:47,565 --> 00:12:50,834 生物研究很脆弱,不好弄。 246 00:12:50,858 --> 00:12:54,943 生物程式不是能躲在後院 工具間裡編寫得出的。 247 00:12:55,642 --> 00:12:57,722 由於才剛起步, 248 00:12:57,746 --> 00:13:00,329 我們能睜大眼睛向前邁進。 249 00:13:00,353 --> 00:13:02,677 我們能預先提出困難的問題, 250 00:13:02,701 --> 00:13:05,741 能採取必要的保障措施。 251 00:13:05,765 --> 00:13:08,562 得要考慮道德規範, 252 00:13:08,586 --> 00:13:13,122 得要考慮限制實現生物功能的範圍。 253 00:13:13,604 --> 00:13:15,783 因此其中一部分 254 00:13:15,783 --> 00:13:18,690 必須將生物倫理學 研究作為優先事項, 255 00:13:18,690 --> 00:13:22,288 不能在科學創新的激情中 將其降為第二。 256 00:13:23,154 --> 00:13:24,847 但是最終的獎賞, 257 00:13:24,847 --> 00:13:26,786 也是此旅程的最終目的地, 258 00:13:26,786 --> 00:13:30,160 將是應用和產業的大突破, 259 00:13:30,160 --> 00:13:33,564 在農業、醫藥、能源、材料, 260 00:13:33,600 --> 00:13:36,109 乃至計算本身領域的大突破。 261 00:13:36,389 --> 00:13:38,713 想像有一天我們能夠在地球上 262 00:13:38,713 --> 00:13:41,403 利用植物終極永續的綠色能源, 263 00:13:41,403 --> 00:13:45,242 如果能夠模仿植物 在幾千年前已經會了的方法—— 264 00:13:45,252 --> 00:13:47,346 如何有效地利用太陽能, 265 00:13:47,346 --> 00:13:50,948 目前的太陽能電池無法有效辦到—— 266 00:13:51,611 --> 00:13:57,428 如果理解植物高效吸收陽光的 量子相互作用程式, 267 00:13:57,428 --> 00:14:01,552 我們也許可以將其轉化為 構建合成的 DNA 電路, 268 00:14:01,576 --> 00:14:04,489 從而為更好的太陽能電池提供材料。 269 00:14:05,349 --> 00:14:08,769 現有團隊和科學家致力於此一基礎, 270 00:14:08,769 --> 00:14:11,699 倘若得到正確的關注和投資, 271 00:14:11,699 --> 00:14:14,613 或許能在十或十五年內實現。 272 00:14:15,457 --> 00:14:18,741 因此我們正處於技術革命的起點。 273 00:14:19,067 --> 00:14:23,930 了解這古老的生物運算類型 是關鍵的第一步。 274 00:14:24,468 --> 00:14:25,785 若能意識到這一點, 275 00:14:25,809 --> 00:14:30,277 我們即將進入運行 實時生物軟體作業系統的時代。 276 00:14:30,604 --> 00:14:31,770 非常感謝。 277 00:14:31,794 --> 00:14:34,484 (掌聲)