AD

2017年7月31日星期一

“矽腦”專家不是夢 機器學習在分子生物學領域大顯身手

如果這是未來的生物學實驗室,那麼它看起來與今天的實驗室似乎並沒有什麼不同。穿著白大褂的科學家拿著盛有冷凍玻璃管的箱子走過,架子上的化學物質——純酒精瓶、糖罐、蛋白質和鹽是培養和調節微生物的標準物件。如果不是耳朵聽到的機械聲音,你可能根本不會注意到這裏的機器人:它們在風扇的低嘯中像蟋蟀一樣彼此哼唱著。

在生物技術新興公司 Zymergen 的一個由 AI 控製的探索生成更多化學物質的菌株中,機器手指正準備挑選微生物菌群。

圖片來源:ZYMERGEN/ALBERT LAW PHOTOGRAPHY

這些機器人為生物技術公司 Zymergen 工作,這家公司在 2014 年搬遷到美加州舊金山東海岸一家原電子工廠所在地。這些機器人整日都在進行微生物實驗,尋找增加有用化學物質產量的方式。這是一個叫作"回聲"的機器人:它位於一堆雜亂的設備中間,一隻機械臂抓住一個塑料模塊,模塊上有數百個細微孔徑,其中盛著液體。一束激光掃描了模塊旁的一個條形碼,然後"回聲"將其運到一個托盤上。下一步發生的過程及其細微,用肉眼難以觀察到。

"這並非是人們如何動手用吸移管吸移液體的複製品。"該公司共同創始人之一、分子生物學家兼操作及工程副總裁 Jed Dean 說,"這是以完全不同的方式在執行這件事。"機器人無須用吸移管吸收並將數毫升的液體注入到每個孔中(在細胞層麵液體量的漲落),且並不會碰觸它。相反,一束聲波脈衝會以每秒鍾 500 次的頻率讓液體自己泛起漣漪,並形成比人類可轉移的液體量小 1000 倍的液滴。

實際上,這些並沒有真正未來主義的部分。大型生物實驗室使用機器人和條形碼已有多年。即便是被稱作"聲微滴噴射"的液體去除技術也已經存在了數十年。當 Dean 被問到這台機器人通過什麼在做實驗時,他才透露了一點真相。實際上,這是一個計算機程序輸出。

"我想要說清楚的是,這個過程中有一位人類科學家在了解結果和現實,並核查它們。"Zymergen 執行總裁 Joshua Hoffman 解釋說。他表示,對於解釋數據、生成推論以及計劃實驗來說,其終極目標是"擺脫人類的主觀直覺思維"。

Zymergen 是若幹家擁有相同目標的公司之一:利用人工智能(AI)增加或替代科學過程中的人類角色。人們用"AI 驅動的生物技術"來描述這一過程,但 Zymergen 共同創始人對這一說法表示擔憂。"'AI'聽起來像是機器人在下象棋。"該公司首席技術官 Aaron Kimball 說,"我覺得'ML'讓人更加舒服。"Hoffman 說,ML 指的是機器學習,即可以解釋最近幾乎所有 AI 進展的計算科學的分支。"這正是我們正在做的。"

自動化發現

科學是一個序列。日複一日的實驗室工作與工廠工作是如此不同。論文來了,啟發新的實驗,然後產生新的發現,結果又產生新的論文。如此循環。各種各樣的公司和研究機構正在拓展基於機器人和 AI 的工具,以增強甚至替代這個過程的每個步驟中人類的角色。

Zymergen 實際上做的是調節可用於生物質燃料、塑料或藥物的產業微生物。為了提高產量,一些公司將它們的菌株送到 Zymergen。那裏的機器人於是便探索和修複每個微生物的基因組,從而設計出一個使其合成產物更加高效的菌株版本。

Hoffman 表示,問題在於被送到 Zymergen 的微生物已經"高度優化"。經過數年的研究育種之後,這些細胞非常擅長發揮自己的功能。因此,"擠"出更多的效率需要深入探索其基因組、開展實驗以及跟蹤相關數據,進行科學研究。

Zymergen 正在設法加速這一科學過程。在傳統生物學中,Hoffman 表示,"需要一個人站在工作台前測試有限數量的假設。可能每月可測試 10 個假設。"而機器人可以用更快的速度完成這一過程,Zymergen 的機器人每周可以進行多達 1000 個實驗。但機器人隻能遵循指令:給它們正確的指令是真正的瓶頸所在。

當被問這個算式如何設計實驗時,Kimball 提到了一個簡單的前提。"比如說你得到了約 5000 個基因的原始微生物,而你改變每個基因的方式有 10 種,這就意味著你要做 5 萬個實驗。"他說,實驗"活動"從製作 1000 個菌株開始,每個菌株都有一個特定的突變。 "每個菌株都生活在一個液滴中。你給它喂糖,然後讓它烹飪一會,接下來是測量獲得了多少產物。"可能有 25 個菌株會產生略多一些的靶標化學物質。這些菌株將會成為下一輪實驗的良種,而其餘的則會進入冷凍倉。

機器人定位

這一發現之路絕非坦途。Kimball 說,找到適當的突變結合體需要漫長而艱難的基因"地形"探索之旅。如果隻是盲目地朝著效率巔峰走,可能永遠不會到達主峰頂點。這是因為如果隻是把所有產生小提升的突變結合到一個微生物中,它們加起來可能並不能形成一次大收獲。他表示,相反,微生物會"生病",它們會比原來的菌株性能差得更遠。因此,選擇正確的道路,包括繞道進入更有潛力的穀地,也需要一張地圖從而一次性地展示所有突變效應,這張圖不是 3 個維度,而是數千個。因此就需要機器學習確定方位。

這是關鍵的差異:當機器人最終發現能夠提高化學物質產量的基因變化時,它們並不知道其效應背後的生物化學線索。

那麼,如果機器人實驗並不能加深人們對生物學工作的了解,它是真的科學嗎?對於 Kimball 來說,這樣的哲學界點可能並不重要。"我們是因為它的工作而得到了收益,並不是因為了解其中的原因而得到了收益。"

到目前為止,Hoffman 說,Zymergen 的機器人實驗室已經將製作化學物質的微生物的效率提高了 10% 以上。這樣的增加聽起來可能不多,但在每年依賴微生物發酵達到 1600 億美元的化學產業內,一小部分的提升也可以轉化為更多的資金,甚至比美國國家科學基金會每年 70 億美元的預算更多。

而機器人發現的先進遺傳變異代表著真正的發現,這些可能是人類科學家並未發現的變異。大多數提高產量的基因並未直接與合成想要的化學物質相關,例如,其中一半並沒有為人所知的功能。"我已經在若幹不同微生物中發現了這種模式。"Dean 說。不用機器學習找到正確的遺傳變異就像嚐試打開一個刻度盤上標著數千個數字的保險箱。"人類的直覺很容易被這種複雜性壓倒。"他說。

計算機作者?

如果機器真的已經準備好替代人類執行一些科學任務,很多科學家將會擁抱它們。不像工廠工人或是出租車司機,大多數實驗科學家會很歡迎讓他們的部分工作自動化。在分子和細胞生物學領域尤其如此,因為其中的手工勞動如噴射液體、電鍍細胞、計數菌落等都非常繁雜且成本高昂。一名研究生最細微的錯誤或不精確性都會浪費數周甚至數月的工作。

然而,也有一些生物學家提出了支持 AI 解釋數據和設計實驗的一些不足之處。"我們發現目前的機器學習方法並不能勝任這一任務。"加州斯坦福大學計算生化學家 Rhiju Das 說,他研究的是分子如何折疊從而設計新的藥物。"與獲得同樣數據的人類相比,它們在 RNA 設計問題上嚴重落後於人類。"盡管他並不知道這是為什麼,但含有"設計"類的任務似乎需要人類的直覺。可能 Zymergen 正巧碰到了非常適應計算機控製的實驗的生物學部分。

即便 AI 控製的研究能夠起作用,人類是否會理解計算機發現了什麼?其結果背後的計算仍是一個"黑匣子"。"一個令人困惑的可能性是我們正在接近'可理解的'科學時代。"賓夕法尼亞州匹茲堡卡耐基·梅隆大學計算生物學家、與分子生物學家一起工作的 Adrien Treuille 說。研究人員可能不僅會依賴計算機做科學,還包括解釋科學:一些生物學理論證據如此複雜,接受它將需要對計算機抱有信心。

在這種情況下,科學家是否應該將其計算機作為論文的共同作者?"我不會這麼做。"波士頓將 AI 應用於科學發現的一家公司 Nutonian 的首席執行官 Michael Schmidt 說。但他隨後表示:"當計算機能夠閱讀並理解論文的意思之後,它們自己就可以成為作者。"

相關文章
三星Galaxy S8 Active高分辨率諜照曝光2017年07月30日
聯想新機K8 Note即將發布:搭載聯發科X202017年07月29日
仍未回來 賈躍亭在美國再次現身2017年07月29日
漢能發布薄膜太陽能新產品漢瓦 售價1390元/平米2017年07月29日
長壽秘方?日本百歲醫學先驅稱不要退休2017年07月29日
[觀點]收購特斯拉可改觀蘋果的自動駕駛計劃2017年07月29日
CRISPR 專利戰最新回合:加州大學轉戰美國聯邦巡回上訴法院2017年07月29日
訂單量達到50萬輛 特斯拉要如何解決產量問題?2017年07月29日
穀歌加快核聚變研究 取之不盡的清潔能源還遠嗎2017年07月29日
蘋果更新Xprotect防新型惡意軟件變種2017年07月29日

没有评论:

发表评论