深度學習改變生物學分析圖像方式,幾年后或將成主流
人們常說眼睛是心靈的窗戶,但是谷歌的研究人員把它們視作人們健康的指示器。谷歌正借助深度學習技術,通過分析人們的視網膜圖像預測一個人的血壓、年齡和吸煙狀態。谷歌的計算機能夠從血管的排布中獲取線索,而且之前的一項研究表明計算機能夠借助這種信息預測一個人近期是否會有心臟病發作的風險。
這些研究依靠的是一種卷積神經網絡,這是一種能夠改變生物學家分析圖像方式的深度學習算法。科學家們正借助這種方法尋找基因中的突變,并且預測單細胞排列的變化。谷歌帶來了新一輪的深度學習應用,能夠讓圖像處理變得更簡單而且更通用,甚至能夠識別以前被忽視的生物學現象。
美國加州山景城谷歌研究所的工程學負責人Philip Nelson稱:“以前將機器學習應用到生物學的許多領域是不切實際的想法。現在你就能夠做到,而且更加令人激動的是,計算機現在能夠觀察到許多人類或許從未見過的細節。”
卷積神經網絡能夠讓計算機高效而且完整的處理圖像,而且不需要再對圖像進行分解。這種方法最早是在2012年出現在技術領域,比如說Facebook借助這種深度學習技術識別照片上的面孔。但是科學家們一直難以把這種方法應用到生物學領域,部分原因源于兩個領域之間的文化差異。
舊金山生物學公司Calico的首席計算機官員Daphne Koller稱:“這就像你把一群生物學家送入到一個計算機科學家團隊所在的房間,他們將彼此用不同的語言談論,而且會產生不同的思維方式。”
科學家們也必須確定借助卷積神經網絡能夠進行哪種類型的研究。當谷歌想要用深度學習尋找基因中的突變時,谷歌科學家必須將DNA字母鏈轉變成計算機能夠識別的圖像。隨后他們需要借助參照基因對神經網絡進行訓練,這樣才能發現突變。12月問世的DeepVariant工具就能夠在DNA序列中發現微小的變化。在測試中,DeepVariant的表現至少趕得上傳統的工具。
西雅圖艾倫細胞科學研究所的細胞生物學家正使用卷積神經網絡,將光學顯微鏡拍攝的單調灰白照片轉換成3D圖像,而且讓部分細胞器擁有了色彩標簽。這種方法消除了細胞染色的流程,細胞染色耗時較多且需要在精密實驗室中進行,而且會給細胞帶來損傷。上個月,該團隊公布了一項先進技術,只借助部分數據就能夠預測細胞其他部分的形狀和位置。
麻省理工學院布羅德研究所和哈佛大學影像平臺的負責人Anne Carpenter稱:“你現在所看是一種史無前例的變化,機器學習能夠借助圖像完成生物學任務。”在2015年她的跨學科團隊開始借助卷積神經網絡處理細胞圖像。現在Carpenter稱,在她的研究中心大約有15%的圖像數據借助了卷積神經網絡。她預測,幾年后這種方法將成為研究中心主要的圖像處理方法。
更加令人激動的是,借助卷積神經網絡分析圖像能夠在無意中揭開微妙的生物學現象,讓生物學家開始思考之前忽視的問題。艾力研究所的執行董事Rick Horwitz稱,這樣的偶然發現能夠幫助醫學研究不斷進步。如果深度學習能夠揭開癌癥在單體細胞中的微妙標識,那么它就可能幫助研究人員提前識別腫瘤。
其他生物學中的機器學習專家已經目標放在更前沿的領域,現在卷積神經網絡已經開始廣泛應用于圖像處理。德國環境健康研究中心的計算機生物學家Alex Wolf稱:“圖像是非常重要的,但是化學和分子數據同樣重要。我認為未來數年內將實現一項重大的突破,讓生物學家更廣泛的應用卷積神經網絡。”(過客)