AD

2017年7月26日星期三

容器技術幫助推動科學研究的重現性

《自然》網站報道了容器技術對數據驅動科學研究的影響。科學研究越來越多地向數據密集型發展,需要大量使用軟件,其中包括研究人員自己開發和配置的軟件,但軟件的運行環境會影響到研究的重現性。容器是一種輕量級的虛擬機,可以將軟件及其運行環境打包在一起,從而有助於推動研究的重現性。

BioinformaticContainers.jpg

科學家使用的一種容器技術是 Docker 。加州大學戴維斯分校生物信息學家 C. Titus Brown 介紹說,實驗室開發的工具極少能拿來就用,它們通常以必須接受處理和配置的腳本或者源代碼的形式存在。大多數軟件需要額外的工具和程序庫,但用戶可能並未安裝。即便用戶能獲得軟件並運行它,計算環境的不同也會無意中改變其性能並且影響可重複性。容器通過將運行所需軟件要求配置的計算環境的關鍵要素打包進一個輕量級的虛擬機,減少了這種複雜性。加州伯克利國家能源研究科學計算機中心計算機專家 Deborah Bard 已幫助很多研究人員在實驗室的超級計算機上安裝了他們的軟件。她回憶說,安裝用於望遠鏡模擬和分析的複雜軟件通道之前需要三四天。利用容器則將這一時間縮減到幾個小時。

相關文章

没有评论:

发表评论