2021-07-16
如(rú)今,人工智能已經滲透到人們生活的方方面面,各種深度學習算法也越來越多愛謝地應用于各個(gè)領域。尤其在生物和(hé)醫學領域,人工智能技術(shù藍工)可(kě)以說大放異彩,極大加速了有關(guān)生物、病理等科學的發區飛展,而其中(zhōng)一項重要的應用,就是預測蛋白質結構。
蛋白質作為構成人體組織器(qì)官的支架和(h女裡é)主要物質,在人體生命活動(dòng)中(zhōng)資視起着重要作用。2020 年,DeepMind在第 14 屆 “蛋白質結構預測關(guān)鍵評估”(懂議CASP14)大賽中(zhōng)展示了轟動(dòng)一時拍遠的相關(guān)成果 ——AlphaFold2,當時,該技術(shù)預測蛋白質結構的準确度排名第一。信算
現在,西雅圖華盛頓大學醫學院蛋白質設計研究所的研究人員,研發飛城出一款新的深度學習工具RoseTTAFold,不僅擁有媲美 AlphaFold2 的蛋白質結構預測超高準确度,而且更快、所需計算機處理體兒能力更低,更重要的是,RoseTTAFold完全免費!
相關(guān)論文(wén)發表在最新一期的報兒 Science 雜志上。
AlphaFold2:聲名大噪的 “前浪”
蛋白質是一切生命的物質基礎,由無數氨基酸鍊組成,它們按照特有了定方式折疊結合成複雜的微觀形狀,這些獨特的結構反過來又引發了生物體内幾乎所有的很請化學過程。因此,通(tōng)過更好地了解蛋街訊白質内部結構,科學家們可(kě)以加快開發針對癌花放症、COVID-19 和(hé)數千種其它健康疾病的新療法。
圖 | 蛋白質 3D 結構(來源:Nat Commun)
Science雜志曾指出,蛋白質折疊問(wèn)題是人類在21世紀需要解決的125個(gè)科學前沿問(wèn)題之一。通(tōng)過蛋白質結構預件書測破譯 “第二遺傳密碼”,是生物學中(zhōng)心法則尚未揭紅能示的奧妙之一,也是目前結構生物學面臨的一項具有挑戰性的重大基礎性研究課題。
然而,确定蛋白質的3D結構一直是一個(gè)難題。在過去的幾十年中(zhōng),人類已經能夠利用錯雪冷(lěng)凍電子(zǐ)顯微鏡、核磁共振或員光 X 射線晶體學等實驗技術(shù)确定蛋白質的基本結構,街車但這些技術(shù)基于大量試錯,往往需要花(huā)費數年時間,成本服業也非常高。
近年來,随着人工智能技術(shù)的不斷發展,有關(guān)預內照測蛋白質結構的AI工具也越來越成熟。其中(zhōng),性能最強、準确度最高的就是去間看年DeepMind在CASP14蛋白質結構預測評估會議上展示的AlphaFold2。在去年的比賽中(zhōng),AlphaFold2預測的大部分結構達到了空前的準确度,不僅與實驗方法得出的讀了結果不相上下(xià),還遠(yuǎn)超解析新蛋白質結構的其他方法。
圖 | AlphaFold2 預測的蛋白結構與實驗結果幾乎一緻。(來源:DeepMind)
AlphaFold2的高性能令世人矚目,然而人們也開始思考一個(gè)問(wèn)題:除了DeepMind這種在世界領先的深度學習公司以外,其他機構或科研團隊開發技得的系統中(zhōng)是否也可(kě)以實現這種準确性呢(n白綠e)?
RoseTTAFold:公開免費的 “後浪”
現在,肯定的答案浮出水面。
在此次的新研究中(zhōng),華盛頓大學醫學院生物兒民化學系教授、蛋白質設計研究所所長 David Baker 領導一支計算生物學家團隊,成功開發一款名為 RoseTTAFold 的工具,基于深度學習,能夠根據有限的信息快速準确地預測出目标蛋白質的結構,這妹達到與AlphaFold2不相上下(xià)的準确度。
圖 | David Baker(來源:UW)
不僅如(rú)此,RoseTTAFold所需的計算耗能與計算時間均比 AlphaFold2 還要低:僅用一台遊戲計算機,在短(duǎn)短(duǎn)十分鐘内報月就可(kě)以可(kě)靠地計算出蛋白質結構。更值得注意的是,RoseTTAFold的代碼和(hé)服務器(qì)完全免費提供給科學界!自7月(yuè)以來,相關(guān)程序已被140多個(gè)獨立科研團隊從GitHub免費下(xià)載,來自世界各地的科學家現在正在使用RoseTTAFold來構建蛋白質模型,以加速相關(guān)領域的研究。
因此可(kě)以說,RoseTTAFold不僅僅是 “免費版” 的AlphaFold2,更是該技術(shù)領域推翻 “前浪” 的那一股 “後浪”。
整個(gè)研究學界都将受益
實際上,RoseTTAFold 是一個(gè) “三軌” 神經網絡("three-track" neural networ要也k),這意味着它同時考慮一維蛋白質中(zhōn劇城g)的氨基酸序列、二維蛋白質的氨基酸如(r通影ú)何相互作用以及蛋白質可(kě)能的三維結構。在這種架構中(zhōng),一劇計維、二維和(hé)三維信息來回流動(dòng),從而使神經網絡能科文夠共同推理出蛋白質的化學部分與其折疊結構之間的關(guān)系。
目前,該團隊已經使用RoseTTAFold計算了數百種新的蛋白質結構,其中(zhōng藍公)包括許多來自人類基因組的知之甚少(shǎo)的蛋白質。研究人員還生成了問人與人類健康直接相關(guān)的蛋白質結構,包括與非正常脂質代謝、炎症購內障礙和(hé)癌細胞生長相關(guān)的蛋白質結構。這些成果都呢呢表明,RoseTTAFold 可(kě)以僅用從前所需時間的很小一部分,構建出複照開雜生物組件的模型。
圖 | 研究人員使用 RoseTTAFold 生成了數百種新的蛋白質結構,包括人類白細胞介素 12 與其受體結合的 3D 視圖(來源:UW Medicine Institute for Prote嗎微in Design)
當然,看似 “小小” 的一步,背後支撐的是整個(gè)研究團隊的努力。作為團隊主要負責人,Baker說:“在蛋白質設計研究所這忙碌的一年中(zhōng)聽黃,我們設計COVID-19療法和(hé)疫苗并将其投入臨床試驗,同時開發出用于高精度蛋白劇舊質結構預測的RoseTTAFold工具。我很高興科學界已經在使用RoseTTAFold服務器(qì)來解決突出的生物學問(wèn)題。”
可(kě)以想見的是,如(rú)此一款便捷免費、高準确度暗章、低成本的工具必然會受到世界各地的科研人員的歡迎。團隊從購成員之一、博士後學者Minkyung Baek也表示:“我們希望RoseTTAFold新工具在今後,繼續使整個(gè)研究學界受益。物線”
(轉載自學術(shù)頭條)