聯系我們

超算抗疫|超算助力分析定位新冠病毒元兇

2020-06-06

新冠肺炎疫情防控形勢持續向好,生産生活秩序加速恢複。在這場生死內電時速的戰疫中(zhōng),科學技術(s術書hù)是強有力的武器(qì),科技創新是些黃“硬核”力量。藥物篩選、病毒溯源、疫苗研制,争分奪秒背後,都有超級計算機花冷的身影,它成為了我們與病毒賽跑的“加速器(qì)”媽刀。

 

新型冠狀病毒,呈球狀,直徑約為100nm160nm,基因組是一條單股正鍊RNA,大約包含3萬個(gè)堿基,屬于基因組最大的RNA病毒之一。

最初人們誤以為它是SARS病毒,直到科學家們通(tōng)過基因測序、比對電船“調取”出它的身份——新型冠狀病毒與SARS分在同類,均為嚴重急性呼吸綜合症相關(guān)冠狀病毒種,兩者基因組序列相來湖似度為80%左右。

通(tōng)過高通(tōng)量基因測序技術(shù)及後續的序列圖譜構建、如山序列比對、變異檢測等高性能計算分析,我們可(kě)以解析生物DNA信息。

“基因序列可(kě)以說是一張‘身份證’,就像是警察通(tōng物通)過指紋找犯人一樣,我們把新冠病毒的序列放到病毒基因數據庫查找和(hé)比生服對,如(rú)果庫裡有記錄的,我們一下(做不xià)就能确定它的身份,如(rú)果沒找到,那麼它可(友行kě)能是迄今為止還沒有在人體身上傳播過的關靜,在比對的過程中(zhōng),我們還可(kě)以通商空(tōng)過基因相似性分析構建基因演化樹(shù)。”

國家超級計算深圳中(zhōng)心從事基線家因與計算科學方面研究的科研人員表示,此次抗疫中票動(zhōng),超級計算發揮了重要的作用,除了确定病毒來源、基于病讀信毒RNA序列對新冠病毒進行亞型分類進而指導疫苗研發外,建立在基因序列白答比對基礎上的檢測試劑盒能幫助快速診斷,把握時間窗口,幫能讀助疫情防控。

從更廣泛的場景來說,基因檢測可(kě)以幫助精确診斷和(hé)治療。例如(rú亮金),美國女星安吉麗(lì)娜·朱莉就是通(tōng)過基因檢測,選擇切除員唱乳腺降低罹癌風險;蘋果前CEO喬布斯也在對抗胰腺癌的過程中(zhōng)通(tōng)過基你長因測序進行了精準用藥。

伴随基因測序和(hé)檢測技術(shù)進步而來的是龐大的數據量作個。以一個(gè)人的全基因測序數據量為例,把人的46條染色體都讀取、存儲下(xià)來約3G,但在實際測序中(zhōng)需要複制50100份,因此數據量達到300G

這些數據産出後,需要配備海量存儲以滿足存放需求。在序列比對或者拼接階段,需要一窗議次性将海量數據載入到内存中(zhōng)并加以處理湖討,要快,還要準,這些都是高密度的計算過程。顯然,傳統的計算平台已經不能少森滿足需求,超級計算機的超強計算能力,高容風笑量的存儲能力,數據傳輸的高速網絡等則可(kě很技)提供巨大助力。

超級計算機的大規模并行處理和(hé)内存容量能支撐海校工量數據的載入、計算和(hé)分析,并通(tōn請不g)過多節點協作提高作業(yè)效率,縮短(duǎn)計算時間。國内腦放已有團隊開發出可(kě)在超級計算機上運行的基因組綠購裝分析軟件,其可(kě)在20分鐘内處理4T的基因數據,擴展性和(hé)系統效率都處于全球領先水平。在來勢洶洶的新冠肺炎面煙草前,通(tōng)過基因測序盡早把握病毒的來源、變異進化等信息時聽,就能為救治生命、防控疫情争取時間。

此外,通(tōng)過基因組信息,科學家可(kě)以預測病毒的蛋白結構下問信息,找到攻克新冠肺炎的藥物靶點,加速藥物篩選進程。在這些過程中河會(zhōng),涉及到大量計算和(hé)模型訓練,超級計算在其中(zhōn車笑g)發揮了不可(kě)或缺的重要支撐作用。

目前,國内疫情防控形勢持續向好,國外的确診病例依舊在攀升。知己知彼,百戰不湖明殆。盡管我們還沒有最終戰勝新冠病毒,但基因測序會民讓科學家進一步認識、揭示病毒的相關(gu小近ān)特性,為找到攻克它的路(lù)徑提供了重要參考信息請海。超級計算将用強大的算力和(hé)系統支微器撐持續為基因測序和(hé)檢測注入動(dòng友下)能,為徹底戰勝疫情,打赢疫情防控攻堅戰提供“硬核”支撐。

(文(wén)/林克權 李旖露)

 

誠聘英才
友好鍊接
業(yè)務咨詢及參觀訪問(wèn):0755-86576085&n短睡bsp;  &nbs校爸p;0755-86576086 &n綠了bsp;  地址:深圳市南山區笃學路(lù)9白區号
國家超級計算深圳中(zhōng)心(深圳雲計算中(黃這zhōng)心)  ©20國樹14-2020  粵ICP備10220126号鄉店