近日,阿里云對(duì)外宣布其容器服務(wù)調(diào)度GPU云服務(wù)器啟動(dòng)加速計(jì)算,最快只需60秒即可完成新冠病毒的核酸對(duì)比工作;同時(shí)將向醫(yī)療科研機(jī)構(gòu)、疾控中心等一線病毒研究機(jī)構(gòu)免費(fèi)開(kāi)放基因計(jì)算服務(wù),技術(shù)可大幅提升宏基因組測(cè)序、疫苗研發(fā)相關(guān)的處理效率。
基于此,晶少專程采訪了阿里云基因計(jì)算服務(wù)AGS負(fù)責(zé)人、高級(jí)技術(shù)專家李鵬,集中呈現(xiàn)針對(duì)GPU和容器技術(shù)大幅提升核酸比對(duì)速度的有關(guān)細(xì)節(jié)以及關(guān)于阿里云基因計(jì)算服務(wù)(AGS)的諸多信息。
據(jù)晶少了解,本次阿里云基因計(jì)算服務(wù)AGS病毒比對(duì)能力-mNGS宏基因組比對(duì)從設(shè)計(jì)、研發(fā)、驗(yàn)證到最終上線只用了短短20幾天,但李鵬所在團(tuán)隊(duì)卻每天肩負(fù)著艱苦卓絕的工作。很關(guān)鍵的一個(gè)出發(fā)點(diǎn)在于,除了提供針對(duì)新冠肺炎病毒中mNGS宏基因組測(cè)序數(shù)據(jù)的快速比對(duì)能力之外,更重要的是讓研究機(jī)構(gòu)更專注業(yè)務(wù)創(chuàng)新,而不是數(shù)據(jù)本身的重復(fù)處理工作,這其中就涉及到了生物類型計(jì)算解決方案所具有的鮮明特殊性。
晶少:生物計(jì)算解決方案有一定的特殊性,相比其他類型的技術(shù)解決方案有何不同?
阿里云基因計(jì)算服務(wù)AGS負(fù)責(zé)人、高級(jí)技術(shù)專家李鵬:不同于常規(guī)的計(jì)算,基因計(jì)算對(duì)海量數(shù)據(jù)計(jì)算和存儲(chǔ)能力有很高的要求,主要通過(guò)容器計(jì)算的自動(dòng)伸縮特性和阿里云ECS自動(dòng)伸縮能力的打通,這才能讓AGS具備大規(guī)模調(diào)度云上計(jì)算資源的能力。具體來(lái)說(shuō)通過(guò)特定算法對(duì)基因數(shù)據(jù)進(jìn)行合理切分后,可實(shí)現(xiàn)大規(guī)模的并行計(jì)算以及處理TB級(jí)別的樣本數(shù)據(jù)。
過(guò)去的基因計(jì)算服務(wù)以集群化,混合云,彈性為主的AGS工作流服務(wù)。但在走過(guò)的兩年時(shí)間里,阿里云提供了基于容器混合云的基因計(jì)算方案,整體技術(shù)是混合云架構(gòu)下的云原生容器,達(dá)成云上云下資源一體,跨地域集群統(tǒng)一管理。2020年,在以往技術(shù)沉淀基礎(chǔ)上,阿里云升級(jí)了AGS的能力,用公共云API化服務(wù)做到即開(kāi)即用、用完即走,以這次的病毒檢測(cè)為例,在提供了自定義病毒庫(kù)靈活性的基礎(chǔ)上又使得調(diào)用的無(wú)服務(wù)化,一次調(diào)用即能產(chǎn)出比對(duì)的最終數(shù)據(jù)結(jié)果并返給用戶。
實(shí)時(shí)熒光定量PCR(RT-PCR)和病原宏基因測(cè)序(mNGS)是最早用于確診新冠病毒感染的方法。由于兩項(xiàng)技術(shù)各有優(yōu)劣,聯(lián)合使用方能實(shí)現(xiàn)互補(bǔ)。
RT-PCR是目前新冠病毒的核酸檢測(cè)主流方法,成本較低,操作簡(jiǎn)便?,F(xiàn)已有眾多新冠病毒RT-PCR試劑盒可選,但由于病毒濃度和試劑盒質(zhì)量問(wèn)題,其結(jié)果出現(xiàn)假陰性較高,導(dǎo)致醫(yī)生和患者往往需要重復(fù)多次檢測(cè)和長(zhǎng)時(shí)間等待檢測(cè)結(jié)果。
mNGS的技術(shù)優(yōu)勢(shì)可通過(guò)一次檢測(cè)便能排查所有已知的病原體,有效避免重復(fù)采樣的麻煩操作,以及多次檢測(cè)篩查所需大量樣本難以實(shí)現(xiàn)的問(wèn)題。當(dāng)病毒經(jīng)過(guò)數(shù)代傳播,還會(huì)產(chǎn)生變異,mNGS也是較為有效的追蹤方案,配合病毒庫(kù)可精準(zhǔn)確定病毒的代際關(guān)系,甚至找到病毒源發(fā)地?;趍NGS基因序列比對(duì)的分析方式,一旦病原體的基因組已知,通過(guò)更新數(shù)據(jù)庫(kù),就可實(shí)現(xiàn)高效準(zhǔn)確檢測(cè)出相似病毒的功能,同時(shí)對(duì)新型病毒以外的其他病原及混合感染進(jìn)行綜合鑒定。但mNGS的缺點(diǎn)是成本較高,需要測(cè)序儀和專業(yè)的生信分析,并且操作復(fù)雜、檢測(cè)時(shí)間相對(duì)較長(zhǎng),因此無(wú)法實(shí)現(xiàn)大范圍推廣和快速診斷。
如今通過(guò)使用阿里云容器服務(wù),科研人員只需在阿里云上通過(guò)命令行AGS rna-mapping API 啟動(dòng)比對(duì)過(guò)程,隨即阿里云容器服務(wù)調(diào)度GPU云服務(wù)器啟動(dòng)加速計(jì)算,60秒內(nèi)即可得到高質(zhì)量匹配reads的數(shù)據(jù)和初步質(zhì)量報(bào)告,為多種病原體檢測(cè)和進(jìn)一步的新冠病毒蛋白質(zhì)研究及變異研究提供快速準(zhǔn)確的數(shù)據(jù)支撐。
基于此我們發(fā)現(xiàn),本次阿里云方面提供的云服務(wù)與以往顯著不同,“全套”思想貫穿其中,也就是說(shuō)所使用的機(jī)構(gòu)不再需要購(gòu)買(mǎi)額外計(jì)算資源,更不用關(guān)心如何搭建集群以及考慮算法和網(wǎng)絡(luò)等諸多問(wèn)題,只需將數(shù)據(jù)放入對(duì)象存儲(chǔ)中并上傳,等待授權(quán)完成后即可調(diào)用云服務(wù)來(lái)處理數(shù)據(jù),產(chǎn)出結(jié)果并生成有關(guān)報(bào)告,“既開(kāi)即用、用完即走”的特質(zhì)表現(xiàn)突出。
另外AGS在處理測(cè)序儀下機(jī)數(shù)據(jù)的比對(duì)、排序、變異檢測(cè)等環(huán)節(jié)擁有目前云上最快的加速比,可以達(dá)到普通CPU處理速度的百倍,同時(shí)又保持了BWA/GATK等主流金標(biāo)準(zhǔn)軟件的精度和召回率,大幅度降低了計(jì)算的成本,性價(jià)比十分可觀,也足見(jiàn)其技術(shù)探索的功底深厚,但究竟是何種機(jī)緣促成了容器技術(shù)與基因計(jì)算間的火花迸發(fā)?
晶少:何時(shí)何種契機(jī)開(kāi)始針對(duì)容器技術(shù)加速基因計(jì)算做有關(guān)探索的?這種API調(diào)用更多意味著什么?
阿里云基因計(jì)算服務(wù)AGS負(fù)責(zé)人、高級(jí)技術(shù)專家李鵬:我們觀察到,容器技術(shù)一方面在數(shù)據(jù)分拆、質(zhì)量控制、Call 變異提供了標(biāo)準(zhǔn)化流程化、加速、彈性、鑒權(quán)、觀測(cè)、度量等能力;另一方面,高價(jià)值挖掘需要借助容器化的機(jī)器學(xué)習(xí)平臺(tái)和并行框架完成大規(guī)模線性代數(shù)計(jì)算建立模型,實(shí)現(xiàn)精準(zhǔn)醫(yī)療。過(guò)去的兩年中,AGS一直在行業(yè)里通過(guò)集群化、混合云,彈性為主的AGS工作流服務(wù)方式幫助大型的基因測(cè)序企業(yè)完成當(dāng)日處理100TB以上的數(shù)據(jù)的,1年數(shù)十PB數(shù)據(jù)的處理任務(wù),成果顯著。
而這種API化的嘗試確實(shí)能夠有效幫助用戶擺脫集群的復(fù)雜性,資源創(chuàng)建和維護(hù)的代價(jià),以極少的存儲(chǔ)成本就可以完成任意數(shù)量的按需計(jì)算需求,成本支出只需要按照處理的數(shù)據(jù)量和計(jì)算量來(lái)支付, 實(shí)現(xiàn)真正的無(wú)服務(wù)化和Pay as you go。
有消息表明,阿里云其實(shí)早在疫情嚴(yán)峻階段就宣布向新冠疫苗研發(fā)科研機(jī)構(gòu)免費(fèi)提供一切AI算力,目前已收到了包括浙江大學(xué)醫(yī)學(xué)院、GHDDI全球健康藥物研發(fā)中心、清華大學(xué)醫(yī)學(xué)院、北京大學(xué)醫(yī)學(xué)院等國(guó)內(nèi)外數(shù)十家權(quán)威科研機(jī)構(gòu)的申請(qǐng),第一批申請(qǐng)的算力資源已部署上線、不斷為疫苗研發(fā)提速加碼,但個(gè)中情況具體如何呢?
晶少:目前對(duì)外申請(qǐng)算力部署的整體情況如何?效果怎樣?后續(xù)的服務(wù)支持有哪些具體方面?未來(lái)在助力疫苗藥品研制方向有何規(guī)劃?
阿里云基因計(jì)算服務(wù)AGS負(fù)責(zé)人、高級(jí)技術(shù)專家李鵬:目前AGS已經(jīng)開(kāi)通了國(guó)內(nèi)的多個(gè)地區(qū)的服務(wù),特別是北京、深圳、杭州等都有大型基因公司開(kāi)始生產(chǎn)使用;另外國(guó)外的多個(gè)地區(qū)也開(kāi)通了服務(wù),例如法蘭克福等疫情重災(zāi)區(qū)也可以訪問(wèn)到AGS服務(wù)。
晶少:新冠狀病毒疫情發(fā)生后,為了幫助抗攻擊疫情,阿里云免費(fèi)向全球公共科研機(jī)構(gòu)提供高性能計(jì)算、SCC 超級(jí)計(jì)算集群和 CPU/GPU 機(jī)器、云超算及 AI 等技術(shù),包括助力在E-HPC云超算上進(jìn)行藥物研發(fā)等,這與AGS關(guān)系如何?AGS在阿里云技術(shù)的對(duì)外輸出中占據(jù)了何種位置或者扮演了怎樣的角色?
阿里云基因計(jì)算服務(wù)AGS負(fù)責(zé)人、高級(jí)技術(shù)專家李鵬:AGS主要定位于公有云的開(kāi)箱即用的Serverless服務(wù),提供給各個(gè)生態(tài)伙伴,例如基因公司、研究機(jī)構(gòu)、學(xué)校等PaaS服務(wù),是可以被集成在各種云端SaaS應(yīng)用中來(lái)實(shí)現(xiàn)效率的百倍提升和成本的大幅縮減。當(dāng)然E-HPC也是阿里云中很有優(yōu)勢(shì)的產(chǎn)品線,主要面向科研機(jī)構(gòu)做高分子分析等高性能計(jì)算,當(dāng)然科研機(jī)構(gòu)、疾控中心可以同時(shí)使用AGS和E-HPC來(lái)形成科研項(xiàng)目互補(bǔ),并不沖突。
采訪接近尾聲,可以想見(jiàn)的一點(diǎn),未來(lái)AGS基因計(jì)算會(huì)繼續(xù)朝著Serverless與按量付費(fèi)、按需彈性的持續(xù)被集成的路線發(fā)展,有幸提供各種人類基因組、動(dòng)植物以及病毒等基因的加速處理云服務(wù)??傮w來(lái)看隨著測(cè)序成本、計(jì)算成本以及分析成本的持續(xù)下降,人們有理由相信基因測(cè)序和精準(zhǔn)醫(yī)療在不遠(yuǎn)的將來(lái)將進(jìn)入到普通人的常規(guī)健康服務(wù)列表中,人類對(duì)自身基因認(rèn)知的深入必然推動(dòng)壽命提升以及戰(zhàn)勝各種疾病的可能,云計(jì)算服務(wù)AGS會(huì)推動(dòng)國(guó)內(nèi)乃至世界范圍內(nèi)普惠精準(zhǔn)醫(yī)療早日到來(lái)。
地址:柳州市陽(yáng)光100-3號(hào)樓-7-23
公司名稱:柳州智慧星網(wǎng)絡(luò)科技有限公司
開(kāi)戶行:柳州銀行紅光支行
賬戶:7080 0500 0000 0003 2067
15807738124(技術(shù)總監(jiān))
15807730604(產(chǎn)品經(jīng)理)
柳州智慧星網(wǎng)絡(luò)公司-專注柳州網(wǎng)站建設(shè),柳州小程序制作,柳州軟件開(kāi)發(fā),擁有15年廣西網(wǎng)站建設(shè)團(tuán)隊(duì)開(kāi)發(fā)經(jīng)驗(yàn),擁有5000余成功案例!
Copyright ?2006 - 2020 999xing.com All Rights Reserved.
公司承接: 柳州網(wǎng)站建設(shè),柳州小程序開(kāi)發(fā),柳州公眾號(hào)維護(hù),柳州網(wǎng)站制作,柳州團(tuán)購(gòu)商城開(kāi)發(fā),柳州軟件開(kāi)發(fā),柳州網(wǎng)站設(shè)計(jì),柳州公眾號(hào)維護(hù)
柳州智慧星網(wǎng)絡(luò)科技有限公司版權(quán)所有
智慧星備案號(hào): 桂ICP備20001182號(hào)-1
桂公網(wǎng)安備 45020402000142號(hào)