本報訊(通訊員 張梓欣 記者 劉盾)“通過智能技術,我們發現了許多未研究過的病毒群體,以及具有特殊長度、復雜基因組結構的RNA(核糖核酸)病毒類型?!比涨?,中山大學醫學院教授施莽團隊在將人工智能技術應用于病毒鑒定方面實現突破。他們跨越重重技術難關,發現了大量全新RNA病毒。
過去,人們通過分離培養病毒,在顯微鏡下觀察確認病毒的存在。隨著技術發展,科學家們利用測序技術,通過比較未知病毒和已知病毒核酸序列的相似性,來識別和鑒定新病毒。然而,這些傳統的病毒發現方法比較依賴既有知識,還有很多病毒缺乏同源性或同源性低,用傳統方法很難識別,這類病毒被稱為“暗物質病毒”。
如何突破傳統病毒發現方法的瓶頸,用更高效、更精準的方法去發現和鑒定新病毒,并進行下游的驗證工作?
2020年起,中山大學研究團隊開發了一種基于同源性的生物信息學算法,它能夠幫助科研人員發現遠緣的病毒,但仍面臨著操作煩瑣,以及難以深入探測“暗物質病毒”的技術難關。2022年,中山大學研究團隊與阿里云李兆融團隊的一次偶然交流,為發現“暗物質病毒”帶來了契機。此后,兩個團隊展開緊密合作,聯合開發用于病毒發現的人工智能模型。
反復優化模型后,LucaProt人工智能算法能夠對病毒和非病毒基因組序列深度學習,且能在數據集中后,自主判斷病毒序列?!芭c傳統方法相比,LucaProt結合了序列和預測結構信息,在準確性、效率以及檢測病毒多樣性方面展現出很大優勢?!表椖肯嚓P負責人介紹,LucaProt人工智能算法專為RNA病毒發現而設計,其框架融合了蛋白質序列與隱含的結構信息??蒲腥藛T輸入蛋白質序列,就可以對該序列進行判別。
在來自全球生物環境樣本的10487份RNA測序數據中,研究團隊利用這套算法,發現了超過51萬條病毒基因組,代表超過16萬個潛在病毒種及180個RNA病毒超群,使RNA病毒超群數量擴容約9倍。其中23個超群無法通過序列同源方法識別,被稱為病毒圈的“暗物質”。
《中國教育報》2024年10月21日 第01版
工信部備案號:京ICP備05071141號
互聯網新聞信息服務許可證 10120170024
中國教育報刊社主辦 中國教育新聞網版權所有,未經書面授權禁止下載使用
Copyright@2000-2022 www.junhanjc.com All Rights Reserved.