病毒不斷偽裝變異 疫苗與它的貓鼠遊戲

加拿大都市网

  病毒可能比人們想像得更狡猾,它能不斷偽裝自己,逃避「疫苗獵人」的追捕。

  一直以來,研製對抗流感和艾滋病病毒(HIV)等病毒的有效疫苗之所以如此困難,原因之一是這些病毒的變異非常迅速。這使得它們可以通過一種被稱為病毒逃逸的過程,避開特定疫苗產生的抗體。

  美國麻省理工學院研究人員現在設計了一種計算病毒逃逸的新模型。該模型基於最初用來分析語言的模型,可以預測病毒表面蛋白的哪些部分更容易發生突變,從而使病毒能夠逃逸,也可以識別出不太可能發生突變的部分,使它們成為新疫苗的良好靶標。

  「病毒逃逸是個大問題。」麻省理工學院計算機科學與人工智能實驗室教授Bonnie Berger說,「流感病毒表面蛋白和HIV病毒包膜表面蛋白的病毒逃逸是造成目前沒有通用疫苗的主要原因。這兩種疾病每年都會導致數十萬人死亡。」

  在1月15日發表在《科學》上的一項研究中,Berger及同事確定了流感、HIV和新冠病毒疫苗的可能目標。研究人員還將該模型用於研究最近在英國和南非出現的新冠病毒新變種。研究人員說,尚未經過同行評審的相關分析發現,這些病毒的基因序列應該被進一步調查,以確定它們是否有可能逃脫現有疫苗的影響。

  病毒也有語言 

  不同類型的病毒以不同的速度發生基因突變,HIV和流感是突變最快的病毒之一。

  「HIV和流感病毒突變得很快,這是它們複製生物學的結果。例如,HIV和流感遺傳物質複製的機制容易出錯,從而導致突變。」該研究通訊作者、麻省理工學院生物工程助理教授Bryan Bryson在接受《中國科學報》記者採訪時表示。

  為了讓這些突變促進病毒逃逸,它們必須幫助病毒改變其表面蛋白質的形狀,這樣抗體就不能再與它們結合。然而,這種蛋白質不會發生使其失去功能的變化。

  Berger、Bryson以及研究生Brian Hie等人,決定使用一種被稱為語言模型的計算模型對這些標準進行建模。這種模型來自自然語言處理(NLP)領域,最初被設計用來分析語言模式,特別是某些單詞同時出現的頻率。然後,這些模型就可以預測哪些單詞可以用來完成一個句子,比如要補全「薩莉在()中吃了雞蛋」,NLP模型可能預測「早餐」或「午餐」。

  「我們對NLP語言模型的最新進展感到興奮,這些模型可以通過訓練原始文本來理解人類語言。於是,我們認為,由於病毒最豐富的數據只是原始的病毒序列,我們也可以通過訓練語言模型從病毒序列數據集中學習非常複雜的模式。」Bryson說。

  當這種模型應用於生物信息,如基因序列時,語法類似於確定特定序列編碼的蛋白質是否具有功能的規則,語義意義類似於蛋白質是否能夠呈現新的形狀,幫助它逃避抗體。因此,使病毒能夠逃脫的突變必須保持序列的語法性,但同時能以一種有用的方式改變蛋白質的結構。

  用序列訓練模型 

  「如果病毒想要逃離人類的免疫系統,又不想讓自己因突變而死亡或無法複製,換句話說,它既想保持健康,又想充分偽裝自己,以便不會被人體免疫系統檢測到。」Hie說。

  為了模擬這一過程,研究人員訓練了一個NLP模型來分析基因序列中的模式,該模型可以預測具有新功能但仍遵循蛋白質結構生物學規則的新序列。這種建模的一個顯著優點是它只需要序列信息,這比獲得蛋白質結構容易得多。

  此外,該模型可以在相對少量的信息上進行訓練——在這項研究中,研究人員使用了6萬條HIV序列、4.5萬條流感序列和4000條冠狀病毒序列。

  「語言模型非常強大,因為它們可以學習這個複雜的分佈結構,並從序列變化中獲得一些對功能的洞見。」Hie告訴記者,「我們在每個氨基酸位置都有大量的病毒序列數據,模型通過訓練數據學習氨基酸共現和共變的這些特性。」

  一旦該模型被訓練,研究人員能使用它來預測冠狀病毒刺突蛋白、HIV包膜蛋白和流感血凝素(HA)蛋白的序列變化,這些蛋白或多或少可能產生逃逸突變。

  「發現看似不相關的科學分支之間的聯繫,可能會發展出來加速一個分支研究的新方法。該研究提供了一個此類聯繫的示例。作者們發現了病毒與自然語言之間的相似之處,進而提出了一種識別突變的強大新方法,這種突變可以使病毒通過中和抗體而逃脫識別。」未參與該研究的美國國家醫學圖書館Teresa M. Przytycka等人在相關評論文章中指出。

  知己知彼 阻斷逃逸 

  對於流感,該模型揭示了最不可能發生突變和產生病毒逃逸的序列是在HA蛋白的莖部。這與最近的研究一致,研究表明,針對HA莖部的抗體可以提供幾乎全面的保護,以對抗任何流感毒株。

  在對HIV的研究中,研究人員發現,該蛋白的V1-V2高變區域有許多可能的逃逸突變,這與之前的研究結果一致,他們還發現了逃逸概率較低的序列。

  該模型對冠狀病毒的分析表明,被稱為S2亞基的刺突蛋白的一部分最不可能產生逃逸突變。但新冠病毒變異的速度仍是一個問題,因此目前部署的抗擊新冠肺炎大流行的疫苗將在多長時間內保持有效尚不清楚。

  「目前,對於新冠病毒,我們認為我們的模型可以迅速標記出與以前看到的病毒序列有本質區別的新序列,以便在實驗室進行進一步測試。」 Berger告訴《中國科學報》,「你可以想像,模型能檢查每一個新序列,而改變超過一定閾值的序列就需要在實驗室中進行進一步研究。」

  初步證據表明,這種病毒的變異速度不像流感或HIV那麼快。然而,研究人員最近發現了新加坡、南非和馬來西亞出現的新突變,他們認為應該對潛在的病毒逃逸進行調查。

  研究人員認為,我們面臨的問題仍然是新冠病毒的變異速度有多快。

  「該病毒種類繁多,控制其複製的生物機制因人而異,所以儘管它們有共同的特徵,人們仍需要對每種病毒進行專門研究,以了解它們的突變率。」Bryson說,「我們最好的見解將來自於動物感染模型,其中完整的免疫反應是存在的,因此我們可以理解總的免疫壓力是如何影響病毒突變率的。之後,我們需要對新冠病毒感染者的病毒進行測序,以識別感染這些人的病毒中存在的突變。」

  此外,研究人員現在正與其他人合作,利用他們的模型確定癌症疫苗的可能目標,從而刺激人體自身免疫系統摧毀腫瘤。他們說,它還可以用於設計小分子藥物,這種藥物可能不太可能引髮結核病等疾病的耐藥性。(中國科學報 作者:唐鳳)

share to wechat

延伸阅读

延伸阅读

老外如何清洗水果和蔬菜?注册营养师教你3个简单的步骤

什么是最健康的甜椒?红、绿、黄之间的真正区别

看日食时没有戴合适的眼镜?如何判断您的眼睛是否受损

3个原因告诉你为什么会在半夜醒来