7月22日,頂級期刊《Nature》帶來了一項令科學家們振臂高呼的文章。DeepMind公司宣布旗下人工智能系統AlphaFold已經實現對98.5%已知人類蛋白質以及大腸桿菌、果蠅、斑馬魚等20種模式生物蛋白質的結構預測。更驚人的是,該系統還能夠對其預測結果的置信度進行測量。也就是說,生物學家們盼了數十年,終于盼來了一個給力的科研外掛。 蛋白質是構成生命體的重要物質,其結構能夠為科學研究提供諸
7月22日,頂級期刊《Nature》帶來了一項令科學家們振臂高呼的文章。DeepMind公司宣布旗下人工智能系統AlphaFold已經實現對98.5%已知人類蛋白質以及大腸桿菌、果蠅、斑馬魚等20種模式生物蛋白質的結構預測。更驚人的是,該系統還能夠對其預測結果的置信度進行測量。也就是說,生物學家們盼了數十年,終于盼來了一個“給力”的科研“外掛”。
蛋白質是構成生命體的重要物質,其結構能夠為科學研究提供諸多寶貴信息。包括對生物過程的推理,以及幫助科學家們基于相關結構進行藥物開發。經過數十年的漫長努力,結構生物學家已經確定了覆蓋人類蛋白質組17%的氨基酸。如何更快更好地解開更多蛋白質結構,仍然是生物學界的一大挑戰。
一周前,DeepMind公司在《Nature》分享了其備受關注的AlphaFold2的源代碼,這款人工智能系統曾在2020年的國際蛋白質結構預測競賽(CASP)上擊敗了約100個團隊,對三分之二的蛋白靶點給出幾乎與實驗室解析相等的結構預測結果。盡管此篇研究文章的發布已經令人大飽眼福,但是科學家們仍然期待著AlphaFold2能夠為科學界帶來更多驚喜。
如今,第二篇《Nature》的發布又一次在科學界又投下了一顆重磅炸彈。DeepMind公司帶來了36.5萬個蛋白質結構,并且這些結構信息可在歐洲分子生物學實驗室下屬歐洲生物信息學研究所EMBL-EBI 核酸數據庫中免費獲得。預計隨著新蛋白質的識別和預測的改進,到今年年底數據將增至1.3億。
如此規模的蛋白質結構已經令人足夠振奮,但是在這篇最新的文章中,AlphaFold還將為科學家們帶來了另一個驚喜:對預測蛋白質置信度的估算。
“我們希望能夠給科研人員和生物學家一個非常明確的信號,告訴他們應該依賴預測的哪些部分。”該報告的第一作者、DeepMind的科學工程師Kathryn Tunyasuvunakool說,“在當前近乎覆蓋整個人類蛋白質組的蛋白質結構中,AlphaFold2對58%的氨基酸殘基預測具有置信度,其中有36%的預測結構具有非常高的置信度,能夠提供對藥物設計有用的詳細的原子特征,例如酶的活性位點。”
當然,即使是不太準確的預測結構也可能會啟發生物學研究。生物學家們通常認為,人類和其他真核生物蛋白質中有一定比例沒有固有的結構,只有在與其他分子協同作用的情況下才具有特定的結構。而AlphaFold2預測不準確的蛋白質,或許就是這類無序物質。
該報告的合著者、EMBL歐洲生物信息研究所所長Ewan Birney說:“這將是人類基因組圖譜繪制以來最重要的數據集之一。AlphaFold2已經刺激了新型酶的發展,并為藥物治療被忽視的疾病帶來了新的可能性。”
總之,DeepMind公司的成果正將結構生物學帶入新的想象之中,這可能意味著生物學研究的“范式轉變”。期待今后人工智能系統能夠為生物學研究帶來更多驚喜。
copyright©醫學論壇網 版權所有,未經許可不得復制、轉載或鏡像
京ICP證120392號  京公網安備110105007198  京ICP備10215607號-1  互聯網藥品信息服務資格證書:(京)-非經營性-2017-0056