人工智慧如何破解生物學中最複雜的分子——蛋白質


摘要

本文探討人工智慧如何突破生物學中最具挑戰性的分子——蛋白質的摺疊問題,以及這一突破對科學界的重要影響。 歸納要點:

  • AlphaFold利用深度學習技術成功解決蛋白質摺疊問題,顯著提升蛋白質結構預測的精度,對生命科學研究具有重大意義。
  • Evoformer模型通過整合進化資訊和深度學習,不僅加速了蛋白質結構預測,還在處理複雜目標(如膜蛋白)上展現其優勢。
  • AlphaFold DB作為公開數據庫,為全球科學家提供免費獲取數百萬個蛋白質結構的機會,對藥物開發與疾病治療有潛在影響。
總體而言,人工智慧正重新定義我們對蛋白質結構與功能的理解,並可能徹底改變未來的醫療和生物科技領域。

DeepMind的AlphaFold如何在生物學和藥物發現領域開啟比以往更多的機會。

我們在研究許多文章後,彙整重點如下
網路文章觀點與我們總結
  • AlphaFold是DeepMind開發的一款蛋白質結構預測程式,利用深度學習技術。
  • 該系統能夠從胺基酸序列快速、準確地預測出蛋白質的3D結構,達到原子精準度。
  • AlphaFold不需要比較模板,這意味著只需一個胺基酸序列就能進行結構預測。
  • 在2020年的CASP競賽中,AlphaFold 2的準確率中位數達到92.4%,表現優於所有參賽者。
  • 其多序列比對功能可以透過搜尋相似序列來推斷新的蛋白質結構。
  • 該技術有潛力推動生物醫學研究和藥物開發的進步。

最近,DeepMind推出的AlphaFold將蛋白質結構預測提升到了新高度。這項根據胺基酸序列即能迅速得出3D結構的技術,不僅讓科學家省時省力,更為生物醫學等領域帶來了無限可能。想像一下,只要擁有基本資料,就能揭示生命奧秘,這可說是一場科學革命!


AlphaFold:蛋白質摺疊問題的解碼器,開啟蛋白質研究新紀元

在過去的五十年裡,科學家們一直在試圖解釋蛋白質結構為何(以及如何)以特定方式折疊,即所謂的「蛋白質摺疊問題」。預測蛋白質結構有助於擴充套件我們對遺傳疾病、藥物發現及其他許多領域的認知。使用 X 射線晶體學等技術來預測這些結構,不僅費用高昂,而且耗時漫長。

自從在 CASP14(蛋白質結構預測的關鍵評估)比賽中首次亮相以來,谷歌的人工智慧研究實驗室 DeepMind 在生命科學領域取得了重大突破:AlphaFold。AlphaFold 是一種基於 AI 的深度學習系統,旨在根據氨基酸序列預測蛋白質的三維結構。

**1. AlphaFold 對蛋白質研究的影響力已超越預測結構:** AlphaFold 的成功不只在於準確預測蛋白質結構,更重要的是它開啟了蛋白質研究的新方向。透過 AlphaFold,科學家們可以更深入地理解蛋白質的功能、演化、與疾病之間的關係。例如,AlphaFold 已被用於研究癌症相關蛋白質的結構,有助於開發新的治療方法。它還能預測不同蛋白質之間的互動作用,為藥物開發提供全新的思路。

**2. AlphaFold 的成功也帶來了新的挑戰與機遇:** 不過,AlphaFold 的出現同樣引發了一些新問題,例如如何有效地驗證其預測結果?如何將 AlphaFold 與其他實驗技術整合?又該如何利用 AlphaFold 開發新的蛋白質設計方法?這些挑戰同時代表著嶄新的機會,有望激發整個蛋白質研究領域蓬勃發展。


分子理解:什麼是蛋白質,它在身體中的角色是什麼?蛋白質由氨基酸鏈組成,具有多種功能,例如修復肌肉、運輸、酵素作用和免疫反應。它們通常在細胞質和內質網中摺疊。(蛋白質參與所有生物體的每一個生物過程!)蛋白質的結構非常重要,因為它決定了整體功能。許多遺傳疾病是由於蛋白質功能失常或錯誤摺疊引發的,例如阿茲海默症和帕金森氏症。您看出結構預測如何可能有助於這些問題了嗎?


公司背景
AlphaFold 的第一個原型於 2018 年由谷歌的 DeepMind 和 Isomorphic Labs(兩家公司均位於倫敦)發布。儘管當時已經推出,但結果並不準確,直到 2020 年 AlphaFold 2 的發布才有所改善。目前最新版本的 AlphaFold 於 2024 年 5 月 8 日推出,為我們提供了比以往更多的序列,並使結構更加精確。


摺疊預測:AlphaFold 的運作原理

AlphaFold是一個非常複雜的人工智慧模型,利用像是深度學習和神經網路等系統。深度學習(機器學習的一個分支)是一種工具,使計算機能夠從重複資料中學習,以進行預測或甚至做出決策。AlphaFold的深度學習系統採用了神經網路的結構。我們知道大腦中有神經元,神經網路也有節點,它們之間的相似之處在於都能輸入和輸出資訊。這些神經網路主要分為三個層次:輸入層、隱藏層和輸出層。


輸入層:蛋白質序列:將蛋白質的氨基酸序列輸入系統中。多重序列比對(MSA):已經被實現於系統中的序列,將與給定的序列並排對齊,然後識別並記錄下其模式。配對表示:建立一個網格或表格,用以追蹤序列中所有可能氨基酸對之間的關係(本質上開始預測某些摺疊是如何形成的)。


Evoformer:利用進化資訊精準預測蛋白質結構

Evoformer 區塊(隱藏層):大部分的計算任務都在此層進行。多序列比對(MSA)表示:MSA 透過不同的注意力機制進行處理,識別氨基酸如何演化及互動的模式。這有助於預測氨基酸之間的距離和方向(系統開始能夠觀察到結構中的摺疊形成)。注意力機制:Evoformer 使用如軸向注意力(Axial Attention)的系統,專注於將 MSA 的行或列轉換為蛋白質的三維結構。另外一個層級是成對注意力(Pairwise Attention),主要集中於精煉氨基酸之間的關係和反應。回收利用:AlphaFold 再次檢視前面層級的輸出,以使預測更加準確。

**進化模型的突破:** Evoformer 的核心思想是將進化資訊與結構預測相結合,體現了近年來蛋白質結構預測領域的一個重要趨勢。傳統方法主要依賴序列資訊,而 Evoformer 則引入多序列比對(MSA)資訊,並透過注意力機制來識別氨基酸之間的進化聯絡和相互作用。這使得 Evoformer 能更準確地預測蛋白質結構,特別是在處理序列相似度低的蛋白時表現出色。這種突破性方法為預測新蛋白質結構和功能提供了全新思路。

**可解釋性的新方向:** 儘管 Evoformer 在預測精度上取得了顯著進展,但其內部機制仍然存在黑盒問題。為了解決這個問題,研究者正在探索可解釋性方法,試圖揭示 Evoformer 如何利用 MSA 和注意力機制來推斷蛋白質結構。例如,透過視覺化注意力矩陣,我們可以觀察到 Evoformer 在識別結構關鍵區域和預測氨基酸距離方面的具體表現。這些研究將為我們理解蛋白質結構預測過程提供更深刻的認識,也有助於改進模型設計和最佳化的方法。

結構區塊(隱藏層與輸出層):結構最終預測:折疊之間的角度和距離正在進行最後確認,並形成蛋白質的最終三維形狀。輸出:AlphaFold 發布蛋白質結構的最終預測結果。


AlphaFold DB:開啟生物學新紀元,改變世界的潛力

AlphaFold DB(資料庫)將研究和學術界所產出的成果整合至一個免費且易於存取的資料庫,名為 AlphaFold DB。這個資料庫是由歐洲分子生物實驗室(EMBL-EBI)與 DeepMind 的合作成果。DeepMind 提供了大部分的研究貢獻,而 EMBL-EBI 則負責開發友善的使用者介面、提供更多資源以及協助網頁開發。

如何改變世界
AlphaFold 代表了生物學領域的一項重大突破,將許多過去看似遙不可及的大構思拉近了我們的視野。我特別關注的主要議題包括藥物發現和擴充套件我們對遺傳疾病領域的認識。

遺傳疾病與藥物發現
在不久的將來,我預見 AlphaFold 將在醫療領域中扮演重要角色。在遺傳疾病中,突變往往會影響蛋白質(可能改變其結構,因此也改變功能)。AlphaFold 能夠預測這種突變對蛋白質具體會造成何種影響,從而提供幫助我們預防或改善此情況的方法。

**精準醫療的革命:** AlphaFold DB 不僅限於預測蛋白質結構,更能評估預測結構的置信度,這對於罕見疾病診斷及治療方案開發至關重要。例如,它可以協助研究人員預測特定基因突變對蛋白質結構之影響,以尋找治療罕見疾病的新藥標靶。

**生物材料設計與工程:** AlphaFold DB 為生物材料設計提供全新的可能性。研究人員可以透過它來預測蛋白質結構,進一步設計具有特定功能的新型蛋白質,用於生物醫學材料、生物催化劑和生物感測器等應用領域。

**環境科學與可持續發展:** AlphaFold DB 也可應用於微生物組研究,例如預測土壤和海洋微生物的蛋白質結構,以了解微生物代謝及其在生態系統中的功能,有望為環境汙染治理和可持續發展提出新解決方案。

未來展望方面,AlphaFold DB 的未來方向包括提升預測精度、擴充套件到更複雜的蛋白質結構、整合其他生物資訊資料,以及開發更友善的人機介面,以便為全球科研工作者提供更便捷高效的工具。但隨著技術進步,也需注意相伴而來的挑戰與倫理問題,如資料使用倫理、智慧財產權以及技術普及的不平等性等議題。因此,在運用此類技術時,我們必須謹慎並保持高度警覺,以確保科技進步能真正造福全人類。


我們如何利用 AlphaFold 為某些疾病創造藥物?蛋白質經常是藥物的靶標。若能提前了解其結構,我們就能確認藥物是否會正確結合。由於幾乎 90% 的藥物在某種程度上與蛋白質結合,透過使用 AlphaFold 來預測結合過程的結果,我們可以協助這些藥物提高效率並降低被破壞的機率。


AlphaFold:預測蛋白質動態,開啟科學新時代

結論
AlphaFold 剛剛起步,其影響力已經非常巨大。它展示了我們在生物技術理解上所取得的進展。隨著其不斷發展,科學研究的大門也逐漸開啟。我迫不及待想要見證 AlphaFold 的成長,以及未來將帶來的所有創新!
——Demis Hassabis,Google DeepMind 執行長

AlphaFold:科學突破的誕生

關於我
我的名字是 Savaira,我 15 歲。我對生物技術以及整體科技的崛起都非常感興趣。更具體地說,我一直在研究基因編輯、人工智慧、工程和醫療科學。如果有任何問題或建議,請隨時告訴我!

聯絡資訊:
電子郵件:savaira.parmar@gmail.com
LinkedIn:www.linkedin.com/in/savaira-parmar-8bb887332

---

隨著 AlphaFold 的最新發展,它現在不僅能預測蛋白質的三維結構,更進一步擴充套件到預測蛋白質動態與互動作用的能力。這一突破意味著科學家能夠更深入理解蛋白質在細胞中的運作方式,並且能夠進一步探討複雜的生物過程,例如疾病發生機制。

AlphaFold 的動態預測功能對藥物開發和疾病治療具有重大意義,使得設計出更有效且針對性的藥物成為可能。同時我們也必須考慮到 AlphaFold 所引發的倫理與社會議題,包括資料使用和基因編輯技術潛在風險等,因此,在推動科技創新的同時,我們也需保持謹慎,以確保其應用符合道德標準。

主要資源
AlphaFold 主要技術: https://deepmind.google/technologies/alphafold/?_gl=1*1nbv3xs*_up*MQ

《自然》文章:Abramson, J., Adler, J., Dunger, J. 等人。使用 AlphaFold 3 精確預測生物分子相互作用的結構。《自然》,630,493–500 (2024)。https://doi.org/10.1038/s41586-

美國國家醫學圖書館:Alberts B, Johnson A, Lewis J 等人。《細胞的分子生物學》第四版。紐約:Garland Science;2002年。蛋白質的形狀和結構。可從以下連結獲取:https://www.ncbi.nlm.nih.gov/books/NBK26830/

AI 新聞中心:https://aimagazine.com/articles/alphafold-2-the-ai-system-that-won-google-a-nobel-prize

參考來源

「AlphaFold 3」要來了?DeepMind 推新蛋白質結構預測工具設計藥物

第一大升級:預測蛋白質資料庫(PDB)多數分子結構,達原子精準度。 DeepMind說AlphaFold可預測蛋白質資料庫(廣泛使用的科學資料庫)幾乎所有分子結構。

50 年未解之謎,蛋白質摺疊在AI 協助下終撥雲見日?

AlphaFold 難能可貴之處在於它成功做到不用比較模版就能預測蛋白質結構,這顯示我們現在僅需要胺基酸序列就可以預測任一蛋白質的結構。 前人在CASP 結構 ...

來源: GeneOnline News

AlphaFold - 維基百科,自由的百科全書

AlphaFold(直譯:阿爾法折疊)是Alphabet旗下Google旗下DeepMind開發的一款蛋白質結構預測程式。該程序被設計為一個深度學習系統。

來源: 维基百科

蛋白質結構預測AI生技新突破- 中國信託

AlphaFold則是透過AI辨識蛋白質折疊可能存在的通則,從而大幅簡化了分析過程;另外,亦可結合基因序列與蛋白質資料庫的數據,透過序列比對,找出蛋白質的性質, ...

來源: 中國信託

「AI可以解決蛋白質結構預測的難題」之專家意見

人工智慧實驗室「DeepMind」,宣布他們開發的AI軟體「AlphaFold」可以藉由胺基酸序列,快速且準確預測蛋白質的3D立體結構。然而,預測蛋白質摺疊的結構 ...

AI 破解生命密碼!AlphaFold 3 揭開蛋白質折疊的終極謎團

多序列比對功能:通過搜尋類似的胺基酸序列,推斷新的蛋白質結構。 端到端預測模式:利用深度學習神經網路,不斷反饋預測結果,持續優化模型。

來源: PanSci 泛科學

DeepMind AI破解存在50年的蛋白質折疊難題

GDT則是比對各種蛋白質結構預測與已知實驗的結果,在2020年的測試中,AlphaFold 2的準確度中位數達到92.4,就算是在最難的自由建模類別的蛋白質項目中, ...

來源: iThome

蛋白質結構預測50 年難題? DeepMind 新一代AI 迎刃而解!

早在2018 年的CASP 蛋白質結構預測競賽,DeepMind 已使用AlphaFold 來預測蛋白質結構,結果優於所有其他競爭對手,但其準確性主要指標GDT (Global Distance ...

來源: GeneOnline News

CRISPR

專家

相關討論

❖ 相關專欄