AI人工智能在藥物研發中的應用
日期:2024-10-12 15:59:43
2024年諾貝爾化學獎于10月9日揭曉,一半授予大衛·貝克(David Baker),“以表彰在計算蛋白質設計方面的貢獻”;另一半則共同授予德米斯·哈薩比斯(Demis Hassabis)和約翰·M·詹珀(John M. Jumper),“以表彰他們在蛋白質結構預測方面的成就”。三位獲獎者將人工智能技術引入了化學領域,尤其是在蛋白質設計和結構預測上取得了劃時代的成果。諾獎的頒布,凸顯了人工智能(AI)在化學和生物領域的巨大潛力。AI技術,尤其是機器學習和深度學習,正在藥物研發中發揮越來越重要的作用。
藥物研發是一個復雜、耗時且成本高昂的過程。傳統藥物研發過程通常包括靶點識別、化合物篩選、藥物設計、臨床試驗等多個階段,這一過程耗時長、成本高且成功率低。然而,AI技術的應用正在改變這一現狀,通過提高研發效率、降低成本并縮短研發周期,AI有望打破傳統藥物研發的“雙十定律”。
1. AI在靶標識別與驗證中的應用
藥物靶標(通常是蛋白質)是指體內與特定疾病過程具有內在聯系、可通過與藥物作用從而產生預期治療效果的分子。新藥研發的首要問題就是對藥物-靶標相互作用(drug-target interaction, DT)的鑒定,即確定藥物分子和靶標之間是否會產生相互作用,并基于此尋找能夠作用于特定靶標的藥物分子。
DTI的鑒定是一個非常復雜的步驟,它對于候選藥物的發現、藥物分子作用機制的理解、藥物分子的多靶標研究和藥物重定位等問題具有重要意義。DTI預測的核心問題是判斷藥物分子和靶標蛋白是否會產生相互作用。AI可以基于已有的藥物分子與靶標蛋白相互作用的信息,對未知的藥物分子和靶標蛋白進行預測,從而篩選藥物分子,繼而能夠快速、有效地為后續臨床試驗確定候選藥物。此外,基于異質網絡的深度學習方法也被用于藥物靶標預測,通過整合藥物-疾病信息、靶標-靶標信息等多維度信息,構建特征矩陣進行預測[1]。
目前,AI已經被一些企業投入到實際應用中。例如,Atomwise公司開發的深度卷積神經網絡(AtomNet)可以對小分子和靶標蛋白的相互作用進行預測,從而篩選出高親和力結合的藥物分子和靶標[2]。Deep Genomics公司開發的AI系統可以在18個月內完成從靶點發現到先導化合物篩選的全過程,并成功發現了業界首個由AI發現的治療候選藥物[3]。
2. AI在蛋白質結構預測中的應用
蛋白質結構預測是生物信息學中的一個重要問題,它對于理解生物分子的功能、疾病機理以及藥物設計至關重要。AI技術,尤其是機器學習和深度學習,已經在這一領域取得了顯著進展。
AlphaFold是由DeepMind開發的革命性人工智能系統,它利用深度學習和共進化信號預測蛋白質的三維結構,達到了與實驗方法相媲美的精度。在CASP13競賽中取得顯著成績后,AlphaFold2進一步提升了預測能力,甚至能夠預測蛋白質的多種構象。
AlphaFold 3 模型在預測準確性方面取得了顯著的改進,與許多以前專門用于特定類型的分子間相互作用的預測工具相比,它在多個方面都顯示出更高的準確性。這些改進包括與小分子配體的相互作用、蛋白質-核酸相互作用、抗體-抗原相互作用等[4]。
AlphaFold的成功標志著AI在結構生物學領域的重大進展,并為未來的研究和應用開辟了新的可能性。上文所提到的諾貝爾化學獎獲得者Demis Hassabis和John M. Jumper正是AlphaFold的發明者。
3. AI在藥物設計中的應用
計算機輔助藥物設計(computer-aided drug design, CADD)技術基于計算化學和計算生物學的理論與方法,運用特定的計算機程序來分析、模擬和預測藥物分子的結構與性質的關系、藥物分子與受體生物大分子之間的相互作用機制,以及生物大分子之間的識別和結合過程。CADD技術包括基于結構的藥物設計(structure-based drug design, SBDD)、基于配體的藥物設計(ligand-based drug design, LBDD)和高通量虛擬篩選(HTVS),這些技術極大地促進了先導化合物的發現和優化[5]。
1979年,世界上首家CADD公司Tripos成立,開啟了該領域的商業化進程。1990年,Schrodinger公司成立,迅速成為CADD及人工智能藥物設計(artificial intelligence drug design, AIDD)領域的領頭羊。
在AIDD中,首要步驟是學習并理解輸入化合物的結構和特性,以便生成具有預期活性和成藥性的新分子?;玖鞒淌紫劝〝祿@取和處理,涉及對已有藥學數據(包括蛋白信息、小分子結構及藥效信息等)的收集、清洗和標準化處理,隨后是特征工程和表征學習,例如蛋白質和分子的表征。CADD與AIDD的融合為藥物發現和開發領域帶來了根本性的變化。通過將CADD的強大數據處理與分析能力與AIDD的先進算法和人工智能技術相結合,通過不斷的技術革新和跨學科合作,特別是生成式大模型技術的運用,AIDD的未來展望非常廣闊。
4. 臨床試驗優化
AI不僅可以加速藥物的發現和設計,還可以優化臨床試驗的設計和執行,不僅能夠提高臨床試驗的效率和成功率,還能夠在多個方面對臨床試驗的設計、執行和結果分析產生積極影響。
在臨床試驗設計中,AI可以通過模擬和建模來創建虛擬隊列,從而增加案例組的大小,這有助于提高試驗的成功率。此外,AI還能夠自動化和優化試驗設計,預測試驗成功率,從而減少時間和成本[6]。例如,通過使用遺傳算法(GA),可以優化藥物開發中的生物等效性研究和劑量發現研究的設計,從而減少所需的樣本量和血液采集點。
在患者招募方面,通過智能匹配系統,AI可以提高受試者的招募效率和成功率,尤其是在招募腫瘤患者和罕見病患者時。此外,AI還可以通過自然語言處理技術高效處理復雜的電子健康記錄數據,從而縮短招募時間并減輕臨床試驗設計人員的工作負擔[7]。
在臨床試驗的執行過程中,AI可以通過自動化數據生成和管理,智能解釋數據,并自動填寫所需的分析報告,從而提高臨床試驗的效率和準確性。此外,AI還可以在遠程患者監測中發揮作用,通過結構化、標準化和數字化驅動的元素來加速臨床試驗[8]。
在臨床試驗的結果分析方面,AI方法可以學習標準化輸入數據的結果,以產生準確的結果預測。此外,AI還可以通過提取或接入電子醫療保健記錄,并結合患者的遺傳數據,來提高對臨床結果的預測能力[9]。
5. 藥物重定位
AI在藥物重定位中的應用已經成為一個重要的研究領域,其目的是利用現有的藥物、臨床試驗失敗的藥物或擱置的藥物來探索新的適應癥,以縮短研發周期、降低研發成本,并提高藥物開發的效率。
AI技術通過整合和分析來自不同來源的數據,如基因組學、蛋白質組學、藥物化學和臨床試驗數據,幫助研究人員識別藥物與疾病之間的新關聯。例如,通過機器學習算法,可以從大規模的生物醫學數據庫中挖掘出藥物與特定疾病之間的潛在關系[10]。此外,AI還能夠預測藥物對特定疾病的治療效果,加速藥物重定位的過程。
目前,已有多種AI算法被應用于藥物重定位中,包括基于特征的方法、基于矩陣分解的方法、基于網絡的方法以及深度學習方法。這些方法能夠處理數據稀疏性、缺失數據和多種關聯類型的問題,提高藥物重定位的準確性和效率[11]。例如,基于深度學習的藥物重定位方法能夠通過組合深度結構與藥物相關的各種屬性信息進行模式挖掘,加快藥物重定位的研發速度。
6. 結語
隨著人工智能技術的不斷進步,其在藥物研發領域的應用前景廣闊。AI不僅能夠加速藥物發現和設計的過程,還能夠提高臨床試驗的效率和成功率,最終為患者帶來更有效、更個性化的治療方案。然而,要實現這一目標,我們需要跨學科的合作、高質量的數據、先進的算法,以及對AI模型的透明度和可解釋性的關注。未來,隨著AI技術的進一步發展和應用,我們有理由相信,它將在藥物研發領域發揮更加重要的作用,為全球健康事業做出更大的貢獻。
參考文獻:
[1] Application of Machine Learning for Drug-Target Interaction Prediction. Front Genet, 2021.
[2] Meramalnet: A Deep Learning Convolutional Neural Network for Bioactivity Prediction in Structure-based Drug Discovery. 2020.
[3] Deep Genomics Nominates Industry’s First AI-Discovered Therapeutic Candidate. Retrieved September 25, 2019
[4] Accurate structure prediction of biomolecular interactions with AlphaFold 3. Nature,2024.
[5] Artificial intelligence in drug design .Sci China Life Sci, 2018.
[6] Artificial intelligence for optimizing recruitment and retention in clinical trials: a scoping review. J Am Med Inform Assoc, 2024.
[7] The role of artificial intelligence in hastening time to recruitment in clinical trials. BJR Open, 2023.
[8] Computational design of clinical trials using a combination of simulation and the genetic algorithm. CPT Pharmacometrics Syst Pharmacol, 2023.
[9] Artificial intelligence, machine learning, and deep learning for clinical outcome prediction. Emerg Top Life Sci, 2021.
[10] Rethinking Drug Repositioning and Development with Artificial Intelligence, Machine Learning, and Omics. OMICS, 2019.
[11] Performance Analysis of Big Data Based Mining and Machine Learning Algorithms: A Review. Turkish Online Journal of Qualitative Inquiry, 2021.
藥物研發是一個復雜、耗時且成本高昂的過程。傳統藥物研發過程通常包括靶點識別、化合物篩選、藥物設計、臨床試驗等多個階段,這一過程耗時長、成本高且成功率低。然而,AI技術的應用正在改變這一現狀,通過提高研發效率、降低成本并縮短研發周期,AI有望打破傳統藥物研發的“雙十定律”。
1. AI在靶標識別與驗證中的應用
藥物靶標(通常是蛋白質)是指體內與特定疾病過程具有內在聯系、可通過與藥物作用從而產生預期治療效果的分子。新藥研發的首要問題就是對藥物-靶標相互作用(drug-target interaction, DT)的鑒定,即確定藥物分子和靶標之間是否會產生相互作用,并基于此尋找能夠作用于特定靶標的藥物分子。
DTI的鑒定是一個非常復雜的步驟,它對于候選藥物的發現、藥物分子作用機制的理解、藥物分子的多靶標研究和藥物重定位等問題具有重要意義。DTI預測的核心問題是判斷藥物分子和靶標蛋白是否會產生相互作用。AI可以基于已有的藥物分子與靶標蛋白相互作用的信息,對未知的藥物分子和靶標蛋白進行預測,從而篩選藥物分子,繼而能夠快速、有效地為后續臨床試驗確定候選藥物。此外,基于異質網絡的深度學習方法也被用于藥物靶標預測,通過整合藥物-疾病信息、靶標-靶標信息等多維度信息,構建特征矩陣進行預測[1]。
目前,AI已經被一些企業投入到實際應用中。例如,Atomwise公司開發的深度卷積神經網絡(AtomNet)可以對小分子和靶標蛋白的相互作用進行預測,從而篩選出高親和力結合的藥物分子和靶標[2]。Deep Genomics公司開發的AI系統可以在18個月內完成從靶點發現到先導化合物篩選的全過程,并成功發現了業界首個由AI發現的治療候選藥物[3]。
2. AI在蛋白質結構預測中的應用
蛋白質結構預測是生物信息學中的一個重要問題,它對于理解生物分子的功能、疾病機理以及藥物設計至關重要。AI技術,尤其是機器學習和深度學習,已經在這一領域取得了顯著進展。
AlphaFold是由DeepMind開發的革命性人工智能系統,它利用深度學習和共進化信號預測蛋白質的三維結構,達到了與實驗方法相媲美的精度。在CASP13競賽中取得顯著成績后,AlphaFold2進一步提升了預測能力,甚至能夠預測蛋白質的多種構象。
AlphaFold 3 模型在預測準確性方面取得了顯著的改進,與許多以前專門用于特定類型的分子間相互作用的預測工具相比,它在多個方面都顯示出更高的準確性。這些改進包括與小分子配體的相互作用、蛋白質-核酸相互作用、抗體-抗原相互作用等[4]。
AlphaFold的成功標志著AI在結構生物學領域的重大進展,并為未來的研究和應用開辟了新的可能性。上文所提到的諾貝爾化學獎獲得者Demis Hassabis和John M. Jumper正是AlphaFold的發明者。
3. AI在藥物設計中的應用
計算機輔助藥物設計(computer-aided drug design, CADD)技術基于計算化學和計算生物學的理論與方法,運用特定的計算機程序來分析、模擬和預測藥物分子的結構與性質的關系、藥物分子與受體生物大分子之間的相互作用機制,以及生物大分子之間的識別和結合過程。CADD技術包括基于結構的藥物設計(structure-based drug design, SBDD)、基于配體的藥物設計(ligand-based drug design, LBDD)和高通量虛擬篩選(HTVS),這些技術極大地促進了先導化合物的發現和優化[5]。
1979年,世界上首家CADD公司Tripos成立,開啟了該領域的商業化進程。1990年,Schrodinger公司成立,迅速成為CADD及人工智能藥物設計(artificial intelligence drug design, AIDD)領域的領頭羊。
在AIDD中,首要步驟是學習并理解輸入化合物的結構和特性,以便生成具有預期活性和成藥性的新分子?;玖鞒淌紫劝〝祿@取和處理,涉及對已有藥學數據(包括蛋白信息、小分子結構及藥效信息等)的收集、清洗和標準化處理,隨后是特征工程和表征學習,例如蛋白質和分子的表征。CADD與AIDD的融合為藥物發現和開發領域帶來了根本性的變化。通過將CADD的強大數據處理與分析能力與AIDD的先進算法和人工智能技術相結合,通過不斷的技術革新和跨學科合作,特別是生成式大模型技術的運用,AIDD的未來展望非常廣闊。
4. 臨床試驗優化
AI不僅可以加速藥物的發現和設計,還可以優化臨床試驗的設計和執行,不僅能夠提高臨床試驗的效率和成功率,還能夠在多個方面對臨床試驗的設計、執行和結果分析產生積極影響。
在臨床試驗設計中,AI可以通過模擬和建模來創建虛擬隊列,從而增加案例組的大小,這有助于提高試驗的成功率。此外,AI還能夠自動化和優化試驗設計,預測試驗成功率,從而減少時間和成本[6]。例如,通過使用遺傳算法(GA),可以優化藥物開發中的生物等效性研究和劑量發現研究的設計,從而減少所需的樣本量和血液采集點。
在患者招募方面,通過智能匹配系統,AI可以提高受試者的招募效率和成功率,尤其是在招募腫瘤患者和罕見病患者時。此外,AI還可以通過自然語言處理技術高效處理復雜的電子健康記錄數據,從而縮短招募時間并減輕臨床試驗設計人員的工作負擔[7]。
在臨床試驗的執行過程中,AI可以通過自動化數據生成和管理,智能解釋數據,并自動填寫所需的分析報告,從而提高臨床試驗的效率和準確性。此外,AI還可以在遠程患者監測中發揮作用,通過結構化、標準化和數字化驅動的元素來加速臨床試驗[8]。
在臨床試驗的結果分析方面,AI方法可以學習標準化輸入數據的結果,以產生準確的結果預測。此外,AI還可以通過提取或接入電子醫療保健記錄,并結合患者的遺傳數據,來提高對臨床結果的預測能力[9]。
5. 藥物重定位
AI在藥物重定位中的應用已經成為一個重要的研究領域,其目的是利用現有的藥物、臨床試驗失敗的藥物或擱置的藥物來探索新的適應癥,以縮短研發周期、降低研發成本,并提高藥物開發的效率。
AI技術通過整合和分析來自不同來源的數據,如基因組學、蛋白質組學、藥物化學和臨床試驗數據,幫助研究人員識別藥物與疾病之間的新關聯。例如,通過機器學習算法,可以從大規模的生物醫學數據庫中挖掘出藥物與特定疾病之間的潛在關系[10]。此外,AI還能夠預測藥物對特定疾病的治療效果,加速藥物重定位的過程。
目前,已有多種AI算法被應用于藥物重定位中,包括基于特征的方法、基于矩陣分解的方法、基于網絡的方法以及深度學習方法。這些方法能夠處理數據稀疏性、缺失數據和多種關聯類型的問題,提高藥物重定位的準確性和效率[11]。例如,基于深度學習的藥物重定位方法能夠通過組合深度結構與藥物相關的各種屬性信息進行模式挖掘,加快藥物重定位的研發速度。
6. 結語
隨著人工智能技術的不斷進步,其在藥物研發領域的應用前景廣闊。AI不僅能夠加速藥物發現和設計的過程,還能夠提高臨床試驗的效率和成功率,最終為患者帶來更有效、更個性化的治療方案。然而,要實現這一目標,我們需要跨學科的合作、高質量的數據、先進的算法,以及對AI模型的透明度和可解釋性的關注。未來,隨著AI技術的進一步發展和應用,我們有理由相信,它將在藥物研發領域發揮更加重要的作用,為全球健康事業做出更大的貢獻。
參考文獻:
[1] Application of Machine Learning for Drug-Target Interaction Prediction. Front Genet, 2021.
[2] Meramalnet: A Deep Learning Convolutional Neural Network for Bioactivity Prediction in Structure-based Drug Discovery. 2020.
[3] Deep Genomics Nominates Industry’s First AI-Discovered Therapeutic Candidate. Retrieved September 25, 2019
[4] Accurate structure prediction of biomolecular interactions with AlphaFold 3. Nature,2024.
[5] Artificial intelligence in drug design .Sci China Life Sci, 2018.
[6] Artificial intelligence for optimizing recruitment and retention in clinical trials: a scoping review. J Am Med Inform Assoc, 2024.
[7] The role of artificial intelligence in hastening time to recruitment in clinical trials. BJR Open, 2023.
[8] Computational design of clinical trials using a combination of simulation and the genetic algorithm. CPT Pharmacometrics Syst Pharmacol, 2023.
[9] Artificial intelligence, machine learning, and deep learning for clinical outcome prediction. Emerg Top Life Sci, 2021.
[10] Rethinking Drug Repositioning and Development with Artificial Intelligence, Machine Learning, and Omics. OMICS, 2019.
[11] Performance Analysis of Big Data Based Mining and Machine Learning Algorithms: A Review. Turkish Online Journal of Qualitative Inquiry, 2021.
上一篇: 前沿靶點速遞:每周醫學研究精選(十五)
下一篇: 前沿靶點速遞:每周醫學研究精選(十六)