時間:2024年01月10日 分類:新聞中心 次數:
近兩年國內外頂尖課題組MIT、Harvard University、UPenn、清華大學、復旦大學、西湖大學等都在從事人工智能與組學與藥物設計和蛋白質預測技術以及的研究,這一研究成果更是多次發表在Nature Reviews Genetics、Nature Methods、Science Advances、Cancer Cell、Nature Biotechnology等知名國際頂刊上,為我們發表頂刊鑒定了基礎。
在藥物設計中,化合物效價預測是一種流行的機器學習應用。圖神經網絡 (GNN) 通過通常從 X 射線結構中提取的蛋白質-配體相互作用的圖表示來預測配體親和力。盡管有一些有希望的發現導致聲稱GNN可以學習蛋白質-配體相互作用的細節,但這種預測也存在爭議。例如,有證據表明,GNNs可能不會學習蛋白質-配體相互作用,而是記住配體和蛋白質訓練數據。我們在社區標準數據集上用六種GNN架構進行了親和力預測,并使用可解釋的人工智能對預測進行了合理化。結果證實了配體(而不是蛋白質)記憶在GNN學習過程中的強烈影響,并且還表明一些GNN架構越來越優先考慮交互信息來預測高親和力。因此,雖然GNN不能全面地解釋蛋白質-配體相互作用和物理現實,但根據模型的不同,它們在配體記憶和相互作用模式的學習之間取得了平衡。
人工智能和生物學界的研究人員利用深度學習技術與計算硬件的進步,從不斷增長的生物數據庫中學習模式,對蛋白質進行注釋。這些被注釋的模式可以用來提供對藥物發現和生物分子設計的新見解。深度學習幾乎顛覆了每一個研究領域,包括那些對藥物發現有直接重要性的領域,如藥物化學和藥理學,CADD應用中的DL已經取得了重大進展,如虛擬篩選、新藥設計、吸收、分布、代謝、排泄和毒性 (ADMET) 特性預測等。
計算機輔助藥物設計,依據生物化學、酶學、分子生物學以及遺傳學等生命科學的研究成果,針對這些基礎研究中所揭示的包括酶、受體、離子通道及核酸等潛在的藥物設計靶點,并參考其它類源性配體或天然產物的化學結構特征,以計算機化學為基礎,通過計算機的模擬、計算和預算藥物與受體生物大分子之間的相互作用,考察藥物與靶點的結構互補、性質互補等,設計出合理的藥物分子。它是設計和優化先導化合物的方法,靶點的發現與確證是現代新藥研發的第一步,也是新藥創制過程中的瓶頸之一。CADD的應用可以加快靶點發現的速度,提高靶點發現的準確度,從而推進新藥研發,特別是在食品、生物、化學、醫藥、植物、疾病方面應用廣泛!
隨著高通量技術的發展,已經積累了不同種類的組學數據,包括基因組學,表觀基因組學,轉錄組學,蛋白質組學,代謝組學和宏基因組學,因此需要對不同類型的多組學數據進行綜合分析,以了解疾病發展的潛在機制.機器學習算法現在正成為分析和理解疾病多組學數據的有效工具.討論了基于機器學習的多組學數據分析的挑戰及應用,包括疾病亞型識別,生物標志物發現,通路分析和藥物發現及其再利用.
深度學習已經被廣泛應用于基因組學研究中,利用已知的訓練集對數據的類型和應答結果進行預測,深度學習,可以進行預測和降維分析。深度學習模型的能力更強且更靈活,在適當的訓練數據下,深度學習可以在較少人工參與的情況下自動學習特征和規律。調控基因組學,變異檢測,致病性評分成功應用。深度學習可以提高基因組數據的可解釋性,并將基因組數據轉化為可操作的臨床信息。
下面是近兩年在頂刊發表的部分研究方向
Nature Protocols | 基于機器學習和并行計算的代謝組學數據處理新方法
Nature| 基于機器學習的血清代謝組學開發生物標志物用早期肺腺癌篩查
Nature Biotechnology自動化和機器學習的高通量微生物培養組學分離微生物組
Cancer Cell | 基于多模態深度學習的泛癌組織學-基因組學整合分析
Science Advances|利用深度學習發現癌癥中的新基因突變
Nature|腫瘤微環境的多組學機器學習預測乳腺癌治療反應
Nature|肺癌和轉移瘤中的基因組-轉錄組進化
Nature Methods | 用深度多任務神經網絡探索單細胞數據
JCIM|利用深度學習進行基于結構的從頭藥物設計
Journal of Medicinal Chemistry報道基于靶標結構的深度學習全新藥物設計方法
Nature Reviews綜述 | 機器學習在藥物發現和開發的應用
Science Advances | 實現了對較小的膜蛋白晶體結構解析方法的研究突破
Nature:一種基于CRISPR/Cas9的非病毒精準基因組編輯臨床級療法
版權聲明:文章來源于網絡,由本平臺整合撰寫,版權歸原作者或平臺所有,分享只為學術交流,如有侵權請聯系刪除或整改,謝謝。