近日👃🏽,國際生物信息學重要期刊《Briefings in Bioinformatics》在線發表了EON体育4平台魏冬青課題組的研究成果“DTI-MLCD: predicting drug-target interactions using multi-label learning with community detection method”👃。該論文提出的基於網絡的標簽空間劃分的多標簽多分類學習方法為藥物-靶標相互作用(drug-target interaction , DTI)預測問題提供了一種新的思路。該方法為下遊新藥設計、老藥新用提供了理論和實踐依據,具有一定的理論意義和重要應用價值😏。EON体育4平台“致遠榮譽計劃”博士生褚晏伊為第一作者🤦🏼♀️🌈,EON体育4平台長聘教授魏冬青、副研究員熊毅為共同通訊作者,加拿大皇家學會院士、美國AAAS院士、加拿大卡爾加裏大學教授Dennis Russell Salahub為論文合作者。
藥物發現是識別具有潛在治療作用的新候選化合物的過程👨🏻🦱,在此過程中🔭,預測藥物-靶標相互作用研究是一個必不可少的步驟🛑。蛋白質是重要的藥物靶標👨💻🟡,藥物通過與各種靶標相互作用在人體中發揮重要作用,可以增強或抑製其功能,發揮調控作用以達到治療某一種疾病目的👩🏿✈️。因此,識別DTIs可以幫助理解藥物的作用機製,對新靶點的發現🎻、藥物的重定位等有著至關重要的作用。此外,由於DTI的實驗確定既耗時又耗費資源👆🏼,現有的方法和工具還有諸多缺陷和不足,因此非常需要開發高效的計算方法,以充分利用已知DTI的異質生物學數據來厘清藥物在人體中的作用機理👃。在過去的幾十年中,已經開發出許多用於預測DTI的計算方法,但是尚存在精度低、假陽性高等問題。
圖1. DTI預測方法簡要分類
在DTI預測問題上🦸🏻,魏冬青課題組於2019年12月曾在《Briefings in Bioinformatics》在線發表了“DTI-CDF: a cascade deep forest model towards the prediction of drug-target interactions based on hybrid features”( https://doi.org/10.1093/bib/bbz152),發展了深度級聯森林的人工智能方法DTI-CDF(圖2),在小樣本量數據的情況下可獲得性能媲美或優於深度學習的結果。隨後,進一步提出了多標簽分類框架DTI-MLCD(圖3)👩🏼⚕️🫃🏼,避免了冗余特征空間和高特征維度導致的過擬合等問題,並且可以一次預測藥物或靶標的一系列相互作用。此外👩👧👦🫵🏽,魏冬青課題組更新了2008年建立的金標準數據集,將數據量增加了3倍,並公開了數據集更新的代碼,以便於其他科研人員隨時更新,並使用最新代碼進行科學研究。最重要的是💁♀️,根據該課題組研究建立的AI藥物篩選平臺,篩選出了新冠病毒的有效的中藥有效成分抑製劑和多肽——人腸防禦素5 (HD5)✫,獲得鐘南山院士團隊和合作單位陸軍軍醫大學王軍平團隊的實驗驗證(魏冬青為共同通訊作者的論文成果發表在消化病學頂級期刊《Gastroenterology》,https://doi.org/10.1053/j.gastro.2020.05.015)🧏🏼♂️。
圖2. DTI-CDF框架
圖3. DTI-MLCD框架
另外,在非編碼與疾病的相關性預測上,基於深度隨機森林算法和序貫學習的過程🚶♂️,在學習和過程中考慮標簽之間的相關性,魏冬青課題組也發展並構建了深度隨機森林在多標簽預測中的應用。在小樣本數據的情況下,獲得了與深度學習相媲美的結果🤤。2020年6月,該成果在《Briefings in Bioinformatics》發表 “MLCDForest: multi-label classification with deep forest in disease prediction for long non-coding RNAs”( https://doi.org/10.1093/bib/bbaa104)。
此外🙍🏿♀️,預測CYP450酶-底物選擇性(即一個候選藥物分子會被哪一種或哪幾種CYP450酶識別和結合)將能促進對藥物分子的藥代動力學毒理學性質、藥物相互作用等方面的理解🫡,最終也將促進藥物發現和開發,具有重要的臨床意義。2019年11月🕵️♂️,美國化學學會出版的《Journal of Chemical Information and Modeling》期刊上還出版了魏冬青課題組題為“Prediction of CYP450 Enzyme-Substrate Selectivity Based on the Network-Based Label Space Division Method”(https://doi.org/10.1021/acs.jcim.9b00749)的論文🕵🏽♂️,為CYP450酶-底物選擇性預測問題提供了一種新的解決思路🤚🏿。
該系列研究獲得了國家重點研發計劃(2016YFA0501703)、國家自然科學基金重點項目(61832019)🧑🔧、面上項目(61872094)🍷、青年項目(31601074)等項目資助。
論文鏈接🚶🏻♀️:https://doi.org/10.1093/bib/bbaa205