天天即時(shí):利用ChatGPT背后的AI加速藥物發(fā)現(xiàn) - 每天可篩選1億種化合物
通過(guò)將語(yǔ)言模型應(yīng)用于蛋白質(zhì)與藥物的相互作用,研究人員可以快速篩選大量的潛在藥物化合物庫(kù)。巨大的藥物化合物庫(kù)可能擁有治療各種疾病的潛力,如癌癥或心臟病。理想情況下,科學(xué)家們希望通過(guò)實(shí)驗(yàn)對(duì)這些化合物中的每一種針對(duì)所有可能的目標(biāo)進(jìn)行測(cè)試,但進(jìn)行這樣的篩選是非常耗時(shí)的。
近年來(lái),研究人員已經(jīng)開(kāi)始使用計(jì)算方法來(lái)篩選這些化合物庫(kù),希望能加快藥物發(fā)現(xiàn)的速度。然而,其中許多方法也需要很長(zhǎng)的時(shí)間,因?yàn)樗鼈冎械拇蠖鄶?shù)都是從氨基酸序列中計(jì)算出每個(gè)目標(biāo)蛋白的三維結(jié)構(gòu),然后用這些結(jié)構(gòu)來(lái)預(yù)測(cè)它將與哪些藥物分子相互作用。
麻省理工學(xué)院和塔夫茨大學(xué)的研究人員現(xiàn)在已經(jīng)設(shè)計(jì)出一種基于一種被稱(chēng)為大型語(yǔ)言模型的人工智能算法的替代計(jì)算方法。這些模型--一個(gè)著名的例子是ChatGPT--可以分析大量的文本,并找出哪些詞(或者,在這種情況下是氨基酸)最有可能一起出現(xiàn)。這個(gè)被稱(chēng)為ConPLex的新模型可以將目標(biāo)蛋白質(zhì)與潛在的藥物分子相匹配,而不必執(zhí)行計(jì)算分子結(jié)構(gòu)的密集步驟。
【資料圖】
使用這種方法,研究人員可以在一天內(nèi)篩選出超過(guò)1億個(gè)化合物--比任何現(xiàn)有模型都要多。
麻省理工學(xué)院計(jì)算機(jī)科學(xué)與人工智能實(shí)驗(yàn)室(CSAIL)計(jì)算與生物學(xué)組組長(zhǎng)、西蒙斯數(shù)學(xué)教授邦尼-伯杰(Bonnie Berger)說(shuō):"這項(xiàng)工作解決了對(duì)潛在候選藥物進(jìn)行高效和準(zhǔn)確的硅計(jì)算篩選的需求,而且該模型的可擴(kuò)展性使得大規(guī)模篩選可以評(píng)估脫靶效應(yīng)、藥物再利用以及確定突變對(duì)藥物結(jié)合的影響。"
塔夫茨大學(xué)計(jì)算機(jī)科學(xué)教授Lenore Cowen也是該論文的資深作者,該論文于6月8日發(fā)表在《美國(guó)國(guó)家科學(xué)院院刊》上。CSAIL的研究科學(xué)家Rohit Singh和麻省理工學(xué)院的研究生Samuel Sledzieski是這篇論文的主要作者,麻省理工學(xué)院生物工程副教授、麻省理工學(xué)院和哈佛大學(xué)Ragon研究所成員Bryan Bryson也是作者。除了這篇論文,研究人員還在網(wǎng)上提供了他們的模型供其他科學(xué)家使用。
進(jìn)行預(yù)測(cè)
近年來(lái),計(jì)算科學(xué)家在開(kāi)發(fā)能夠根據(jù)蛋白質(zhì)的氨基酸序列預(yù)測(cè)其結(jié)構(gòu)的模型方面取得了巨大的進(jìn)展。然而,使用這些模型來(lái)預(yù)測(cè)大型潛在藥物庫(kù)如何與一個(gè)癌癥蛋白質(zhì)相互作用,例如,已被證明具有挑戰(zhàn)性,主要是因?yàn)橛?jì)算蛋白質(zhì)的三維結(jié)構(gòu)需要大量的時(shí)間和計(jì)算能力。
另一個(gè)障礙是,這類(lèi)模型在消除被稱(chēng)為誘餌的化合物方面沒(méi)有良好的記錄,這些誘餌與成功的藥物非常相似,但實(shí)際上并不能與目標(biāo)發(fā)生良好的互動(dòng)。
Singh說(shuō):"該領(lǐng)域的一個(gè)長(zhǎng)期挑戰(zhàn)是這些方法是脆弱的,也就是說(shuō),如果我給模型一種藥物或一種小分子,看起來(lái)幾乎像真正的東西,但它在某些微妙的方面略有不同,該模型可能仍然預(yù)測(cè)它們會(huì)相互作用,盡管它不應(yīng)該。"
研究人員已經(jīng)設(shè)計(jì)出了能夠克服這種脆弱性的模型,但它們通常只針對(duì)一類(lèi)藥物分子,而且由于計(jì)算時(shí)間過(guò)長(zhǎng),它們并不適合大規(guī)模篩選。
麻省理工學(xué)院的團(tuán)隊(duì)決定采取另一種方法,基于他們?cè)?019年首次開(kāi)發(fā)的一個(gè)蛋白質(zhì)模型。與一個(gè)包含2萬(wàn)多個(gè)蛋白質(zhì)的數(shù)據(jù)庫(kù)合作,該語(yǔ)言模型將這些信息編碼為每個(gè)氨基酸序列的有意義的數(shù)字表示,這些數(shù)字表示捕捉了序列和結(jié)構(gòu)之間的關(guān)聯(lián)。
Sledzieski說(shuō):"有了這些語(yǔ)言模型,即使是序列非常不同但可能具有類(lèi)似結(jié)構(gòu)或類(lèi)似功能的蛋白質(zhì)也可以在這個(gè)語(yǔ)言空間中以類(lèi)似的方式表示,我們能夠利用這一點(diǎn)來(lái)進(jìn)行預(yù)測(cè)。"
在他們的新研究中,研究人員將蛋白質(zhì)模型應(yīng)用于找出哪些蛋白質(zhì)序列將與特定藥物分子相互作用的任務(wù),兩者都有數(shù)字表示,通過(guò)神經(jīng)網(wǎng)絡(luò)轉(zhuǎn)化為一個(gè)共同的共享空間。他們對(duì)已知的蛋白質(zhì)-藥物相互作用進(jìn)行了訓(xùn)練,這使得它能夠?qū)W會(huì)將蛋白質(zhì)的具體特征與藥物結(jié)合能力聯(lián)系起來(lái),而不必計(jì)算任何分子的三維結(jié)構(gòu)。
"有了這種高質(zhì)量的數(shù)字表示,該模型可以完全繞過(guò)原子表示,并從這些數(shù)字中預(yù)測(cè)這種藥物是否會(huì)結(jié)合,"Singh說(shuō)。"這樣做的好處是,你避免了通過(guò)原子表示法的需要,但這些數(shù)字仍然有你需要的所有信息。"
這種方法的另一個(gè)優(yōu)點(diǎn)是,它考慮到了蛋白質(zhì)結(jié)構(gòu)的靈活性,當(dāng)與藥物分子相互作用時(shí),蛋白質(zhì)結(jié)構(gòu)可能是"搖擺不定"的,并呈現(xiàn)出略微不同的形狀。
高親和力
為了使他們的模型不太可能被誘餌藥物分子所愚弄,研究人員還納入了一個(gè)基于對(duì)比學(xué)習(xí)概念的訓(xùn)練階段。在這種方法下,研究人員給模型提供了"真實(shí)"藥物和誘餌的例子,并教它區(qū)分它們。
然后,研究人員通過(guò)篩選大約4700個(gè)候選藥物分子庫(kù)來(lái)測(cè)試他們的模型,看它們是否能與一組被稱(chēng)為蛋白激酶的51種酶結(jié)合。
研究人員從排名靠前的藥物中選擇了19個(gè)藥物-蛋白對(duì)進(jìn)行實(shí)驗(yàn)測(cè)試。實(shí)驗(yàn)顯示,在這19個(gè)命題中,有12個(gè)具有很強(qiáng)的結(jié)合親和力(在納摩爾范圍內(nèi)),而幾乎所有其他可能的藥物-蛋白質(zhì)配對(duì)都沒(méi)有親和力。這些配對(duì)中的四個(gè)以極高的、亞納摩爾的親和力結(jié)合(如此之強(qiáng),以至于極小的藥物濃度,即十億分之一,就能抑制該蛋白質(zhì))。
雖然研究人員在這項(xiàng)研究中主要側(cè)重于篩選小分子藥物,但他們現(xiàn)在正致力于將這種方法應(yīng)用于其他類(lèi)型的藥物,如治療性抗體。這種建模也可以證明對(duì)潛在的藥物化合物進(jìn)行毒性篩選是有用的,以確保它們?cè)趧?dòng)物模型中測(cè)試之前沒(méi)有任何不必要的副作用。
"藥物發(fā)現(xiàn)如此昂貴的部分原因是它有很高的失敗率。"Singh說(shuō):"如果我們能夠通過(guò)預(yù)先說(shuō)這種藥物不可能成功來(lái)減少這些失敗率,這可以在很大程度上降低藥物發(fā)現(xiàn)的成本。"
美國(guó)國(guó)家癌癥研究所癌癥數(shù)據(jù)科學(xué)實(shí)驗(yàn)室主任Eytan Ruppin說(shuō),這種新方法"代表了藥物-靶點(diǎn)相互作用預(yù)測(cè)的重大突破,并為未來(lái)的研究提供了更多機(jī)會(huì),以進(jìn)一步提高其能力",他并沒(méi)有參與這項(xiàng)研究。"例如,將結(jié)構(gòu)信息納入潛伏空間或探索生成誘餌的分子生成方法可以進(jìn)一步改善預(yù)測(cè)。"
關(guān)鍵詞:
相關(guān)閱讀
-
天天即時(shí):利用ChatGPT背后的AI加速藥物...
通過(guò)將語(yǔ)言模型應(yīng)用于蛋白質(zhì)與藥物的相互作用,研究人員可以快速篩選大 -
廣州軟件學(xué)院召開(kāi)2020-2022年度校園治安...
6月15日上午,廣州軟件學(xué)院2020-2022年度校園治安綜合治理(平安創(chuàng)建) -
2023順德倫教街道公辦小學(xué)轉(zhuǎn)學(xué)插班學(xué)區(qū)...
2023年秋季學(xué)期順德倫教街道公辦小學(xué)轉(zhuǎn)學(xué)插班學(xué)區(qū)劃分安排表:符合條件 -
內(nèi)托和法比奧·席爾瓦將在今晚開(kāi)啟歐青...
內(nèi)托和法比奧·席爾瓦將在今晚開(kāi)啟歐青賽征程,葡萄牙U21的三個(gè)小組... -
消息!鄭州申請(qǐng)公租房第二個(gè)月月底還是...
鄭州申請(qǐng)公租房第二個(gè)月月底還是月初發(fā)補(bǔ)貼?一般都是次月發(fā),時(shí)間具體 -
華塑股份(600935.SH):建信金融累計(jì)減持...
格隆匯6月21日丨華塑股份600935SH公布建信金融在2022年12月22日至2023 -
【快播報(bào)】豬肉的瘦肉中的脂肪含量是多少?
豬肉的瘦肉中的脂肪含量通常在12%至22%之間,取決于肉的部位和飼養(yǎng)方式 -
世界速訊:美國(guó)學(xué)者:美中經(jīng)貿(mào)合作空間...
原標(biāo)題:美國(guó)學(xué)者:美中經(jīng)貿(mào)合作空間廣闊為雙邊關(guān)系注入穩(wěn)定性丨世界觀 -
快訊:2023西湖區(qū)市場(chǎng)監(jiān)督管理局招聘崗位
一、招聘崗位西湖區(qū)市場(chǎng)監(jiān)督管理局編外合同制工作人員1名(詳見(jiàn)附件1) -
甘肅渭源:鄉(xiāng)村振興“薯”光好
盛夏時(shí)節(jié),走進(jìn)位于定西市渭源縣的甘肅田地農(nóng)業(yè)科技有限責(zé)任公司,無(wú)菌 -
巨星空降,Taylor明年將在伯納烏和安菲...
泰勒-斯威夫特(TaylorSwift)巡回演唱會(huì)安排公布,其中兩場(chǎng)分別在皇馬 -
海南出臺(tái)促銷(xiāo)費(fèi)若干措施 將發(fā)放新一批...
根據(jù)海南省統(tǒng)計(jì)局發(fā)布的數(shù)據(jù),今年1-5月份,海南全省社會(huì)消費(fèi)品零售總 -
森霸傳感:公司實(shí)控人擬間接減持不超1%股份
森霸傳感公告,持股21 91%的股東香港鵬威計(jì)劃通過(guò)集中競(jìng)價(jià)方式減持,公 -
癌癥住院報(bào)銷(xiāo)多少?從商業(yè)醫(yī)療險(xiǎn)和醫(yī)保...
1 商業(yè)醫(yī)療險(xiǎn)報(bào)銷(xiāo):如果自費(fèi)2-5萬(wàn)元,報(bào)銷(xiāo)比例為50%;如果自費(fèi)5-10萬(wàn)元 -
每日視點(diǎn)!TVB知名戲骨現(xiàn)身內(nèi)地旅行!一...
要知道馬海倫只是TVB的一位配角,收入并不高,如今卻動(dòng)不動(dòng)就背著十多 -
環(huán)球觀察:民法典見(jiàn)義勇為免責(zé)是怎么規(guī)...
一、《民法典》見(jiàn)義勇為免責(zé)是怎么規(guī)定的《民法典(自2021年1月1日施行 -
天天快訊:痛心!一對(duì)夫妻身亡,兩孩子目...
痛心!一對(duì)夫妻身亡,兩孩子目睹悲?。壕染劝职謰寢?hellip;…,6月18日,... -
當(dāng)前熱訊:新亞電子(605277.SH):通過(guò)安...
格隆匯6月21日丨有投資者向新亞電子(605277 SH)提問(wèn),“公司生產(chǎn)的高頻 -
環(huán)球快看:金冠股份:我司研發(fā)生產(chǎn)的大...
同花順金融研究中心6月21日訊,有投資者向金冠股份提問(wèn),貴公司的充電 -
鮮咔醬油_關(guān)于鮮咔醬油簡(jiǎn)述
小伙伴們,你們好,今天小夏來(lái)聊聊一篇關(guān)于鮮咔醬油,關(guān)于鮮咔醬油簡(jiǎn)述