国产综合久久久久久精品,国产精品成人av片免费看,国产精品天天看天天狠,国产专区国产精品国产三级,国产大片内射1区2区

您的位置:首頁(yè)>新聞 > 數(shù)據(jù) >

天天即時(shí):利用ChatGPT背后的AI加速藥物發(fā)現(xiàn) - 每天可篩選1億種化合物

2023-06-21 20:54:42    來(lái)源:cnBeta

通過(guò)將語(yǔ)言模型應(yīng)用于蛋白質(zhì)與藥物的相互作用,研究人員可以快速篩選大量的潛在藥物化合物庫(kù)。巨大的藥物化合物庫(kù)可能擁有治療各種疾病的潛力,如癌癥或心臟病。理想情況下,科學(xué)家們希望通過(guò)實(shí)驗(yàn)對(duì)這些化合物中的每一種針對(duì)所有可能的目標(biāo)進(jìn)行測(cè)試,但進(jìn)行這樣的篩選是非常耗時(shí)的。

近年來(lái),研究人員已經(jīng)開(kāi)始使用計(jì)算方法來(lái)篩選這些化合物庫(kù),希望能加快藥物發(fā)現(xiàn)的速度。然而,其中許多方法也需要很長(zhǎng)的時(shí)間,因?yàn)樗鼈冎械拇蠖鄶?shù)都是從氨基酸序列中計(jì)算出每個(gè)目標(biāo)蛋白的三維結(jié)構(gòu),然后用這些結(jié)構(gòu)來(lái)預(yù)測(cè)它將與哪些藥物分子相互作用。

麻省理工學(xué)院和塔夫茨大學(xué)的研究人員現(xiàn)在已經(jīng)設(shè)計(jì)出一種基于一種被稱(chēng)為大型語(yǔ)言模型的人工智能算法的替代計(jì)算方法。這些模型--一個(gè)著名的例子是ChatGPT--可以分析大量的文本,并找出哪些詞(或者,在這種情況下是氨基酸)最有可能一起出現(xiàn)。這個(gè)被稱(chēng)為ConPLex的新模型可以將目標(biāo)蛋白質(zhì)與潛在的藥物分子相匹配,而不必執(zhí)行計(jì)算分子結(jié)構(gòu)的密集步驟。


【資料圖】

使用這種方法,研究人員可以在一天內(nèi)篩選出超過(guò)1億個(gè)化合物--比任何現(xiàn)有模型都要多。

麻省理工學(xué)院計(jì)算機(jī)科學(xué)與人工智能實(shí)驗(yàn)室(CSAIL)計(jì)算與生物學(xué)組組長(zhǎng)、西蒙斯數(shù)學(xué)教授邦尼-伯杰(Bonnie Berger)說(shuō):"這項(xiàng)工作解決了對(duì)潛在候選藥物進(jìn)行高效和準(zhǔn)確的硅計(jì)算篩選的需求,而且該模型的可擴(kuò)展性使得大規(guī)模篩選可以評(píng)估脫靶效應(yīng)、藥物再利用以及確定突變對(duì)藥物結(jié)合的影響。"

塔夫茨大學(xué)計(jì)算機(jī)科學(xué)教授Lenore Cowen也是該論文的資深作者,該論文于6月8日發(fā)表在《美國(guó)國(guó)家科學(xué)院院刊》上。CSAIL的研究科學(xué)家Rohit Singh和麻省理工學(xué)院的研究生Samuel Sledzieski是這篇論文的主要作者,麻省理工學(xué)院生物工程副教授、麻省理工學(xué)院和哈佛大學(xué)Ragon研究所成員Bryan Bryson也是作者。除了這篇論文,研究人員還在網(wǎng)上提供了他們的模型供其他科學(xué)家使用。

進(jìn)行預(yù)測(cè)

近年來(lái),計(jì)算科學(xué)家在開(kāi)發(fā)能夠根據(jù)蛋白質(zhì)的氨基酸序列預(yù)測(cè)其結(jié)構(gòu)的模型方面取得了巨大的進(jìn)展。然而,使用這些模型來(lái)預(yù)測(cè)大型潛在藥物庫(kù)如何與一個(gè)癌癥蛋白質(zhì)相互作用,例如,已被證明具有挑戰(zhàn)性,主要是因?yàn)橛?jì)算蛋白質(zhì)的三維結(jié)構(gòu)需要大量的時(shí)間和計(jì)算能力。

另一個(gè)障礙是,這類(lèi)模型在消除被稱(chēng)為誘餌的化合物方面沒(méi)有良好的記錄,這些誘餌與成功的藥物非常相似,但實(shí)際上并不能與目標(biāo)發(fā)生良好的互動(dòng)。

Singh說(shuō):"該領(lǐng)域的一個(gè)長(zhǎng)期挑戰(zhàn)是這些方法是脆弱的,也就是說(shuō),如果我給模型一種藥物或一種小分子,看起來(lái)幾乎像真正的東西,但它在某些微妙的方面略有不同,該模型可能仍然預(yù)測(cè)它們會(huì)相互作用,盡管它不應(yīng)該。"

研究人員已經(jīng)設(shè)計(jì)出了能夠克服這種脆弱性的模型,但它們通常只針對(duì)一類(lèi)藥物分子,而且由于計(jì)算時(shí)間過(guò)長(zhǎng),它們并不適合大規(guī)模篩選。

麻省理工學(xué)院的團(tuán)隊(duì)決定采取另一種方法,基于他們?cè)?019年首次開(kāi)發(fā)的一個(gè)蛋白質(zhì)模型。與一個(gè)包含2萬(wàn)多個(gè)蛋白質(zhì)的數(shù)據(jù)庫(kù)合作,該語(yǔ)言模型將這些信息編碼為每個(gè)氨基酸序列的有意義的數(shù)字表示,這些數(shù)字表示捕捉了序列和結(jié)構(gòu)之間的關(guān)聯(lián)。

Sledzieski說(shuō):"有了這些語(yǔ)言模型,即使是序列非常不同但可能具有類(lèi)似結(jié)構(gòu)或類(lèi)似功能的蛋白質(zhì)也可以在這個(gè)語(yǔ)言空間中以類(lèi)似的方式表示,我們能夠利用這一點(diǎn)來(lái)進(jìn)行預(yù)測(cè)。"

在他們的新研究中,研究人員將蛋白質(zhì)模型應(yīng)用于找出哪些蛋白質(zhì)序列將與特定藥物分子相互作用的任務(wù),兩者都有數(shù)字表示,通過(guò)神經(jīng)網(wǎng)絡(luò)轉(zhuǎn)化為一個(gè)共同的共享空間。他們對(duì)已知的蛋白質(zhì)-藥物相互作用進(jìn)行了訓(xùn)練,這使得它能夠?qū)W會(huì)將蛋白質(zhì)的具體特征與藥物結(jié)合能力聯(lián)系起來(lái),而不必計(jì)算任何分子的三維結(jié)構(gòu)。

"有了這種高質(zhì)量的數(shù)字表示,該模型可以完全繞過(guò)原子表示,并從這些數(shù)字中預(yù)測(cè)這種藥物是否會(huì)結(jié)合,"Singh說(shuō)。"這樣做的好處是,你避免了通過(guò)原子表示法的需要,但這些數(shù)字仍然有你需要的所有信息。"

這種方法的另一個(gè)優(yōu)點(diǎn)是,它考慮到了蛋白質(zhì)結(jié)構(gòu)的靈活性,當(dāng)與藥物分子相互作用時(shí),蛋白質(zhì)結(jié)構(gòu)可能是"搖擺不定"的,并呈現(xiàn)出略微不同的形狀。

高親和力

為了使他們的模型不太可能被誘餌藥物分子所愚弄,研究人員還納入了一個(gè)基于對(duì)比學(xué)習(xí)概念的訓(xùn)練階段。在這種方法下,研究人員給模型提供了"真實(shí)"藥物和誘餌的例子,并教它區(qū)分它們。

然后,研究人員通過(guò)篩選大約4700個(gè)候選藥物分子庫(kù)來(lái)測(cè)試他們的模型,看它們是否能與一組被稱(chēng)為蛋白激酶的51種酶結(jié)合。

研究人員從排名靠前的藥物中選擇了19個(gè)藥物-蛋白對(duì)進(jìn)行實(shí)驗(yàn)測(cè)試。實(shí)驗(yàn)顯示,在這19個(gè)命題中,有12個(gè)具有很強(qiáng)的結(jié)合親和力(在納摩爾范圍內(nèi)),而幾乎所有其他可能的藥物-蛋白質(zhì)配對(duì)都沒(méi)有親和力。這些配對(duì)中的四個(gè)以極高的、亞納摩爾的親和力結(jié)合(如此之強(qiáng),以至于極小的藥物濃度,即十億分之一,就能抑制該蛋白質(zhì))。

雖然研究人員在這項(xiàng)研究中主要側(cè)重于篩選小分子藥物,但他們現(xiàn)在正致力于將這種方法應(yīng)用于其他類(lèi)型的藥物,如治療性抗體。這種建模也可以證明對(duì)潛在的藥物化合物進(jìn)行毒性篩選是有用的,以確保它們?cè)趧?dòng)物模型中測(cè)試之前沒(méi)有任何不必要的副作用。

"藥物發(fā)現(xiàn)如此昂貴的部分原因是它有很高的失敗率。"Singh說(shuō):"如果我們能夠通過(guò)預(yù)先說(shuō)這種藥物不可能成功來(lái)減少這些失敗率,這可以在很大程度上降低藥物發(fā)現(xiàn)的成本。"

美國(guó)國(guó)家癌癥研究所癌癥數(shù)據(jù)科學(xué)實(shí)驗(yàn)室主任Eytan Ruppin說(shuō),這種新方法"代表了藥物-靶點(diǎn)相互作用預(yù)測(cè)的重大突破,并為未來(lái)的研究提供了更多機(jī)會(huì),以進(jìn)一步提高其能力",他并沒(méi)有參與這項(xiàng)研究。"例如,將結(jié)構(gòu)信息納入潛伏空間或探索生成誘餌的分子生成方法可以進(jìn)一步改善預(yù)測(cè)。"

關(guān)鍵詞:

相關(guān)閱讀