A:http://biocomp.chem.uw.edu.pl/CABSdock/這個(gè)網(wǎng)站的結(jié)果怎么比較啊?
殷賦科技:我還沒用過呢,只是在網(wǎng)上搜索到的。你那計(jì)算完了,有什么結(jié)果啊?
A:
殷賦科技:沒有打分之類的東西?
A:只給了結(jié)果,但沒看到這樣排序的依據(jù)。
殷賦科技:應(yīng)該是最上面的是最合適的,那你下載下來就可以用啦!
A:沒看到這樣排序的依據(jù)。
殷賦科技:上面有講啊,根據(jù)動(dòng)力學(xué)軌跡中出現(xiàn)的概率排序,1表示最可能。
A:我還以為會(huì)和vina一樣,有一個(gè)數(shù)值結(jié)果的比較。
殷賦科技:大多數(shù)都有個(gè)評(píng)分,但這個(gè)恰好沒有。不過也不妨礙我們使用,評(píng)分只是一個(gè)參考,通常只具有相對(duì)比較的意義,所以,換成概率也是可以的,而概率也只是一個(gè)粗略的估計(jì),變成排序更為方便。請(qǐng)根據(jù)你對(duì)體系的了解,多看幾個(gè)model,綜合判斷,選擇一個(gè)合適的來做后續(xù)工作吧。
殷賦科技:我多說一句,我經(jīng)常在群里和私聊說,“對(duì)體系的了解”,指的是根據(jù)你的目標(biāo)確定你要了解哪些信息,以此篩選、過濾模型。比如,如果我要做分子對(duì)接預(yù)測(cè)蛋白-配體結(jié)合模式,那么,除了打分是一個(gè)參考指標(biāo)外,還需要你對(duì)這個(gè)蛋白的功能、關(guān)鍵殘基、抑制劑、激動(dòng)劑、拮抗劑的作用機(jī)理有所了解。掌握的信息越多,判斷就越容易。我們平臺(tái)把操作最簡(jiǎn)化,但其實(shí)對(duì)用戶具有更高的要求,要做出科學(xué)合理的結(jié)果,需要用戶去了解和思考,而非當(dāng)個(gè)操作員。
模型預(yù)測(cè)B:想問下大家,ZINC數(shù)據(jù)庫下載下來的小分子,有沒有相對(duì)應(yīng)的LD50?
C:沒有吧。
D:zinc里面天然產(chǎn)物能知道來源生物嗎?
E:什么數(shù)據(jù)庫這么強(qiáng)大?
D:我在zinc里面下載的好像ibs還是stock1n。我也不懂,納悶?zāi)莻(gè)物質(zhì)能查到來源嗎。
B:USCF DOCK對(duì)接軟件里,可以預(yù)測(cè)化合物的LD50嗎?主要是因?yàn)槲铱戳诉@篇文獻(xiàn),文章里沒說做實(shí)驗(yàn)得到的LD50,我就想不明白這個(gè)LD50到底是哪里得來的。
B:
F:數(shù)據(jù)庫查到的?對(duì)接不能預(yù)測(cè)LD50吧。
殷賦科技:對(duì)接軟件不能預(yù)測(cè)LD50,文獻(xiàn)是個(gè)別化合物剛好有人測(cè)了LD50。
B:
結(jié)果是這樣的一個(gè)表格,我也不知道這些LD50哪里來的,關(guān)鍵是65個(gè)來源于ZINC數(shù)據(jù)庫的小分子,難道正好都是查到了別人做過的LD50嗎。
F:可能他選的大部分都是測(cè)過的吧。
殷賦科技:是啊,不是還有2個(gè)沒有LD50嗎?如果是軟件預(yù)測(cè),為啥不是全部有呢?
B:也對(duì)哈,突然間我也意識(shí)到這個(gè)問題了。
G:部分化合物有admet數(shù)據(jù),可以自己做模型預(yù)測(cè)。
B:怎么做啊這個(gè)?
G:自己訓(xùn)練模型,我沒有訓(xùn)練過急性毒性,我做過遺傳毒性。
C:搞個(gè)深度學(xué)習(xí)模型預(yù)測(cè)ADMET。
G:http://admet.scbdd.com/。
B:為啥有兩個(gè)化合物沒有毒性信息呢?
G:http://:8080//DLAOT/DLAOThome.php。有很多文獻(xiàn),照文獻(xiàn)來就可以,大部分都沒有,只有部分有。
B:我是看文獻(xiàn),沒看懂。
G:其實(shí)現(xiàn)在不用看懂文獻(xiàn),只要做個(gè)合格的數(shù)據(jù)搬運(yùn)工: 將數(shù)據(jù)幫到百度、阿里云、Google上,讓它自動(dòng)訓(xùn)練,獲得模型。建議試試Google機(jī)器學(xué)習(xí),1小時(shí)20美金。
B:我看是文獻(xiàn)里對(duì)接出打分較高的65個(gè)小分子,然后這些小分子做了LD50,直接將這些小分子結(jié)構(gòu)輸入這些網(wǎng)站就能得到LD50?
G:不會(huì),你要首先要訓(xùn)練它,獲得一個(gè)模型; 然后用模型預(yù)測(cè)。
B:訓(xùn)練他什么意思?
C:數(shù)據(jù)結(jié)構(gòu)整理好,輸入模型就可以了。
G:你還是用這個(gè)比較好。http://:8080//DLAOT/DLAOThome.php。再看看這個(gè)的方法學(xué)。
H:請(qǐng)問現(xiàn)在有沒有那種輸入化合物,直接給出合成路線的軟件或網(wǎng)站?尤其是天然產(chǎn)物那種。
G:我也想找一個(gè)。
H:通過訓(xùn)練ai,應(yīng)該可能實(shí)現(xiàn)吧?
G:普通機(jī)器學(xué)習(xí)就可以
H:那怎么沒人搞
D:效果不好唄
G:很多人搞,最好的是simulation pkus。https://www.simulations-plus.com/
G:剛才發(fā)的也都是機(jī)器學(xué)習(xí),比薛定諤強(qiáng)100倍。你試試herg毒性預(yù)測(cè)就知道比所有的都強(qiáng),只是學(xué)術(shù)用的比較少而已。
D:好,我平常用的都是ds帶的ADMET預(yù)測(cè),估計(jì)也不太靠譜。
G:你試試herg陰性化合物,試試schrodinger與ds,看看預(yù)測(cè)結(jié)果。
I:我之前用nlp的word2vec搞逆合成的深度學(xué)習(xí),可惜學(xué)藝不精,準(zhǔn)確度比較差。就是把化合物的smiles格式字符串變成向量,然后用LSTM神經(jīng)網(wǎng)絡(luò)學(xué)習(xí),大概60萬個(gè)化學(xué)反應(yīng)。預(yù)測(cè)準(zhǔn)確度很低。
C:反應(yīng)當(dāng)做什么,變量還是描述符?
I:就是自然語言處理翻譯,把產(chǎn)物“翻譯”成反應(yīng)物。這個(gè)描述符就是word2vec,把smiles格式變成向量即可。
C:逆合成啊?
I:是啊。
殷賦科技:LSTM適用于序列預(yù)測(cè)問題,但逆合成不涉及時(shí)間序列吧。你把逆合成的步驟算作序列?
I:lstm在nlp中比較常見,所以我就選它了。
MiscellaneousI:DS對(duì)接出來Energy得分是正的,這代表啥意思啊?
D:是cdock嗎?
I:是的,是cdocker。
G:不管是正值還是負(fù)值,解讀應(yīng)該都一樣。這篇文章里的cdocker也都是正值。
https://www.sciencedirect.com/science/article/pii/S2095754817302119,見表5。
G:正確做法應(yīng)該讀個(gè)說明書與算法,看看結(jié)合親和力與打分的關(guān)系。再與大家分享一下,文獻(xiàn)之類的都不靠譜。
H:有沒有軟件或網(wǎng)站,能直接給出蛋白活性口袋區(qū)域的DNA序列?
G:你是說組成口袋氨基酸殘基對(duì)應(yīng)的dna嗎?
H:對(duì),我想比較一下兩個(gè)蛋白的口袋,看看有沒有異同。
G:那直接比蛋白口袋就可以了,序列比對(duì)或蛋白疊合就可以了。
K:
K:@殷賦科技 這個(gè)地方指的保守的氫鍵網(wǎng)絡(luò)是什么啊?
殷賦科技:應(yīng)該是跟同類多肽、不同種屬、同工蛋白之類的進(jìn)行比較,這個(gè)氫鍵是大家都有的,稱為保守吧。要根據(jù)上下文判斷。
貝爾湖:大家好,新來菜鳥報(bào)道,請(qǐng)問得到分子對(duì)接文件dlg怎么解釋結(jié)果合理性呢,怎么解讀結(jié)果呢?
殷賦科技:還在用autodock4啊?用vina吧,更推薦用dock6。
貝爾湖:autodock4和dock6有什么大的差異嗎,是結(jié)果可靠性還是什么?
殷賦科技:官方數(shù)據(jù)表明autodock vina比autodock4更快更準(zhǔn),我的經(jīng)驗(yàn)是dock6比vina準(zhǔn)確,而且能夠解釋更多東西,更有物理意義。
M:嗯,不會(huì)用dock6。
殷賦科技:用我們的平臺(tái),有教程,跟著一步一步點(diǎn)擊鼠標(biāo)就行。
這里還有分析教程:【文獻(xiàn)重現(xiàn)】D715-2441 抑制劑與PB2蛋白的結(jié)合模式研究和作圖教程:高質(zhì)量PyMOL作圖教程。
M:可以win嗎?我還不會(huì)linux。
殷賦科技:不用安裝任何軟件,只要瀏覽器,在任何系統(tǒng)都可以。
更多資訊,請(qǐng)登錄www.yinfotek.com 或關(guān)注微信公眾號(hào)“殷賦科技”。我司建立了微信學(xué)術(shù)交流群,為生物醫(yī)藥領(lǐng)域的朋友搭建溝通交流的互動(dòng)平臺(tái)。想入群的朋友,請(qǐng)?jiān)谖⑿殴娞?hào)菜單欄輸入“加群”,根據(jù)提示操作即可。