A:用的cdocker將晶體復(fù)合物的配體對接回原來的蛋白質(zhì)重合度不好啊,rmsd也比較高,請問大家對接時受體蛋白加力場嗎?
B:參數(shù)沒設(shè)置好吧。
C:要分析原因哦。
(1)是所有對接計算出來的pose都不好?
(2) 還是打分最好的那個不好,打分差的反而好?
(3)還是根本沒有生成活性構(gòu)象。
如果生成了活性構(gòu)象,而打分函數(shù)沒有把他挑出來,說明打分函數(shù)有問題,需要換一個打分函數(shù)。如果根本沒有擺出正確pose,需要改變搜索策略。或者干脆換軟件。
活性預(yù)測D:我現(xiàn)在自己做小分子活性預(yù)測的深度學(xué)習(xí),在建模的過程中有個問題,訓(xùn)練集多少比較合適?
C:深度學(xué)習(xí)以不過擬合為準,同一個靶標的QSAR估計你要幾千個數(shù)據(jù)點,我做過的都有6000,7000,8000或更多以上。
D:這個訓(xùn)練集您是以什么標準篩選的,有什么數(shù)據(jù)庫嗎?
C:開源的有pubchem,chembl,bindingdb。
D:他的活性值在這些數(shù)據(jù)庫都有嗎?需要爬蟲下來?
C:不需要爬蟲啊, 直接可以按靶標搜索。
E:現(xiàn)在什么靶標比較火呀,我也做的深度學(xué)習(xí)的,描述符有很多。
殷賦科技:不應(yīng)該選經(jīng)典成熟的靶標么?
E:用二維描述符+卷積神經(jīng)網(wǎng)絡(luò)。哪個靶標有一萬以上的小分子呢?
C:毒性,代謝是所有藥物上市前都研究的,這些靶標比較多,比如hERG。
蛋白處理與分子對接A:請問如果是鋅結(jié)合的抑制劑對接完成后做QM/MM除了將配體,鋅離子以及與鋅離子直接相連的三個氨基酸設(shè)為QM區(qū),那些與配體成氫鍵或是pi作用的氨基酸也要設(shè)為QM區(qū)嗎?
E:是的。
A:還有請問對于配體的電荷怎么看啊?比如一個羧酸分子,是0嗎?
E:羧酸有H嗎?有H就是0。
A:請問什么叫有氫嗎?我加了charmm力場,羧酸那個O上面沒有H。
E:那是-1,你的qm是dft還是dftb?
A:我不懂,怎么看啊?我是在ds里做的。
E:我以為你是qm/mm/md!
A:不是,沒有做分子動力學(xué)。你好,我的配體就是這樣的。
A:這個就算做-1是嗎?還有請問組氨酸電荷是不是+1呢?我天冬氨酸按照-1算的。
E:HID,HIP還是HIE?看你質(zhì)子化情況。
A:HIS。怎么看質(zhì)子化啊?我是小白就是按教程做的。
殷賦科技:讓DS處理吧。用UCSF Chimera的Prep Dock就可以處理,我們平臺也會自動處理蛋白,生成的mol2文件就含有質(zhì)子化氫和偏電荷(partial charge)。
F:你用什么做QMMM?
A:你好,我用的ds@F。下載的pdb晶體里面有一個配體很大,為了對接,清理蛋白質(zhì)的時候定義活性位點設(shè)定的半徑要不要相應(yīng)增大啊?
G:不知道具體的結(jié)合位點?
A:我就選中的原來配體設(shè)定的半徑。
H:原來的配體就是活性位點,一般半徑設(shè)置10左右吧,半徑太大的話對接時間會長,另外結(jié)果不準確,當(dāng)然半徑太小會對接不進去,可以適當(dāng)調(diào)整。
A:你好,我看教程也是說半徑設(shè)為10但是10的話我看無法全部包括原來的配體分子啊。
H:你可以適當(dāng)增大,12也可以。
I:你們用的什么軟件?我之前對接一個蛋白,用的原配體口袋,對接我的化合物打分挺高的,可是作用的氨基酸跟文獻差好多,這正常么?
A:ds,我主要是現(xiàn)在想要選一個好的晶體,把自帶的配體對接回去和本身的配體重疊查看一下rmsd值。
G:就是對接出來的結(jié)果不是那么準確吧。
A:好多晶體對接回去都不好,我現(xiàn)在調(diào)大點半徑試試,先對上再說。
I:我之前用薛定諤對接的效果不錯。
A:我感覺你那種情況好像也挺正常,這種對接也不怎么準,尤其是ds。
I:后來用的DS對接效果一般,但是作用的蛋白跟我用薛定諤對接的差不多。
A:薛定諤好像是更靠譜一些。
I:做起來挺慢的。
A:你們有薛定諤的教程嗎?
I:我是跟別人學(xué)了兩天,也沒太搞明白。原來學(xué)校有個課題組做這個方向的,我畢業(yè)走了,我們學(xué)校開始開的計算機輔助藥物設(shè)計這門課了!
QSAR疊合構(gòu)象R:請問,做QSAR分子疊合的時候,有些疊合的不好該怎么搞呢,明明都差不多。殷賦科技:你指的是QSAR模型的預(yù)測能力不好吧?如果疊合不整齊,手動調(diào)整咯。
R:你是說調(diào)訓(xùn)練測試集嘛?
殷賦科技:你是說結(jié)構(gòu)疊合得不好(不整齊)嗎?還是疊合后做出來的模型預(yù)測能力不好?
R:疊合出來的預(yù)測能力還行 confa的0.6幾,comsia的有0.7幾,就是疊合的不整齊。
殷賦科技:截圖看如何不整齊。
殷賦科技:你是不是認為有部分結(jié)構(gòu)應(yīng)該左右反過來疊合才算整齊?
R:反倒是沒反。
殷賦科技:那就沒問題啊。
G:這是什么軟件?
殷賦科技:SYBYL。
R:有幾個明明就一點差別,但是疊合出來就重合的不好。
殷賦科技:那是構(gòu)像問題了,它已經(jīng)盡力了,但疊合是剛性的,構(gòu)像如此,它也很無奈啊。調(diào)整構(gòu)像唄,可以用你認為合適的某個化合物來構(gòu)建相似結(jié)構(gòu)的結(jié)構(gòu),構(gòu)像就接近啦。
殷賦科技:或者產(chǎn)生大量構(gòu)像,然后用算法去挑選。我不知道SYBYL里邊有沒有這個功能。
R:我剛看了教程找到了你說的利用構(gòu)象搜索去挑選疊合構(gòu)象@殷賦科技 感謝你的提醒。
虛擬篩選S:導(dǎo)師讓我做虛擬篩選這塊兒(學(xué)autodock) ,但是沒有頭緒,我也不怎么會python,請問有這方面的課程么?
殷賦科技:我們博客上有個腳本,可以用用,不過,并不建議新手去用腳本做篩選。因為計算不是問題,問題是沒有經(jīng)驗的人的命中率很低,浪費的是買化合物做實驗的錢。
S:有道理,之前同組的同學(xué)用svm篩選過酪氨酸酶抑制劑,酶一點點花了八千多。
殷賦科技:我們正在開發(fā)在線方案,聯(lián)合使用vina和dock6對接,再加上根據(jù)以往經(jīng)驗寫成的分析篩選腳本,能極大提高命中率。如果不著急,不妨等一等。
D:您說的基于Vina和dock6對接,然后經(jīng)過分析后得到數(shù)據(jù)的腳本,這個分析是什么個過程?共同命中被選下來?這個的話腳本不難寫,如果這個思路可行的話我也想寫寫試一試。
殷賦科技:主要是兩步,一是根據(jù)打分挑選最好的化合物,二是根據(jù)結(jié)合模式挑選,前者容易實現(xiàn),后者則比較困難。
D:結(jié)合模式的話會把關(guān)鍵氨基酸以及結(jié)合對關(guān)鍵氨基酸的影響考慮進去嗎?
殷賦科技:對,分為一般相互作用(比比如氫鍵、pi-pi堆積)和特殊相互作用(針對該體系的關(guān)鍵氨基酸及其作用),還有口袋形狀的匹配程度HH。
靶標預(yù)測圖G:大家有預(yù)測疾病靶點的那種圖嗎?我寫東西想用用。但是找不到啊。
F:舉個例子?
K:什么樣的圖?
殷賦科技 :大概要個網(wǎng)絡(luò)圖吧。
G:對就是網(wǎng)絡(luò)關(guān)系那種。
G:不用顯示具體的物質(zhì)。我就是想用一下這樣的圖。說明一下預(yù)測靶點。
殷賦科技:化合物在中間,周圍是潛在的蛋白靶標,遠近表示可能性大小。http://aAs.cytoscape.org/media/golorize/screenshots/Golorize.jpg。
更多資訊,請登錄www.yinfotek.com 或關(guān)注微信公眾號“殷賦科技”。我司建立了微信學(xué)術(shù)交流群,為生物醫(yī)藥領(lǐng)域的朋友搭建溝通交流的互動平臺。想入群的朋友,請在微信公眾號菜單欄輸入“加群”,根據(jù)提示操作即可。