计算化学公社

标题: DS藥效基團驗證和篩選問題 [已解決 補上解法] [打印本页]

作者
Author:
HarrisLin    时间: 2017-6-23 21:50
标题: DS藥效基團驗證和篩選問題 [已解決 補上解法]
本帖最后由 HarrisLin 于 2017-6-24 11:57 编辑



今天早上根據前輩建議回去仔細研究參數設定
發現其實是個很小的細節導致了(犯蠢

receptor-ligand pharmacophore驗證時要先利用browse 3D database開啟兩個active-ligand/decoys databases
但是我之前都只注意到不要開啟數目限制選all這樣會開出全部數量的分子(預設最多開300)
這次問題出在預設的output:one comformation
可是當初建模時放入1分子會產生255構型
也就是預設會自動捨去244構型
這邊調成all 就可以開出全部的n*255構型進行驗證

補充
不過這樣調整有個問題
首先是會導致active ligand/decoys被模型篩出的數量飆升(因為每個分子有255個機會)
因為飆升的主要是decoys 建模內建的驗證結果各種難看
建議搭配screen library使用會比較好
因為這個可以設定mapped energy threshold(預設20  我降至5)
可以大幅度壓制decoys篩選數量而對active ligand影響較小
能大幅拉抬GH score指標(我GH score 6.9>>8.8 一般認為0.7~0.8以上就代表是好模型)

另外就是全篩會導致運算時間過長
一開始建議用1分子1構型篩
篩出結果挑active ligand低/中 decoys 低/零這種模型
然後再去做全部1分子255構型的驗證篩選




Discovery Studio感覺有點冷門
不過因為這問題還蠻困擾的
所以上來請教一下

實驗目的是建立一個可以篩大型資料庫(NCI database)的蛋白-配體藥效基團模型
使用的建模方式是structure-based
預先從文件收集了82個active-ligand畫出2D模型
另外根據DUDE decoys網站準備了240左右的decoys
自NCI database下載約26萬個小分子
上述兩組小分子根據原廠建議以prepare ligand功能根據pH進行結構優化
然後以build 3D database功能建立3D database(comformation 255/best)

後續再建模過程中驗證分別放入active-ligand和decoys做驗證(flexible/omitted fiture=0)
此時驗證結果顯示模型可以從82個active-ligand篩正確篩出40個而自decoys誤篩10個(舉例

然後拿此模型去以篩大型資料庫的Search 3D database功能double check
卻發現此模型會從active-ligand資料庫篩出75個自decoys資料庫篩出170個
(search,screen and profile下的其他子功能都有同樣問題mapping/screen library/ligand profiler)

很明顯同一個模型在藥效建立時的驗證和Search 3D databas的精度明顯不同...
那我要怎樣才能用和建模時同樣嚴謹的方式去篩大型資料庫呢...

我目前想過一個比較蠢的補救方法就是大型資料庫篩完挑出候選後
把候選單獨做成一個一個active-ligand 3D database然後個別扔回建模步驟看能不能被篩出來...

想問問看板上的前輩們有沒有解決辦法
或者說DS建立的pharmacophore可以輸出去別的地方篩選呢?

謝謝



作者
Author:
霜晨月    时间: 2017-6-23 22:27
Search 3D database 这个 protocol 的精度应该也是可调的吧?
多年前用过DS(那时还是2.0)的药效团搜索,感觉速度很慢,甚至比分子对接还慢
如果你的计算资源足够(并且license token也足够),可以尝试并行筛选啊

作者
Author:
霜晨月    时间: 2017-6-23 22:30
另外,NCI的26万个分子,建议先用lipinsiki rule of 5或其他二维规则预筛一遍,这个速度很快,而且可以预筛掉不少分子,降低不少计算量
个人用docking的方法筛过几次NCI,其中很多分子类药性很差,完全没有筛选的价值,可以预筛掉

作者
Author:
HarrisLin    时间: 2017-6-23 22:52
霜晨月 发表于 2017-6-23 22:30
另外,NCI的26万个分子,建议先用lipinsiki rule of 5或其他二维规则预筛一遍,这个速度很快,而且可以预筛 ...


先感謝回答

台灣的代理商工程師跟我說建模後掃資料庫用ligand profiler
不過search 3D database其實就是預先建模後的ligand profiler

精度我在看看有什麼參數可以調好了
DS2016/2017跑起來蠻快的
掃250左右的database不用一分鐘

你說的篩選是指screen library嗎?
因為我曾經試過
效果差異不大

NCI有先篩過了lipinski和pH優化 大概剩21萬個
因為打算做起來放著給後人用
就不再用docking篩選
就先前掃過的經驗i7*6700大概半天掃完
作者
Author:
霜晨月    时间: 2017-6-23 22:57
HarrisLin 发表于 2017-6-23 22:52
先感謝回答

台灣的代理商工程師跟我說建模後掃資料庫用ligand profiler

如果速度不是很慢的话,那你可以用你建模验证时的protocol去筛你的NCI library啊
作者
Author:
HarrisLin    时间: 2017-6-23 23:07
霜晨月 发表于 2017-6-23 22:57
如果速度不是很慢的话,那你可以用你建模验证时的protocol去筛你的NCI library啊

建模時的驗證
是包含在receptor-ligand pharmacophore generation裡面的
可能沒辦法拆出來

還是你的意思是說
我直接把整個NCI database扔進去active ligand選項這樣驗證嗎?
不過這會有另外一個問題
因為建模時的驗證他只會告訴你數量
但沒辦法看確切是那些分子(攤手
不論是report或是輸出的result output資料夾裡都沒有
所以我才考慮挑到最後  才作成一個一個單一的active ligand database回去建模驗證
作者
Author:
霜晨月    时间: 2017-6-23 23:42
哦,这样啊  我也爱莫能助
作者
Author:
greatzdk    时间: 2017-6-24 10:10
药效团本来就是很粗糙的模型,严谨的意义不大
作者
Author:
HarrisLin    时间: 2017-6-24 11:57
已解決 謝謝各位




欢迎光临 计算化学公社 (http://bbs.keinsci.com/) Powered by Discuz! X3.3