计算化学公社

 找回密码 Forget password
 注册 Register
Views: 4080|回复 Reply: 1
打印 Print 上一主题 Last thread 下一主题 Next thread

[虚拟筛选] Target Fishing|基于对比学习的药物-靶标相互作用预测工具

[复制链接 Copy URL]

6

帖子

0

威望

127

eV
积分
133

Level 2 能力者

本帖最后由 farfarcheng 于 2023-11-1 15:44 编辑
我们将在本期文章中带大家走进基于序列的药物-靶标相互作用预测工具 Target Fishing。目前 Target  Fishing 工具已上线 Bohrium® Apps 平台(https://app.bohrium.dp.tech/targetfishing),欢迎大家直接在网页端在线体验。本文将简要介绍反向找靶的算法,并引入相应的 App 使用教程。

反向找靶的实际需求

反向找靶的核心思想是从已知或潜在的药物分子出发,通过计算或实验手段,鉴定其可能的生物学靶点。这种方法具有以下优势:

1. 理解靶点作用机制,助力副反应研究
2. 解决耐药性问题,提高药物治疗效果
3. 探究新型药物靶点,拓宽药物应用领域
4. 实现药物再利用,为疾病治疗提供更多可能性

因此,反向找靶工具的需求十分广泛迫切,具有很高的实际价值。为实现反向找靶,研究人员开发了多种实验方法和计算工具

  • 实验方法包括基因敲除、亲和纯化、基于活性的探针分析、以化合物为中心的化学蛋白质组学等技术,直接观察药物分子与生物体系的相互作用,以确定靶点,这些方法结果可靠,但操作繁琐且成本较高。


    a) 基于活性的探针分析与以化合物为中心的化学蛋白质组学的找靶方法
    b) 不同类型化学蛋白质组学探针的一般分子结构 [1]

  • 计算方法主要依靠计算机模拟和数据挖掘技术,分析药物分子和潜在靶点之间的相互作用,从而预测可能的靶点,常见的找靶方法有:
    1、基于配体相似性
    2、基于机器学习
    3、基于受体结构反向对接
    4、基于药效团筛选
    这些方法具有高通量、高效、低成本等优点,但可能受到计算模型和数据质量的影响。


常见的基于配体或受体的反向找靶方法[2]

虽然实验结果依然是验证药物功能的金标准,但计算机预测药物与靶标的结合仍具备更快、更经济的优势。因此,在治疗候选药物的早期筛选中,计算机预测将继续发挥重要作用。准确的高通量计算预测药物与靶标的相互作用能够创造显著价值,指导并优先考虑有潜力的候选物进行实验筛选,从而助力药物研发。


化合物反向找靶工具 Target Fishing


深势科技通过结合蛋白预训练模型和对比学习方法,在大量参数调优的基础上,针对大规模化合物库和人类蛋白质组的部署与管理进行了优化,成功开发并部署了易于使用的反向找靶在线工具 Target Fishing。

蛋白质预训练模型有助于解决靶点与小分子结合训练数据有限的问题:通过无监督方式学习数亿种蛋白质上氨基酸序列的分布特征,生成基于序列的表示,更好地描述蛋白结构。对比学习则解决了药物与靶点结合结构中的特异性问题:将蛋白质与药物共同定位到一个共享的潜在空间中,这种协同嵌入加强了真正相互作用分子与诱饵之间的分离,实现广泛泛化与高特异性。

TargetFishing 在保证高准确度、未知数据广泛适应性以及诱饵化合物特异性的基础上,根据学习到的表征间距离预测结合情况,从而能够在大规模化合物库与人类蛋白质组规模上进行预测。后续还将接入深势科技的 3D 分子表征预训练模型 Uni-Mol,以进一步优化反向找靶工具的准确性。


Target Fishing@Apps

接下来,我们将为大家介绍 Target Fishing 是如何方便地在 Bohrium® Apps 的页面上提交化合物反向找靶预测任务的:

  • 打开网址 https://app.bohrium.dp.tech/targetfishing,可以自行选择 Guest 模式(仅浏览)或登录模式(支持任务提交);

  • 上传/编辑 化合物结构:支持直接输入/编辑 SMILES 或上传文件;
    a. SMILES
    b. SDF
  • 上传/选择 蛋白质数据库:可以上传包含多条氨基酸序列信息的 FASTA 文件,也可以直接选用内置的序列数据库;

    1)uniprotkb_human
    2)uniprotkb_mouse
    3)uniprotkb_rat
  • 输入任务名并提交任务;
  • 查看任务运行情况:在顶部标签栏点击My Jobs ,点击对应的 job name;
  • 查看计算结果:下拉至Job Workspace,点击 outputs,可通过:

    1)点击large_scale_run.tsv 在线查看预测结果
    2)下载 large_scale_run.tar.gz 解压后分析结果



计算结果将按照化合物作用的靶点的可能性高低进行默认排序。

结果参数解释:
1. Uniprot-ID(可跳转https://www.uniprot.org/查询靶点相关信息)
2. Probability(此结果中仅按相对排序,进行靶点选择即可,没有一个绝对的阈值)
3. ProteinSize(蛋白靶点氨基酸总数)
4. ProteinName(蛋白的完整名称,可依据已知适应症或实验信息,结合人为经验进行靶点评判)
5. GeneName(编码特定蛋白质靶点的基因的名称,可跳转https://www.genome.jp/kegg/  查询靶点相关信息)
6. Disease(已知的该靶点相关的疾病信息,可作为参考)
如想试用化合物反向找靶工具 Target Fishing, 亦或是不仅希望使用 Target Fishing 开展靶点预测工作,还想开展基于靶点和小分子的相关工作,例如 MM-GB/PBSA、自由能微扰 FEP 计算、虚拟筛选等综合评估和分析,欢迎联系我们。

阅读原文加入「Target Fishing 交流群」,与算法开发团队碰撞你的思考。



关于 Bohrium® Apps

Bohrium® Apps 是深势科技通过 MLOps 等新一代开发工具和基础设施,让算法代码可以快速上线为易用的应用,让新想法的验证效率从几个月缩短到几天。

开发者只需简单地修改算法运行入口的 Argument Parser 相关代码,便可以自动生成算法运行所需的丰富用户界面以及完整的 Job 管理运行、用户管理、数据管理、模型管理、性能评估、付费授权和结果可视化等周边全整套功能。

对于 App 用户来说,简单四个步骤提交任务,便可快速返回结果:
1. IO Options:配置输入文件
2. Job Options:设置变量
3. System Options:配置系统级参数
4. Review:所有配置参数的摘要

我们将在「NBHub App 专栏」持续为大家介绍更多 AI4S 应用,如想成为 App 开发者,请填写此表单申请加入 Bohrium Apps 开发者社区:https://dptechnology.feishu.cn/share/base/form/shrcn96VSkz0xFUjLTbaSNdgrwg


Reference:
[1] Chen, Xiao , et al. "Target identification of natural medicine with chemical proteomics approach: probe synthesis, target fishing and protein identification." Sig Transduct Target Ther 5, 72 (2020).
[2] Galati, S. , et al. "Recent Advances in In Silico Target Fishing. " Molecules 26.17(2021).




1

帖子

0

威望

11

eV
积分
12

Level 1 能力者

2#
发表于 Post on 2025-2-4 17:27:58 | 只看该作者 Only view this author
没有large_scale_run.tsv结果文件怎么办

本版积分规则 Credits rule

手机版 Mobile version|北京科音自然科学研究中心 Beijing Kein Research Center for Natural Sciences|京公网安备 11010502035419号|计算化学公社 — 北京科音旗下高水平计算化学交流论坛 ( 京ICP备14038949号-1 )|网站地图

GMT+8, 2026-2-20 07:19 , Processed in 0.215292 second(s), 29 queries , Gzip On.

快速回复 返回顶部 返回列表 Return to list