|
student0618 发表于 2025-11-3 15:13 感谢你如此耐心的讲解! |
本帖最后由 student0618 于 2025-11-4 12:02 编辑 287192454 发表于 2025-11-3 14:33 不用想得太复杂。 要作类比的话,想想二氧化碳可以叫CO2, SMILES 是C(=O)=O。这几个写法包含的资讯量都不同。 延伸开去,想想我们用分子力场给每个原子及分子定义“一大堆参数”、或者量化给某个原子的基组、或者用ChemDraw画二维的分子式、或者是用GaussView/Avogadro建立三维的分子模型。 像“二氧化碳”和“CO2”都是代表分子的方法,分子编码也是一种代表分子的表示方式,是让电脑模型更容易处理数据的表示方式。 一楼的帖子就是在介绍不同的、方便电脑模型(尤其是AI模型)使用的,代表分子的方法,用layman's terms套用二氧化碳的示例就是“几种告诉电脑模型什么是CO2的方式,不同写法更适合用于什么目的”。好比以下一句“考试时用CO2代表二氧化碳可以节省1秒时间”。 |
| 参与人数Participants 1 | eV +5 | 收起 理由Reason |
|---|---|---|
|
| + 5 | 赞! |
student0618 发表于 2025-11-3 11:07 看了,看不懂,所以感觉害怕 |
本帖最后由 student0618 于 2025-11-3 11:08 编辑 287192454 发表于 2025-11-3 09:21 这没关係吧,真的有看一楼的文吗?用到分子编码的QSAR/QSPR等N年前就有了,25年前我博导第一位研究生就是和实验组合作用QSPR。 还有用来在database搜相似分子的方法都用到分子编码。 真要说AI不说分子编码的话,很多docking工具用到的 genetic algorithm 也可算是很早期有进化能力的AI。 利用AI结合研究或提高效率,还是把思考外包给AI,都取决于个人的。 |
| 所以AI会把计算化学饭碗给端走吗?可怕 |
| 讲的很好,但是如果能给一些实操案例就更好了 |
|
本帖最后由 student0618 于 2025-11-2 00:18 编辑 就算没用AI,跑传统高通量虚拟筛选前先用来filter database、后续看QSPR/QSAR、clustering analysis等,了解各编码还是很有用的。 从当年用来学高通量筛选,很旧的Open3DQSAR教程、到后来试用的TeachOpenCADD教程、deepchem库、目的是优化分子的各类continuous latent representation (encoder based),等等,都用到分子编码相关知识。很多老教程最后现在还会用到的不是它们的工具或 Algorithm,而是用分子编码处理database或分析结果、设计新分子的思路及方法。 |
手机版 Mobile version|北京科音自然科学研究中心 Beijing Kein Research Center for Natural Sciences|京公网安备 11010502035419号|计算化学公社 — 北京科音旗下高水平计算化学交流论坛 ( 京ICP备14038949号-1 )|网站地图
GMT+8, 2026-1-25 22:07 , Processed in 0.173985 second(s), 27 queries , Gzip On.