计算化学公社

 找回密码 Forget password
 注册 Register
Views: 769|回复 Reply: 12
打印 Print 上一主题 Last thread 下一主题 Next thread

[科研杂谈] 关于开发核磁解谱软件的idea

[复制链接 Copy URL]

52

帖子

0

威望

234

eV
积分
286

Level 3 能力者

跳转到指定楼层 Go to specific reply
楼主
坛子里是不是有很多编程水平很NB的佬?

突然的想法,如果开发一个MestReNova自动解谱的软件是不是可以赚大钱(采取订阅模式)或者发超高被引文章(要求利用该软件解谱而投稿的文章引用原文)?(当然也可以选择开源造福大众)

大概会点AI会做起来比较容易,当然不是大语言模型那种了,就得专业的模型。

之前去开了个材料相关的会议,有个做航空航天器件检测的佬,自己团队训练模型识别检测结果中的器件表面瑕疵,说比初级人工好很多,接近资深员工水平。

我想,用来解谱的话,靠谱的但凡涉及化学合成的文章里面,谱图要多少有多少,训练资源应该是够够的了。

1万

帖子

0

威望

9739

eV
积分
21935

Level 6 (一方通行)

2#
发表于 Post on 2025-8-21 21:08:22 | 只看该作者 Only view this author
本帖最后由 wzkchem5 于 2025-8-21 21:09 编辑

必须得对待测物的结构有相当的了解才行。否则神仙来了也难解出一个物质是氯代物还是溴代物。难的可能不是解谱,而是让用户告诉软件,待测物可能具有哪些结构。而假如可以锁定为寥寥几个可能结构之一,那就不需要解谱软件了,分别对这几个结构做核磁计算然后和实验对比即可
Zikuan Wang
山东大学光学高等研究中心 研究员
BDF(https://bdf-manual.readthedocs.io/zh_CN/latest/Introduction.html)、ORCA(https://orcaforum.kofo.mpg.de/index.php)开发团队成员
Google Scholar: https://scholar.google.com/citations?user=XW6C6eQAAAAJ
ORCID: https://orcid.org/0000-0002-4540-8734
主页:http://www.qitcs.qd.sdu.edu.cn/info/1133/1776.htm
GitHub:https://github.com/wzkchem5
本团队长期招收研究生,有意者可私信联系

52

帖子

0

威望

234

eV
积分
286

Level 3 能力者

3#
 楼主 Author| 发表于 Post on 2025-8-22 09:31:43 | 只看该作者 Only view this author
wzkchem5 发表于 2025-8-21 21:08
必须得对待测物的结构有相当的了解才行。否则神仙来了也难解出一个物质是氯代物还是溴代物。难的可能不是解 ...

知道结构的情况下解谱其实也有用,写SI省时省力了。

当然能解谱更好,天然产物分离后结合质谱以及已知化合物数据快速分析。大大提高工作效率。

解结构的话倒不必一开始就追求完美,能从只含碳氢氧的结构开始就很厉害了,应用面也已经很广了。
甚至氮这种都可以后面再加,大佬提到的卤素区分不开可以先比如说用X这种通用符号表示这样。

===================================

核磁计算然后和谱图比对这个算力和分析谱图的算力比,后者要是能便宜很多那也有一定的意义。

431

帖子

8

威望

4280

eV
积分
4871

Level 6 (一方通行)

石墨

4#
发表于 Post on 2025-8-22 15:53:39 | 只看该作者 Only view this author
本帖最后由 Graphite 于 2025-8-24 16:05 编辑

代码只是工具,码代码现在不难,解谱也不是什么计算密集的任务,前端界面用AI辅助也快得很。

其实就是训练解谱的ML模型,前面有不少论文有研究基础了。但是做出开箱即用的产品的没见过多少。本质复杂度在解谱本身,附加复杂度在于推动项目。

模型训练部分无非还是数据收集、人工打标、训练、验证这些,是个劳动密集的工作。完了做出产品的话还需要找个中级水平的全栈程序员,比如用electron做桌面应用框架或者react.js做在线服务,当中分子可视化找基于three.js的成熟框架,做出UI/UX、测各种用户输入、边界条件这些。然后是推广和运营,后面这些对于产品来说占八成(这一点和复杂度是倒挂的)。
按照一般软件业来说一个组里面四五个人是要的,最理想情况来说几个到十几个人月这样。不过现实角度最后就是训练_搭脚手架+前端这些全是自己一个人+AI,最多必要时候找实习生打标做苦力,一通缝合做出来之后抓紧发个arxiv,然后小红书淘宝咸鱼微信公众号一通发广告,或者跟计算公司py一波让他们给你运营分账,如果产品质量可以+推广能起来就继续做,起不来就自己发论文玩XD

评分 Rate

参与人数
Participants 1
eV +5 收起 理由
Reason
glycosylation + 5 谢谢

查看全部评分 View all ratings

自在飞花轻似梦,无边丝雨细如愁。

全自动反应动力学(ReaxFF、AIMD、NEP等)后处理工具网页版:http://cc-portal.xyz/reax_tools

71

帖子

0

威望

1187

eV
积分
1258

Level 4 (黑子)

5#
发表于 Post on 2025-8-23 16:40:40 | 只看该作者 Only view this author
确实,从谱直接解但凡复杂点的化合物几乎是不可能的,至少得给出大概的反应,但感觉这其中涉及的太多了,对反应机理的理解,对一些特殊情况(dr,阻转等)也要有判断。个人觉得远远不是拿些文献里的化合物结构和谱练练就能自动解谱了

52

帖子

0

威望

234

eV
积分
286

Level 3 能力者

6#
 楼主 Author| 发表于 Post on 2025-8-25 09:04:14 | 只看该作者 Only view this author
Graphite 发表于 2025-8-22 15:53
代码只是工具,码代码现在不难,解谱也不是什么计算密集的任务,前端界面用AI辅助也快得很。

其实就是训 ...

石墨佬专业!

52

帖子

0

威望

234

eV
积分
286

Level 3 能力者

7#
 楼主 Author| 发表于 Post on 2025-8-25 09:13:40 | 只看该作者 Only view this author
Strange 发表于 2025-8-23 16:40
确实,从谱直接解但凡复杂点的化合物几乎是不可能的,至少得给出大概的反应,但感觉这其中涉及的太多了,对 ...

从谱直接解毕竟人都很难。
所以开发AI解谱也不会很简单,不过我觉得虽然没法一开始就做得很完美,但是开发出来的可能性是有的。
也不用一步到位,先从给AI结构AI能自动标峰做起慢慢积累就好。
楼上石墨佬说的打标我感觉在初期应该还算轻松,OL JOC的SI里有很多标好的(但是谱图不是核磁源文件,而是图片格式的,这个可能得识别一下。)
嘛实际开发过程中肯定不管怎样都会有一堆坑吧。

431

帖子

8

威望

4280

eV
积分
4871

Level 6 (一方通行)

石墨

8#
发表于 Post on 2025-8-25 16:31:42 | 只看该作者 Only view this author
glycosylation 发表于 2025-8-25 09:13
从谱直接解毕竟人都很难。
所以开发AI解谱也不会很简单,不过我觉得虽然没法一开始就做得很完美,但是开 ...

其实我觉得初期拿开源框架甚至训练好的模型,做个开源界面(套皮)也未尝不可,一方面是最小代价验证市场接受度,一方面也是对整个流程(包括技术、包括业务推广这些)积累经验。后面如果确实有戏,再自己捣鼓模型或者算法,逐步成熟化产品。

这年头能写两行代码或者训练个的模型太多了,但是大部分是没能推广出去,一部分人就是为了快速发个论文,一部分是没这个市场需要,产品的点不对,一部分是缺乏过程中的正反馈没坚持做下去

评分 Rate

参与人数
Participants 1
eV +5 收起 理由
Reason
glycosylation + 5 确实,我主要是代码一窍不通……就抛砖引玉.

查看全部评分 View all ratings

自在飞花轻似梦,无边丝雨细如愁。

全自动反应动力学(ReaxFF、AIMD、NEP等)后处理工具网页版:http://cc-portal.xyz/reax_tools

849

帖子

4

威望

1915

eV
积分
2844

Level 5 (御坂)

A Student

9#
发表于 Post on 2025-8-26 23:15:04 | 只看该作者 Only view this author
估计卖仪器的会先用海量in-house数据做出来,再跟NMR当配套软件打包发售。
敬仰一针见血的指责,厌倦别有用心的赞美。

52

帖子

0

威望

234

eV
积分
286

Level 3 能力者

10#
 楼主 Author| 发表于 Post on 2025-9-9 19:08:26 | 只看该作者 Only view this author
student0618 发表于 2025-8-26 23:15
估计卖仪器的会先用海量in-house数据做出来,再跟NMR当配套软件打包发售。

那我希望MNova他们努努力~

92

帖子

0

威望

4123

eV
积分
4215

Level 6 (一方通行)

11#
发表于 Post on 2025-9-10 00:35:28 | 只看该作者 Only view this author

52

帖子

0

威望

234

eV
积分
286

Level 3 能力者

12#
 楼主 Author| 发表于 Post on 2025-9-11 09:21:37 | 只看该作者 Only view this author
lanthanum 发表于 2025-9-10 00:35
请参考ACD Labs的解谱软件。https://www.acdlabs.com/products/spectrus-platform/structure-elucidator-su ...

啊,果然我能想到的idea就一定会有人比我早想到吗?

评分 Rate

参与人数
Participants 1
eV +5 收起 理由
Reason
北大-陶豫 + 5 你太可爱

查看全部评分 View all ratings

70

帖子

0

威望

1234

eV
积分
1304

Level 4 (黑子)

13#
发表于 Post on 2025-9-11 21:09:39 | 只看该作者 Only view this author
利益相关,参与开发了一个在线免费的NMR服务,积极迭代中,目前特色功能如下:
  • 搜库(database search)
  • NMR谱分子推断(structure elucidation)
  • 化学位移预测和谱比对(prediction & matching)
网页服务https://www.bohrium.com/apps/nmr-toolbox
微信公告https://mp.weixin.qq.com/s/oJb15AeIQWZaC_nfHqZXZg

评分 Rate

参与人数
Participants 1
eV +5 收起 理由
Reason
lanthanum + 5 牛!

查看全部评分 View all ratings

本版积分规则 Credits rule

手机版 Mobile version|北京科音自然科学研究中心 Beijing Kein Research Center for Natural Sciences|京公网安备 11010502035419号|计算化学公社 — 北京科音旗下高水平计算化学交流论坛 ( 京ICP备14038949号-1 )|网站地图

GMT+8, 2026-1-23 18:12 , Processed in 0.165295 second(s), 21 queries , Gzip On.

快速回复 返回顶部 返回列表 Return to list