计算化学公社

标题: 关于开发核磁解谱软件的idea [打印本页]

作者
Author:
glycosylation    时间: 2025-8-21 14:37
标题: 关于开发核磁解谱软件的idea
坛子里是不是有很多编程水平很NB的佬?

突然的想法,如果开发一个MestReNova自动解谱的软件是不是可以赚大钱(采取订阅模式)或者发超高被引文章(要求利用该软件解谱而投稿的文章引用原文)?(当然也可以选择开源造福大众)

大概会点AI会做起来比较容易,当然不是大语言模型那种了,就得专业的模型。

之前去开了个材料相关的会议,有个做航空航天器件检测的佬,自己团队训练模型识别检测结果中的器件表面瑕疵,说比初级人工好很多,接近资深员工水平。

我想,用来解谱的话,靠谱的但凡涉及化学合成的文章里面,谱图要多少有多少,训练资源应该是够够的了。


作者
Author:
wzkchem5    时间: 2025-8-21 21:08
本帖最后由 wzkchem5 于 2025-8-21 21:09 编辑

必须得对待测物的结构有相当的了解才行。否则神仙来了也难解出一个物质是氯代物还是溴代物。难的可能不是解谱,而是让用户告诉软件,待测物可能具有哪些结构。而假如可以锁定为寥寥几个可能结构之一,那就不需要解谱软件了,分别对这几个结构做核磁计算然后和实验对比即可
作者
Author:
glycosylation    时间: 2025-8-22 09:31
wzkchem5 发表于 2025-8-21 21:08
必须得对待测物的结构有相当的了解才行。否则神仙来了也难解出一个物质是氯代物还是溴代物。难的可能不是解 ...

知道结构的情况下解谱其实也有用,写SI省时省力了。

当然能解谱更好,天然产物分离后结合质谱以及已知化合物数据快速分析。大大提高工作效率。

解结构的话倒不必一开始就追求完美,能从只含碳氢氧的结构开始就很厉害了,应用面也已经很广了。
甚至氮这种都可以后面再加,大佬提到的卤素区分不开可以先比如说用X这种通用符号表示这样。

===================================

核磁计算然后和谱图比对这个算力和分析谱图的算力比,后者要是能便宜很多那也有一定的意义。
作者
Author:
Graphite    时间: 2025-8-22 15:53
本帖最后由 Graphite 于 2025-8-24 16:05 编辑

代码只是工具,码代码现在不难,解谱也不是什么计算密集的任务,前端界面用AI辅助也快得很。

其实就是训练解谱的ML模型,前面有不少论文有研究基础了。但是做出开箱即用的产品的没见过多少。本质复杂度在解谱本身,附加复杂度在于推动项目。

模型训练部分无非还是数据收集、人工打标、训练、验证这些,是个劳动密集的工作。完了做出产品的话还需要找个中级水平的全栈程序员,比如用electron做桌面应用框架或者react.js做在线服务,当中分子可视化找基于three.js的成熟框架,做出UI/UX、测各种用户输入、边界条件这些。然后是推广和运营,后面这些对于产品来说占八成(这一点和复杂度是倒挂的)。
按照一般软件业来说一个组里面四五个人是要的,最理想情况来说几个到十几个人月这样。不过现实角度最后就是训练_搭脚手架+前端这些全是自己一个人+AI,最多必要时候找实习生打标做苦力,一通缝合做出来之后抓紧发个arxiv,然后小红书淘宝咸鱼微信公众号一通发广告,或者跟计算公司py一波让他们给你运营分账,如果产品质量可以+推广能起来就继续做,起不来就自己发论文玩XD


作者
Author:
Strange    时间: 2025-8-23 16:40
确实,从谱直接解但凡复杂点的化合物几乎是不可能的,至少得给出大概的反应,但感觉这其中涉及的太多了,对反应机理的理解,对一些特殊情况(dr,阻转等)也要有判断。个人觉得远远不是拿些文献里的化合物结构和谱练练就能自动解谱了
作者
Author:
glycosylation    时间: 2025-8-25 09:04
Graphite 发表于 2025-8-22 15:53
代码只是工具,码代码现在不难,解谱也不是什么计算密集的任务,前端界面用AI辅助也快得很。

其实就是训 ...

石墨佬专业!
作者
Author:
glycosylation    时间: 2025-8-25 09:13
Strange 发表于 2025-8-23 16:40
确实,从谱直接解但凡复杂点的化合物几乎是不可能的,至少得给出大概的反应,但感觉这其中涉及的太多了,对 ...

从谱直接解毕竟人都很难。
所以开发AI解谱也不会很简单,不过我觉得虽然没法一开始就做得很完美,但是开发出来的可能性是有的。
也不用一步到位,先从给AI结构AI能自动标峰做起慢慢积累就好。
楼上石墨佬说的打标我感觉在初期应该还算轻松,OL JOC的SI里有很多标好的(但是谱图不是核磁源文件,而是图片格式的,这个可能得识别一下。)
嘛实际开发过程中肯定不管怎样都会有一堆坑吧。
作者
Author:
Graphite    时间: 2025-8-25 16:31
glycosylation 发表于 2025-8-25 09:13
从谱直接解毕竟人都很难。
所以开发AI解谱也不会很简单,不过我觉得虽然没法一开始就做得很完美,但是开 ...

其实我觉得初期拿开源框架甚至训练好的模型,做个开源界面(套皮)也未尝不可,一方面是最小代价验证市场接受度,一方面也是对整个流程(包括技术、包括业务推广这些)积累经验。后面如果确实有戏,再自己捣鼓模型或者算法,逐步成熟化产品。

这年头能写两行代码或者训练个的模型太多了,但是大部分是没能推广出去,一部分人就是为了快速发个论文,一部分是没这个市场需要,产品的点不对,一部分是缺乏过程中的正反馈没坚持做下去
作者
Author:
student0618    时间: 2025-8-26 23:15
估计卖仪器的会先用海量in-house数据做出来,再跟NMR当配套软件打包发售。
作者
Author:
glycosylation    时间: 2025-9-9 19:08
student0618 发表于 2025-8-26 23:15
估计卖仪器的会先用海量in-house数据做出来,再跟NMR当配套软件打包发售。

那我希望MNova他们努努力~
作者
Author:
lanthanum    时间: 2025-9-10 00:35
请参考ACD Labs的解谱软件。https://www.acdlabs.com/products ... e-elucidator-suite/
作者
Author:
glycosylation    时间: 2025-9-11 09:21
lanthanum 发表于 2025-9-10 00:35
请参考ACD Labs的解谱软件。https://www.acdlabs.com/products/spectrus-platform/structure-elucidator-su ...

啊,果然我能想到的idea就一定会有人比我早想到吗?
作者
Author:
ShangChien    时间: 2025-9-11 21:09
利益相关,参与开发了一个在线免费的NMR服务,积极迭代中,目前特色功能如下:
网页服务https://www.bohrium.com/apps/nmr-toolbox
微信公告https://mp.weixin.qq.com/s/oJb15AeIQWZaC_nfHqZXZg




欢迎光临 计算化学公社 (http://bbs.keinsci.com/) Powered by Discuz! X3.3