计算化学公社

 找回密码 Forget password
 注册 Register
Views: 3609|回复 Reply: 12
打印 Print 上一主题 Last thread 下一主题 Next thread

[科研杂谈] 求助:是否有类似OCR的分子结构式识别软件?

[复制链接 Copy URL]

19

帖子

0

威望

1350

eV
积分
1369

Level 4 (黑子)

跳转到指定楼层 Go to specific reply
楼主
最近需要整理课题组合成出来的有机分子,打算做成一个数据集,未来做一些AI预测相关工作。但是数量实在太多了,凭我一己之力不太好完成,想问问大家是不是有类似OCR文字识别的程序来截取文档中的有机分子结构式?求推荐哈!

1万

帖子

0

威望

7391

eV
积分
18144

Level 6 (一方通行)

2#
发表于 Post on 2021-8-24 20:57:26 | 只看该作者 Only view this author
如果有chemdraw源文件,从chemdraw转SMILES应该有现成工具,也比OCR可靠
BDF(https://bdf-manual.readthedocs.io/zh_CN/latest/Introduction.html)、ORCA(https://orcaforum.kofo.mpg.de/index.php)开发团队成员

19

帖子

0

威望

1350

eV
积分
1369

Level 4 (黑子)

3#
 楼主 Author| 发表于 Post on 2021-8-25 09:12:25 | 只看该作者 Only view this author
wzkchem5 发表于 2021-8-24 20:57
如果有chemdraw源文件,从chemdraw转SMILES应该有现成工具,也比OCR可靠

谢谢朋友的回答哈,确实可以处理一部分从Chemdraw出来的源文件,可能我的数据还是比较麻烦,因为还有一大部分师兄师姐们的分子是在pdf里面

1万

帖子

0

威望

7391

eV
积分
18144

Level 6 (一方通行)

4#
发表于 Post on 2021-8-25 15:41:47 | 只看该作者 Only view this author
Villain_IP 发表于 2021-8-25 02:12
谢谢朋友的回答哈,确实可以处理一部分从Chemdraw出来的源文件,可能我的数据还是比较麻烦,因为还有一大 ...

先找师兄师姐要一下chemdraw源文件吧,有源格式识别准确度肯定高一些
BDF(https://bdf-manual.readthedocs.io/zh_CN/latest/Introduction.html)、ORCA(https://orcaforum.kofo.mpg.de/index.php)开发团队成员

1632

帖子

4

威望

4088

eV
积分
5800

Level 6 (一方通行)

喵星人

5#
发表于 Post on 2021-8-25 19:10:36 | 只看该作者 Only view this author
最便宜可靠的方法,雇一群学生给你分分钟搞定

1万

帖子

0

威望

7391

eV
积分
18144

Level 6 (一方通行)

6#
发表于 Post on 2021-8-25 21:43:39 | 只看该作者 Only view this author
喵星大佬 发表于 2021-8-25 12:10
最便宜可靠的方法,雇一群学生给你分分钟搞定

有道理,楼主所在的学校如果有老师开化学信息学课的话,可以问那个老师能不能在讲SMILES的时候把这个留成作业,每个学生分几个分子,转SMILES。。。
BDF(https://bdf-manual.readthedocs.io/zh_CN/latest/Introduction.html)、ORCA(https://orcaforum.kofo.mpg.de/index.php)开发团队成员

1632

帖子

4

威望

4088

eV
积分
5800

Level 6 (一方通行)

喵星人

7#
发表于 Post on 2021-8-25 21:44:20 | 只看该作者 Only view this author
wzkchem5 发表于 2021-8-25 21:43
有道理,楼主所在的学校如果有老师开化学信息学课的话,可以问那个老师能不能在讲SMILES的时候把这个留成 ...

emmm。。。一肚子坏水wzk

19

帖子

0

威望

1350

eV
积分
1369

Level 4 (黑子)

8#
 楼主 Author| 发表于 Post on 2021-8-26 09:08:43 | 只看该作者 Only view this author
喵星大佬 发表于 2021-8-25 19:10
最便宜可靠的方法,雇一群学生给你分分钟搞定

好办法,LOL!

336

帖子

2

威望

4531

eV
积分
4907

Level 6 (一方通行)

9#
发表于 Post on 2021-8-26 12:46:56 | 只看该作者 Only view this author

10

帖子

0

威望

127

eV
积分
137

Level 2 能力者

10#
发表于 Post on 2021-8-27 11:25:31 | 只看该作者 Only view this author
本帖最后由 Andie 于 2021-8-27 11:30 编辑

确实有分子结构OCR识别软件,最近在逛某乎论坛搜到一个软件介绍,名字叫"Img2Chem",应该满足你想要的识别分子结构式的功能。我稍微拿了几个大环药物分子测试了一下,识别准确率还OK。看看适不适合你的体系。附上某乎链接:https://zhuanlan.zhihu.com/p/402508373
还有下载链接:http://chem.fulmz.com/img2chem.html?channelNumber=CSHOW

19

帖子

0

威望

1350

eV
积分
1369

Level 4 (黑子)

11#
 楼主 Author| 发表于 Post on 2021-8-27 18:11:52 | 只看该作者 Only view this author
Andie 发表于 2021-8-27 11:25
确实有分子结构OCR识别软件,最近在逛某乎论坛搜到一个软件介绍,名字叫"Img2Chem",应该满足你想要的识别 ...

恩人啊!~~~这款软件很好用,我的分子(多环结构)都能识别出来,基本不需要修改,牛啊!感恩!

19

帖子

0

威望

1350

eV
积分
1369

Level 4 (黑子)

12#
 楼主 Author| 发表于 Post on 2021-8-27 18:14:43 | 只看该作者 Only view this author

谢谢朋友的热心帮助,这个网址我试了一下,可能是我的网的问题,图片一直上传不成功  但没关系,在10#楼找到替代的程序了,感谢哈!

63

帖子

0

威望

474

eV
积分
537

Level 4 (黑子)

13#
发表于 Post on 2021-9-14 10:17:19 | 只看该作者 Only view this author
这个可能有吧。

本版积分规则 Credits rule

手机版 Mobile version|北京科音自然科学研究中心 Beijing Kein Research Center for Natural Sciences|京公网安备 11010502035419号|计算化学公社 — 北京科音旗下高水平计算化学交流论坛 ( 京ICP备14038949号-1 )|网站地图

GMT+8, 2024-11-23 10:54 , Processed in 0.179750 second(s), 21 queries , Gzip On.

快速回复 返回顶部 返回列表 Return to list