计算化学公社

标题: 求助:是否有类似OCR的分子结构式识别软件? [打印本页]

作者
Author:
Villain_IP    时间: 2021-8-24 20:20
标题: 求助:是否有类似OCR的分子结构式识别软件?
最近需要整理课题组合成出来的有机分子,打算做成一个数据集,未来做一些AI预测相关工作。但是数量实在太多了,凭我一己之力不太好完成,想问问大家是不是有类似OCR文字识别的程序来截取文档中的有机分子结构式?求推荐哈!

作者
Author:
wzkchem5    时间: 2021-8-24 20:57
如果有chemdraw源文件,从chemdraw转SMILES应该有现成工具,也比OCR可靠
作者
Author:
Villain_IP    时间: 2021-8-25 09:12
wzkchem5 发表于 2021-8-24 20:57
如果有chemdraw源文件,从chemdraw转SMILES应该有现成工具,也比OCR可靠

谢谢朋友的回答哈,确实可以处理一部分从Chemdraw出来的源文件,可能我的数据还是比较麻烦,因为还有一大部分师兄师姐们的分子是在pdf里面
作者
Author:
wzkchem5    时间: 2021-8-25 15:41
Villain_IP 发表于 2021-8-25 02:12
谢谢朋友的回答哈,确实可以处理一部分从Chemdraw出来的源文件,可能我的数据还是比较麻烦,因为还有一大 ...

先找师兄师姐要一下chemdraw源文件吧,有源格式识别准确度肯定高一些
作者
Author:
喵星大佬    时间: 2021-8-25 19:10
最便宜可靠的方法,雇一群学生给你分分钟搞定
作者
Author:
wzkchem5    时间: 2021-8-25 21:43
喵星大佬 发表于 2021-8-25 12:10
最便宜可靠的方法,雇一群学生给你分分钟搞定

有道理,楼主所在的学校如果有老师开化学信息学课的话,可以问那个老师能不能在讲SMILES的时候把这个留成作业,每个学生分几个分子,转SMILES。。。
作者
Author:
喵星大佬    时间: 2021-8-25 21:44
wzkchem5 发表于 2021-8-25 21:43
有道理,楼主所在的学校如果有老师开化学信息学课的话,可以问那个老师能不能在讲SMILES的时候把这个留成 ...

emmm。。。一肚子坏水wzk
作者
Author:
Villain_IP    时间: 2021-8-26 09:08
喵星大佬 发表于 2021-8-25 19:10
最便宜可靠的方法,雇一群学生给你分分钟搞定

好办法,LOL!
作者
Author:
greatzdk    时间: 2021-8-26 12:46
https://cactus.nci.nih.gov/cgi-bin/osra/index.cgi
作者
Author:
Andie    时间: 2021-8-27 11:25
本帖最后由 Andie 于 2021-8-27 11:30 编辑

确实有分子结构OCR识别软件,最近在逛某乎论坛搜到一个软件介绍,名字叫"Img2Chem",应该满足你想要的识别分子结构式的功能。我稍微拿了几个大环药物分子测试了一下,识别准确率还OK。看看适不适合你的体系。附上某乎链接:https://zhuanlan.zhihu.com/p/402508373
还有下载链接:http://chem.fulmz.com/img2chem.html?channelNumber=CSHOW

作者
Author:
Villain_IP    时间: 2021-8-27 18:11
Andie 发表于 2021-8-27 11:25
确实有分子结构OCR识别软件,最近在逛某乎论坛搜到一个软件介绍,名字叫"Img2Chem",应该满足你想要的识别 ...

恩人啊!~~~这款软件很好用,我的分子(多环结构)都能识别出来,基本不需要修改,牛啊!感恩!
作者
Author:
Villain_IP    时间: 2021-8-27 18:14
greatzdk 发表于 2021-8-26 12:46
https://cactus.nci.nih.gov/cgi-bin/osra/index.cgi

谢谢朋友的热心帮助,这个网址我试了一下,可能是我的网的问题,图片一直上传不成功  但没关系,在10#楼找到替代的程序了,感谢哈!
作者
Author:
qq0057655320    时间: 2021-9-14 10:17
这个可能有吧。




欢迎光临 计算化学公社 (http://bbs.keinsci.com/) Powered by Discuz! X3.3