计算化学公社

标题: 怎么用py从xml文件里提取数据 [打印本页]

作者
Author:
biogon    时间: 2020-5-16 21:22
标题: 怎么用py从xml文件里提取数据
本帖最后由 biogon 于 2020-5-16 21:25 编辑

从测试仪器里导出数据的xml用excel没法处理,因为结构比较复杂不知道怎么用py提取指定位置的数据,求大神给点思路
图给出了这个xml结构,要提取部分黑色的数字,每次都提取同一个位置的


作者
Author:
liuyuje714    时间: 2020-5-16 21:26
你得说提取什么数据。这种结构显然用正则匹配靠谱。
作者
Author:
greedbob    时间: 2020-5-16 21:46
python中的beautifulsoup4库可以把xml文档解析为一个类,然后利用api访问和遍历子节点即可
作者
Author:
hebrewsnabla    时间: 2020-5-16 21:52
用BeautifulSoup(bs4)
作者
Author:
卡开发发    时间: 2020-5-16 22:04
除了上面提到的bs4,也可以用lxml的etree的xpath,更简单的是用xmltodict转换成字典。
作者
Author:
心向暖阳    时间: 2020-5-17 17:04
r = requests.get('https://gitee.com/komavideo/LearnPython3/tree/master/Lesson28')
soup=BeautifulSoup(r.text,'html.parser')
for k in soup.find_all('p'):   #p是r.text中定义的标签
    print(k.get_text())
作者
Author:
biogon    时间: 2020-5-18 14:56
卡开发发 发表于 2020-5-16 22:04
除了上面提到的bs4,也可以用lxml的etree的xpath,更简单的是用xmltodict转换成字典。

用xmltodict搞好了
作者
Author:
biogon    时间: 2020-5-18 14:57
心向暖阳 发表于 2020-5-17 17:04
r = requests.get('https://gitee.com/komavideo/LearnPython3/tree/master/Lesson28')
soup=BeautifulSou ...

感谢提供思路




欢迎光临 计算化学公社 (http://bbs.keinsci.com/) Powered by Discuz! X3.3