计算化学公社

标题: 怎么用py从xml文件里提取数据 [打印本页]

作者
Author: biogon 时间: 2020-5-16 21:22
标题: 怎么用py从xml文件里提取数据
本帖最后由 biogon 于 2020-5-16 21:25 编辑

从测试仪器里导出数据的xml用excel没法处理，因为结构比较复杂不知道怎么用py提取指定位置的数据，求大神给点思路
图给出了这个xml结构，要提取部分黑色的数字，每次都提取同一个位置的

作者
Author: liuyuje714 时间: 2020-5-16 21:26
你得说提取什么数据。这种结构显然用正则匹配靠谱。

作者
Author: greedbob 时间: 2020-5-16 21:46
python中的beautifulsoup4库可以把xml文档解析为一个类，然后利用api访问和遍历子节点即可

作者
Author: hebrewsnabla 时间: 2020-5-16 21:52
用BeautifulSoup（bs4）

作者
Author: 卡开发发 时间: 2020-5-16 22:04
除了上面提到的bs4，也可以用lxml的etree的xpath，更简单的是用xmltodict转换成字典。

作者
Author: 心向暖阳 时间: 2020-5-17 17:04
r = requests.get('https://gitee.com/komavideo/LearnPython3/tree/master/Lesson28')
soup=BeautifulSoup(r.text,'html.parser')
for k in soup.find_all('p'): #p是r.text中定义的标签
print(k.get_text())

作者
Author: biogon 时间: 2020-5-18 14:56

卡开发发发表于 2020-5-16 22:04
除了上面提到的bs4，也可以用lxml的etree的xpath，更简单的是用xmltodict转换成字典。

用xmltodict搞好了

作者
Author: biogon 时间: 2020-5-18 14:57

心向暖阳发表于 2020-5-17 17:04
r = requests.get('https://gitee.com/komavideo/LearnPython3/tree/master/Lesson28')
soup=BeautifulSou ...

感谢提供思路

欢迎光临计算化学公社 (http://bbs.keinsci.com/)