计算化学公社

 找回密码 Forget password
 注册 Register

怎么用py从xml文件里提取数据

查看数: 3518 | 评论数: 7 | 收藏 Add to favorites 0
关灯 | 提示:支持键盘翻页<-左 右->
    组图打开中,请稍候......
发布时间: 2020-5-16 21:22

正文摘要:

本帖最后由 biogon 于 2020-5-16 21:25 编辑 从测试仪器里导出数据的xml用excel没法处理,因为结构比较复杂不知道怎么用py提取指定位置的数据,求大神给点思路 图给出了这个xml结构,要提取部分黑色的数字,每次 ...

回复 Reply

biogon 发表于 Post on 2020-5-18 14:57:01
心向暖阳 发表于 2020-5-17 17:04
r = requests.get('https://gitee.com/komavideo/LearnPython3/tree/master/Lesson28')
soup=BeautifulSou ...

感谢提供思路
biogon 发表于 Post on 2020-5-18 14:56:49
卡开发发 发表于 2020-5-16 22:04
除了上面提到的bs4,也可以用lxml的etree的xpath,更简单的是用xmltodict转换成字典。

用xmltodict搞好了
心向暖阳 发表于 Post on 2020-5-17 17:04:05
r = requests.get('https://gitee.com/komavideo/LearnPython3/tree/master/Lesson28')
soup=BeautifulSoup(r.text,'html.parser')
for k in soup.find_all('p'):   #p是r.text中定义的标签
    print(k.get_text())
卡开发发 发表于 Post on 2020-5-16 22:04:35
除了上面提到的bs4,也可以用lxml的etree的xpath,更简单的是用xmltodict转换成字典。

评分 Rate

参与人数
Participants 1
eV +5 收起 理由
Reason
hebrewsnabla + 5

查看全部评分 View all ratings

hebrewsnabla 发表于 Post on 2020-5-16 21:52:45
用BeautifulSoup(bs4)
greedbob 发表于 Post on 2020-5-16 21:46:14
python中的beautifulsoup4库可以把xml文档解析为一个类,然后利用api访问和遍历子节点即可
liuyuje714 发表于 Post on 2020-5-16 21:26:34
你得说提取什么数据。这种结构显然用正则匹配靠谱。

手机版 Mobile version|北京科音自然科学研究中心 Beijing Kein Research Center for Natural Sciences|京公网安备 11010502035419号|计算化学公社 — 北京科音旗下高水平计算化学交流论坛 ( 京ICP备14038949号-1 )|网站地图

GMT+8, 2024-11-24 11:54 , Processed in 0.238567 second(s), 27 queries , Gzip On.

快速回复 返回顶部 返回列表 Return to list