计算化学公社

 找回密码 Forget password
 注册 Register
Views: 3517|回复 Reply: 7
打印 Print 上一主题 Last thread 下一主题 Next thread

[Python] 怎么用py从xml文件里提取数据

[复制链接 Copy URL]

1236

帖子

1

威望

3495

eV
积分
4751

Level 6 (一方通行)

本帖最后由 biogon 于 2020-5-16 21:25 编辑

从测试仪器里导出数据的xml用excel没法处理,因为结构比较复杂不知道怎么用py提取指定位置的数据,求大神给点思路
图给出了这个xml结构,要提取部分黑色的数字,每次都提取同一个位置的

M2]~`H~[70T@0VI6{XEF2CJ.png (118.09 KB, 下载次数 Times of downloads: 81)

M2]~`H~[70T@0VI6{XEF2CJ.png

1236

帖子

1

威望

3495

eV
积分
4751

Level 6 (一方通行)

8#
 楼主 Author| 发表于 Post on 2020-5-18 14:57:01 | 只看该作者 Only view this author
心向暖阳 发表于 2020-5-17 17:04
r = requests.get('https://gitee.com/komavideo/LearnPython3/tree/master/Lesson28')
soup=BeautifulSou ...

感谢提供思路

1236

帖子

1

威望

3495

eV
积分
4751

Level 6 (一方通行)

7#
 楼主 Author| 发表于 Post on 2020-5-18 14:56:49 | 只看该作者 Only view this author
卡开发发 发表于 2020-5-16 22:04
除了上面提到的bs4,也可以用lxml的etree的xpath,更简单的是用xmltodict转换成字典。

用xmltodict搞好了

68

帖子

0

威望

1637

eV
积分
1705

Level 5 (御坂)

6#
发表于 Post on 2020-5-17 17:04:05 | 只看该作者 Only view this author
r = requests.get('https://gitee.com/komavideo/LearnPython3/tree/master/Lesson28')
soup=BeautifulSoup(r.text,'html.parser')
for k in soup.find_all('p'):   #p是r.text中定义的标签
    print(k.get_text())

3621

帖子

3

威望

1万

eV
积分
18429

Level 6 (一方通行)

第一原理惨品小作坊

5#
发表于 Post on 2020-5-16 22:04:35 | 只看该作者 Only view this author
除了上面提到的bs4,也可以用lxml的etree的xpath,更简单的是用xmltodict转换成字典。

评分 Rate

参与人数
Participants 1
eV +5 收起 理由
Reason
hebrewsnabla + 5

查看全部评分 View all ratings

日常打哑谜&&探寻更多可能。
原理问题不公开讨论,非商业性质讨论欢迎私聊。
本周忙

831

帖子

1

威望

7185

eV
积分
8036

Level 6 (一方通行)

4#
发表于 Post on 2020-5-16 21:52:45 | 只看该作者 Only view this author
用BeautifulSoup(bs4)

8

帖子

0

威望

564

eV
积分
572

Level 4 (黑子)

3#
发表于 Post on 2020-5-16 21:46:14 | 只看该作者 Only view this author
python中的beautifulsoup4库可以把xml文档解析为一个类,然后利用api访问和遍历子节点即可

183

帖子

4

威望

1599

eV
积分
1862

Level 5 (御坂)

2#
发表于 Post on 2020-5-16 21:26:34 | 只看该作者 Only view this author
你得说提取什么数据。这种结构显然用正则匹配靠谱。

手机版 Mobile version|北京科音自然科学研究中心 Beijing Kein Research Center for Natural Sciences|京公网安备 11010502035419号|计算化学公社 — 北京科音旗下高水平计算化学交流论坛 ( 京ICP备14038949号-1 )|网站地图

GMT+8, 2024-11-24 11:40 , Processed in 0.677211 second(s), 26 queries , Gzip On.

快速回复 返回顶部 返回列表 Return to list