计算化学公社»论坛首页 › 大杂烩 (Miscellaneous) › 编程、软件开发 (Developement) › 怎么用py从xml文件里提取数据

怎么用py从xml文件里提取数据

查看数: 4286 | 评论数: 7 | 收藏 Add to favorites 0

关灯 | 提示：支持键盘翻页<-左右->

帖子模式

biogon

发布时间: 2020-5-16 21:22

正文摘要:

本帖最后由 biogon 于 2020-5-16 21:25 编辑从测试仪器里导出数据的xml用excel没法处理，因为结构比较复杂不知道怎么用py提取指定位置的数据，求大神给点思路图给出了这个xml结构，要提取部分黑色的数字，每次 ...

回复 Reply

biogon 发表于 Post on 2020-5-18 14:57:01

心向暖阳发表于 2020-5-17 17:04
r = requests.get('https://gitee.com/komavideo/LearnPython3/tree/master/Lesson28')
soup=BeautifulSou ...

感谢提供思路

biogon 发表于 Post on 2020-5-18 14:56:49

卡开发发发表于 2020-5-16 22:04
除了上面提到的bs4，也可以用lxml的etree的xpath，更简单的是用xmltodict转换成字典。

用xmltodict搞好了

心向暖阳 发表于 Post on 2020-5-17 17:04:05

r = requests.get('https://gitee.com/komavideo/LearnPython3/tree/master/Lesson28')
soup=BeautifulSoup(r.text,'html.parser')
for k in soup.find_all('p'): #p是r.text中定义的标签
print(k.get_text())

卡开发发 发表于 Post on 2020-5-16 22:04:35

除了上面提到的bs4，也可以用lxml的etree的xpath，更简单的是用xmltodict转换成字典。

评分 Rate

参与人数 Participants 1	eV +5	收起理由 Reason
hebrewsnabla	+ 5

查看全部评分 View all ratings

hebrewsnabla 发表于 Post on 2020-5-16 21:52:45

用BeautifulSoup（bs4）

greedbob 发表于 Post on 2020-5-16 21:46:14

python中的beautifulsoup4库可以把xml文档解析为一个类，然后利用api访问和遍历子节点即可

liuyuje714 发表于 Post on 2020-5-16 21:26:34

你得说提取什么数据。这种结构显然用正则匹配靠谱。

		自动登录 Automatic login	找回密码 Forget password
密码 Password			注册 Register