心向暖阳 发表于 2020-5-17 17:04 感谢提供思路 |
卡开发发 发表于 2020-5-16 22:04 用xmltodict搞好了 |
r = requests.get('https://gitee.com/komavideo/LearnPython3/tree/master/Lesson28') soup=BeautifulSoup(r.text,'html.parser') for k in soup.find_all('p'): #p是r.text中定义的标签 print(k.get_text()) |
除了上面提到的bs4,也可以用lxml的etree的xpath,更简单的是用xmltodict转换成字典。 |
参与人数Participants 1 | eV +5 | 收起 理由Reason |
---|---|---|
hebrewsnabla | + 5 |
用BeautifulSoup(bs4) |
python中的beautifulsoup4库可以把xml文档解析为一个类,然后利用api访问和遍历子节点即可 |
你得说提取什么数据。这种结构显然用正则匹配靠谱。 |
手机版 Mobile version|北京科音自然科学研究中心 Beijing Kein Research Center for Natural Sciences|京公网安备 11010502035419号|计算化学公社 — 北京科音旗下高水平计算化学交流论坛 ( 京ICP备14038949号-1 )|网站地图
GMT+8, 2024-11-24 11:54 , Processed in 0.238567 second(s), 27 queries , Gzip On.