博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
使用BeautifulSoup处理XML文档
阅读量:5784 次
发布时间:2019-06-18

本文共 1598 字,大约阅读时间需要 5 分钟。

hot3.png

        最近需要用python处理一个简单的XML,因其格式较乱,恰巧为了测试BeautifulSoup,所以百度学习了下,发现大多数都是解析HTML的文章,所以翻文档大概笔记下,功能是实现了,但问题很多后期再说吧。

测试XML代码:

    
         
地址
         
北京西街
    
    
         
                寡妇墙.....         
    
    
         
姓名
         
小强
         
               
动物
               
人类
         
         
1
    

测试python代码

#coding=utf-8'''    简单测试BeautifulSoup解析XML'''from bs4 import BeautifulSoupimport re#使用BeautifulSoup以XML格式打开test.xml文件soup = BeautifulSoup(open('test.xml'),'xml')#格式化XML输出print soup.prettify()#查找所有叫param-value的tag子节点print "\n" +  "*"*20 + "\n"print soup.find_all('param-value')print "\n" +  "*"*20 + "\n"#打印出所有符合条件的子节点属性值for tag in soup.find_all('param-value'):	print tag.text.strip()print "\n" +  "*"*20 + "\n"#使用正则的方式查找符合条件的子节点for tag1 in soup.find_all(re.compile('param-value')):	print tag1.text.strip()

输出结果

 
  
   地址  
  
   北京西街  
 
 
  
   寡妇墙.....  
 
 
  
   姓名  
  
   小强  
  
   
    动物   
   
    人类   
  
  
   1  
 
********************[
北京西街
人类
]********************北京西街人类********************北京西街人类

转载于:https://my.oschina.net/u/1188877/blog/362734

你可能感兴趣的文章
GuavaCache缓存技术
查看>>
判断圆是否在矩形中
查看>>
将传入结构体 pMtInfo 中包含的数据内容转换成 JSON 字符串返回
查看>>
Error while performing database login with the ora
查看>>
OpenGl的glMatrixMode()函数理解
查看>>
java并发编程之:Queue
查看>>
ForkJoinPool多线程编程
查看>>
cocos2d-x
查看>>
Spring安全权限管理(Spring Security)
查看>>
驰骋工作流引擎-系统变量的引用
查看>>
php 写入access 的编码
查看>>
Smarge——基于HTML5 localStorage的key-value缓存框架
查看>>
JS继承实现Base类的源码解析
查看>>
idea git提交代码步骤
查看>>
html 网页文本设计
查看>>
head first设计模式概述
查看>>
利用Maven 自定义打包
查看>>
jQuery动画效果--mouseenter(),mouseleave();---(slide...
查看>>
TCP/IP四层网络模型和OSI七层模型
查看>>
10 Best HTML5 Development Tools For Web Develop...
查看>>