python 解析XML python模塊xml.dom解析xml實(shí)例代碼
一 、python模塊 xml.dom 解析XML的API
minidom.parse(filename)
加載讀取XML文件
doc.documentElement
獲取XML文檔對象
node.getAttribute(AttributeName)
獲取XML節(jié)點(diǎn)屬性值
node.getElementsByTagName(TagName)
獲取XML節(jié)點(diǎn)對象集合
node.childNodes #返回子節(jié)點(diǎn)列表。
node.childNodes[index].nodeValue
獲取XML節(jié)點(diǎn)值
node.firstChild
#訪問第一個(gè)節(jié)點(diǎn)。等價(jià)于pagexml.childNodes[0]
doc = minidom.parse(filename)
doc.toxml('UTF-8')
返回Node節(jié)點(diǎn)的xml表示的文本
Node.attributes["id"]
a.name #就是上面的 "id"
a.value #屬性的值
訪問元素屬性
二、python解析xml文件的實(shí)例代碼
1、創(chuàng)建user.xml文件,添加XMl節(jié)點(diǎn)
<?xml version="1.0" encoding="UTF-8" ?>
<users>
<user id="1000001">
<username>Admin</username>
<email>admin@live.cn</email>
<age>23</age>
<sex>男</sex>
</user>
<user id="1000002">
<username>Admin2</username>
<email>admin2@live.cn</email>
<age>22</age>
<sex>男</sex>
</user>
<user id="1000003">
<username>Admin3</username>
<email>admin3@live.cn</email>
<age>27</age>
<sex>男</sex>
</user>
<user id="1000004">
<username>Admin4</username>
<email>admin4@live.cn</email>
<age>25</age>
<sex>女</sex>
</user>
<user id="1000005">
<username>Admin5</username>
<email>admin5@live.cn</email>
<age>20</age>
<sex>男</sex>
</user>
<user id="1000006">
<username>Admin6</username>
<email>admin6@live.cn</email>
<age>23</age>
<sex>女</sex>
</user>
</users>
2、Demo.py解析user.xml文檔數(shù)據(jù)
# -*- coding:utf-8 -*-
"""
* User: lhj588
* Date: 11-11-9
* Time: 13:20
* Desc:
"""
from xml.dom import minidom
def get_attrvalue(node, attrname):
return node.getAttribute(attrname) if node else ''
def get_nodevalue(node, index = 0):
return node.childNodes[index].nodeValue if node else ''
def get_xmlnode(node,name):
return node.getElementsByTagName(name) if node else []
def xml_to_string(filename='user.xml'):
doc = minidom.parse(filename)
return doc.toxml('UTF-8')
def get_xml_data(filename='user.xml'):
doc = minidom.parse(filename)
root = doc.documentElement
user_nodes = get_xmlnode(root,'user')
user_list=[]
for node in user_nodes:
user_id = get_attrvalue(node,'id')
node_name = get_xmlnode(node,'username')
node_email = get_xmlnode(node,'email')
node_age = get_xmlnode(node,'age')
node_sex = get_xmlnode(node,'sex')
user_name =get_nodevalue(node_name[0]).encode('utf-8','ignore')
user_email = get_nodevalue(node_email[0]).encode('utf-8','ignore')
user_age = int(get_nodevalue(node_age[0]))
user_sex = get_nodevalue(node_sex[0]).encode('utf-8','ignore')
user = {}
user['id'] , user['username'] , user['email'] , user['age'] , user['sex'] = (
int(user_id), user_name , user_email , user_age , user_sex
)
user_list.append(user)
return user_list
def test_xmltostring():
print xml_to_string()
def test_laod_xml():
user_list = get_xml_data()
for user in user_list :
#print user['sex']
print '-----------------------------------------------------'
if user:
user_str='編 號:%d\n用戶名:%s\n性 別:%s\n年 齡:%s\n郵 箱:%s\n ' % (int(user['id']) , user['username'], user['sex'] , user['age'] , user['email'])
print user_str
print '====================================================='
if __name__ == "__main__":
test_xmltostring()
test_laod_xml()
3、測試效果
A、測試toxml
demo.py 文件中修改成
if __name__ == "__main__":
test_xmltostring()
本節(jié)是 python 解析XML python模塊xml.dom解析xml實(shí)例 第二部分的內(nèi)容。
執(zhí)行打印結(jié)果:
<user id="1000001">
<username>Admin</username>
<email>admin@live.cn</email>
<age>23</age>
<sex>男</sex>
</user>
<user id="1000002">
<username>Admin2</username>
<email>admin2@live.cn</email>
<age>22</age>
<sex>男</sex>
</user>
<user id="1000003">
<username>Admin3</username>
<email>admin3@live.cn</email>
<age>27</age>
<sex>男</sex>
</user>
<user id="1000004">
<username>Admin4</username>
<email>admin4@live.cn</email>
<age>25</age>
<sex>女</sex>
</user>
<user id="1000005">
<username>Admin5</username>
<email>admin5@live.cn</email>
<age>20</age>
<sex>男</sex>
</user>
<user id="1000006">
<username>Admin6</username>
<email>admin6@live.cn</email>
<age>23</age>
<sex>女</sex>
</user>
B、測試解析XML
demo.py 文件中修改成
if __name__ == "__main__":
test_laod_xml()
執(zhí)行打印出結(jié)果:
-----------------------------------------------------
編 號:1000001
用戶名:Admin
性 別:男
年 齡:23
郵 箱:admin@live.cn
=====================================================
-----------------------------------------------------
編 號:1000002
用戶名:Admin2
性 別:男
年 齡:22
郵 箱:admin2@live.cn
=====================================================
-----------------------------------------------------
編 號:1000003
用戶名:Admin3
性 別:男
年 齡:27
郵 箱:admin3@live.cn
=====================================================
-----------------------------------------------------
編 號:1000004
用戶名:Admin4
性 別:女
年 齡:25
郵 箱:admin4@live.cn
=====================================================
-----------------------------------------------------
編 號:1000005
用戶名:Admin5
性 別:男
年 齡:20
郵 箱:admin5@live.cn
=====================================================
-----------------------------------------------------
編 號:1000006
用戶名:Admin6
性 別:女
年 齡:23
郵 箱:admin6@live.cn
=====================================================
相關(guān)文章
Python處理Excel的14個(gè)常用操作總結(jié)
在數(shù)據(jù)處理和分析的領(lǐng)域中,Excel是一種被廣泛使用的工具,然而,通過Python處理Excel,能夠更好地實(shí)現(xiàn)自動化和批量處理,本文為大家整理了14個(gè)Python處理Excel的常用操作,希望對大家有所幫助2023-12-12
Python進(jìn)階之使用selenium爬取淘寶商品信息功能示例
這篇文章主要介紹了Python進(jìn)階之使用selenium爬取淘寶商品信息功能,結(jié)合實(shí)例形式詳細(xì)分析了Python使用selenium與requests模塊爬取淘寶商品信息的相關(guān)操作技巧,需要的朋友可以參考下2019-09-09
Python?作為小程序后端的三種實(shí)現(xiàn)方法(推薦)
這篇文章主要介紹了Python?作為小程序后端的三種方法,在這比較推薦前兩種方法,本文通過實(shí)例圖文相結(jié)合給大家介紹的非常詳細(xì),需要的朋友可以參考下2022-05-05
Python實(shí)現(xiàn)環(huán)境隔離和幾種常見方法
在 Python 開發(fā)中,環(huán)境隔離是一個(gè)非常重要的實(shí)踐,它可以避免不同項(xiàng)目之間的依賴沖突,確保每個(gè)項(xiàng)目都能在獨(dú)立的環(huán)境中運(yùn)行,以下是幾種常見的 Python 環(huán)境隔離方法,需要的朋友可以參考下2025-09-09
Python一行代碼實(shí)現(xiàn)生成和讀取二維碼
二維碼被稱為快速響應(yīng)碼,可能看起來很簡單,但它們能夠存儲大量數(shù)據(jù)。無論掃描二維碼時(shí)包含多少數(shù)據(jù),用戶都可以立即訪問信息。本文將用一行Python代碼實(shí)現(xiàn)二維碼的讀取與生成,需要的可以參考一下2022-02-02
Python3.6 中的pyinstaller安裝和使用教程
這篇文章主要介紹了Python3.6 中的pyinstaller安裝和使用的教程,本文給大家介紹的非常詳細(xì),對大家的工作或?qū)W習(xí)具有一定的參考借鑒價(jià)值,需要的朋友可以參考下2020-03-03

