使用python解析json字段的3種方式實(shí)例
1、運(yùn)用re、json、jsonpath包解析json思路
(1)re:正則表達(dá)式,通過json的形式對癥下藥,寫表達(dá)式去解析json;
(2)json: 通過json中的json.loads()方法,將str類型轉(zhuǎn)為dict類型,運(yùn)用python字典的數(shù)據(jù)結(jié)構(gòu)特點(diǎn)去解析json;
(3)jsonpath:對比與json包,jsonpath可以根據(jù)路徑去解析json,比較適合用來解析json中帶“[ ]”的數(shù)據(jù)。
2、三種方式的json解析案例
#json數(shù)據(jù)樣式,本文采用帶[]的數(shù)據(jù)樣式
{
"version": "version 1.0.12",
"result": {
"pages": 1314,
"data": [
{
"name": "大明",
"IDcard": "440588190001015688",
"address": "廣東省廣州市天河區(qū)正佳廣場99樓520號",
},
{
"name": "二明",
"IDcard": "440588190012317456",
"address": "廣東省廣州市天河區(qū)天環(huán)廣場88樓520號",
}
]
}
}
(1)運(yùn)用re正則表達(dá)式解析json
import re
jsondata={
"version": "23231cimesfedkk",
"result": {
"pages": 1314,
"data": [
{
"name": "大明",
"IDcard": "440588190001015688",
"address": "廣東省廣州市天河區(qū)正佳廣場99樓520號",
},
{
"name": "二明",
"IDcard": "440588190012317456",
"address": "廣東省廣州市天河區(qū)天環(huán)廣場88樓520號",
}
]
}
}
if __name__ == '__main__':
name_list=re.findall(r"'name': '(\w*)'",str(jsondata))
IDcard_list=re.findall(r"'IDcard': '(\w{18})'", str(jsondata))#身份證18位數(shù)字和字母組合
address_list=re.findall(r"'address': '(\w*)'", str(jsondata))#地址
print(name_list)
print(IDcard_list)
print(address_list)
運(yùn)行結(jié)果:
['大明', '二明']
['440588190001015688', '440588190012317456']
['廣東省廣州市天河區(qū)正佳廣場99樓520號', '廣東省廣州市天河區(qū)天環(huán)廣場88樓520號']
(2)運(yùn)用字典的數(shù)據(jù)結(jié)構(gòu)性質(zhì)解析json
import json
jsondata={"version": "23231cimesfedkk","result": {"pages": 1314,"data": [{"name": "大明","IDcard": "440588190001015688","address": "廣東省廣州市天河區(qū)正佳廣場99樓520號",},{"name": "二明","IDcard": "440588190012317456","address": "廣東省廣州市天河區(qū)天環(huán)廣場88樓520號",}]}}
if __name__ == '__main__':
# 若傳入的數(shù)據(jù)為str類型需要將它轉(zhuǎn)成dict類型
# result = json.loads(jsondata)
jsondata = jsondata["result"]["data"]
resultdata = jsondata
namelist=[]
idcardlist=[]
addresslist=[]
for data in resultdata:
namelist.append(data['name'])
idcardlist.append(data['IDcard'])
addresslist.append(data['address'])
print(namelist)
print(idcardlist)
print(addresslist)
運(yùn)行結(jié)果:
['大明', '二明']
['440588190001015688', '440588190012317456']
['廣東省廣州市天河區(qū)正佳廣場99樓520號', '廣東省廣州市天河區(qū)天環(huán)廣場88樓520號']
(3)運(yùn)用jsonpath的路徑解析json
import jsonpath
jsondata={"version": "23231cimesfedkk","result": {"pages": 1314,"data": [{"name": "大明","IDcard": "440588190001015688","address": "廣東省廣州市天河區(qū)正佳廣場99樓520號",},{"name": "二明","IDcard": "440588190012317456","address": "廣東省廣州市天河區(qū)天環(huán)廣場88樓520號",}]}}
if __name__ == '__main__':
namelist=[]
idcardlist=[]
addresslist=[]
#運(yùn)用jsonpath.jsonpath(字典數(shù)據(jù), 路徑)
namelist=jsonpath.jsonpath(jsondata, '$..name')
idcardlist=jsonpath.jsonpath(jsondata, '$..IDcard')
addresslist=jsonpath.jsonpath(jsondata, '$..address')
print(namelist)
print(idcardlist)
print(addresslist)
運(yùn)行結(jié)果:
['大明', '二明']
['440588190001015688', '440588190012317456']
['廣東省廣州市天河區(qū)正佳廣場99樓520號', '廣東省廣州市天河區(qū)天環(huán)廣場88樓520號']
3、附錄:re正則表達(dá)式語法

附:python 處理非標(biāo)準(zhǔn) json 格式字符串
在寫爬蟲的時(shí)候,會發(fā)現(xiàn)很多數(shù)據(jù)都是通過 json 格式進(jìn)行傳輸?shù)?,?biāo)準(zhǔn)的 json 我們可以將其轉(zhuǎn)化為 Python 中的數(shù)據(jù)類型,進(jìn)行查詢,但對于一些類似于 json 但又非標(biāo)準(zhǔn) json 格式的字符,就會比較頭疼了,這里統(tǒng)計(jì)一些咱遇到的非標(biāo)準(zhǔn)的 json 格式,及相應(yīng)的解析方法。
字符串中 key 的值沒有被單引號包裹

類似于這種字符,看上去格式和 json 很像(眼尖的朋友可能發(fā)現(xiàn)了,這是 qq 的數(shù)據(jù) 嘿嘿),但仔細(xì)觀察會發(fā)現(xiàn),這其中的 key 沒有被單引號包裹起來,這就導(dǎo)致了它無法被簡單的解析為字典類型,因?yàn)榻馕龅臅r(shí)候 key 會被解析成相應(yīng)的變量而非字符,這些變量又都沒有定義,所以會報(bào)錯(cuò)。
那怎么辦呢?咱的第一反應(yīng)是利用正則去人為構(gòu)造成標(biāo)準(zhǔn)的格式,不過這個(gè)難度系數(shù)有點(diǎn)大,對正則的要求挺高,還費(fèi)腦子,明顯不符合咱的風(fēng)格。于是咱就去網(wǎng)上找了一下,有沒有現(xiàn)成的方法,還真有呢:
使用 demjson
首先安裝 demjson
pip install demjson
s = '{suggestion:[{query:"London",interpretation: \'abc\'}]}'
dict1 = demjson.decode(s)
print(dict1)
{'suggestion': [{'interpretation': 'abc', 'query': 'London'}]}
總結(jié)
到此這篇關(guān)于使用python解析json字段的3種方式的文章就介紹到這了,更多相關(guān)python解析json字段內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
- 如何利用Python解析超大的json數(shù)據(jù)(GB級別)
- Python實(shí)現(xiàn)yaml與json文件批量互轉(zhuǎn)
- 關(guān)于Python中request發(fā)送post請求傳遞json參數(shù)的問題
- Python中json模塊load/loads方法實(shí)戰(zhàn)以及參數(shù)詳解
- Python中使用json.load()和json.loads()加載json數(shù)據(jù)的方法實(shí)例
- python中Requests發(fā)送json格式的post請求方法
- python轉(zhuǎn)換wrf輸出的數(shù)據(jù)為網(wǎng)頁可視化json格式
相關(guān)文章
基于python實(shí)現(xiàn)動態(tài)煙霧效果
動態(tài)煙霧效果常用于游戲和動畫中,為場景增添 逼真的視覺效果,在這篇博客中,我們將使用Python和Pygame庫來創(chuàng)建一個(gè)逼真的煙霧動畫效果,感興趣的小伙伴跟著小編一起來看看吧2024-09-09
Python+tkinter實(shí)現(xiàn)一個(gè)繪圖風(fēng)格控件
這篇文章主要為大家詳細(xì)介紹了Python如何利用tkinter實(shí)現(xiàn)一個(gè)簡單的繪圖風(fēng)格控件,文中的示例代碼講解詳細(xì),感興趣的小伙伴可以學(xué)習(xí)一下2023-09-09
Python基于回溯法子集樹模板實(shí)現(xiàn)8皇后問題
這篇文章主要介紹了Python基于回溯法子集樹模板實(shí)現(xiàn)8皇后問題,簡單說明了8皇后問題的原理并結(jié)合實(shí)例形式分析了Python回溯法子集樹模板解決8皇后問題的具體實(shí)現(xiàn)技巧,需要的朋友可以參考下2017-09-09

