基于python爬取鏈家二手房信息代碼示例
基本環(huán)境配置
- python 3.6
- pycharm
- requests
- parsel
- time
相關模塊pip安裝即可
確定目標網(wǎng)頁數(shù)據(jù)

哦豁,這個價格..................看到都覺得腦闊疼
通過開發(fā)者工具,可以直接找到網(wǎng)頁返回的數(shù)據(jù)~


每一個二手房的數(shù)據(jù),都在網(wǎng)頁的 li 標簽里面,咱們可以獲取網(wǎng)頁返回的數(shù)據(jù),然后通過解析,就可以獲取到自己想要的數(shù)據(jù)了~
獲取網(wǎng)頁數(shù)據(jù)
import requests
headers = {
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.138 Safari/537.36'
}
response = requests.get(url=url, headers=headers)
解析網(wǎng)頁數(shù)據(jù)
import parsel
selector = parsel.Selector(response.text)
lis = selector.css('.sellListContent li')
dit = {}
for li in lis:
title = li.css('.title a::text').get()
dit['標題'] = title
positionInfo = li.css('.positionInfo a::text').getall()
info = '-'.join(positionInfo)
dit['開發(fā)商'] = info
houseInfo = li.css('.houseInfo::text').get()
dit['房子信息'] = houseInfo
followInfo = li.css('.followInfo::text').get()
dit['發(fā)布周期'] = followInfo
Price = li.css('.totalPrice span::text').get()
dit['售價/萬'] = Price
unitPrice = li.css('.unitPrice span::text').get()
dit['單價'] = unitPrice
csv_writer.writerow(dit)
print(dit)

保存數(shù)據(jù)
import csv
f = open('二手房信息.csv', mode='a', encoding='utf-8-sig', newline='')
csv_writer = csv.DictWriter(f, fieldnames=['標題', '開發(fā)商', '房子信息', '發(fā)布周期', '售價/萬', '單價'])
csv_writer.writeheader()
csv_writer.writerow(dit)
f.close()

以上就是本文的全部內(nèi)容,希望對大家的學習有所幫助,也希望大家多多支持腳本之家。
相關文章
python encrypt 實現(xiàn)AES加密的實例詳解
在本篇文章里小編給大家分享的是關于python encrypt 實現(xiàn)AES加密的實例內(nèi)容,有興趣的朋友們可以參考下。2020-02-02
python如何用columns參數(shù)獲取DataFrame各列的表頭名
這篇文章主要介紹了python如何用columns參數(shù)獲取DataFrame各列的表頭名問題,具有很好的參考價值,希望對大家有所幫助,如有錯誤或未考慮完全的地方,望不吝賜教2024-03-03
使用Pytorch Geometric進行鏈接預測的實現(xiàn)代碼
PyTorch Geometric (PyG)是構(gòu)建圖神經(jīng)網(wǎng)絡模型和實驗各種圖卷積的主要工具,在本文中我們將通過鏈接預測來對其進行介紹,文中有詳細的代碼示例供大家參考,需要的朋友可以參考下2023-10-10
python基于urllib實現(xiàn)按照百度音樂分類下載mp3的方法
這篇文章主要介紹了python基于urllib實現(xiàn)按照百度音樂分類下載mp3的方法,涉及Python使用urllib模塊操作頁面元素的相關技巧,需要的朋友可以參考下2015-05-05

