python3 BeautifulSoup模塊使用字典的方法抓取a標簽內的數據示例

更新時間：2019年11月28日 09:08:24 作者：weixin_34351321

這篇文章主要介紹了python3 BeautifulSoup模塊使用字典的方法抓取a標簽內的數據,結合實例形式Fenix了python3 BeautifulSoup模塊進行數據的抓取相關操作技巧,需要的朋友可以參考下

本文實例講述了python3 BeautifulSoup模塊使用字典的方法抓取a標簽內的數據。分享給大家供大家參考，具體如下：

# -*- coding:utf-8 -*-
#python 2.7
#XiaoDeng
#http://tieba.baidu.com/p/2460150866
#標簽操作
from bs4 import BeautifulSoup
import urllib.request
import re
#如果是網址，可以用這個辦法來讀取網頁
#html_doc = "http://tieba.baidu.com/p/2460150866"
#req = urllib.request.Request(html_doc) 
#webpage = urllib.request.urlopen(req) 
#html = webpage.read()
html="""
<html><head><title>The Dormouse's story</title></head>
<body>
<p class="title" name="dromouse"><b>The Dormouse's story</b></p>
<p class="story">Once upon a time there were three little sisters; and their names were
<a  rel="external nofollow" rel="external nofollow" class="sister" id="xiaodeng"><!-- Elsie --></a>,
<a  rel="external nofollow" rel="external nofollow" class="sister" id="link2">Lacie</a> and
<a  rel="external nofollow" class="sister" id="link3">Tillie</a>;
<a  rel="external nofollow" rel="external nofollow" class="sister" id="xiaodeng">Lacie</a>
and they lived at the bottom of a well.</p>
<p class="story">...</p>
"""
soup = BeautifulSoup(html, 'html.parser') #文檔對象
#查找a標簽,只會查找出一個a標簽
#print(soup.a)#<a class="sister"  rel="external nofollow" rel="external nofollow" id="xiaodeng"><!-- Elsie --></a>
for k in soup.find_all('a'):
 print(k)
 print(k['class'])#查a標簽的class屬性
 print(k['id'])#查a標簽的id值
 print(k['href'])#查a標簽的href值
 print(k.string)#查a標簽的string
#如果，標簽中含有其他標簽，比如..，此時要提取中的數據，需要用k.get_text()
#tag.get('calss')，也可以達到這個效果

Python Socket編程技巧總結》、《Python正則表達式用法總結》、《Python數據結構與算法教程》、《Python函數使用技巧總結》、《Python字符串操作技巧匯總》、《Python入門與進階經典教程》及《Python文件與目錄操作技巧匯總》

更多關于Python相關內容可查看本站專題：《

希望本文所述對大家Python程序設計有所幫助。

您可能感興趣的文章:

python實現發(fā)送和獲取手機短信驗證碼
這篇文章主要介紹了python實現發(fā)送和獲取手機短信驗證碼的相關資料，講解了python如何解決接口測試獲取手機驗證碼問題，感興趣的小伙伴們可以參考一下
2016-01-01
Python使用defaultdict讀取文件各列的方法
這篇文章主要介紹了Python使用defaultdict讀取文件各列的方法,涉及Python針對文件相關讀取、遍歷操作技巧,需要的朋友可以參考下
2017-05-05
Python利用Charles 實現全部自動答題思路流程分析
這篇文章主要介紹了Python利用Charles 實現全部自動答題思路流程分析,本文通過實例代碼給大家介紹的非常詳細，對大家的學習或工作具有一定的參考借鑒價值，需要的朋友可以參考下
2021-08-08
如何使用Python處理登錄與驗證碼
Python 爬蟲在抓取需要登錄的網站數據時,通常會遇到兩個主要問題：登錄驗證和驗證碼處理,這些機制是網站用來防止自動化程序過度抓取數據的主要手段,本文將詳細講解如何使用 Python 處理登錄與驗證碼,以便進行順利的數據抓取,需要的朋友可以參考下
2024-11-11
Python生成requirements.txt的三種方法
requirements.txt?文件通常用于列出項目所需的所有Python包及其版本,本文主要介紹了Python生成requirements.txt的三種方法,具有一定的參考價值,感興趣的可以了解一下
2024-07-07
Python網頁正文轉換語音文件的操作方法
這篇文章主要介紹了Python網頁正文轉換語音文件的操作方法,需要的朋友可以參考下
2018-12-12
Python實現SMTP發(fā)送郵件詳細教程
這篇文章主要為大家詳細介紹了Python實現SMTP發(fā)送郵件詳細教程，附SMTP郵件發(fā)送代碼，文中示例代碼介紹的非常詳細，具有一定的參考價值，感興趣的小伙伴們可以參考一下
2016-08-08
Python爬蟲框架scrapy實現的文件下載功能示例
這篇文章主要介紹了Python爬蟲框架scrapy實現的文件下載功能,結合實例形式分析了scrapy框架進行文件下載的具體操作步驟與相關實現技巧,需要的朋友可以參考下
2018-08-08
pycharm 批量修改變量名稱的方法
這篇文章主要介紹了pycharm 批量修改變量名稱的方法，文中通過示例代碼介紹的非常詳細，對大家的學習或者工作具有一定的參考學習價值，需要的朋友們下面隨著小編來一起學習學習吧
2019-08-08
python如何查看安裝了的模塊
在本篇文章里小編給大家分享的是一篇關于python查看安裝了的模塊的方法，需要的朋友們可以學習下。
2020-06-06