Python BeautifulSoup [解決方法] TypeError: list indices must be integers or slices, not str
在python的Beautiful Soup 4 擴(kuò)展庫(kù)的使用過程中出現(xiàn)了
TypeError: list indices must be integers or slices, not str
這個(gè)錯(cuò)誤,這里就分析一下為什么會(huì)報(bào)錯(cuò)以及如何解決。
這個(gè)錯(cuò)誤的意思是'類型錯(cuò)誤:list的索引必須是'integers'或者'slices'不能是'str'
我出現(xiàn)錯(cuò)誤的代碼:
#引入庫(kù)
from bs4 import BeautifulSoup
#讀取頁面
soup = BeautifulSoup(open('index.html'))
#獲取標(biāo)簽
img_tag = div.select("img")
#獲取標(biāo)簽屬性(這里報(bào)錯(cuò))
src = img_tag['src']
#輸出
print(src)
經(jīng)過檢查對(duì)比后我發(fā)現(xiàn)錯(cuò)誤原因
就是獲取標(biāo)簽時(shí)獲取的是list數(shù)據(jù)而不是tag
主要原因如下:
主要就是獲取的內(nèi)容和自己認(rèn)為的有偏差。
也就是find()和find_all(),select()和select_one()的區(qū)別。
當(dāng)使用
find() select_one()
時(shí),獲得的是一個(gè)標(biāo)簽
類型為
<class 'bs4.element.Tag'>
所以可以使用tag['class']取值
當(dāng)使用
find_all() select()
時(shí),獲得的是組標(biāo)簽(就算只有一個(gè)標(biāo)簽也是一組)
類型為
#find_all()的返回值類型 <class 'bs4.element.ResultSet'> #select()的返回值類型 <class 'list'>
這時(shí),我們要取值就需要先定位是list(ResultSet)中的那個(gè)標(biāo)簽在取值
例如tag[0]['class']
解決方法
方法一:
#引入庫(kù)
from bs4 import BeautifulSoup
#讀取頁面
soup = BeautifulSoup(open('index.html'))
#獲取標(biāo)簽
img_tag = div.select("img")
#獲取標(biāo)簽屬性(這里有改動(dòng))
src = img_tag[0]['src']
#輸出
print(src)
因?yàn)槲抑理撁嬷械慕Y(jié)構(gòu)可以確保獲得的第一個(gè)bag為我需要的標(biāo)簽。
所以使用src = img_tag[0]['src']來獲取屬性信息。
方法二:
#引入庫(kù)
from bs4 import BeautifulSoup
#讀取頁面
soup = BeautifulSoup(open('index.html'))
#獲取標(biāo)簽
img_tag = div.select_one("img")
#獲取標(biāo)簽屬性(這里有改動(dòng))
src = img_tag['src']
#輸出
print(src)
同上理,這樣修改也是可以成功的。
出現(xiàn)這種問題還是因?yàn)樽约翰挥眯模€是要時(shí)刻提醒自己。
以上就是本文的全部?jī)?nèi)容,希望對(duì)大家的學(xué)習(xí)有所幫助,也希望大家多多支持腳本之家。
- python BeautifulSoup使用方法詳解
- Python BeautifulSoup中文亂碼問題的2種解決方法
- python 解析html之BeautifulSoup
- Python爬蟲庫(kù)BeautifulSoup獲取對(duì)象(標(biāo)簽)名,屬性,內(nèi)容,注釋
- python中bs4.BeautifulSoup的基本用法
- python基于BeautifulSoup實(shí)現(xiàn)抓取網(wǎng)頁指定內(nèi)容的方法
- Python使用BeautifulSoup庫(kù)解析HTML基本使用教程
- python爬蟲之BeautifulSoup 使用select方法詳解
- python爬蟲入門教程--HTML文本的解析庫(kù)BeautifulSoup(四)
- 從零開始學(xué)習(xí)Python與BeautifulSoup網(wǎng)頁數(shù)據(jù)抓取
相關(guān)文章
Python標(biāo)準(zhǔn)庫(kù)re的使用舉例(正則化匹配)
正則表達(dá)式re是內(nèi)置函數(shù),通過一定的匹配規(guī)則獲取指定的數(shù)據(jù),下面這篇文章主要給大家介紹了關(guān)于Python標(biāo)準(zhǔn)庫(kù)re的使用舉例,文中通過實(shí)例代碼介紹的非常詳細(xì),需要的朋友可以參考下2022-10-10
python如何給字典的鍵對(duì)應(yīng)的值為字典項(xiàng)的字典賦值
這篇文章主要介紹了python如何給字典的鍵對(duì)應(yīng)的值為字典項(xiàng)的字典賦值,文中通過示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧2019-07-07
Python制作運(yùn)行進(jìn)度條的實(shí)現(xiàn)效果(代碼運(yùn)行不無聊)
這篇文章主要介紹了Python制作運(yùn)行進(jìn)度條的實(shí)現(xiàn)效果(代碼運(yùn)行不無聊),本文通過實(shí)例代碼給大家介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或工作具有一定的參考借鑒價(jià)值,需要的朋友可以參考下2021-02-02
利用Python實(shí)現(xiàn)RSA加密解密方法實(shí)例
過去幾天我一直在嘗試用Python實(shí)現(xiàn)RSA算法,下面這篇文章主要給大家介紹了關(guān)于利用Python實(shí)現(xiàn)RSA加密解密的相關(guān)資料,文中通過示例代碼介紹的非常詳細(xì),需要的朋友可以參考下2022-04-04
淺談python實(shí)現(xiàn)Google翻譯PDF,解決換行的問題
今天小編就為大家分享一篇淺談python實(shí)現(xiàn)Google翻譯PDF,解決換行的問題,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過來看看吧2018-11-11
使用python檢測(cè)網(wǎng)頁文本內(nèi)容屏幕上的坐標(biāo)
在 Web 開發(fā)中,經(jīng)常需要對(duì)網(wǎng)頁上的文本內(nèi)容進(jìn)行處理和操作,有時(shí)候,我們可能需要知道某個(gè)特定文本在屏幕上的位置,以便進(jìn)行后續(xù)的操作,所以本文將介紹如何使用 Python 中的 Selenium 和 BeautifulSoup 庫(kù)來檢測(cè)網(wǎng)頁文本內(nèi)容在屏幕上的坐標(biāo),需要的朋友可以參考下2024-04-04

