基于pycharm的beautifulsoup4庫使用方法教程

更新時間：2022年01月26日 13:21:16 作者：霧里看花花里看霧?

這篇文章主要介紹了基于pycharm的beautifulsoup4庫使用方法教程，對正在學習或者工作的你有一點的參考價值，需要的朋友可以參加一下

1.beautifulsoup4庫安裝

第一步：在控制臺輸入如下命令，安裝beautifulsoup4庫。

pip install beautifulsoup4

第三步：在pycharm中，點擊file——settings——project——python interpreter——點擊+號——搜索beautifulsoup4——install package！

這樣就可以在.py文件中導入模塊了！

2.beautifulsoup4庫使用

import requests
# 雖然庫名叫做beautiful4 但是在導入時 使用的是其縮寫bs4 其中BeautifulSoup是一個類名
from bs4 import BeautifulSoup

url = 'https://www.baidu.com/s?'
# 由于一般網(wǎng)站都是供用戶訪問 如果檢測到User-Agent是黑客或者其他可能拒絕訪問 故此處模擬瀏覽器
headers = {
? ? 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/97.0.4692.71 Safari/537.36'
}
response = requests.get(url=url, headers=headers)
# 以防亂碼 此處將其編碼設置為utf-8 因為有中文
response.encoding = 'utf-8'
# print(response.text)
# 使用的解析器是html.parser 注意是.奧
soup = BeautifulSoup(response.text, 'html.parser')
# 打印解析后的結果
print(soup.prettify())

需要講解的都在代碼注釋中了奧！

3.beautifulsoup4庫基本元素

beautifulsoup4庫是解析、遍歷、維護“標簽樹”的功能庫。

首先來看BeautifulSoup庫解析器，前兩個比較常用！

在上述代碼的基礎上，增加如下幾行，結合基本元素的使用，可得到如圖所示。

需要注意的是，.string可以跨標簽，所以很有可能結果也為注釋，為了區(qū)分是標簽內(nèi)的字符串還是注釋，可以通過打印類型來判斷。

接下來，看一下BeautifulSoup庫的遍歷，其中畫紅框的迭代遍歷，可以用于for in循環(huán)中。

4.beautifulsoup4庫的HTML查找方法

find_all( name , attrs , recursive , string , **kwargs )

find_all() 方法搜索當前tag的所有tag子節(jié)點,并判斷是否符合過濾器的條件。

name 參數(shù)可以對名字為 name 的標簽進行檢索。

attrs參數(shù)可以對標簽屬性值為attrs的標簽進行檢索。

recursive參數(shù)表示是否對子孫全部檢索，默認是TRUE，如果只想搜索當前節(jié)點的兒子信息，可以置其為FALSE。

string 參數(shù)可以標簽中的字符串內(nèi)容進行檢索。

5.補充Json（Javascript Object Notation）

我們學過js的或者java的，應該對Json不陌生吧！

Json是一種有類型的鍵值對！

需要注意的是，鍵和值都需要用"“括起來，如果值是整數(shù)，則可以不用”"！

如果值是多值，則可以用[,]；如果值是鍵值對，則可以用{:,:,}，可以嵌套使用。

JSON一般用于接口，而YAML是無類型鍵值對，一般用于配置文件。

到此這篇關于基于pycharm的beautifulsoup4庫使用方法教程的文章就介紹到這了,更多相關pycharm的beautifulsoup4庫使用內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關文章希望大家以后多多支持腳本之家！

您可能感興趣的文章:

為什么相對PHP黑python的更少
在本篇內(nèi)容里小編給各位整理了關于為什么相對PHP黑python的更少的原因和知識點，需要的朋友們可以參考下。
2020-06-06
python如何更新包
在本篇文章里小編給大家整理的是關于python更新包的相關知識點內(nèi)容，有興趣的朋友們可以參考下。
2020-06-06
Python通過DOM和SAX方式解析XML的應用實例分享
這篇文章主要介紹了Python通過DOM和SAX方式解析XML的應用實例分享,針對這兩種解析方式Python都有相關的模塊可供使用,需要的朋友可以參考下
2015-11-11
Python常見數(shù)字運算操作實例小結
這篇文章主要介紹了Python常見數(shù)字運算操作,結合實例形式總結分析了Python數(shù)字常見的四則運算、整除、取余、開平方等相關操作技巧與注意事項,需要的朋友可以參考下
2019-03-03
python修改linux中文件(文件夾)的權限屬性操作
這篇文章主要介紹了python修改linux中文件(文件夾)的權限屬性操作，具有很好的參考價值，希望對大家有所幫助。一起跟隨小編過來看看吧
2020-03-03
python3+PyQt5 實現(xiàn)Rich文本的行編輯方法
今天小編就為大家分享一篇python3+PyQt5 實現(xiàn)Rich文本的行編輯方法，具有很好的參考價值，希望對大家有所幫助。一起跟隨小編過來看看吧
2019-06-06
Python之修改圖片像素值的方法
今天小編就為大家分享一篇Python之修改圖片像素值的方法，具有很好的參考價值，希望對大家有所幫助。一起跟隨小編過來看看吧
2019-07-07
關于多元線性回歸分析——Python&SPSS
今天小編就為大家分享一篇關于多元線性回歸分析——Python&SPSS，具有很好的參考價值，希望對大家有所幫助。一起跟隨小編過來看看吧
2020-02-02
深入講解Python中的上下文管理器和with語句
這篇文章主要為大家介紹了Python中的上下文管理器和with語句的深入講解，有需要的朋友可以借鑒參考下，希望能夠有所幫助，祝大家多多進步，早日升職加薪
2023-06-06
Python中tkinter無法同時顯示多個image的解決方法及pack與place解析
這篇文章主要介紹了Python中tkinter無法同時顯示多個image的解決方法及pack與place解析,本文給大家分享問題原因解析及解決方案，需要的朋友可以參考下
2023-02-02