python+selenium+chromedriver實(shí)現(xiàn)爬蟲(chóng)示例代碼
下載好所需程序
1.Selenium簡(jiǎn)介
Selenium是一個(gè)用于Web應(yīng)用程序測(cè)試的工具,直接運(yùn)行在瀏覽器中,就像真正的用戶在操作一樣。
2.Selenium安裝
方法一:在Windows命令行(cmd)輸入pip install selenium即可自動(dòng)安裝,安裝完成后,輸入pip show selenium可查看當(dāng)前的版本

方法二:直接下載selenium包:
Pychome安裝selenium如果出現(xiàn)無(wú)法安裝,參考以下博客
解決Pycharm無(wú)法使用已經(jīng)安裝Selenium的問(wèn)題
3.禁止谷歌瀏覽器自動(dòng)更新
搜索本地:管理工具-服務(wù)-Google自動(dòng)更新服務(wù)-選擇禁止

安裝瀏覽器對(duì)應(yīng)的驅(qū)動(dòng)driver
我這里用的是谷歌,選擇對(duì)應(yīng)的驅(qū)動(dòng)版本
驅(qū)動(dòng)的下載地址如下:
http://chromedriver.storage.googleapis.com/index.html


win32、win64的都下載win32.zip的
將下載的chromedriver進(jìn)行解壓,并將文件復(fù)制或移動(dòng)到,瀏覽器快捷方式所在目錄。
環(huán)境變量配置
1.Python環(huán)境配置
2.chromedriver環(huán)境配置
3.pychrome的python環(huán)境指向自己電腦安裝好的python
注意:將下載好的chromewebdriver.exe驅(qū)動(dòng)放在Python的安裝路徑下的Scripts里面,同時(shí)將Scripts路徑添加到PATH中,這樣每次運(yùn)行python的時(shí)候就會(huì)自動(dòng)加載驅(qū)動(dòng)
代碼實(shí)現(xiàn)
#已經(jīng)準(zhǔn)備環(huán)境:webdriver:Google已經(jīng)安裝好;環(huán)境變量配置好;pip install selenium;
#selenium是一個(gè)包,包有很多對(duì)象,對(duì)象有屬性,方法。
from selenium import webdriver
browser=webdriver.Chrome()#打開(kāi)瀏覽器
url="https://news.qq.com/zt2020/page/feiyan.htm#/global?nojump=1"#獲取數(shù)據(jù)的地址
#請(qǐng)求瀏覽器內(nèi)容:請(qǐng)求方式:get,post,token
browser.get(url)
#css選擇器,id選擇器:#開(kāi)頭,class選擇器:.開(kāi)頭,標(biāo)簽選擇器:p,span,div。
coronavirus_countent=browser.find_element_by_class_name('d')#定位到class選擇器d這個(gè)內(nèi)容
print(coronavirus_countent)#查看內(nèi)容,session,一種緩存機(jī)制,通過(guò)瀏覽器解析,然后緩存的內(nèi)容
# <selenium.webdriver.remote.webelement.WebElement (session="a1aa22161543b44f599e97b35dbc1ac5", element="fe645993-43cb-46cf-83a7-2488dd3d838a")>
print(coronavirus_countent.text)#查看當(dāng)前css.class中的d的內(nèi)容
coronavirus_time=browser.find_element_by_class_name('ml')#定位到class選擇器d這個(gè)內(nèi)容
print(coronavirus_time.text)
coronavirus_data=browser.find_element_by_class_name('nowConfirm')#定位到class選擇器d這個(gè)內(nèi)容
print("=======")
print(coronavirus_data.text)
print("=====找nowConfirm下面的字內(nèi)容")
coronavirus_sub=coronavirus_data.find_element_by_class_name('addnum')
print(coronavirus_sub.text)
browser.quit()
到此這篇關(guān)于python+selenium+chromedriver實(shí)現(xiàn)爬蟲(chóng)示例代碼的文章就介紹到這了,更多相關(guān)python selenium chromedriver 爬蟲(chóng)內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
- Python第三方庫(kù)undetected_chromedriver的使用
- python一招完美搞定Chromedriver的自動(dòng)更新問(wèn)題
- Python3爬蟲(chóng)ChromeDriver的安裝實(shí)例
- 詳解Python+Selenium+ChromeDriver的配置和問(wèn)題解決
- Selenium執(zhí)行完畢未關(guān)閉chromedriver/geckodriver進(jìn)程的解決辦法(java版+python版)
- 下載與當(dāng)前Chrome對(duì)應(yīng)的chromedriver.exe(用于python+selenium)
- python selenium 執(zhí)行完畢關(guān)閉chromedriver進(jìn)程示例
- python3?chromedrivers簽到的簡(jiǎn)單實(shí)現(xiàn)
相關(guān)文章
Django與數(shù)據(jù)庫(kù)交互的實(shí)現(xiàn)
最近在學(xué)習(xí)Django,本文主要介紹了Django與數(shù)據(jù)庫(kù)交互的實(shí)現(xiàn),具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下2021-06-06
Django如何使用asyncio協(xié)程和ThreadPoolExecutor多線程
這篇文章主要介紹了Django如何使用asyncio協(xié)程和ThreadPoolExecutor多線程,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友可以參考下2020-10-10
python中的selenium實(shí)現(xiàn)自動(dòng)向下滾動(dòng)頁(yè)面并指定最大滑動(dòng)距離
這篇文章主要介紹了python中的selenium實(shí)現(xiàn)自動(dòng)向下滾動(dòng)頁(yè)面并指定最大滑動(dòng)距離,下文有關(guān)selenium的資料介紹有一定的參考價(jià)值,需要的小伙伴可以參考一下2022-02-02
Python PyQt5學(xué)習(xí)之自定義信號(hào)
PyQ5已經(jīng)自動(dòng)定義了很多QT自建的信號(hào)。但是在實(shí)際的使用中為了靈活使用信號(hào)與槽機(jī)制,可以根據(jù)需要自定義信號(hào)。本文就將為大家詳細(xì)講講PyQt5自定義信號(hào),感興趣的可以了解一下2022-03-03
Python標(biāo)準(zhǔn)庫(kù)之sqlite3使用實(shí)例
這篇文章主要介紹了Python標(biāo)準(zhǔn)庫(kù)之sqlite3使用實(shí)例,本文講解了創(chuàng)建數(shù)據(jù)庫(kù)、插入數(shù)據(jù)、查詢數(shù)據(jù)、更新與刪除數(shù)據(jù)操作實(shí)例,需要的朋友可以參考下2014-11-11
已安裝Pytorch卻提示no?moudle?named?'torch'(沒(méi)有名稱為torch
這篇文章主要給大家介紹了關(guān)于已安裝Pytorch卻提示no?moudle?named?'torch'(沒(méi)有名稱為torch的模塊)的相關(guān)資料,當(dāng)提示"No module named 'torch'"時(shí),可能是由于安裝的Pytorch版本與當(dāng)前環(huán)境不匹配導(dǎo)致的,需要的朋友可以參考下2023-11-11

