Python+Selenium+phantomjs實(shí)現(xiàn)網(wǎng)頁模擬登錄和截圖功能(windows環(huán)境)
本文全部操作均在windows環(huán)境下
安裝 Python
Python是一種跨平臺(tái)的計(jì)算機(jī)程序設(shè)計(jì)語言,它可以運(yùn)行在Windows、Mac和各種Linux/Unix系統(tǒng)上。是一種面向?qū)ο蟮膭?dòng)態(tài)類型語言,最初被設(shè)計(jì)用于編寫自動(dòng)化腳本(shell),隨著版本的不斷更新和語言新功能的添加,越來越多被用于獨(dú)立的、大型項(xiàng)目的開發(fā)
去Python的官網(wǎng) www.python.org 下載安裝
安裝時(shí)勾選pip (python包管理工具),同時(shí)安裝pip
python安裝好之后,打開命令行工具cmd,輸入“python -V”,然后敲回車,如果出現(xiàn)python版本號(hào),則表示安裝成功
安裝 selenium
selenium 是一個(gè)用于Web應(yīng)用程序測(cè)試的工具。selenium測(cè)試直接運(yùn)行在瀏覽器中,就像真正的用戶在操作一樣。支持的瀏覽器包括IE(7, 8, 9, 10, 11),Mozilla Firefox,Safari,Google Chrome,Opera等。selenium 是一套完整的web應(yīng)用程序測(cè)試系統(tǒng),包含了測(cè)試的錄制(selenium IDE),編寫及運(yùn)行(Selenium Remote Control)和測(cè)試的并行處理(Selenium Grid)
通過python包管理工具pip安裝
pip install selenium
安裝 phantomjs
phantomJS是一個(gè)基于webkit的javaScript API。它使用QtWebKit作為它核心瀏覽器的功能,使用webkit來編譯解釋執(zhí)行javaScript代碼。任何你可以基于在webkit瀏覽器做的事情,它都能做到。它不僅是個(gè)隱性的瀏覽器,提供了諸如css選擇器、支持wen標(biāo)準(zhǔn)、DOM操作、json、HTML5等,同時(shí)也提供了處理文件I/O的操作,從而使你可以向操作系統(tǒng)讀寫文件等。phantomJS的用處可謂非常廣泛諸如網(wǎng)絡(luò)監(jiān)測(cè)、網(wǎng)頁截屏、無需瀏覽器的wen測(cè)試、頁面訪問自動(dòng)化等
phantomjs安裝鏈接 www.phantomjs.org
在桌面創(chuàng)建demo文件夾,創(chuàng)建demo.py文件,當(dāng)做我們的腳本文件,創(chuàng)建img文件夾用來存放截取的圖片demo.py:
# coding=utf-8
# 導(dǎo)入網(wǎng)頁驅(qū)動(dòng)軟件
from selenium import webdriver
# 導(dǎo)入WebDriverWait等待模塊
from selenium.webdriver.support.wait import WebDriverWait
import time
# 調(diào)用環(huán)境變量指定的PhantomJS瀏覽器創(chuàng)建瀏覽器對(duì)象
# 括號(hào)內(nèi)為phantomjs安裝位置
driver = webdriver.PhantomJS(executable_path="D:\\Python27\\Scripts\\phantomjs-2.1.1-windows\\bin\\phantomjs.exe")
# 訪問的網(wǎng)址(以央視網(wǎng)為例)
driver.get("http://www.cctv.com/")
# 最大化瀏覽器
driver.maximize_window()
# 模擬點(diǎn)擊登錄按鈕登錄彈出登錄框(后面有定位元素方法介紹)
driver.find_elements_by_xpath('//span[@class="btn_icon"]')[1].click()
# 等待登錄頁面加載完成,WebDriverWait (后面有等待方法介紹)
WebDriverWait(driver, 10, 0.5).until(lambda diver:driver.find_element_by_xpath('//a[@class="dl"]'),message="")
time.sleep(2)
# 截取登錄框的頁面保存到相應(yīng)位置
driver.save_screenshot('demo\\img\\login1.png')
# 定位登錄頁面用戶名和密碼元素并模擬填入用戶名和密碼
driver.find_element_by_name("username").send_keys('xxxxxxxxxxx')
driver.find_element_by_name("passwd_view").send_keys('xxxxxxxxxxx')
# 模擬點(diǎn)擊登錄按鈕登錄
driver.find_element_by_link_text('登錄').click()
WebDriverWait(driver, 10, 0.5).until(lambda diver:driver.find_elements_by_xpath('//span[@class="btn_icon"]'),message="")
time.sleep(2)
# 截取登錄后的頁面保存到相應(yīng)位置
driver.save_screenshot('demo\\img\\login2.png')
# 模擬點(diǎn)擊按鈕跳轉(zhuǎn)體育頁面
driver.find_element_by_link_text('體育').click()
WebDriverWait(driver, 10, 0.5).until(lambda diver:driver.find_element_by_link_text('CBA'),message="")
time.sleep(2)
# 截取體育頁面保存到相應(yīng)位置
driver.save_screenshot('demo\\img\\sport.png')
# 退出驅(qū)動(dòng)關(guān)閉所有窗口
driver.quit()
運(yùn)行python腳本
打開命令行窗口cmd,切換到demo.py文件的路徑下,輸入
python demo.py
腳本運(yùn)行后會(huì)自動(dòng)填寫我們?cè)O(shè)定好的用戶名密碼并登錄,截取設(shè)置好的頁面并保存到img文件夾
登錄框的頁面截圖:

登錄后的頁面截圖:

體育頁面截圖:

部分方法介紹:區(qū)塊定位截圖(二次截圖)方法:
PIL(Python Image Library)是python的第三方圖像處理庫,PIL功能非常強(qiáng)大,API非常簡單易用,已經(jīng)是Python平臺(tái)事實(shí)上的圖像處理標(biāo)準(zhǔn)庫了。 PIL只支持python2.x的版本,python3.x的版本需要安裝pillow, pillow是一個(gè)對(duì)PIL友好的分支,但是支持python3.x的版本
python2.x版本下安裝PIL進(jìn)行二次截圖
pip install PIL
python3.x版本下安裝pillow 進(jìn)行區(qū)塊定位截圖
pip install pillow
demo.py:
# 導(dǎo)入Image類
from PIL import Image
# 定位需要二次截圖區(qū)塊的元素
img = driver.find_element_by_xpath('//*[@class="weui-img"]')
# 區(qū)塊元素左上角在網(wǎng)頁中的x坐標(biāo)
left = img.location['x']
# 區(qū)塊元素左上角在網(wǎng)頁中的y坐標(biāo)
top = img.location['y']
# 區(qū)塊元素右下角在網(wǎng)頁中的x坐標(biāo)
right = img.location['x'] + img.size['width']
# 區(qū)塊元素右下角在網(wǎng)頁中的y坐標(biāo)
bottom = img.location['y'] + img.size['height']
# 打開頁面的截圖
photo = Image.open('demo\\img\\img_page.png')
# 根據(jù)區(qū)塊元素坐標(biāo)實(shí)現(xiàn)二次截圖
photo = photo.crop((left, top, right, bottom))
# 保存二次截圖
photo.save('demo\\img\\img.png')
WebDriver8種基本元素定位方法:
1. find_element_by_id() 根據(jù)id屬性進(jìn)行定位
例如:find_element_by_id(“one”) 定位id為one的元素
2. find_element_by_name() 根據(jù)name屬性進(jìn)行定位
例如:find_element_by_name(“one”) 定位name屬性為one的元素
3. find_element_by_class_name() 根據(jù)class的名字進(jìn)行定位
例如:find_element_by_class_name(“one”) 定位class為one的元素
4. find_element_by_xpath() xpath是XML路徑語言,通過確定xml文檔中的元素位置來完成對(duì)元素的定位
例如:find_element_by_xpath("http://div[@id=‘one']") 定位id為one的div元素
find_element_by_xpath("http://*[@class=‘two']") 定位class為two的元素
5. find_element_by_css_selector() 根據(jù)css屬性進(jìn)行定位
例如:find_element_by_css_selector("#one") 定位id為one的div元素
find_element_by_css_selector(".two") 定位class為two的元素
6. find_element_by_tag_name () 根據(jù)標(biāo)簽名進(jìn)行定位
例如:find_element_by_tag_name(“input”) 定位input元素
7. find_element_by_link_text() 根據(jù)完整a鏈接文字進(jìn)行定位find_element_by_partial_link_text() 根據(jù)部分a鏈接文字進(jìn)行定位
例如:find_element_by_link_text(“新聞”) 定位文字為‘新聞'的a元素
find_element_by_partial_link_text(“聞”) 定位文字包括‘聞'的a元素
8. By定位( 需要導(dǎo)入By類:from selenium.webdriver.common.by import By )
例如:find_element(By.ID,“one”) 定位id為one的元素
find_element(By.NAME,“one”) 定位name屬性為one的元素
find_element(By.CLASS_NAME,“one”) 定位class為one的元素
find_element(By.TAG_NAME,“div”) 定位div元素
當(dāng)定位元素為多個(gè)時(shí),使用elements復(fù)數(shù)定位,即把定位方法中的element換成elements,此時(shí)獲取到的為相同屬性的一組元素,返回一個(gè)list隊(duì)列,然后可以再去定位單個(gè)元素
例如:find_elements_by_class_name(“one”)[1] 定位class為one的所有元素中第二個(gè)元素
selenium的3種等待方法:
在做自動(dòng)化測(cè)試時(shí),有時(shí)下一步的操作會(huì)依賴上一步的結(jié)果或者內(nèi)容,上一步操作成功完成之后才能進(jìn)行下一步操作,此時(shí),我們就需要使用等待,來判斷上一步操作是否完成,進(jìn)而執(zhí)行下面的操作,例如登錄頁面進(jìn)行登錄操作時(shí),需要等待登錄頁面加載成功,才能定位到用戶名和密碼對(duì)應(yīng)的元素,然后才能填充用戶名和密碼,進(jìn)行登錄操作。
1. 強(qiáng)制等待time.sleep(s) 強(qiáng)制等待s秒后再進(jìn)行下面的操作
缺點(diǎn):不易把控時(shí)間,等待時(shí)間固定,如果沒到設(shè)置時(shí)間,已經(jīng)可以進(jìn)行下面的操作,則需要多余的等待,如果到達(dá)設(shè)置時(shí)間,還沒完成上一步操作,下面的操作還無法正常進(jìn)行,則會(huì)直接報(bào)錯(cuò)
2. 隱式等待implicitly_wait(s) 在s秒內(nèi),上一步操作完成,進(jìn)行下一步操作,否則等待s秒后,然后進(jìn)行下一步操作
缺點(diǎn):如果到達(dá)設(shè)置時(shí)間,還沒完成上一步操作,下面的操作還無法正常進(jìn)行,則會(huì)直接報(bào)錯(cuò)
3. 顯式等待(推薦使用)WebDriverWait(driver,timeout,poll_frequency=0.5,ignored_exceptions=None)
等待頁面加載完成,找到某個(gè)條件發(fā)生后再繼續(xù)執(zhí)行后續(xù)代碼,如果超過設(shè)置時(shí)間檢測(cè)不到則拋出異常
driver:瀏覽器驅(qū)動(dòng)
timeout:最長超時(shí)時(shí)間,默認(rèn)以秒為單位
poll_frequency:檢測(cè)的間隔步長,默認(rèn)為0.5s
ignored_exceptions:超時(shí)后的拋出的異常信息,默認(rèn)拋出NoSuchElementExeception異常
與until()結(jié)合使用:
WebDriverWait(driver, s).until(method,message="")
在s秒內(nèi),每0.5秒檢測(cè)一次,如果傳入的方法返回為true,進(jìn)行下一步操作,如果到達(dá)設(shè)置時(shí)間未檢測(cè)到,下面的操作無法正常運(yùn)行,則會(huì)直接報(bào)錯(cuò)
總結(jié)
以上所述是小編給大家介紹的Python+Selenium+phantomjs實(shí)現(xiàn)網(wǎng)頁模擬登錄和截圖功能(windows環(huán)境),希望對(duì)大家有所幫助,如果大家有任何疑問請(qǐng)給我留言,小編會(huì)及時(shí)回復(fù)大家的。在此也非常感謝大家對(duì)腳本之家網(wǎng)站的支持!
如果你覺得本文對(duì)你有幫助,歡迎轉(zhuǎn)載,煩請(qǐng)注明出處,謝謝!
相關(guān)文章
Python?內(nèi)置模塊?argparse快速入門教程
argparse模塊是Python內(nèi)置的用于命令項(xiàng)選項(xiàng)與參數(shù)解析的模塊,argparse模塊可以讓人輕松編寫用戶友好的命令行接口,能夠幫助程序員為模型定義參數(shù),這篇文章主要介紹了快速入門Python內(nèi)置模塊argparse,需要的朋友可以參考下2023-06-06
Python連接和操作PostgreSQL數(shù)據(jù)庫的流程步驟
PostgreSQL 是一種開源的對(duì)象關(guān)系型數(shù)據(jù)庫管理系統(tǒng)(ORDBMS),以其強(qiáng)大的功能和穩(wěn)定性而廣受歡迎,本文將詳細(xì)介紹如何使用 Python 連接和操作 PostgreSQL 數(shù)據(jù)庫,需要的朋友可以參考下2024-10-10
Pycharm運(yùn)行程序時(shí),控制臺(tái)輸出PyDev?console:starting問題
Pycharm運(yùn)行程序時(shí),控制臺(tái)輸出PyDev?console:starting問題,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。如有錯(cuò)誤或未考慮完全的地方,望不吝賜教2023-05-05
使用python編寫android截屏腳本雙擊運(yùn)行即可
使用python編寫一個(gè)截屏的腳本,雙擊運(yùn)行腳本就OK,截屏成功后會(huì)將截屏文件已當(dāng)前時(shí)間命名,并保存在存放腳本的當(dāng)前路徑的screenshot文件夾下2014-07-07
Django博客系統(tǒng)注冊(cè)之創(chuàng)建用戶模塊應(yīng)用
本文主要介紹了Django博客系統(tǒng)注冊(cè)之創(chuàng)建用戶模塊應(yīng)用,文中通過示例代碼介紹的非常詳細(xì),具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下2021-09-09
Python實(shí)現(xiàn)的擬合二元一次函數(shù)功能示例【基于scipy模塊】
這篇文章主要介紹了Python實(shí)現(xiàn)的擬合二元一次函數(shù)功能,結(jié)合實(shí)例形式分析了Python基于scipy模塊進(jìn)行二元一次函數(shù)擬合相關(guān)科學(xué)運(yùn)算操作實(shí)現(xiàn)技巧,需要的朋友可以參考下2018-05-05
python多個(gè)模塊py文件的數(shù)據(jù)共享實(shí)例
今天小編就為大家分享一篇python多個(gè)模塊py文件的數(shù)據(jù)共享實(shí)例,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過來看看吧2019-01-01
python numpy 部分排序 尋找最大的前幾個(gè)數(shù)的方法
今天小編就為大家分享一篇python numpy 部分排序 尋找最大的前幾個(gè)數(shù),具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過來看看吧2018-06-06
python找出列表中大于某個(gè)閾值的數(shù)據(jù)段示例
今天小編就為大家分享一篇python找出列表中大于某個(gè)閾值的數(shù)據(jù)段示例,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過來看看吧2019-11-11

