python定位xpath 節(jié)點位置的方法
chrome 右鍵有copy xpath地址
但是有些時候獲取的可能不對
可以自己用代碼驗證一下
如果還是不行 可以考慮從源碼當中取出來
趁熱打鐵,使用前一篇文章中 XPath 節(jié)點來定位HTML 頁面。
HTML文件如下(您可以將其拷貝,保存成html文件,跟我筆者實驗):
<!DOCTYPE html> <html lang="en"> <head> <meta charset="UTF-8"> <title>Storm</title> </head> <body> <h1 id="h1" name="hname" class="cname">這是一個h1標簽</h1> <form> 文本域1:<input type="text" name="first_name"> <br> 文本域2:<input type="text" name="last_name"> </form> <form> 密碼字段:<input type="password" name="password"> </form> <form> 單選按鈕1: <input type="radio" name="radio1" value="nan">male <input type="radio" name="radio1" value="nv">female </form> <form> 寵物: <input type="checkbox" name="cw">貓 <input type="checkbox" name="cw">狗 <input type="checkbox" name="cw">兔子 </form> </body> </html>
1、節(jié)點
上面的HTML文件,<html> 為根節(jié)點,他有個lang的屬性,他有兩個子節(jié)點<head>和<body>。
2、選取節(jié)點實驗
(1)/,從根節(jié)點選取
下面的代碼從根節(jié)點開始選取所有的html元素(這里只有一個),打印tag name,就是html
from selenium import webdriver
driver = webdriver.Chrome()
driver.get(r'file:///E:\python\test1\day1\test0.html')
eles = driver.find_elements_by_xpath('/html')
for ele in eles:
print(ele.tag_name)
driver.quit()
運行結果
C:\Python36\python.exe E:/python/test1/day1/test9.py html Process finished with exit code 0
(2)//,從目標節(jié)點下選取
下面的xpath,意思就是我要去找head,找到就保存到eles里面,不一定需要在根目錄下面找
from selenium import webdriver
driver = webdriver.Chrome()
driver.get(r'file:///E:\python\test1\day1\test0.html')
eles = driver.find_elements_by_xpath('//head')
for ele in eles:
print(ele.tag_name)
driver.quit()
運行結果:
C:\Python36\python.exe E:/python/test1/day1/test9.py head Process finished with exit code 0
如果我換成下面的xpath,結果會如何呢?
from selenium import webdriver
driver = webdriver.Chrome()
driver.get(r'file:///E:\python\test1\day1\test0.html')
eles = driver.find_elements_by_xpath('/head')
for ele in eles:
print(ele.tag_name)
driver.quit()
從根節(jié)點選取head元素,跟節(jié)點不是head元素,所以找不到,打印為空
(3). ,選取當前節(jié)點;.. ,選取父節(jié)點
下面的xpath,第一個,匹配到head元素,然后分配找head當前節(jié)點(就是head);head父節(jié)點(是html)
from selenium import webdriver
driver = webdriver.Chrome()
driver.get(r'file:///E:\python\test1\day1\test0.html')
eles2 = driver.find_elements_by_xpath('//head/.')
eles3 = driver.find_elements_by_xpath('//head/..')
for ele in eles2:
print(ele.tag_name)
for ele in eles3:
print(ele.tag_name)
driver.quit()
運行結果:
C:\Python36\python.exe E:/python/test1/day1/test9.py head html Process finished with exit code 0
(4)@ 選取屬性
下面xpath為,匹配任意元素,其有個屬性charset,值為UTF-8。
from selenium import webdriver
driver = webdriver.Chrome()
driver.get(r'file:///E:\python\test1\day1\test0.html')
eles3 = driver.find_elements_by_xpath('//*[@charset="UTF-8"]')
for ele in eles3:
print(ele.tag_name)
driver.quit()
運行結果為:
C:\Python36\python.exe E:/python/test1/day1/test9.py meta Process finished with exit code 0
3、謂語實驗
(1)[1]
選擇第一個form元素下面的第一個input元素,打印name屬性值
eles1 = driver.find_elements_by_xpath('//form[1]/input[1]')
for ele in eles1:
print(ele.get_attribute('name'))
運行結果:first_name
(2)[last()]
eles1 = driver.find_elements_by_xpath('//form[1]/input[last()]')
運行結果:last_name
(3)[last()-1]
eles1 = driver.find_elements_by_xpath('//form[1]/input[last()-1]')
運行結果:first_name
(4)[position()<3]
eles1 = driver.find_elements_by_xpath('//form[1]/input[position()<3]')
運行結果:
first_name last_name
(5)h1[@class]
在body元素下層找具有class屬性的h1標簽
eles1 = driver.find_elements_by_xpath('//body/h1[@class]')
for ele in eles1:
print(ele.tag_name)
(6)h1[@class="cname"]
在body元素下層找具有class屬性的h1標簽,且值為cname
eles1 = driver.find_elements_by_xpath('//body/h1[@class="cname"]')
(7)input[xxx>35]
這個沒找到合適的例子,暫缺
4、選取未知節(jié)點——通過通配符實現(xiàn)
(1)//form[1]/*
選擇form[1]下的所有元素
eles1 = driver.find_elements_by_xpath('//form[1]/*')
for ele in eles1:
print(ele.get_attribute('name'))
運行結果:
first_name None last_name
(2)//*
選擇所有元素
eles1 = driver.find_elements_by_xpath('//*')
for ele in eles1:
print(ele.tag_name)
運行結果:
html head meta title body h1 form input br input form input form input input form input input input input
(3)//input[@*]
匹配只要有任意屬性的input元素
以上這篇python定位xpath 節(jié)點位置的方法就是小編分享給大家的全部內容了,希望能給大家一個參考,也希望大家多多支持腳本之家。
相關文章
python實現(xiàn)爬蟲統(tǒng)計學校BBS男女比例之數(shù)據(jù)處理(三)
這篇文章主要介紹了python實現(xiàn)爬蟲統(tǒng)計學校BBS男女比例之數(shù)據(jù)處理,需要的朋友可以參考下2015-12-12
Python技法之簡單遞歸下降Parser的實現(xiàn)方法
遞歸下降解析器可以用來實現(xiàn)非常復雜的解析,下面這篇文章主要給大家介紹了關于Python技法之簡單遞歸下降Parser的實現(xiàn)方法,文中通過示例代碼介紹的非常詳細,需要的朋友可以參考下2022-05-05
詳解Python+Pyecharts實現(xiàn)漏斗圖的繪制
漏斗圖是一個簡單的散點圖,反映研究在一定樣本量或精確性下單個研究的干預效應估計值。本文將用Python Pyecharts實現(xiàn)漏斗圖的繪制,需要的可以參考一下2022-06-06
使用python爬取連續(xù)降水數(shù)據(jù)信息實例
這篇文章主要為大家介紹了使用python提取連續(xù)降水數(shù)據(jù)信息實現(xiàn)示例,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進步,早日升職加薪2024-01-01
在macOS上搭建python環(huán)境的實現(xiàn)方法
今天小編就為大家分享一篇在macOS上搭建python環(huán)境的實現(xiàn)方法,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧2019-08-08
pyecharts如何實現(xiàn)顯示數(shù)據(jù)為百分比的柱狀圖
這篇文章主要介紹了pyecharts如何實現(xiàn)顯示數(shù)據(jù)為百分比的柱狀圖,具有很好的參考價值,希望對大家有所幫助。如有錯誤或未考慮完全的地方,望不吝賜教2022-11-11
全面了解Python的getattr(),setattr(),delattr(),hasattr()
下面小編就為大家?guī)硪黄媪私釶ython的getattr(),setattr(),delattr(),hasattr()。小編覺得挺不錯的,現(xiàn)在就分享給大家,也給大家做個參考。一起跟隨小編過來看看吧2016-06-06

