python正則匹配查詢辦理進度示例分享
[code]
import socket
import re
def gethtmlbyidentityid(identityid):
s = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
host = 'www.gdcrj.com';
suburl = '/wsyw/tcustomer/tcustomer.do?&method=find&applyid={0}'
port = 80;
remote_ip = socket.gethostbyname(host)
s.connect((remote_ip , port))
print('【INFO】:socket連接成功')
message = 'GET '+ suburl.format(identityid) +' HTTP/1.1\r\nHost: '+ host +'\r\n\r\n'
# str 2 bytes
m_bytes = message.encode('utf-8')
# send bytes
s.sendall(m_bytes)
print('【INFO】:遠程下載中...')
recevstr = ''
while True:
# return bytes
recev = s.recv(4096)
# bytes 2 str
recevstr += recev.decode(encoding = 'utf-8', errors = 'ignore')
if not recev:
s.close()
print('【INFO】:遠程下載網(wǎng)頁完成')
break
return recevstr
'''
利用正則表達式從上步獲取的網(wǎng)頁html內(nèi)容里找出查詢結(jié)果
'''
def getresultfromhtml(htmlstr):
linebreaks = re.compile(r'\n\s*')
space = re.compile('( )+')
resultReg = re.compile(r'\<td class="news_font"\>([^<td]+)\</td\>', re.MULTILINE)
#去除換行符和空格
htmlstr = linebreaks.sub('', htmlstr)
htmlstr = space.sub(' ', htmlstr)
#匹配出查詢結(jié)果
result = resultReg.findall(htmlstr)
for res in result:
print(res.strip())
相關文章
python3+RobotFramework環(huán)境搭建過程
之前用的python2.7+robotframework進行的自動化測試,python3的還沒嘗試,今天嘗試了下,搭建環(huán)境的時候也是各種報錯,今天給大家分享下python3+RobotFramework環(huán)境搭建過程,感興趣的朋友一起看看吧2023-08-08
python 在指定范圍內(nèi)隨機生成不重復的n個數(shù)實例
今天小編就為大家分享一篇python 在指定范圍內(nèi)隨機生成不重復的n個數(shù)實例,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧2019-01-01
利用Python批量識別電子賬單數(shù)據(jù)的方法
這篇文章主要介紹了利用Python批量識別電子賬單數(shù)據(jù)的方法,本文給大家介紹的非常詳細,對大家的學習或工作具有一定的參考借鑒價值,需要的朋友可以參考下2021-02-02

