python實(shí)現(xiàn)代理服務(wù)功能實(shí)例
更新時間:2013年11月15日 14:43:27 作者:
本文分析了代理服務(wù)的原理,并使用PYTHON實(shí)現(xiàn)了一個簡單的代理服務(wù)功能供大家參考使用
代理服務(wù)原理很簡單,就拿瀏覽器與web服務(wù)器來說。無非是A瀏覽器
發(fā)request給B代理,B代理再把request把送給C web服務(wù),然后C的reponse->B->A。
要寫web代理服務(wù)就要先了解下http協(xié)議,當(dāng)然并不要多深入,除非要實(shí)現(xiàn)強(qiáng)大的功能:修改XX信息、
負(fù)載均衡等。http請求由三部分組成:請求行、消息報頭、請求正文;
詳細(xì)的網(wǎng)上有,想了解可以看看。下面是一個正常的GET請求頭(Cookie部分本人沒截屏,使用的系統(tǒng)w7):

可以看到首行:GET是請求方法, /是路徑,在后面是協(xié)議版本;第二行以后是請求報頭,都是鍵值對形式;
GET方法沒有正文。post有正文,除此之外,請求方法頭部基本一致,每一行結(jié)尾都是\r\n。
基本的請求方法,如下:
GET 請求獲取Request-URI所標(biāo)識的資源
POST 在Request-URI所標(biāo)識的資源后附加新的數(shù)據(jù)
HEAD 請求獲取由Request-URI所標(biāo)識的資源的響應(yīng)消息報頭
PUT 請求服務(wù)器存儲一個資源,并用Request-URI作為其標(biāo)識
DELETE 請求服務(wù)器刪除Request-URI所標(biāo)識的資源
TRACE 請求服務(wù)器回送收到的請求信息,主要用于測試或診斷
CONNECT 保留將來使用
OPTIONS 請求查詢服務(wù)器的性能,或者查詢與資源相關(guān)的選項(xiàng)和需求
但是使用代理后,從代理服務(wù)上得到的請求如下:

與第一張圖片對比一下,有什么不同......第一行的資源路徑不對。當(dāng)瀏覽器上設(shè)置代理請求時把整個url都作為資源路徑了,所以我們要把域名刪掉,然后代理服務(wù)器在把修改后的請求發(fā)送給目標(biāo)
web服務(wù)器。就這么簡單,當(dāng)然CONNECT方法特別,要特別對待,所以先說其他方法。
基本的思路:
1、代理服務(wù)器運(yùn)行監(jiān)聽,當(dāng)有客戶端瀏覽器請求到來時通過accept()獲得client句柄(或者叫描述符);
2、利用client描述符接收瀏覽器發(fā)來的request,分離出第一行為了修改第一行和獲得method,
要去掉的的部分,除去http://的部分用targetHost表示吧。
3、通過第2步能夠獲得方法method、request和targetHost,這一步可以根據(jù)不同的method做不同的處理,
由于GET、POET、PUT、DELETE等除了CONNECT處理基本一致,所以處理首行,比如:
GET http://www.a.com/ HTTP/1.1
替換為
GET / HTTP/1.1
此時targetHost也就是紅色的部分,默認(rèn)的請求80端口,此時port為80;如果targetHost中有端口(比如www.a.com:8081),
就要分理處端口,此時port為8081。然后根據(jù)targetHost和port連接到目標(biāo)服務(wù)器target了,實(shí)現(xiàn)代碼如下:
def getTargetInfo(self,host): #處理targetHost獲得網(wǎng)址和端口,作為返回值。
port=0
site=None
if ':' in host:
tmp=host.split(':')
site=tmp[0]
port=int(tmp[1])
else:
site=host
port=80
return site,port
def commonMethod(self,request): #處理除CONNECT以外的方法
tmp=self.targetHost.split('/')
net=tmp[0]+'//'+tmp[2]
request=request.replace(net,'') #替換掉首行不必要的部分
targetAddr=self.getTargetInfo(tmp[2]) #調(diào)用上面的函數(shù)
try:
(fam,_,_,_,addr)=socket.getaddrinfo(targetAddr[0],targetAddr[1])[0]
except Exception as e:
print e
return
self.target=socket.socket(fam)
self.target.connect(addr) #連接到目標(biāo)web服務(wù)
4、這一步就好辦了,根據(jù)第三步處理后的request就可以self.target.send(request)發(fā)送給web服務(wù)器了。
5、這一步web服務(wù)器的reponse反響通過代理服務(wù)直接轉(zhuǎn)發(fā)給客戶端就行了,本人用了非阻塞select,可以試試epoll。
基本步驟就是這樣,使用的方法函數(shù)可以改進(jìn),比如主函數(shù)部分使用的多線程或者多進(jìn)程,怎樣選擇......
但是思路差不多都是這樣啦。想測試的話,chrome安裝SwitchySharp插件,設(shè)置一下,代理端口8083;
firefox插件autoproxy。
對于connect的處理還在解決中(如果有博友幫助就更好了),所以現(xiàn)在這個代理程序不支持https協(xié)議。
代理服務(wù)可以獲得http協(xié)議的所有信息,想了解學(xué)習(xí)http,利用代理服務(wù)器是個不錯的方法。
下面附上代碼
#-*- coding: UTF-8 -*-
import socket,select
import sys
import thread
from multiprocessing import Process
class Proxy:
def __init__(self,soc):
self.client,_=soc.accept()
self.target=None
self.request_url=None
self.BUFSIZE=4096
self.method=None
self.targetHost=None
def getClientRequest(self):
request=self.client.recv(self.BUFSIZE)
if not request:
return None
cn=request.find('\n')
firstLine=request[:cn]
print firstLine[:len(firstLine)-9]
line=firstLine.split()
self.method=line[0]
self.targetHost=line[1]
return request
def commonMethod(self,request):
tmp=self.targetHost.split('/')
net=tmp[0]+'//'+tmp[2]
request=request.replace(net,'')
targetAddr=self.getTargetInfo(tmp[2])
try:
(fam,_,_,_,addr)=socket.getaddrinfo(targetAddr[0],targetAddr[1])[0]
except Exception as e:
print e
return
self.target=socket.socket(fam)
self.target.connect(addr)
self.target.send(request)
self.nonblocking()
def connectMethod(self,request): #對于CONNECT處理可以添加在這里
pass
def run(self):
request=self.getClientRequest()
if request:
if self.method in ['GET','POST','PUT',"DELETE",'HAVE']:
self.commonMethod(request)
elif self.method=='CONNECT':
self.connectMethod(request)
def nonblocking(self):
inputs=[self.client,self.target]
while True:
readable,writeable,errs=select.select(inputs,[],inputs,3)
if errs:
break
for soc in readable:
data=soc.recv(self.BUFSIZE)
if data:
if soc is self.client:
self.target.send(data)
elif soc is self.target:
self.client.send(data)
else:
break
self.client.close()
self.target.close()
def getTargetInfo(self,host):
port=0
site=None
if ':' in host:
tmp=host.split(':')
site=tmp[0]
port=int(tmp[1])
else:
site=host
port=80
return site,port
if __name__=='__main__':
host = '127.0.0.1'
port = 8083
backlog = 5
server = socket.socket(socket.AF_INET,socket.SOCK_STREAM)
server.setsockopt(socket.SOL_SOCKET,socket.SO_REUSEADDR,1)
server.bind((host,port))
server.listen(5)
while True:
thread.start_new_thread(Proxy(server).run,())
# p=Process(target=Proxy(server).run, args=()) #多進(jìn)程
# p.start()
發(fā)request給B代理,B代理再把request把送給C web服務(wù),然后C的reponse->B->A。
要寫web代理服務(wù)就要先了解下http協(xié)議,當(dāng)然并不要多深入,除非要實(shí)現(xiàn)強(qiáng)大的功能:修改XX信息、
負(fù)載均衡等。http請求由三部分組成:請求行、消息報頭、請求正文;
詳細(xì)的網(wǎng)上有,想了解可以看看。下面是一個正常的GET請求頭(Cookie部分本人沒截屏,使用的系統(tǒng)w7):

可以看到首行:GET是請求方法, /是路徑,在后面是協(xié)議版本;第二行以后是請求報頭,都是鍵值對形式;
GET方法沒有正文。post有正文,除此之外,請求方法頭部基本一致,每一行結(jié)尾都是\r\n。
基本的請求方法,如下:
GET 請求獲取Request-URI所標(biāo)識的資源
POST 在Request-URI所標(biāo)識的資源后附加新的數(shù)據(jù)
HEAD 請求獲取由Request-URI所標(biāo)識的資源的響應(yīng)消息報頭
PUT 請求服務(wù)器存儲一個資源,并用Request-URI作為其標(biāo)識
DELETE 請求服務(wù)器刪除Request-URI所標(biāo)識的資源
TRACE 請求服務(wù)器回送收到的請求信息,主要用于測試或診斷
CONNECT 保留將來使用
OPTIONS 請求查詢服務(wù)器的性能,或者查詢與資源相關(guān)的選項(xiàng)和需求
但是使用代理后,從代理服務(wù)上得到的請求如下:

與第一張圖片對比一下,有什么不同......第一行的資源路徑不對。當(dāng)瀏覽器上設(shè)置代理請求時把整個url都作為資源路徑了,所以我們要把域名刪掉,然后代理服務(wù)器在把修改后的請求發(fā)送給目標(biāo)
web服務(wù)器。就這么簡單,當(dāng)然CONNECT方法特別,要特別對待,所以先說其他方法。
基本的思路:
1、代理服務(wù)器運(yùn)行監(jiān)聽,當(dāng)有客戶端瀏覽器請求到來時通過accept()獲得client句柄(或者叫描述符);
2、利用client描述符接收瀏覽器發(fā)來的request,分離出第一行為了修改第一行和獲得method,
要去掉的的部分,除去http://的部分用targetHost表示吧。
3、通過第2步能夠獲得方法method、request和targetHost,這一步可以根據(jù)不同的method做不同的處理,
由于GET、POET、PUT、DELETE等除了CONNECT處理基本一致,所以處理首行,比如:
復(fù)制代碼 代碼如下:
GET http://www.a.com/ HTTP/1.1
替換為
GET / HTTP/1.1
此時targetHost也就是紅色的部分,默認(rèn)的請求80端口,此時port為80;如果targetHost中有端口(比如www.a.com:8081),
就要分理處端口,此時port為8081。然后根據(jù)targetHost和port連接到目標(biāo)服務(wù)器target了,實(shí)現(xiàn)代碼如下:
復(fù)制代碼 代碼如下:
def getTargetInfo(self,host): #處理targetHost獲得網(wǎng)址和端口,作為返回值。
port=0
site=None
if ':' in host:
tmp=host.split(':')
site=tmp[0]
port=int(tmp[1])
else:
site=host
port=80
return site,port
def commonMethod(self,request): #處理除CONNECT以外的方法
tmp=self.targetHost.split('/')
net=tmp[0]+'//'+tmp[2]
request=request.replace(net,'') #替換掉首行不必要的部分
targetAddr=self.getTargetInfo(tmp[2]) #調(diào)用上面的函數(shù)
try:
(fam,_,_,_,addr)=socket.getaddrinfo(targetAddr[0],targetAddr[1])[0]
except Exception as e:
print e
return
self.target=socket.socket(fam)
self.target.connect(addr) #連接到目標(biāo)web服務(wù)
4、這一步就好辦了,根據(jù)第三步處理后的request就可以self.target.send(request)發(fā)送給web服務(wù)器了。
5、這一步web服務(wù)器的reponse反響通過代理服務(wù)直接轉(zhuǎn)發(fā)給客戶端就行了,本人用了非阻塞select,可以試試epoll。
基本步驟就是這樣,使用的方法函數(shù)可以改進(jìn),比如主函數(shù)部分使用的多線程或者多進(jìn)程,怎樣選擇......
但是思路差不多都是這樣啦。想測試的話,chrome安裝SwitchySharp插件,設(shè)置一下,代理端口8083;
firefox插件autoproxy。
對于connect的處理還在解決中(如果有博友幫助就更好了),所以現(xiàn)在這個代理程序不支持https協(xié)議。
代理服務(wù)可以獲得http協(xié)議的所有信息,想了解學(xué)習(xí)http,利用代理服務(wù)器是個不錯的方法。
下面附上代碼
復(fù)制代碼 代碼如下:
#-*- coding: UTF-8 -*-
import socket,select
import sys
import thread
from multiprocessing import Process
class Proxy:
def __init__(self,soc):
self.client,_=soc.accept()
self.target=None
self.request_url=None
self.BUFSIZE=4096
self.method=None
self.targetHost=None
def getClientRequest(self):
request=self.client.recv(self.BUFSIZE)
if not request:
return None
cn=request.find('\n')
firstLine=request[:cn]
print firstLine[:len(firstLine)-9]
line=firstLine.split()
self.method=line[0]
self.targetHost=line[1]
return request
def commonMethod(self,request):
tmp=self.targetHost.split('/')
net=tmp[0]+'//'+tmp[2]
request=request.replace(net,'')
targetAddr=self.getTargetInfo(tmp[2])
try:
(fam,_,_,_,addr)=socket.getaddrinfo(targetAddr[0],targetAddr[1])[0]
except Exception as e:
print e
return
self.target=socket.socket(fam)
self.target.connect(addr)
self.target.send(request)
self.nonblocking()
def connectMethod(self,request): #對于CONNECT處理可以添加在這里
pass
def run(self):
request=self.getClientRequest()
if request:
if self.method in ['GET','POST','PUT',"DELETE",'HAVE']:
self.commonMethod(request)
elif self.method=='CONNECT':
self.connectMethod(request)
def nonblocking(self):
inputs=[self.client,self.target]
while True:
readable,writeable,errs=select.select(inputs,[],inputs,3)
if errs:
break
for soc in readable:
data=soc.recv(self.BUFSIZE)
if data:
if soc is self.client:
self.target.send(data)
elif soc is self.target:
self.client.send(data)
else:
break
self.client.close()
self.target.close()
def getTargetInfo(self,host):
port=0
site=None
if ':' in host:
tmp=host.split(':')
site=tmp[0]
port=int(tmp[1])
else:
site=host
port=80
return site,port
if __name__=='__main__':
host = '127.0.0.1'
port = 8083
backlog = 5
server = socket.socket(socket.AF_INET,socket.SOCK_STREAM)
server.setsockopt(socket.SOL_SOCKET,socket.SO_REUSEADDR,1)
server.bind((host,port))
server.listen(5)
while True:
thread.start_new_thread(Proxy(server).run,())
# p=Process(target=Proxy(server).run, args=()) #多進(jìn)程
# p.start()
您可能感興趣的文章:
- python多線程threading.Lock鎖用法實(shí)例
- Python threading多線程編程實(shí)例
- python基于queue和threading實(shí)現(xiàn)多線程下載實(shí)例
- Python用threading實(shí)現(xiàn)多線程詳解
- python threading模塊操作多線程介紹
- Python使用代理抓取網(wǎng)站圖片(多線程)
- Python代理抓取并驗(yàn)證使用多線程實(shí)現(xiàn)
- 嘗試使用Python多線程抓取代理服務(wù)器IP地址的示例
- 在python中的socket模塊使用代理實(shí)例
- Python基于ThreadingTCPServer創(chuàng)建多線程代理的方法示例
相關(guān)文章
python單例設(shè)計模式實(shí)現(xiàn)解析
這篇文章主要介紹了python單例設(shè)計模式實(shí)現(xiàn)解析,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友可以參考下2020-01-01
基于Python+tkinter實(shí)現(xiàn)簡易計算器桌面軟件
tkinter是Python的標(biāo)準(zhǔn)GUI庫,對于初學(xué)者來說,它非常友好,因?yàn)樗峁┝舜罅康念A(yù)制部件,本文小編就來帶大家詳細(xì)一下如何利用tkinter制作一個簡易計算器吧2023-09-09
python將matplotlib嵌入到tkinter中的步驟詳解
tkinter是Python標(biāo)準(zhǔn)庫中自帶的GUI工具,使用十分方便,如能將matplotlib嵌入到tkinter中,就可以做出相對專業(yè)的數(shù)據(jù)展示系統(tǒng),很有競爭力,本文就給大家介紹python將matplotlib嵌入到tkinter中的方法步驟,需要的朋友可以參考下2023-08-08
Python+Pygame實(shí)現(xiàn)之走四棋兒游戲的實(shí)現(xiàn)
大家以前應(yīng)該都聽說過一個游戲:叫做走四棋兒。直接在家里的水泥地上用燒完的炭火灰畫出幾條線,擺上幾顆石頭子即可。當(dāng)時的火爆程度可謂是達(dá)到了一個新的高度。本文將利用Pygame實(shí)現(xiàn)這一游戲,需要的可以參考一下2022-07-07
Python繪圖系統(tǒng)之自定義一個坐標(biāo)設(shè)置控件
這篇文章主要為大家詳細(xì)介紹了Python如何編寫一個繪圖系統(tǒng),可以實(shí)現(xiàn)自定義一個坐標(biāo)設(shè)置控件,文中的示例代碼講解詳細(xì),感興趣的可以了解一下2023-08-08
Python程序打包工具py2exe和PyInstaller詳解
這篇文章主要介紹了Python程序打包工具py2exe和PyInstaller詳解,如果可以提前將程序打包成 Windows平臺的 .exe 文件或者是Linux下的 .sh 腳本,那么使用起來就會方便很多,需要的朋友可以參考下2019-06-06
關(guān)于jieba.cut與jieba.lcut的區(qū)別及說明
這篇文章主要介紹了關(guān)于jieba.cut與jieba.lcut的區(qū)別及說明,具有很好的參考價值,希望對大家有所幫助。如有錯誤或未考慮完全的地方,望不吝賜教2023-05-05

