python小程序?qū)崿F(xiàn)刷票功能詳解
刷票一般要突破以下限制:
1、驗證碼識別
2、同一ip不可連續(xù)投票
解決辦法
1、用tesseract工具,鏈接在此 https://code.google.com/p/tesseract-ocr/ (人人還是加不了https鏈接)
2、使用代理,國內(nèi)可以的代理服務(wù)器可以從這里找到 http://cn-proxy.com/
程序語言當(dāng)然用python
瀏覽器投票的流程如下
1、向服務(wù)器發(fā)送請求,服務(wù)器返回驗證碼和表單
2、填好表單,發(fā)送到服務(wù)器
可以用firefox+httpfox插件查看整個事件過程,以及發(fā)送請求的POST和GET數(shù)據(jù)格式
使用python的urllib2庫實現(xiàn)上述過程
1、向服務(wù)器請求驗證碼
可以用
import urllib urllib.urlretrieve(imgurl,imgfile)#imgurl可以從頁面源代碼找到
但是由于每次請求服務(wù)器,都會重新生成驗證碼,所以這樣請求道的驗證碼即便識別出來,再POST進(jìn)去時也會提示錯誤。解決辦法時使用cookie
import cookie import urllib2 cookiejar=cookielib.MozillaCookieJar(cookieFilename) opener=urllib2.build_opener(urllib2.HTTPCookieProcessor(cookiejar)) response=opener.open(imgurl)
如果需要使用代理服務(wù)器,則可以這樣寫
import cookie
import urllib2
proxy_line='127.0.0.1:8087'
cookieFilename='cookie.txt'
cookiejar=cookielib.MozillaCookieJar(cookieFilename)
opener=urllib2.build_opener(urllib2.ProxyHandler({'http':proxy_line}),urllib2.HTTPCookieProcessor(cookieFileJar))
response=opener.open(imgurl,timeout=2)#設(shè)置超時時間
這樣就是以本機8087端口帶有cookie驗證訪問服務(wù)器,下一步識別出驗證碼,依然帶cookie POST進(jìn)服務(wù)器即可。
2、保存驗證碼到本地
上面response即返回得到的驗證碼二進(jìn)制流,寫入文件用下面代碼
content=response.read() fp=file(imgfile,'wb')#將二進(jìn)制圖片保存 fp.write(content) fp.close()
3、驗證碼識別
驗證碼識別用tesseract,由于tesseract沒有提供python接口,這里用系統(tǒng)調(diào)用外部命令
用法為
import os imgfile='img.jpg' out
用python刷票代碼如下
# -*- coding: utf-8 -*-
import os
import urllib
import urllib2
import string
import socks
import httplib2
import cookielib
import time
import random
tes='tesseract.exe'
filepath='./'
imgurl='http://example.com/vote/img.jsp'
myurl="http://example.com/vote"
voteInfoId='xxxxxxxx'
headers={'User-Agent':'Mozilla/5.0 (Windows NT 6.1; WOW64; rv:25.0) Gecko/20100101 Firefox/25.0'}#,
# 'Cookie':'324E661DE12427BD71CE63DF436A80D1'}
imgfile=filepath + '/img.jpg'
outfile=filepath + '/out'
proxy_file=filepath+'/proxy.txt'
user_file=filepath+'/user2.txt'
cookieFilename=filepath +'/cookies.txt'
#myproxy_line='211.142.236.137:80'
#cookieJarFileLWP=cookielib.LWPCookieJar(cookieFilename)
cookieFileJar=cookielib.FileCookieJar(cookieFilename)
#opener=urllib2.build_opener(urllib2.ProxyHandler({'http':myproxy_line}),urllib2.HTTPCookieProcessor(cookieMozillaJar))
opener=urllib2.build_opener(urllib2.HTTPCookieProcessor(cookieFileJar))
f_user=open(user_file)
f_proxy=open(proxy_file)
proxy_all=f_proxy.read().split('\n')
f_user=open(user_file)
user_all=f_user.read().split('\n')
count=1
cookieFileJar=cookielib.FileCookieJar(cookieFilename)#使用cookie登陸
while True:
i=random.randint(1,100)
j=random.randint(1,60)
#print user_all.length()
user_line=user_all[i]
myproxy_line=proxy_all[j]
for myproxy_line in [myproxy_line]:#f_proxy:
#使用代理和cookie
opener=urllib2.build_opener(urllib2.ProxyHandler({'http':myproxy_line}),urllib2.HTTPCookieProcessor(cookieFileJar))
try:
response2=opener.open(imgurl,timeout=1)#返回二進(jìn)制圖片
except Exception,e:
print 'I can not connect the server,try again'
continue
content=response2.read()
fp=file(imgfile,'wb')#將二進(jìn)制圖片保存
fp.write(content)
fp.close()
outcmd="%s %s %s -l eng digits -psm 7" %(tes,imgfile,outfile)
print 'I begin to recognize the CAPTCHA code ..'
os.system(outcmd)
code_file=open(filepath+'/out.txt')
mycode_line=code_file.readline()
code_file.close()
if len(mycode_line)<=3:
print 'I guess the CAPTCHA code is %s,but I think it\'s error.' % (mycode_line)
continue
mycode=mycode_line[0:4]
print 'I guess the CAPTCHA code is %s' % (mycode)
mylist=user_line.split('----')
proxy_list=myproxy_line.split(':')
myid=mylist[0]#.decode('utf-8')
myname=mylist[1]#.decode('utf-8')
mycomm=mylist[2]#.decode('utf-8')
data={'method':'vote',
'voteInfoId':voteInfoId,
'forward':'***',
'info1':myid,
'info2':myname,
'info3':mycomm,
'inputCode':mycode,
'submit':'確定'}
print 'Now I begin to vote...'
print 'the user is %s' % (myid)
print 'the name is %s' % (myname)
print 'the comment is %s' % (mycomm)
post_data=urllib.urlencode(data)
try:
response=opener.open(myurl,post_data)
except Exception,e:
print 'I can\'t connect the server ,so vote is failure'
continue
content=response.read()
#img_req=opener.open(imgurl)
#cookieFileJar.save(cookieFilename)
#req=opener.open(myurl,post_data)
#req=urllib2.Request(myurl,data=post_data,headers=headers)
fp=file('test.html','w')
print 'I put the received html to the file test.html'
fp.write(content)
fp.close()
#outcmd="%s %s %s" %(tes,imgfile,outfile)
#count+=1
#print cookieFileJar
以上就是本文的全部內(nèi)容,希望對大家的學(xué)習(xí)有所幫助,也希望大家多多支持腳本之家。
相關(guān)文章
opencv python統(tǒng)計及繪制直方圖的方法
這篇文章主要介紹了opencv python統(tǒng)計及繪制直方圖的方法,小編覺得挺不錯的,現(xiàn)在分享給大家,也給大家做個參考。一起跟隨小編過來看看吧2019-01-01
python運行或調(diào)用另一個py文件或參數(shù)方式
這篇文章主要介紹了python運行或調(diào)用另一個py文件或參數(shù)方式,具有很好的參考價值,希望對大家有所幫助。如有錯誤或未考慮完全的地方,望不吝賜教2022-08-08

