通過Python實現(xiàn)自動填寫調(diào)查問卷
0X00 前言
快開學(xué)了,看到空間里面各種求填寫調(diào)查問卷的,我才想起來貌似我也還沒做。對于這種無意義的問卷,我是不怎么感冒的,所以我打算使用”特技”來完成,也就是python,順便重新復(fù)習(xí)一下python,真的好久沒用了。下面,表演開始……
0X01代碼編寫思路
首先先創(chuàng)建一份問卷

我們隨便填寫一個問卷并提交,在提交之前開啟Burpsuite截獲數(shù)據(jù)包

對于截獲的數(shù)據(jù)包進(jìn)行分析,有的被url編碼了不利于分析,可以使用Burpsuite編碼模塊解碼替換,這樣就好分析了



通過觀察可以發(fā)現(xiàn),post了一串奇怪的數(shù)據(jù)submitdata=1$2}2$3}3$3}4$4}5$3}6$2}7$4}8$2}9$3}10$3。仔細(xì)分析可看出數(shù)據(jù)大概是這個意思submitdata=題號$選項號}題號$選項號}題號$選項號}……..
利用這些信息就可以開始編寫python程序了

運行結(jié)果如下

貌似網(wǎng)站還有其他反爬蟲機(jī)制,在連續(xù)提交幾個表單之后,就出現(xiàn)了驗證碼。難道此時我們還要給程序添加上識別驗證碼的功能?其實不必,我們可以先分析一下剛剛Burpsuite截獲的header信息,來看看到底網(wǎng)站是通過什么方式,識別出我們是用爬蟲來提交問卷的。


通過一番測試,我發(fā)現(xiàn)當(dāng)我連續(xù)提交3份問卷,再換一個IP提交3個問卷,也就是連續(xù)提交了6份問卷,并沒有觸發(fā)網(wǎng)站的反爬蟲機(jī)制。所以我們可以猜測對方基于IP提交問卷的頻率來識別爬蟲程序的??吹竭@里,大家可能會想,我們可以通過網(wǎng)上的免費代理來提交問卷。例如這些

那是不是意味著我們還要往python代碼中添加提取免費代理IP的功能呢?NO NO NO!換個思路,在CTF比賽中會遇到一種題目,例如你的IP是來自德國的才可以拿到flag。所以,我們的思路就是進(jìn)行數(shù)據(jù)包頭欺騙,偽造我們的IP,騙過服務(wù)器。下面來說說偽造IP的幾種方式。
X-Client-IP:1.1.1.1 X-Remote-IP:2.2.2.2 X-Remote-Addr:3.3.3.3 X-Originating-IP:4.4.4.4 X-Forwarded-For:5.5.5.5
我們每個都嘗試一下,然后在后臺統(tǒng)計那里可以看到我們的問卷來源

這里我們發(fā)現(xiàn)用X-Forwarded-For可以繞過,按我們就用這種方法在header信息中添加X-Forwarded-For字段,所以修改后的腳本如下

運行結(jié)果如下

再到后臺看看統(tǒng)計信息


至此,我們算是完美的解決任務(wù)了。如果大家想去掉調(diào)查問卷中國外的IP地址,可以收集一下中國的IP地址段,然后添加進(jìn)程序,處理一下即可。
0X02總結(jié)
大家平??梢园褜W(xué)到的東西用到實際生活中,遇到困難的時候不要慌,多思考,找到最優(yōu)的解決方法。例如上面,我并沒有在代碼中添加驗證碼識別模塊,也沒有通過走代理的方式來繞過網(wǎng)站的反爬蟲機(jī)制,而是通過分析網(wǎng)站的反爬蟲機(jī)制,并且使用所學(xué)的安全知識(HTTP頭欺騙)輕松解決問題,使用最短的代碼完美完成任務(wù)。
相關(guān)文章
Python OpenCV之圖片縮放的實現(xiàn)(cv2.resize)
這篇文章主要介紹了Python OpenCV之圖片縮放的實現(xiàn),文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧2019-06-06
Python爬蟲+tkinter界面實現(xiàn)歷史天氣查詢的思路詳解
這篇文章主要介紹了Python爬蟲+tkinter界面實現(xiàn)歷史天氣查詢的思路詳解,本文給大家介紹的非常詳細(xì),對大家的學(xué)習(xí)或工作具有一定的參考借鑒價值,需要的朋友可以參考下2021-02-02
python3.8.1+selenium實現(xiàn)登錄滑塊驗證功能
這篇文章主要介紹了python3.8.1+selenium解決登錄滑塊驗證的問題,本文通過實例代碼給大家介紹的非常詳細(xì),對大家的學(xué)習(xí)或工作具有一定的參考借鑒價值,需要的朋友可以參考下2020-05-05
解決Python內(nèi)層for循環(huán)如何break出外層的循環(huán)的問題
今天小編就為大家分享一篇解決Python內(nèi)層for循環(huán)如何break出外層的循環(huán)的問題,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧2019-06-06
解決python和pycharm安裝gmpy2 出現(xiàn)ERROR的問題
這篇文章主要介紹了python和pycharm安裝gmpy2 出現(xiàn)ERROR的解決方法,本文給大家介紹的非常詳細(xì),對大家的學(xué)習(xí)或工作具有一定的參考借鑒價值,需要的朋友可以參考下2020-08-08
Python并發(fā)編程隊列與多線程最快發(fā)送http請求方式
假如有一個文件,里面有10萬個url,需要對每個url發(fā)送http請求,并打印請求結(jié)果的狀態(tài)碼,如何編寫代碼盡可能快的完成這些任務(wù)呢2021-09-09
python+tkinter實現(xiàn)學(xué)生管理系統(tǒng)
這篇文章主要為大家詳細(xì)介紹了python+tkinter實現(xiàn)學(xué)生管理系統(tǒng),具有一定的參考價值,感興趣的小伙伴們可以參考一下2019-08-08

