高考要來啦!用Python爬取歷年高考數(shù)據(jù)并分析
開發(fā)工具
**Python版本:**3.6.4
相關(guān)模塊:
pyecharts模塊;
以及一些Python自帶的模塊。
環(huán)境搭建
安裝Python并添加到環(huán)境變量,pip安裝需要的相關(guān)模塊即可。
pyecharts模塊的安裝可參考:
“一本正經(jīng)的分析”
首先讓我們來看看從恢復(fù)高考(1977年)開始高考報名、最終錄取的總?cè)藬?shù)走勢吧:

T_T看來學(xué)生黨確實是越來越多了。
不過這樣似乎并不能很直觀地看出每年的錄取比例?Ok,讓我們直觀地看看吧:


看來上大學(xué)越來越“容易”之說不是空穴來風(fēng)的,總錄取比例高的可怕~~~
那么各省的情況呢?
由于各省高考最終錄取人數(shù)的統(tǒng)計標(biāo)準(zhǔn)不一樣,有些是只統(tǒng)計本科,有些是都統(tǒng)計的,為了避免統(tǒng)計標(biāo)準(zhǔn)不一而帶來的不公平對比,我們只分析各省的高考報考人數(shù)。
那么985&211高校的分布又如何呢?

“那就這樣吧,再愛都曲終人散了。”看到這個默默不說話了。
以省份為x軸,年份為y軸,該年該省報考的考生人數(shù)為z軸來更直觀地看看各省每年的高考考生數(shù)量變化情況吧:

上圖中省份的順序是這樣的:
北京、四川、陜西、江西、吉林、寧夏、廣西、內(nèi)蒙古、甘肅、西藏、福建、上海、廣東、山東、浙江、河南、安徽、江蘇、河北、黑龍江、湖南、湖北、山西、云南、貴州、海南、遼寧、重慶、天津、青海、新疆,臺灣因為沒有數(shù)據(jù),所以沒有加入。
T_T河南的高考考生數(shù)量真的恐怖。
Emmm,因為可用的數(shù)據(jù)不多,再分析下去大概就是花式的做圖游戲了,想想還是算了吧。至于個人觀點,還是不發(fā)表為好。畢竟,大家的“哈姆雷特”都不一樣。
到此這篇關(guān)于Python數(shù)據(jù)分析之爬取歷年高考數(shù)據(jù)并分析的文章就介紹到這了,更多相關(guān)Python爬取高考數(shù)據(jù)內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
詳解python數(shù)組中的符號...與:符號的不同之處
這篇文章主要介紹了詳解python數(shù)組中的符號...與:符號的不同之處,文中通過示例代碼介紹的非常詳細,對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧2021-03-03
python皮爾遜相關(guān)性數(shù)據(jù)分析分析及實例代碼
這篇文章主要為大家介紹了python皮爾遜相關(guān)性分析及實例代碼,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進步,早日升職加薪2023-02-02
python3.6中anaconda安裝sklearn踩坑實錄
這篇文章主要介紹了python3.6中anaconda安裝sklearn踩坑實錄,文中通過示例代碼介紹的非常詳細,對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧2020-07-07
python調(diào)用百度通用翻譯API的方法實現(xiàn)
本文主要介紹了python調(diào)用百度通用翻譯API的方法實現(xiàn),文中通過示例代碼介紹的非常詳細,對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧2025-01-01
python 內(nèi)置函數(shù)-range()+zip()+sorted()+map()+reduce()+filte
這篇文章主要介紹了python 內(nèi)置函數(shù)-range()+zip()+sorted()+map()+reduce()+filter(),想具體了解函數(shù)具體用法的小伙伴可以參考一下下面的介紹,希望對你有所幫助2021-12-12
Python的SimpleHTTPServer模塊用處及使用方法簡介
這篇文章主要介紹了Python的SimpleHTTPServer模塊用處及使用方法簡介,小編覺得還是挺不錯的,具有一定借鑒價值,需要的朋友可以參考下2018-01-01

