Python爬蟲(chóng)工程師面試常見(jiàn)問(wèn)題與總結(jié)
一.項(xiàng)目問(wèn)題:
一般面試官的第一個(gè)問(wèn)題八成都是問(wèn)一下以前做過(guò)的項(xiàng)目,所以最好準(zhǔn)備兩個(gè)自己最近寫(xiě)的有些技術(shù)含量的項(xiàng)目,當(dāng)然一定要自己親手寫(xiě)過(guò)的,在別的地方看的源碼,就算看的再清楚,總歸沒(méi)有自己敲的了解的多。以下是抽出的幾點(diǎn)
1.你寫(xiě)爬蟲(chóng)的時(shí)候都遇到過(guò)什么反爬蟲(chóng)措施,你是怎么解決的
2.用的什么框架,為什么選擇這個(gè)框架(我用的是scrapy框架,所以下面的問(wèn)題也是針對(duì)scrapy)
二.框架問(wèn)題(scrapy)可能會(huì)根據(jù)你說(shuō)的框架問(wèn)不同的問(wèn)題,但是scrapy還是比較多的
1.scrapy的基本結(jié)構(gòu)(五個(gè)部分都是什么,請(qǐng)求發(fā)出去的整個(gè)流程)
2.scrapy的去重原理 (指紋去重到底是什么原理)
3.scrapy中間件有幾種類,你用過(guò)那些中間件,
4.scrapy中間件再哪里起的作用(面向切面編程)
三.代理問(wèn)題
1.為什么會(huì)用到代理
2.代理怎么使用(具體代碼,請(qǐng)求在什么時(shí)候添加的代理)
3.代理失效了怎么處理
四.驗(yàn)證碼處理
1.登陸驗(yàn)證碼處理
2.爬取速度過(guò)快出現(xiàn)的驗(yàn)證碼處理
3.如何用機(jī)器識(shí)別驗(yàn)證碼
五.模擬登陸問(wèn)題
1.模擬登陸流程
2.cookie如何處理
3.如何處理網(wǎng)站傳參加密的情況
六.分布式
1.分布式原理
2.分布式如何判斷爬蟲(chóng)已經(jīng)停止了
3.分布式去重原理
七.數(shù)據(jù)存儲(chǔ)和數(shù)據(jù)庫(kù)問(wèn)題
1.關(guān)系型數(shù)據(jù)庫(kù)和非關(guān)系型數(shù)據(jù)庫(kù)的區(qū)別
2.爬下來(lái)數(shù)據(jù)你會(huì)選擇什么存儲(chǔ)方式,為什么
3.各種數(shù)據(jù)庫(kù)支持的數(shù)據(jù)類型,和特點(diǎn),比如:redis如何實(shí)現(xiàn)持久化,mongodb
是否支持事物等。。
八.python基礎(chǔ)問(wèn)題
# 基礎(chǔ)問(wèn)題非常多,但是因?yàn)榕老x(chóng)性質(zhì),還是有些問(wèn)的比較多的,下面是總結(jié)
1.python2和python3的區(qū)別,如何實(shí)現(xiàn)python2代碼遷移到python3環(huán)境
2.python2和python3的編碼方式有什么差別(工作中發(fā)現(xiàn)編碼問(wèn)題還是挺讓人不爽的)
3.迭代器,生成器,裝飾器
4.python的數(shù)據(jù)類型
九.協(xié)議問(wèn)題
爬蟲(chóng)從網(wǎng)頁(yè)上拿數(shù)據(jù)肯定需要模擬網(wǎng)絡(luò)通信的協(xié)議
1.http協(xié)議,請(qǐng)求由什么組成,每個(gè)字段分別有什么用,https和http有什么差距
2.證書(shū)問(wèn)題
3.TCP,UDP各種相關(guān)問(wèn)題
十.數(shù)據(jù)提取問(wèn)題
1.主要使用什么樣的結(jié)構(gòu)化數(shù)據(jù)提取方式,可能會(huì)寫(xiě)一兩個(gè)例子
2.正則的使用
3.動(dòng)態(tài)加載的數(shù)據(jù)如何提取
4.json數(shù)據(jù)如何提取
十二.算法問(wèn)題
這個(gè)實(shí)在不好總結(jié),比較考驗(yàn)代碼功力,大部分會(huì)讓你寫(xiě)出時(shí)間復(fù)雜度比較低的
算法。小伙伴們要善用python的數(shù)據(jù)類型,對(duì)python的數(shù)據(jù)結(jié)構(gòu)深入了解。
以上就是總結(jié)內(nèi)容,歡迎小伙伴們共同探討。每個(gè)公司各有特點(diǎn),但是這些算是基礎(chǔ),也是常見(jiàn)問(wèn)題。
祝大家能找到理想工作,不寫(xiě)bug
相關(guān)文章
python爬蟲(chóng)面試必看的常見(jiàn)問(wèn)題與參考答案解析
這篇文章主要介紹了python爬蟲(chóng)面試必看的常見(jiàn)問(wèn)題與參考答案,結(jié)合實(shí)例形式總結(jié)分析了Python爬蟲(chóng)面試相關(guān)的Python基礎(chǔ)知識(shí)、概念、原理、算法及相關(guān)操作注意事項(xiàng),需要的朋友2019-10-28關(guān)于Python爬蟲(chóng)面試170道題(推薦)
這篇文章主要介紹了關(guān)于Python爬蟲(chóng)面試170道題,小編覺(jué)得挺不錯(cuò)的,現(xiàn)在分享給大家,也給大家做個(gè)參考。一起跟隨小編過(guò)來(lái)看看吧2019-08-15
Python Web工程師面試相關(guān)問(wèn)題總結(jié)
這篇文章主要介紹了Python Web工程師面試相關(guān)問(wèn)題,總結(jié)分析了Python Web工程師面試過(guò)程中經(jīng)常遇到的各種問(wèn)題及需要掌握的知識(shí)點(diǎn),需要的朋友可以參考下2019-11-01- 這篇文章主要介紹了2019Python必刷面試題(小結(jié)),小編覺(jué)得挺不錯(cuò)的,現(xiàn)在分享給大家,也給大家做個(gè)參考。一起跟隨小編過(guò)來(lái)看看吧2019-12-25
python面試流程與經(jīng)驗(yàn)小結(jié)
這篇文章主要介紹了python面試流程與經(jīng)驗(yàn),總結(jié)分析了Python面試過(guò)程中的各個(gè)環(huán)節(jié)、所遇到的問(wèn)題以及相關(guān)注意事項(xiàng),需要的朋友可以參考下2019-11-16- 這篇文章主要介紹了Python經(jīng)典面試題與參考答案,總結(jié)分析了Python面試中各種常見(jiàn)的概念、數(shù)據(jù)結(jié)構(gòu)、算法等相關(guān)操作技巧,需要的朋友可以參考下2019-11-04
python面試常見(jiàn)問(wèn)題及知識(shí)點(diǎn)整理之列表、字典與綜合部分
這篇文章主要介紹了python面試常見(jiàn)問(wèn)題及知識(shí)點(diǎn)整理之列表、字典與綜合部分,總結(jié)整理了Python面試中關(guān)于列表、字典及其他常見(jiàn)數(shù)據(jù)類型操作技巧,需要的朋友可以參考下2019-10-23- 這篇文章主要介紹了兩道阿里python面試題與參考答案,結(jié)合具體實(shí)例形式分析了Python數(shù)組創(chuàng)建、遍歷、拆分及隨機(jī)數(shù)等相關(guān)操作技巧,需要的朋友可以參考下2019-09-02
- 這篇文章主要介紹了60道硬核Python面試題,論面霸是如何煉成的,小編覺(jué)得挺不錯(cuò)的,現(xiàn)在分享給大家,也給大家做個(gè)參考。一起跟隨小編過(guò)來(lái)看看吧2019-08-28
Python是目前編程領(lǐng)域最受歡迎的語(yǔ)言。在本文中,我將總結(jié)Python面試中最常見(jiàn)的50個(gè)問(wèn)題。每道題都提供參考答案,感興趣的可以了解下2019-06-26



