Windows下安裝Scrapy
這幾天正好有需求實(shí)現(xiàn)一個(gè)爬蟲(chóng)程序,想到爬蟲(chóng)程序立馬就想到了python,python相關(guān)的爬蟲(chóng)資料好像也特別多。于是就決定用python來(lái)實(shí)現(xiàn)爬蟲(chóng)程序了,正好發(fā)現(xiàn)了python有一個(gè)開(kāi)源庫(kù)scrapy,正是用來(lái)實(shí)現(xiàn)爬蟲(chóng)框架的,于是果斷采用這個(gè)實(shí)現(xiàn)。下面就先安裝scrapy,決定在windows下面安裝。
Scrapy簡(jiǎn)介
Scrapy,Python開(kāi)發(fā)的一個(gè)快速、高層次的屏幕抓取和web抓取框架,用于抓取web站點(diǎn)并從頁(yè)面中提取結(jié)構(gòu)化的數(shù)據(jù)。
Scrapy用途廣泛,可以用于數(shù)據(jù)挖掘、監(jiān)測(cè)和自動(dòng)化測(cè)試。
Scrapy吸引人的地方在于它是一個(gè)框架,任何人都可以根據(jù)需求方便的修改。它也提供了多種類(lèi)型爬蟲(chóng)的基類(lèi),如BaseSpider、sitemap爬蟲(chóng)等,最新版本又提供了web2.0爬蟲(chóng)的支持。
安裝依賴
- Scrapy安裝依賴于以下幾個(gè)Python庫(kù)
- lxml, an efficient XML and HTML parser
- parsel, an HTML/XML data extraction library written on top of lxml,
- w3lib, a multi-purpose helper for dealing with URLs and web page encodings
- twisted, an asynchronous networking framework
- cryptography and pyOpenSSL, to deal with various network-level security needs
我選擇手動(dòng)安裝這些依賴
- pip install lxml
- pip install parsel
- pip install w3lib
- pip install twisted
- pip install cryptography
- pip install pyOpenSSL
其他的安裝都很順利,就是在安裝twisted的時(shí)候報(bào)錯(cuò)了。
Microsoft Visual C++ 14.0 is required. Get it with "Microsoft Visual C++ Build Tools": http://landinghub.visualstudio.com/visual-cpp-build-tools
于是下載離線的安裝(下載自己的版本)
https://www.lfd.uci.edu/~gohlke/pythonlibs/#twisted
下載到一個(gè)目錄,然后用
pip install Twisted-17.9.0-cp36-cp36m-win32.whl
之后再用下面的命令安裝就可以了
pip install Scrapy
在命令行中輸入scrapy,出現(xiàn)如下界面,則表示安裝成功

總結(jié)
以上就是這篇文章的全部?jī)?nèi)容了,希望本文的內(nèi)容對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,謝謝大家對(duì)腳本之家的支持。如果你想了解更多相關(guān)內(nèi)容請(qǐng)查看下面相關(guān)鏈接
- windows10系統(tǒng)中安裝python3.x+scrapy教程
- python使用scrapy發(fā)送post請(qǐng)求的坑
- Python爬蟲(chóng)框架scrapy實(shí)現(xiàn)downloader_middleware設(shè)置proxy代理功能示例
- Python爬蟲(chóng)框架scrapy實(shí)現(xiàn)的文件下載功能示例
- Python爬蟲(chóng)框架Scrapy常用命令總結(jié)
- 詳解Python安裝scrapy的正確姿勢(shì)
- Scrapy基于selenium結(jié)合爬取淘寶的實(shí)例講解
- 利用Anaconda簡(jiǎn)單安裝scrapy框架的方法
- 基于scrapy的redis安裝和配置方法
- mac下給python3安裝requests庫(kù)和scrapy庫(kù)的實(shí)例
- Docker 部署Scrapy的詳解
- 利用scrapy將爬到的數(shù)據(jù)保存到mysql(防止重復(fù))
- Centos7 Python3下安裝scrapy的詳細(xì)步驟
相關(guān)文章
python實(shí)現(xiàn)俄羅斯方塊游戲(改進(jìn)版)
這篇文章主要為大家詳細(xì)介紹了python實(shí)現(xiàn)俄羅斯方塊游戲的改進(jìn)版,文中示例代碼介紹的非常詳細(xì),具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下2020-03-03
深入理解Python虛擬機(jī)中列表(list)的實(shí)現(xiàn)原理及源碼剖析
在本篇文章當(dāng)中主要給大家介紹?cpython?虛擬機(jī)當(dāng)中針對(duì)列表的實(shí)現(xiàn),在?Python?中,List?是一種非常常用的數(shù)據(jù)類(lèi)型,可以存儲(chǔ)任何類(lèi)型的數(shù)據(jù),并且支持各種操作,如添加、刪除、查找、切片等,在本篇文章當(dāng)中將深入去分析這一點(diǎn)是如何實(shí)現(xiàn)的2023-03-03
vim自動(dòng)補(bǔ)全插件YouCompleteMe(YCM)安裝過(guò)程解析
這篇文章主要介紹了vim自動(dòng)補(bǔ)全插件YouCompleteMe(YCM)安裝過(guò)程解析,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友可以參考下2019-10-10
python 網(wǎng)絡(luò)編程詳解及簡(jiǎn)單實(shí)例
這篇文章主要介紹了python 網(wǎng)絡(luò)編程詳解及簡(jiǎn)單實(shí)例的相關(guān)資料,需要的朋友可以參考下2017-04-04
TensorFlow設(shè)置日志級(jí)別的幾種方式小結(jié)
今天小編就為大家分享一篇TensorFlow設(shè)置日志級(jí)別的幾種方式小結(jié),具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧2020-02-02
python2.7實(shí)現(xiàn)復(fù)制大量文件及文件夾資料
這篇文章主要為大家詳細(xì)介紹了python2.7實(shí)現(xiàn)復(fù)制大量文件及文件夾資料,具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下2019-08-08
python正則表達(dá)式匹配[]中間為任意字符的實(shí)例
今天小編就為大家分享一篇python正則表達(dá)式匹配[]中間為任意字符的實(shí)例,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧2018-12-12

