scrapy redis配置文件setting參數(shù)詳解
scrapy項(xiàng)目 setting.py
#Resis 設(shè)置
#使能Redis調(diào)度器
SCHEDULER = 'scrapy_redis.scheduler.Scheduler'
#所有spider通過(guò)redis使用同一個(gè)去重過(guò)濾器
DUPEFILTER_CLASS = 'scrapy_redis.dupefilter.RFPDupeFilter'
#不清除Redis隊(duì)列、這樣可以暫停/恢復(fù) 爬取
#SCHEDULER_PERSIST = True
#SCHEDULER_QUEUE_CLASS ='scrapy_redis.queue.PriorityQueue' #默認(rèn)隊(duì)列,優(yōu)先級(jí)隊(duì)列
#備用隊(duì)列。
#SCHEDULER_QUEUE_CLASS ='scrapy_redis.queue.FifoQueue' #先進(jìn)先出隊(duì)列
#SCHEDULER_QUEUE_CLASS ='scrapy_redis.queue.LifoQueue' #后進(jìn)先出隊(duì)列
#最大空閑時(shí)間防止分布式爬蟲(chóng)因?yàn)榈却P(guān)閉
#SCHEDULER_IDLE_BEFORE_CLOSE = 10
#將抓取的item存儲(chǔ)在Redis中以進(jìn)行后續(xù)處理。
ITEM_PIPELINES = {
'scrapy_redis.pipelines.RedisPipeline':300,
}
# The item pipeline serializes and stores the items in this redis key.
#item pipeline 將items 序列化 并用如下key名儲(chǔ)存在redis中
#REDIS_ITEMS_KEY = '%(spider)s:items'
#默認(rèn)的item序列化方法是ScrapyJSONEncoder,你也可以使用自定義的序列化方式
#REDIS_ITEMS_SERIALIZER = 'json.dumps'
#設(shè)置redis地址 端口 密碼
REDIS_HOST = 'localhost'
REDIS_HOST = 6379
#也可以通過(guò)下面這種方法設(shè)置redis地址 端口和密碼,一旦設(shè)置了這個(gè),則會(huì)覆蓋上面所設(shè)置的REDIS_HOST和REDIS_HOST
REDIS_URL = 'redis://root:redis_pass@xxx.xx.xx.xx:6379'
#root用戶名,redis_pass:你設(shè)置的redis驗(yàn)證密碼,xxxx:你的主機(jī)ip
#你設(shè)置的redis其他參數(shù) Custom redis client parameters (i.e.: socket timeout, etc.)
REDIS_PARAMS = {}
#自定義的redis客戶端類
#REDIS_PARAMS['redis_cls'] = 'myproject.RedisClient'
# If True, it uses redis ``zrevrange`` and ``zremrangebyrank`` operation. You have to use the ``zadd``
# command to add URLS and Scores to redis queue. This could be useful if you
# want to use priority and avoid duplicates in your start urls list.
#REDIS_START_URLS_AS_SET = False
# 默認(rèn)的RedisSpider 或 RedisCrawlSpider start urls key
#REDIS_START_URLS_KEY = '%(name)s:start_urls'
#redis的默認(rèn)encoding是utf-8,如果你想用其他編碼可以進(jìn)行如下設(shè)置:
#REDIS_ENCODING = 'latin1'
類scrapy_redis.spiders.RedisSpider使spider可以從redis數(shù)據(jù)庫(kù)中讀取URL。Redis隊(duì)列中的URL將被爬取,如果第一個(gè)請(qǐng)求產(chǎn)生更多請(qǐng)求,則spider將處理這些請(qǐng)求,然后再?gòu)腞edis中獲取另一個(gè)URL。
創(chuàng)建spider
from scrapy_redis.spiders import RedisSpider
class MySpider(RedisSpider):
name = 'myspider'
def parse(self, response):
# do stuff
pass
在redis-cli設(shè)置start_url
redis-cli lpush myspider:start_urls http://google.com
到此這篇關(guān)于scrapy redis配置文件setting參數(shù)詳解的文章就介紹到這了,更多相關(guān)scrapy redis配置setting參數(shù)內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
Python pandas DataFrame操作的實(shí)現(xiàn)代碼
這篇文章主要介紹了Python pandas DataFrame操作的實(shí)現(xiàn)代碼,小編覺(jué)得挺不錯(cuò)的,現(xiàn)在分享給大家,也給大家做個(gè)參考。一起跟隨小編過(guò)來(lái)看看吧2019-06-06
PyQT中QTableWidget如何根據(jù)單元格內(nèi)容設(shè)置自動(dòng)寬度
這篇文章主要介紹了PyQT中QTableWidget如何根據(jù)單元格內(nèi)容設(shè)置自動(dòng)寬度問(wèn)題,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。如有錯(cuò)誤或未考慮完全的地方,望不吝賜教2023-05-05
python接口自動(dòng)化之正則用例參數(shù)化的示例詳解
這篇文章主要介紹了python接口自動(dòng)化之正則用例參數(shù)化,它是一個(gè)特殊的字符序列,它能幫助你方便的檢查一個(gè)字符串是否與某種模式匹配,本文給大家介紹的非常詳細(xì),需要的朋友可以參考下2022-07-07
Keras搭建M2Det目標(biāo)檢測(cè)平臺(tái)示例
這篇文章主要為大家介紹了Keras搭建M2Det目標(biāo)檢測(cè)平臺(tái)實(shí)現(xiàn)的源碼示例,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進(jìn)步,早日升職加薪2022-05-05
python3.4 將16進(jìn)制轉(zhuǎn)成字符串的實(shí)例
今天小編就為大家分享一篇python3.4 將16進(jìn)制轉(zhuǎn)成字符串的實(shí)例,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧2019-06-06
python爬取w3shcool的JQuery課程并且保存到本地
本文主要介紹python爬取w3shcool的JQuery的課程并且保存到本地的方法解析。具有很好的參考價(jià)值。下面跟著小編一起來(lái)看下吧2017-04-04
對(duì)python3 一組數(shù)值的歸一化處理方法詳解
今天小編就為大家分享一篇對(duì)python3 一組數(shù)值的歸一化處理方法詳解,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧2018-07-07
用Python代碼來(lái)繪制彭羅斯點(diǎn)陣的教程
這篇文章主要介紹了用Python代碼來(lái)繪制彭羅斯點(diǎn)陣的教程,核心代碼主要就是一行簡(jiǎn)單的lambda匿名函數(shù),需要的朋友可以參考下2015-04-04
Python實(shí)現(xiàn)字符串與數(shù)組相互轉(zhuǎn)換功能示例
這篇文章主要介紹了Python實(shí)現(xiàn)字符串與數(shù)組相互轉(zhuǎn)換功能,結(jié)合具體實(shí)例形式分析了Python字符串與數(shù)組相關(guān)轉(zhuǎn)換功能的相關(guān)實(shí)現(xiàn)技巧與注意事項(xiàng),需要的朋友可以參考下2017-09-09
Python基于paramiko庫(kù)操作遠(yuǎn)程服務(wù)器的實(shí)現(xiàn)
本文主要介紹了使用Python的Paramiko庫(kù)來(lái)操作遠(yuǎn)程服務(wù)器,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來(lái)一起學(xué)習(xí)學(xué)習(xí)吧2025-01-01

