Python實現(xiàn)從腳本里運行scrapy的方法

更新時間：2015年04月07日 16:41:39 作者：pythoner

這篇文章主要介紹了Python實現(xiàn)從腳本里運行scrapy的方法,實例分析了Python腳本運行的使用技巧,具有一定參考借鑒價值,需要的朋友可以參考下

本文實例講述了Python實現(xiàn)從腳本里運行scrapy的方法。分享給大家供大家參考。具體如下：

#!/usr/bin/python

import os

os.environ.setdefault('SCRAPY_SETTINGS_MODULE', 'project.settings') #Must be at the top before other imports

from scrapy import log, signals, project

from scrapy.xlib.pydispatch import dispatcher

from scrapy.conf import settings

from scrapy.crawler import CrawlerProcess

from multiprocessing import Process, Queue

class CrawlerScript():

    def __init__(self):

        self.crawler = CrawlerProcess(settings)

        if not hasattr(project, 'crawler'):

            self.crawler.install()

        self.crawler.configure()

        self.items = []

        dispatcher.connect(self._item_passed, signals.item_passed)

    def _item_passed(self, item):

        self.items.append(item)

    def _crawl(self, queue, spider_name):

        spider = self.crawler.spiders.create(spider_name)

        if spider:

            self.crawler.queue.append_spider(spider)

        self.crawler.start()

        self.crawler.stop()

        queue.put(self.items)

    def crawl(self, spider):

        queue = Queue()

        p = Process(target=self._crawl, args=(queue, spider,))

        p.start()

        p.join()

        return queue.get(True)

# Usage

if __name__ == "__main__":

    log.start()

    """

    This example runs spider1 and then spider2 three times.

    """

    items = list()

    crawler = CrawlerScript()

    items.append(crawler.crawl('spider1'))

    for i in range(3):

        items.append(crawler.crawl('spider2'))

    print items

希望本文所述對大家的Python程序設(shè)計有所幫助。

您可能感興趣的文章:

相關(guān)文章

Django2 連接MySQL及model測試實例分析
這篇文章主要介紹了Django2 連接MySQL及model測試,結(jié)合實例形式分析了Django2框架使用pymysql庫進(jìn)行mysql數(shù)據(jù)庫連接與model調(diào)用測試方法,需要的朋友可以參考下
2019-12-12
python線程類改變類變量的操作代碼
這篇文章主要介紹了python線程類改變類變量的操作代碼，本文給大家介紹的非常詳細(xì)，對大家的學(xué)習(xí)或工作具有一定的參考借鑒價值,需要的朋友可以參考下
2024-01-01
Python?迭代器Iterator詳情
這篇文章主要介紹了Python?迭代器Iterator詳情，迭代器可以幫助我們解決面對復(fù)雜的數(shù)據(jù)場景時，快速簡便的獲取數(shù)據(jù)，下文關(guān)于其詳細(xì)介紹，需要的小伙伴可以參考一下
2022-05-05
Python sqrt()函數(shù)用法說明
這篇文章主要介紹了Python sqrt()函數(shù)用法說明，具有很好的參考價值，希望對大家有所幫助。一起跟隨小編過來看看吧
2021-03-03
Django讀取Mysql數(shù)據(jù)并顯示在前端的實例
今天小編就為大家分享一篇Django讀取Mysql數(shù)據(jù)并顯示在前端的實例，具有很好的參考價值，希望對大家有所幫助。一起跟隨小編過來看看吧
2018-05-05
超簡單的scrapy實現(xiàn)ip動態(tài)代理與更換ip的方法實現(xiàn)
這篇文章主要介紹了超簡單的scrapy實現(xiàn)ip動態(tài)代理與更換ip的方法實現(xiàn)，文中通過示例代碼介紹的非常詳細(xì)，對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值，需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧
2021-03-03
Numpy中Meshgrid函數(shù)基本用法及2種應(yīng)用場景
NumPy包含很多實用的數(shù)學(xué)函數(shù),涵蓋線性代數(shù)運算、傅里葉變換和隨機數(shù)生成等功能,下面這篇文章主要給大家介紹了關(guān)于Numpy中Meshgrid函數(shù)基本用法及2種應(yīng)用場景的相關(guān)資料,需要的朋友可以參考下
2022-08-08
pandas實現(xiàn)excel中的數(shù)據(jù)透視表和Vlookup函數(shù)功能代碼
今天小編就為大家分享一篇pandas實現(xiàn)excel中的數(shù)據(jù)透視表和Vlookup函數(shù)功能代碼，具有很好的參考價值，希望對大家有所幫助。一起跟隨小編過來看看吧
2020-02-02
教你編譯pjsip源碼的方法
通過本文教大家如何編譯pjsip源碼，本文通過圖文并茂的形式給大家介紹的非常詳細(xì)，對大家的學(xué)習(xí)或工作具有一定的參考借鑒價值，需要的朋友參考下吧
2021-10-10
手把手教你實現(xiàn)PyTorch的MNIST數(shù)據(jù)集
本文主要介紹了PyTorch的MNIST數(shù)據(jù)集，文中通過示例代碼介紹的非常詳細(xì)，對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值，需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧
2021-06-06