scrapy 遠程登錄控制臺的實現(xiàn)
遠程登錄控制臺
Scrapy附帶一個內置的telnet控制臺,用于檢查和控制Scrapy運行過程。telnet控制臺只是一個運行在scrappy進程內部的常規(guī)python shell,因此您可以從中做任何事情。
telnet控制臺是一個 built-in Scrapy extension 它在默認情況下是啟用的,但如果需要,您也可以禁用它。有關擴展本身的更多信息,請參閱 Telnet控制臺擴展 。
警告
通過公共網(wǎng)絡使用telnet控制臺是不安全的,因為telnet不提供任何傳輸層安全性。擁有用戶名/密碼驗證不會改變這一點。
預期用途是本地連接到正在運行的Scrapy Spider(Spider進程和Telnet客戶端在同一臺計算機上)或通過安全連接(VPN、SSH通道)進行連接。請避免在不安全的連接上使用telnet控制臺,或使用 TELNETCONSOLE_ENABLED 選擇權。
如何訪問telnet控制臺
telnet控制臺偵聽中定義的TCP端口 TELNETCONSOLE_PORT 設置,默認為 6023 . 要訪問控制臺,您需要鍵入:
telnet localhost 6023 Trying localhost... Connected to localhost. Escape character is '^]'. Username: Password: >>>
默認用戶名為 scrapy 密碼是自動生成的。自動生成的密碼可以在垃圾日志上看到,如下例所示:
2018-10-16 14:35:21 [scrapy.extensions.telnet] INFO: Telnet Password: 16f92501e8a59326
默認用戶名和密碼可以被設置覆蓋 TELNETCONSOLE_USERNAME 和 TELNETCONSOLE_PASSWORD .
警告
用戶名和密碼僅提供有限的保護,因為telnet不使用安全傳輸-默認情況下,即使設置了用戶名和密碼,通信也不會加密。
您需要在Windows和大多數(shù)Linux發(fā)行版中默認安裝的telnet程序。
telnet控制臺中的可用變量
elnet控制臺就像一個運行在scrappy進程內部的常規(guī)python shell,所以您可以從中做任何事情,包括導入新模塊等。
但是,telnet控制臺附帶一些為方便起見而定義的默認變量:
| 捷徑 | 描述 |
|---|---|
crawler | 殘廢的爬蟲 (scrapy.crawler.Crawler 對象) |
engine | crawler.engine屬性 |
spider | 主動蜘蛛 |
slot | 發(fā)動機槽 |
extensions | 擴展管理器(crawler.extensions屬性) |
stats | stats收集器(crawler.stats屬性) |
settings | Scrapy設置對象(crawler.settings屬性) |
est | 打印發(fā)動機狀態(tài)報告 |
prefs | 內存調試(請參見 調試內存泄漏) |
p | 到的快捷方式 pprint.pprint()功能 |
hpy | 內存調試(請參見 調試內存泄漏) |
telnet控制臺使用示例
以下是使用telnet控制臺可以執(zhí)行的一些示例任務:
查看發(fā)動機狀態(tài)
你可以使用 est() scrapy引擎使用telnet控制臺快速顯示其狀態(tài)的方法:
elnet localhost 6023 >>> est() Execution engine status time()-engine.start_time ? ? ? ? ? ? ? ? ? ? ? ?: 8.62972998619 len(engine.downloader.active) ? ? ? ? ? ? ? ? ? : 16 engine.scraper.is_idle() ? ? ? ? ? ? ? ? ? ? ? ?: False engine.spider.name ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?: followall engine.spider_is_idle() ? ? ? ? ? ? ? ? ? ? ? ? : False engine.slot.closing ? ? ? ? ? ? ? ? ? ? ? ? ? ? : False len(engine.slot.inprogress) ? ? ? ? ? ? ? ? ? ? : 16 len(engine.slot.scheduler.dqs or []) ? ? ? ? ? ?: 0 len(engine.slot.scheduler.mqs) ? ? ? ? ? ? ? ? ?: 92 len(engine.scraper.slot.queue) ? ? ? ? ? ? ? ? ?: 0 len(engine.scraper.slot.active) ? ? ? ? ? ? ? ? : 0 engine.scraper.slot.active_size ? ? ? ? ? ? ? ? : 0 engine.scraper.slot.itemproc_size ? ? ? ? ? ? ? : 0 engine.scraper.slot.needs_backout() ? ? ? ? ? ? : False
暫停、恢復和停止報廢發(fā)動機
暫停:
telnet localhost 6023 >>> engine.pause() >>>
恢復:
telnet localhost 6023 >>> engine.unpause() >>>
停止:
telnet localhost 6023 >>> engine.stop() Connection closed by foreign host.
Telnet控制臺信號
scrapy.extensions.telnet.update_telnet_vars(telnet_vars)
在telnet控制臺打開之前發(fā)送。您可以連接到這個信號來添加、刪除或更新telnet本地命名空間中可用的變量。為此,需要更新 telnet_vars 聽寫你的處理程序。
參數(shù)
telnet_vars (dict) – telnet變量的dict
遠程登錄設置
以下是控制telnet控制臺行為的設置:
TELNETCONSOLE_PORT
違約: [6023, 6073]
用于telnet控制臺的端口范圍。如果設置為 None 或 0 ,使用動態(tài)分配的端口。
TELNETCONSOLE_HOST
違約: '127.0.0.1'
telnet控制臺應該監(jiān)聽的接口
TELNETCONSOLE_USERNAME
違約: 'scrapy'
用于telnet控制臺的用戶名
TELNETCONSOLE_PASSWORD
違約: None
telnet控制臺使用的密碼,默認行為是讓它自動生成。
到此這篇關于scrapy 遠程登錄控制臺的實現(xiàn)的文章就介紹到這了,更多相關scrapy 遠程登錄控制臺內容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關文章希望大家以后多多支持腳本之家!
相關文章
python Dijkstra算法實現(xiàn)最短路徑問題的方法
這篇文章主要介紹了python Dijkstra算法實現(xiàn)最短路徑問題的方法,文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友們下面隨著小編來一起學習學習吧2019-09-09
python 使用Yolact訓練自己的數(shù)據(jù)集
這篇文章主要介紹了python 使用Yolact訓練自己的數(shù)據(jù)集,幫助大家更好的理解和學習使用python,感興趣的朋友可以了解下2021-04-04
Python深度學習之實現(xiàn)卷積神經(jīng)網(wǎng)絡
今天帶大家學習如何使用Python實現(xiàn)卷積神經(jīng)網(wǎng)絡,這是個很難的知識點,文中有非常詳細的介紹,對小伙伴們很有幫助,需要的朋友可以參考下2021-06-06
python GUI庫圖形界面開發(fā)之PyQt5不規(guī)則窗口實現(xiàn)與顯示GIF動畫的詳細方法與實例
這篇文章主要介紹了python GUI庫圖形界面開發(fā)之PyQt5不規(guī)則窗口與顯示GIF動畫的詳細方法與實例,需要的朋友可以參考下2020-03-03
Python?xlwt工具使用詳解,生成excel欄位寬度可自適應內容長度
這篇文章主要介紹了Python?xlwt工具使用詳解,生成excel欄位寬度可自適應內容長度,具有很好的參考價值,希望對大家有所幫助。如有錯誤或未考慮完全的地方,望不吝賜教2022-02-02
python將多個py文件和其他文件打包為exe可執(zhí)行文件
這篇文章主要介紹了python將多個py文件和其他文件打包為exe可執(zhí)行文件,通過準備要打包的工程文件展開詳情,需要的小伙伴可以參考一下2022-05-05
Python結合Sprak實現(xiàn)計算曲線與X軸上方的面積
這篇文章主要介紹了Python結合Sprak實現(xiàn)計算曲線與X軸上方的面積,文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友們下面隨著小編來一起學習吧2023-02-02

