完美解決python針對hdfs上傳和下載的問題
當我們使用python的hdfs包進行上傳和下載文件的時候,總會出現(xiàn)如下問題
requests.packages.urllib3.exceptions.NewConnectionError:<requests.packages.urllib3.connection.HTTPConnection object at 0x7fe87cc37c50>: Failed to establish a new connection: [Errno -2] Name or service not known
其實這主要是由于沒有將各個集群節(jié)點的ip映射到/etc/hosts文件中
修改/etc/hosts文件,將各個集群節(jié)點ip映射加上即可,如博主所示
vim /etc/hosts
192.168.20.174 hadoop04
192.168.20.173 hadoop03
192.168.20.172 hadoop02
192.168.20.171 hadoop01
補充知識:python上傳文件到hadoop異常問題
使用庫:pyhdfs
調用方法:
pyhdfs.HdfsClient(ip,port,user).copy_from_local()
pyhdfs.HdfsClient(ip,port,user).copy_to_local()
異常現(xiàn)象1如下圖:

異?,F(xiàn)象2如下圖:

異?,F(xiàn)象3如下圖:

原因分析:可以看出,以上都是連接成功了,但是上傳或者下載失敗了,造成這種現(xiàn)象的原因是
我這里連接的是name節(jié)點,端口50070,當調用copy_from_local()時,name節(jié)點會主動去連接data節(jié)點進行數(shù)據(jù)讀寫操作,而data節(jié)點端口50075沒有開啟,造成data節(jié)點連接超時,拋出異常
解決辦法:開啟data節(jié)點端口
以上這篇完美解決python針對hdfs上傳和下載的問題就是小編分享給大家的全部內容了,希望能給大家一個參考,也希望大家多多支持腳本之家。
- Python select及selectors模塊概念用法詳解
- Python連接HDFS實現(xiàn)文件上傳下載及Pandas轉換文本文件到CSV操作
- Python selenium文件上傳下載功能代碼實例
- 基于python實現(xiàn)FTP文件上傳與下載操作(ftp&sftp協(xié)議)
- Python Socketserver實現(xiàn)FTP文件上傳下載代碼實例
- python3 requests庫文件上傳與下載實現(xiàn)詳解
- 使用Python操作FTP實現(xiàn)上傳和下載的方法
- python ftp 按目錄結構上傳下載的實現(xiàn)代碼
- python實現(xiàn)上傳下載文件功能
- python實現(xiàn)的簡單FTP上傳下載文件實例
- python 基于selectors庫實現(xiàn)文件上傳與下載
相關文章
Python實現(xiàn)求解最大公約數(shù)的五種方法總結
求最大公約數(shù)是習題中比較常見的類型,本文小編將給大家提供五種比較常見的算法,都是用Python語言實現(xiàn)的,感興趣的小伙伴可以了解一下2022-07-07
Pyside2中嵌入Matplotlib的繪圖的實現(xiàn)
這篇文章主要介紹了Pyside2中嵌入Matplotlib的繪圖的實現(xiàn),文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友們下面隨著小編來一起學習學習吧2021-02-02

