HDFS的Java API的訪問方式實例代碼
更新時間:2018年02月03日 09:37:52 作者:墨梅寒香
這篇文章主要介紹了HDFS的Java API的訪問方式實例代碼,分享了相關(guān)代碼示例,小編覺得還是挺不錯的,具有一定借鑒價值,需要的朋友可以參考下
本文研究的主要是HDFS的Java API的訪問方式,具體代碼如下所示,有詳細注釋。
最近的節(jié)奏有點兒快,等有空的時候把這個封裝一下
實現(xiàn)代碼
要導(dǎo)入的包:
import java.io.IOException; import java.net.URI; import java.net.URISyntaxException; import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.fs.BlockLocation; import org.apache.hadoop.fs.FileStatus; import org.apache.hadoop.fs.FileSystem; import org.apache.hadoop.fs.FileUtil; import org.apache.hadoop.fs.Path; import org.apache.hadoop.hdfs.DistributedFileSystem; import org.apache.hadoop.hdfs.protocol.DatanodeInfo;
實體方法:
/**
* 獲取HDFS文件系統(tǒng)
* @return
* @throws IOException
* @throws URISyntaxException
*/
public static FileSystem getFileSystem() throws IOException, URISyntaxException{
//read config file
Configuration conf = new Configuration();
//返回默認文件系統(tǒng)
//如果在Hadoop集群下運行,使用此種方法可以直接獲取默認文件系統(tǒng)
//FileSystem fs = FileSystem.get(conf);
//指定的文件系統(tǒng)地址
URI uri = new URI("hdfs://hy:9000");
//返回指定的文件系統(tǒng)
//如果在本地測試,需要使用此種方法獲取文件系統(tǒng)
FileSystem fs = FileSystem.get(uri, conf);
return fs;
}
/**
* 創(chuàng)建文件目錄
* @throws Exception
*/
public static void mkdir() throws Exception{
//獲取文件系統(tǒng)
FileSystem fs = getFileSystem();
//創(chuàng)建文件目錄
fs.mkdirs(new Path("hdfs://hy:9000/hy/weibo"));
//釋放資源
fs.close();
}
/**
* 刪除文件或者文件目錄
* @throws Exception
*/
public static void rmdir() throws Exception{
//獲取文件系統(tǒng)
FileSystem fs = getFileSystem();
//刪除文件或者文件目錄
fs.delete(new Path("hdfs://hy:9000/hy/weibo"), true);
//釋放資源
fs.close();
}
/**
* 獲取目錄下所有文件
* @throws Exception
*/
public static void listAllFile() throws Exception{
//獲取文件系統(tǒng)
FileSystem fs = getFileSystem();
//列出目錄內(nèi)容
FileStatus[] status = fs.listStatus(new Path("hdfs://hy:9000/hy/"));
//獲取目錄下所有文件路徑
Path[] listedPaths = FileUtil.stat2Paths(status);
//循環(huán)讀取每個文件
for (Path path : listedPaths) {
System.out.println(path);
}
//釋放資源
fs.close();
}
/**
* 將文件上傳至HDFS
* @throws Exception
*/
public static void copyToHDFS() throws Exception{
//獲取文件對象
FileSystem fs = getFileSystem();
//源文件路徑是Linux下的路徑 Path srcPath = new Path("/home/hadoop/temp.jar");
//如果需要在windows下測試,需要改為Windows下的路徑,比如 E://temp.jar
Path srcPath = new Path("E://temp.jar");
//目的路徑
Path dstPath = new Path("hdfs://hy:9000/hy/weibo");
//實現(xiàn)文件上傳
fs.copyFromLocalFile(srcPath, dstPath);
//釋放資源
fs.close();
}
/**
* 從HDFS上下載文件
* @throws Exception
*/
public static void getFile() throws Exception{
//獲得文件系統(tǒng)
FileSystem fs = getFileSystem();
//源文件路徑
Path srcPath = new Path("hdfs://hy:9000/hy/weibo/temp.jar");
//目的路徑,默認是Linux下的
//如果在Windows下測試,需要改為Windows下的路徑,如C://User/andy/Desktop/
Path dstPath = new Path("D://");
//下載HDFS上的文件
fs.copyToLocalFile(srcPath, dstPath);
//釋放資源
fs.close();
}
/**
* 獲取HDFS集群點的信息
* @throws Exception
*/
public static void getHDFSNodes() throws Exception{
//獲取文件系統(tǒng)
FileSystem fs = getFileSystem();
//獲取分布式文件系統(tǒng)
DistributedFileSystem hdfs = (DistributedFileSystem)fs;
//獲取所有節(jié)點
DatanodeInfo[] dataNodeStats = hdfs.getDataNodeStats();
//循環(huán)比遍歷
for (int i = 0; i < dataNodeStats.length; i++) {
System.out.println("DataNote_" + i + "_Name:" + dataNodeStats[i].getHostName());
}
//釋放資源
fs.close();
}
/**
* 查找某個文件在HDFS集群的位置
* @throws Exception
*/
public static void getFileLocal() throws Exception{
//獲取文件系統(tǒng)
FileSystem fs = getFileSystem();
//文件路徑
Path path = new Path("hdfs://hy:9000/hy/weibo/temp.jar");
//獲取文件目錄
FileStatus fileStatus = fs.getFileStatus(path);
//獲取文件塊位置列表
BlockLocation[] blockLocations = fs.getFileBlockLocations(fileStatus, 0, fileStatus.getLen());
//循環(huán)輸出塊信息
for (int i = 0; i < blockLocations.length; i++) {
String[] hosts = blockLocations[i].getHosts();
System.out.println("block_" + i + "_location:" + hosts[0]);
}
//釋放資源
fs.close();
}
總結(jié)
以上就是本文關(guān)于HDFS的Java API的訪問方式實例代碼的全部內(nèi)容,希望對大家有所幫助。感興趣的朋友可以繼續(xù)參閱本站其他相關(guān)專題,如有不足之處,歡迎留言指出。感謝朋友們對本站的支持!
相關(guān)文章
SpringCloud組件OpenFeign之默認HTTP請求方式詳解
這篇文章主要介紹了SpringCloud組件OpenFeign之默認HTTP請求方式詳解,在SpringMvcContract類中有個這樣的方法processAnnotationOnMethod,見名思意,這個方法就是處理Feign接口下方法上的注解的,需要的朋友可以參考下2024-01-01
JetBrains IntelliJ IDEA 2020安裝與使用教程詳解
這篇文章主要介紹了JetBrains IntelliJ IDEA 2020安裝與使用教程,本文通過圖文并茂的形式給大家介紹的非常詳細,對大家的學(xué)習(xí)或工作具有一定的參考借鑒價值,需要的朋友可以參考下2020-06-06
Ubuntu安裝JDK與IntelliJ?IDEA的詳細過程
APT是Linux系統(tǒng)上的包管理工具,能自動解決軟件包依賴關(guān)系并從遠程存儲庫中獲取安裝軟件包,這篇文章主要介紹了Ubuntu安裝JDK與IntelliJ?IDEA的過程,需要的朋友可以參考下2023-08-08
詳解OpenFeign服務(wù)調(diào)用(微服務(wù))
OpenFeign是Spring Cloud在Feign的基礎(chǔ)上支持了SpringMVC的注解,如@RequesMapping等等,這篇文章主要介紹了OpenFeign服務(wù)調(diào)用的相關(guān)知識,需要的朋友可以參考下2022-07-07

