Hive數據導出詳解
一、數據導出是什么?
hive是一個依賴Hadoop集群的數據處理平臺,我們不僅需要對數據進行篩選處理,更需要進行導出,供我們多次重復使用。
二、六大幫派
1.insert
insert有兩種形式,加local上傳到本地路徑,不加local上傳到集群
代碼如下(示例):
insert加local insert overwrite local directory '/root/export/data/student' select * from student; insert不加local(并將數據格式化) insert overwrite directory '/student' row format delimited fields terminated by ',' select * from student;


2.Hadoop命令導出到本地
代碼如下(示例):
hadoop dfs -get /user/hive/warehouse/hive.db/student/student.txt /root/export/data/student/
3.Hive shell命令導出
一個 > 是覆蓋,兩個>是追加
代碼如下(示例):
bin/hive -e 'select * from hive.student' >> /root/export/data/student/student.txt
4.export導出到HDFS上
當該hdfs路徑下有文件時或表存在,都不可導,與import連用。
代碼如下(示例):
export table hive.student to '/user/hive/warehouse/hive.db/student';
5.Sqoop導出
將數據導出到window系統(tǒng)的mysql,并進行可視化操作
6.清除表中的數據(Truncate)——刪庫跑路
Truncate只能刪除管理表,不能刪除外部表的數據(但可以將外部表轉為內部表哦,嘿嘿嘿)只是刪除內部表的hdfs數據,元數據還在
內部轉為外部表
alter table student set tblproperties('EXTERNAL'='TRUE')一定大寫
截斷表
Truncate table student;
總結
六大派別與五大幫派共同統(tǒng)治著數碼武林,俠義精神深入人心,hive語句婦孺皆知。街頭小巷上談論著他們的英雄事跡,再一次掀起了學習hive秘籍的狂潮?;蛟S現在人們學習的已經不再是傍身之計,更多的是對天下武功,為快不滅的熱愛。有人的地方就會就有江湖,大數據時代亦是如此。
到此這篇關于Hive數據導出詳解的文章就介紹到這了,更多相關Hive數據導出內容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關文章希望大家以后多多支持腳本之家!
相關文章
解決Navicat Premium 15連接數據庫閃退的問題
這篇文章主要介紹了Navicat Premium 15連接數據庫閃退,本文給大家分享解決方法,對大家的學習或工作具有一定的參考借鑒價值,需要的朋友可以參考下2021-03-03
利用Navicat Premium導出數據庫表結構信息至Excel的方法
這篇文章主要介紹了利用Navicat Premium導出數據庫表結構信息至Excel的方法,本文給大家介紹的非常詳細,對大家的學習或工作具有一定的參考借鑒價值,需要的朋友可以參考下2021-03-03

