Hadoop分布式文件系統(tǒng)使用指南 中文pdf版146KB / 08-07
Hadoop權(quán)威指南(第2版)中文pdf版23MB / 08-21
Hadoop Map/Reduce教程 pdf版248KB / 08-07
-
ElasticSearch7.x入門到案例實(shí)戰(zhàn)教程 中文pdf版+源碼 服務(wù)器 / 7.2MB
-
Zabbix v7.0使用手冊 中文版PDF 服務(wù)器 / 30MB
-
-
Nginx 安全配置指南技術(shù)手冊pdf版 服務(wù)器 / 488KB
-
DNS學(xué)習(xí)從入門到精通 完整PDF版 服務(wù)器 / 6.33MB
-
Windows Server 2016系統(tǒng)配置指南 完整pdf掃描版[155MB] 服務(wù)器 / 154.8MB
-
-
Windows Server 2016 Active Directory配置指南 中文PDF版 服務(wù)器 / 23.3MB
-
Windows Server 2012-2022 故障轉(zhuǎn)移群集 完整版PDF 服務(wù)器 / 6.64MB
-
vSAN操作指南 中文PDF完整版 服務(wù)器 / 6.11MB
詳情介紹
《Hadoop實(shí)戰(zhàn)》作為云計(jì)算所青睞的分布式架構(gòu),Hadoop是一個用Java語言實(shí)現(xiàn)的軟件框架,在由大量計(jì)算機(jī)組成的集群中運(yùn)行海量數(shù)據(jù)的分布式計(jì)算,是谷歌實(shí)現(xiàn)云計(jì)算的重要基石?!禜adoop實(shí)戰(zhàn)》分為3個部分,深入淺出地介紹了Hadoop框架、編寫和運(yùn)行Hadoop數(shù)據(jù)處理程序所需的實(shí)踐技能及Hadoop之外更大的生態(tài)系統(tǒng)。
《Hadoop實(shí)戰(zhàn)》適合需要處理大量離線數(shù)據(jù)的云計(jì)算程序員、架構(gòu)師和項(xiàng)目經(jīng)理閱讀參考。
書籍目錄: 第一部分 Hadoop——一種分布式編程框架
第1章 Hadoop簡介
1.1 為什么寫《Hadoop 實(shí)戰(zhàn)》
1.2 什么是Hadoop
1.3 了解分布式系統(tǒng)和Hadoop
1.4 比較SQL 數(shù)據(jù)庫和Hadoop
1.5 理解MapReduce
1.5.1 動手?jǐn)U展一個簡單程序
1.5.2 相同程序在MapReduce中的擴(kuò)展
1.6 用Hadoop統(tǒng)計(jì)單詞——運(yùn)行第一個程序
1.7 Hadoop歷史
1.8 小結(jié)
1.9 資源
第2章 初識Hadoop
2.1 Hadoop 的構(gòu)造模塊顯示全部信息
第一部分 Hadoop——一種分布式編程框架
第1章 Hadoop簡介
1.1 為什么寫《Hadoop 實(shí)戰(zhàn)》
1.2 什么是Hadoop
1.3 了解分布式系統(tǒng)和Hadoop
1.4 比較SQL 數(shù)據(jù)庫和Hadoop
1.5 理解MapReduce
1.5.1 動手?jǐn)U展一個簡單程序
1.5.2 相同程序在MapReduce中的擴(kuò)展
1.6 用Hadoop統(tǒng)計(jì)單詞——運(yùn)行第一個程序
1.7 Hadoop歷史
1.8 小結(jié)
1.9 資源
第2章 初識Hadoop
2.1 Hadoop 的構(gòu)造模塊
2.1.1 NameNode
2.1.2 DataNode
2.1.3 Secondary NameNode
2.1.4 JobTracker
2.1.5 TaskTracker
2.2 為Hadoop 集群安裝SSH
2.2.1 定義一個公共賬號
2.2.2 驗(yàn)證SSH安裝
2.2.3 生成SSH密鑰對
2.2.4 將公鑰分布并登錄驗(yàn)證
2.3 運(yùn)行Hadoop
2.3.1 本地(單機(jī))模式
2.3.2 偽分布模式
2.3.3 全分布模式
2.4 基于Web 的集群用戶界面
2.5 小結(jié)
第3章 Hadoop組件
3.1 HDFS 文件操作
3.1.1 基本文件命令
3.1.2 編程讀寫HDFS
3.2 剖析MapReduce 程序
3.2.1 Hadoop數(shù)據(jù)類型
3.2.2 Mapper
3.2.3 Reducer
3.2.4 Partitioner:重定向Mapper輸出
3.2.5 Combiner:本地reduce
3.2.6 預(yù)定義mapper和Reducer類的單詞計(jì)數(shù)
3.3 讀和寫
3.3.1 InputFormat
3.3.2 OutputFormat
3.4 小結(jié)
第二部分 實(shí)戰(zhàn)
第4章 編寫MapReduce基礎(chǔ)程序
4.1 獲得專利數(shù)據(jù)集
4.1.1 專利引用數(shù)據(jù)
4.1.2 專利描述數(shù)據(jù)
4.2 構(gòu)建MapReduce 程序的基礎(chǔ)模板
4.3 計(jì)數(shù)
4.4 適應(yīng)Hadoop API 的改變
4.5 Hadoop 的Streaming
4.5.1 通過Unix命令使用Streaming
4.5.2 通過腳本使用Streaming
4.5.3 用Streaming處理鍵/值對
4.5.4 通過Aggregate包使用Streaming
4.6 使用combiner 提升性能
4.7 溫故知新
4.8 小結(jié)
4.9 更多資源
第5章 高階MapReduce
5.1 鏈接MapReduce 作業(yè)
5.1.1 順序鏈接MapReduce作業(yè)
5.1.2 具有復(fù)雜依賴的MapReduce鏈接
5.1.3 預(yù)處理和后處理階段的鏈接
5.2 聯(lián)結(jié)不同來源的數(shù)據(jù)
5.2.1 Reduce側(cè)的聯(lián)結(jié)
5.2.2 基于DistributedCache的復(fù)制聯(lián)結(jié)
5.2.3 半聯(lián)結(jié):map側(cè)過濾后在reduce側(cè)聯(lián)結(jié)
5.3 創(chuàng)建一個Bloom filter
5.3.1 Bloom filter做了什么
5.3.2 實(shí)現(xiàn)一個Bloom filter
5.3.3 Hadoop 0.20 以上版本的Bloom filter
5.4 溫故知新
5.5 小結(jié)
5.6 更多資源
第6章 編程實(shí)踐
6.1 開發(fā)MapReduce 程序
6.1.1 本地模式
6.1.2 偽分布模式
6.2 生產(chǎn)集群上的監(jiān)視和調(diào)試
6.2.1 計(jì)數(shù)器
6.2.2 跳過壞記錄
6.2.3 用IsolationRunner重新運(yùn)行出錯的任務(wù)
6.3 性能調(diào)優(yōu)
6.3.1 通過combiner來減少網(wǎng)絡(luò)流量
6.3.2 減少輸入數(shù)據(jù)量
6.3.3 使用壓縮
6.3.4 重用JVM
6.3.5 根據(jù)猜測執(zhí)行來運(yùn)行
6.3.6 代碼重構(gòu)與算法重寫
6.4 小結(jié)
第7章 細(xì)則手冊
7.1 向任務(wù)傳遞作業(yè)定制的參數(shù)
7.2 探查任務(wù)特定信息
7.3 劃分為多個輸出文件
7.4 以數(shù)據(jù)庫作為輸入輸出
7.5 保持輸出的順序
7.6 小結(jié)
第8章 管理Hadoop
8.1 為實(shí)際應(yīng)用設(shè)置特定參數(shù)值
8.2 系統(tǒng)體檢
8.3 權(quán)限設(shè)置
8.4 配額管理
8.5 啟用回收站
8.6 刪減DataNode
8.7 增加DataNode
8.8 管理NameNode 和SNN
8.9 恢復(fù)失效的NameNode
8.10 感知網(wǎng)絡(luò)布局和機(jī)架的設(shè)計(jì)
8.11 多用戶作業(yè)的調(diào)度
8.11.1 多個JobTracker
8.11.2 公平調(diào)度器
8.12 小結(jié)
第三部分 Hadoop也瘋狂
第9章 在云上運(yùn)行Hadoop
9.1 Amazon Web Services 簡介
9.2 安裝AWS
9.2.1 獲得AWS身份認(rèn)證憑據(jù)
9.2.2 獲得命令行工具
9.2.3 準(zhǔn)備SSH密鑰對
9.3 在EC2 上安裝Hadoop
9.3.1 配置安全參數(shù)
9.3.2 配置集群類型
9.4 在EC2 上運(yùn)行MapReduce 程序
9.4.1 將代碼轉(zhuǎn)移到Hadoop集群上
9.4.2 訪問Hadoop集群上的數(shù)據(jù)
9.5 清空和關(guān)閉EC2 實(shí)例
9.6 Amazon Elastic MapReduce 和其他AWS 服務(wù)
9.6.1 Amazon Elastic MapReduce
9.6.2 AWS導(dǎo)入/導(dǎo)出
9.7 小結(jié)
第10章 用Pig編程
10.1 像Pig 一樣思考
10.1.1 數(shù)據(jù)流語言
10.1.2 數(shù)據(jù)類型
10.1.3 用戶定義函數(shù)
10.2 安裝Pig
10.3 運(yùn)行Pig
10.4 通過Grunt 學(xué)習(xí)Pig Latin
10.5 談?wù)凱ig Latin
10.5.1 數(shù)據(jù)類型和schema
10.5.2 表達(dá)式和函數(shù)
10.5.3 關(guān)系型運(yùn)算符
10.5.4 執(zhí)行優(yōu)化
10.6 用戶定義函數(shù)
10.6.1 使用UDF
10.6.2 編寫UDF
10.7 腳本
10.7.1 注釋
10.7.2 參數(shù)替換
10.7.3 多查詢執(zhí)行
10.8 Pig 實(shí)戰(zhàn)——計(jì)算相似專利的例子
10.9 小結(jié)
第11章 Hive及Hadoop群
11.1 Hive
11.1.1 安裝與配置Hive
11.1.2 查詢的示例
11.1.3 深入HiveQL
11.1.4 Hive小結(jié)
11.2 其他Hadoop 相關(guān)的部分
11.2.1 HBase
11.2.2 ZooKeeper
11.2.3 Cascading
11.2.4 Cloudera
11.2.5 Katta
11.2.6 CloudBase
11.2.7 Aster Data和Greenplum
11.2.8 Hama和Mahout
11.2.9 search-hadoop.com
11.3 小結(jié)
第12章 案例研究
12.1 轉(zhuǎn)換《紐約時報(bào)》1100 萬個庫存圖片文檔
12.2 挖掘中國移動的數(shù)據(jù)
12.3 在StumbleUpon 推薦最佳網(wǎng)站
12.3.1 分布式StumbleUpon 的開端
12.3.2 HBase 和StumbleUpon
12.3.3 StumbleUpon 上的更多Hadoop 應(yīng)用
12.4 搭建面向企業(yè)查詢的分析系統(tǒng)——IBM的ES2 項(xiàng)目
12.4.1 ES2 系統(tǒng)結(jié)構(gòu)
12.4.2 ES2 爬蟲
12.4.3 ES2 分析
12.4.4 小結(jié)
12.4.5 參考文獻(xiàn)
附錄A HDFS文件命令
下載地址
人氣書籍
![決戰(zhàn)Nginx系統(tǒng)卷:高性能Web服務(wù)器詳解與運(yùn)維 PDF掃描版[94MB] 決戰(zhàn)Nginx系統(tǒng)卷:高性能Web服務(wù)器詳解與運(yùn)維 PDF掃描版[94MB]](http://img.jbzj.com/do/uploads/litimg/140512/1531562U353.png)
決戰(zhàn)Nginx系統(tǒng)卷:高性能Web服務(wù)器詳解與運(yùn)維 PDF掃描版[94MB]
Tomcat權(quán)威指南(第2版) PDF掃描版
Hadoop實(shí)戰(zhàn)(第2版)陸嘉恒著 PDF掃描版![Nginx高性能Web服務(wù)器詳解 pdf掃描版[178MB] Nginx高性能Web服務(wù)器詳解 pdf掃描版[178MB]](http://img.jbzj.com/do/uploads/litimg/160704/1A1562KU6.jpg)
Nginx高性能Web服務(wù)器詳解 pdf掃描版[178MB]![精通Windows Server 2008 R2 PDF掃描版[157MB] 精通Windows Server 2008 R2 PDF掃描版[157MB]](http://img.jbzj.com/do/uploads/litimg/140510/1419532T2T.jpg)
精通Windows Server 2008 R2 PDF掃描版[157MB]![大規(guī)模Web服務(wù)開發(fā)技術(shù) PDF掃描版[14MB] 大規(guī)模Web服務(wù)開發(fā)技術(shù) PDF掃描版[14MB]](http://img.jbzj.com/do/uploads/litimg/140607/162Q12W016.jpg)
大規(guī)模Web服務(wù)開發(fā)技術(shù) PDF掃描版[14MB]
Hadoop應(yīng)用開發(fā)技術(shù)詳解 pdf掃描版
深入剖析Tomcat (Paul Deck) pdf掃描版![Windows Server 2012 Hyper-V虛擬化管理實(shí)踐 PDF掃描版[223MB] Windows Server 2012 Hyper-V虛擬化管理實(shí)踐 PDF掃描版[223MB]](http://img.jbzj.com/do/uploads/litimg/150311/1545362Y592.jpg)
Windows Server 2012 Hyper-V虛擬化管理實(shí)踐 PDF掃描版[223MB]![學(xué)習(xí)Nginx HTTP Server(中文版) PDF掃描版[23MB] 學(xué)習(xí)Nginx HTTP Server(中文版) PDF掃描版[23MB]](http://img.jbzj.com/do/uploads/litimg/150311/1534022V3E.png)
學(xué)習(xí)Nginx HTTP Server(中文版) PDF掃描版[23MB]
下載聲明
☉ 解壓密碼:www.dhdzp.com 就是本站主域名,希望大家看清楚,[ 分享碼的獲取方法 ]可以參考這篇文章
☉ 推薦使用 [ 迅雷 ] 下載,使用 [ WinRAR v5 ] 以上版本解壓本站軟件。
☉ 如果這個軟件總是不能下載的請?jiān)谠u論中留言,我們會盡快修復(fù),謝謝!
☉ 下載本站資源,如果服務(wù)器暫不能下載請過一段時間重試!或者多試試幾個下載地址
☉ 如果遇到什么問題,請?jiān)u論留言,我們定會解決問題,謝謝大家支持!
☉ 本站提供的一些商業(yè)軟件是供學(xué)習(xí)研究之用,如用于商業(yè)用途,請購買正版。
☉ 本站提供的Hadoop實(shí)戰(zhàn)中文版 pdf掃描版 (美) 拉姆 34M 人民郵電出版社資源來源互聯(lián)網(wǎng),版權(quán)歸該下載資源的合法擁有者所有。


