Hadoop構建數(shù)據(jù)倉庫實踐 (王雪迎) 完整pdf高清版[15MB]15.0MB / 09-11
Hadoop權威指南(第4版)(修訂版&升級版) 中文完整pdf掃描版[1191.6MB / 07-20
Hadoop + Spark 大數(shù)據(jù)巨量分析與機器學習整合開發(fā)實戰(zhàn) 完整pdf99.8MB / 07-13
Hadoop大數(shù)據(jù)分析與挖掘實戰(zhàn) 完整pdf掃描版[52MB]51.7MB / 11-13
Hadoop安全:大數(shù)據(jù)平臺隱私保護 中文完整pdf版[3MB] 3.22MB / 11-23
-
-
Zabbix v7.0使用手冊 中文版PDF 服務器 / 30MB
-
VMware vSphere 8.0.2全套中文手冊 官方PDF完整版 服務器 / 64.6MB
-
Nginx 安全配置指南技術手冊pdf版 服務器 / 488KB
-
DNS學習從入門到精通 完整PDF版 服務器 / 6.33MB
-
Windows Server 2016系統(tǒng)配置指南 完整pdf掃描版[155MB] 服務器 / 154.8MB
-
-
Windows Server 2016 Active Directory配置指南 中文PDF版 服務器 / 23.3MB
-
-
vSAN操作指南 中文PDF完整版 服務器 / 6.11MB
詳情介紹
本書全面而系統(tǒng)地講解了如何將R語言與Hadoop技術結合并應用于大數(shù)據(jù)分析,不僅系統(tǒng)且深入地闡釋了R與Hadoop集成技術的工具、方法、原則和最佳實踐,而且通過大量實踐案例深入剖析各種常見問題,能為用戶高效利用R語言與Hadoop技術進行大數(shù)據(jù)處理提供翔實指導。
全書分為四部分,共7章:第一部分(第1~2章)是基礎知識,主要講解R語言以及Hadoop的安裝過程、計算原理和基本概念;第二部分(第3~4章)是初級應用,主要講解RHIPE、RHadoop和streaming三種實現(xiàn)方案;第三部分(第5~6章)是高級實例,主要以RHadoop為技術背景,講解多個實際應用案例;第四部分(第7章)介紹數(shù)據(jù)庫連接,主要講解在RHadoop下如何與各類數(shù)據(jù)庫進行連接。
目錄
目 錄
譯者序
前言
審校者簡介
致謝
第1章 R和Hadoop入門 1
1.1 安裝R 2
1.2 安裝RStudio 3
1.3 R語言的功能特征 3
1.3.1 使用R程序包 3
1.3.2 執(zhí)行數(shù)據(jù)操作 3
1.3.3 日漸增多的社區(qū)支持 4
1.3.4 R語言數(shù)據(jù)建模 4
1.4 Hadoop的安裝 5
1.4.1 不同的Hadoop模式 6
1.4.2 Hadoop的安裝步驟 6
1.5 Hadoop的特點 12
1.5.1 HDFS簡介 13
1.5.2 MapReduce簡介 13
1.6 HDFS和MapReduce架構 14
1.6.1 HDFS架構 14
1.6.2 MapReduce架構 15
1.6.3 通過圖示了解HDFS和MapReduce架構 15
1.7 Hadoop的子項目 16
1.8 小結 19
第2章 編寫Hadoop MapReduce程序 20
2.1 MapReduce基礎概念 20
2.2 Hadoop MapReduce技術簡介 22
2.2.1 MapReduce中包含的實體 22
2.2.2 MapReduce中的主要執(zhí)行進程 23
2.2.3 MapReduce的局限 25
2.2.4 MapReduce 可以解決的問題 26
2.2.5 使用Hadoop編程時用到不同的Java概念 26
2.3 Hadoop MapReduce原理 27
2.3.1 MapReduce對象 27
2.3.2 MapReduce中實現(xiàn)Map階段的執(zhí)行單元數(shù)目 28
2.3.3 MapReduce中實現(xiàn)Reduce階段的執(zhí)行單元數(shù)目 28
2.3.4 MapReduce的數(shù)據(jù)流 28
2.3.5 深入理解HadoopMapReduce 30
2.4 編寫Hadoop MapReduce示例程序 32
2.4.1 MapReduce job運行的步驟 33
2.4.2 MapReduce可解決的商業(yè)問題 38
2.5 在R環(huán)境中編寫Hadoop MapReduce程序的方式 39
2.5.1 RHadoop 39
2.5.2 RHIPE 40
2.5.3 Hadoop streaming 40
2.6 小結 40
第3章 集成R和Hadoop 41
3.1 RHIPE 42
3.1.1 安裝RHIPE 42
3.1.2 RHIPE架構 44
3.1.3 RHIPE實例 45
3.1.4 RHIPE參考函數(shù) 48
3.2 RHadoop 51
3.2.1 RHadoop架構 51
3.2.2 安裝RHadoop 52
3.2.3 RHadoop案例 53
3.2.4 RHadoop參考函數(shù) 56
3.3 小結 58
第4章 Hadoop Streaming中使用R 59
4.1 Hadoop Streaming基礎概念 59
4.2 使用R運行Hadoop streaming 62
4.2.1 MapReduce應用程序基礎 63
4.2.2 如何編寫MapReduce應用程序 65
4.2.3 如何運行MapReduce應用程序 67
4.2.4 如何瀏覽MapRecuce應用程序的輸出 69
4.2.5 Hadoop MapReduce腳本的基礎R函數(shù) 70
4.2.6 管理Hadoop MapReduce任務 71
4.3 R語言擴展包HadoopStreaming介紹 72
4.3.1 hsTableReader函數(shù) 73
4.3.2 hsKeyValReader函數(shù) 75
4.3.3 hasLineReader函數(shù) 75
4.3.4 運行Hadoop streaming任務 78
4.3.5 執(zhí)行Hadoop Streaming任務 79
4.4 小結 79
第5章 利用R和Hadoop學習數(shù)據(jù)分析 80
5.1 數(shù)據(jù)分析項目生命周期 80
5.1.1 問題定義 81
5.1.2 設計數(shù)據(jù)需求 81
5.1.3 數(shù)據(jù)預處理 81
5.1.4 數(shù)據(jù)分析 82
5.1.5 數(shù)據(jù)可視化 82
5.2 數(shù)據(jù)分析問題 83
5.2.1 展示網(wǎng)頁分類 83
5.2.2 計算股市變動頻率 92
5.2.3 案例研究:預測推土機售價 98
5.3 小結 107
第6章 應用機器學習做大數(shù)據(jù)分析 108
6.1 機器學習介紹 108
6.2 有監(jiān)督機器學習算法 109
6.2.1 線性回歸 109
6.2.2 logistic回歸 115
6.3 無監(jiān)督機器學習算法 118
6.4 推薦算法 123
6.4.1 在R中產(chǎn)生推薦商品的步驟 125
6.4.2 使用R和Hadoop產(chǎn)生推薦商品 128
6.5 小結 131
第7章 從各種數(shù)據(jù)庫中導入與導出數(shù)據(jù) 132
7.1 文件型數(shù)據(jù)庫 134
7.1.1 不同類型的文件 134
7.1.2 安裝R包 134
7.1.3 將數(shù)據(jù)導入R 134
7.1.4 從R導出數(shù)據(jù) 135
7.2 MySQL 135
7.2.1 安裝MySQL 135
7.2.2 安裝RMySQL 136
7.2.3 列出數(shù)據(jù)表及其結構 136
7.2.4 導入數(shù)據(jù)進R 136
7.2.5 數(shù)據(jù)操縱 137
7.3 Excel 137
7.3.1 安裝Excel 138
7.3.2 導入數(shù)據(jù)進R 138
7.3.3 R和Excel的數(shù)據(jù)操縱 138
7.3.4 導出數(shù)據(jù)到Excel 138
7.4 MongoDB 138
7.4.1 安裝MongoDB 139
7.4.2 安裝rmongodb 141
7.4.3 導入數(shù)據(jù)進R 141
7.4.4 數(shù)據(jù)操縱 142
7.5 SQLite 143
7.5.1 SQLite的特性 143
7.5.2 安裝SQLite 144
7.5.3 安裝RSQLite 144
7.5.4 將數(shù)據(jù)導師入R 144
7.5.5 數(shù)據(jù)操縱 145
7.6 PostgreSQL 145
7.6.1 PostgreSQL的特性 145
7.6.2 安裝PostgreSQL 145
7.6.3 安裝RPostgreSQL 146
7.6.4 從R導出數(shù)據(jù) 146
7.7 Hive 147
7.7.1 Hive的特性 147
7.7.2 安裝Hive 147
7.7.3 安裝RHive 149
7.7.4 RHive操作 149
7.8 HBase 150
7.8.1 HBase的特性 150
7.8.2 安裝HBase 151
7.8.3 安裝Thrift 152
7.8.4 安裝RHBase 153
7.8.5 導入數(shù)據(jù)進R 153
7.8.6 數(shù)據(jù)操縱 153
7.9 小結 154
附錄 參考資源 155
下載地址
人氣書籍
![決戰(zhàn)Nginx系統(tǒng)卷:高性能Web服務器詳解與運維 PDF掃描版[94MB] 決戰(zhàn)Nginx系統(tǒng)卷:高性能Web服務器詳解與運維 PDF掃描版[94MB]](http://img.jbzj.com/do/uploads/litimg/140512/1531562U353.png)
決戰(zhàn)Nginx系統(tǒng)卷:高性能Web服務器詳解與運維 PDF掃描版[94MB]
Tomcat權威指南(第2版) PDF掃描版
Hadoop實戰(zhàn)(第2版)陸嘉恒著 PDF掃描版![Nginx高性能Web服務器詳解 pdf掃描版[178MB] Nginx高性能Web服務器詳解 pdf掃描版[178MB]](http://img.jbzj.com/do/uploads/litimg/160704/1A1562KU6.jpg)
Nginx高性能Web服務器詳解 pdf掃描版[178MB]![精通Windows Server 2008 R2 PDF掃描版[157MB] 精通Windows Server 2008 R2 PDF掃描版[157MB]](http://img.jbzj.com/do/uploads/litimg/140510/1419532T2T.jpg)
精通Windows Server 2008 R2 PDF掃描版[157MB]![大規(guī)模Web服務開發(fā)技術 PDF掃描版[14MB] 大規(guī)模Web服務開發(fā)技術 PDF掃描版[14MB]](http://img.jbzj.com/do/uploads/litimg/140607/162Q12W016.jpg)
大規(guī)模Web服務開發(fā)技術 PDF掃描版[14MB]
Hadoop應用開發(fā)技術詳解 pdf掃描版
深入剖析Tomcat (Paul Deck) pdf掃描版![Windows Server 2012 Hyper-V虛擬化管理實踐 PDF掃描版[223MB] Windows Server 2012 Hyper-V虛擬化管理實踐 PDF掃描版[223MB]](http://img.jbzj.com/do/uploads/litimg/150311/1545362Y592.jpg)
Windows Server 2012 Hyper-V虛擬化管理實踐 PDF掃描版[223MB]![學習Nginx HTTP Server(中文版) PDF掃描版[23MB] 學習Nginx HTTP Server(中文版) PDF掃描版[23MB]](http://img.jbzj.com/do/uploads/litimg/150311/1534022V3E.png)
學習Nginx HTTP Server(中文版) PDF掃描版[23MB]
下載聲明
☉ 解壓密碼:www.dhdzp.com 就是本站主域名,希望大家看清楚,[ 分享碼的獲取方法 ]可以參考這篇文章
☉ 推薦使用 [ 迅雷 ] 下載,使用 [ WinRAR v5 ] 以上版本解壓本站軟件。
☉ 如果這個軟件總是不能下載的請在評論中留言,我們會盡快修復,謝謝!
☉ 下載本站資源,如果服務器暫不能下載請過一段時間重試!或者多試試幾個下載地址
☉ 如果遇到什么問題,請評論留言,我們定會解決問題,謝謝大家支持!
☉ 本站提供的一些商業(yè)軟件是供學習研究之用,如用于商業(yè)用途,請購買正版。
☉ 本站提供的R與Hadoop大數(shù)據(jù)分析實戰(zhàn) ([印]普賈帕提著) 帶目錄完整pdf[22MB] 資源來源互聯(lián)網(wǎng),版權歸該下載資源的合法擁有者所有。


![R與Hadoop大數(shù)據(jù)分析實戰(zhàn) ([印]普賈帕提著) 帶目錄完整pdf[22MB]](http://img.jbzj.com/file_images/article/201808/2018828155531840.jpg?201872815560)