這是我們東坡下載為大家?guī)淼囊黄形牡?strong>Spark快速數(shù)據(jù)處理中文版電子書,采用的pdf格式,內容完整,講解Spark的使用方法,包括如何在多種機器上安裝Spark,如何配置一個Spark集群等,有需要的朋友們可以來我們東坡免費的下載使用!
Spark快速數(shù)據(jù)處理圖書目錄
譯者序
作者簡介
前言
第1章 安裝Spark以及構建Spark集群
1.1 單機運行Spark
1.2 在EC2上運行Spark
1.3 在ElasticMapReduce上部署Spark
1.4 用Chef(opscode)部署Spark
1.5 在Mesos上部署Spark
1.6 在Yarn上部署Spark
1.7 通過SSH部署集群
1.8 鏈接和參考
1.9 小結
第2章 Sparkshell的使用
2.1 加載一個簡單的text文件
2.2 用Sparkshell運行邏輯回歸
2.3 交互式地從S3加載數(shù)據(jù)
2.4 小結
第3章 構建并運行Spark應用
3.1 用sbt構建Spark作業(yè)
3.2 用Maven構建Spark作業(yè)
3.3 用其他工具構建Spark作業(yè)
3.4 小結
第4章 創(chuàng)建SparkContext
4.1 Scala
4.2 Java
4.3 Java和Scala共享的API
4.4 Python
4.5 鏈接和參考
4.6 小結
第5章 加載與保存數(shù)據(jù)
5.1 RDD
5.2 加載數(shù)據(jù)到RDD中
5.3 保存數(shù)據(jù)
5.4 連接和參考
5.5 小結
第6章 操作RDD
6.1 用Scala和Java操作RDD
6.2 用Python操作RDD
6.3 鏈接和參考
6.4 小結
第7章 Shark-Hive和Spark的綜合運用
7.1 為什么用HiveShark
7.2 安裝Shark
7.3 運行Shark
7.4 加載數(shù)據(jù)
7.5 在Spark程序中運行HiveQL查詢
7.6 鏈接和參考
7.7 小結
第8章 測試
8.1 用Java和Scala測試
8.2 用Python測試
8.3 鏈接和參考
8.4 小結
第9章 技巧和竅門
9.1 日志位置
9.2 并發(fā)限制
9.3 內存使用與垃圾回收
9.4 序列化
9.5 IDE集成環(huán)境
9.6 Spark與其他語言
9.7 安全提示
9.8 郵件列表
9.9 鏈接和參考
9.10 小結
Spark快速數(shù)據(jù)處理pdf預覽
- PC官方版
- 安卓官方手機版
- IOS官方手機版