spark快速大數(shù)據(jù)分析PDF版是一款非常好看的書,可以讓你學習到很多的內(nèi)容,而且小編是免費分享給大家的,想看的小朋友們趕緊下載吧。
Spark快速大數(shù)據(jù)分析電子書介紹
《Spark快速大數(shù)據(jù)分析》由 Spark 開發(fā)者及核心成員共同打造,講解了網(wǎng)絡大數(shù)據(jù)時代應運而生的、能高效迅捷地分析處理數(shù)據(jù)的工具——Spark,它帶領(lǐng)讀者快速掌握用 Spark 收集、計算、簡化和保存海量數(shù)據(jù)的方法,學會交互、迭代和增量式分析,解決分區(qū)、數(shù)據(jù)本地化和自定義序列化等問題。
Spark快速大數(shù)據(jù)分析目錄
第1章 Spark數(shù)據(jù)分析導論 1
1.1 Spark是什么 1
1.2 一個大一統(tǒng)的軟件! 2
1.2.1 Spark Core 2
1.2.2 Spark SQL 3
1.2.3 Spark Streaming 3
1.2.4 MLlib 3
1.2.5 GraphX 3
1.2.6 集群管理器 4
1.3 Spark的用戶和用途 4
1.3.1 數(shù)據(jù)科學任務 4
1.3.2 數(shù)據(jù)處理應用 5
1.4 Spark簡史 5
1.5 Spark的版本和發(fā)布 6
1.6 Spark的存儲層次 6
第2章 Spark下載與入門 7
2.1 下載Spark 7
2.2 Spark中Python和Scala的shell 9
2.3 Spark 核心概念簡介 12
2.4 獨立應用 14
2.4.1 初始化SparkContext 15
2.4.2 構(gòu)建獨立應用 16
2.5 總結(jié) 19