關(guān)于我們
書單推薦
新書推薦

Apache Spark大數(shù)據(jù)分析 基于Azure Databricks云平臺

Apache Spark大數(shù)據(jù)分析 基于Azure Databricks云平臺

定  價:79.8 元

        

  • 作者:[瑞典]羅伯特·伊利杰森(Robert Ilijason)
  • 出版時間:2023/6/1
  • ISBN:9787115614568
  • 出 版 社:人民郵電出版社
  • 中圖法分類:TP274 
  • 頁碼:236
  • 紙張:
  • 版次:01
  • 開本:小16開
9
7
6
8
1
7
4
1
5
1
6
5
8
Azure Databricks是一款基于云的大數(shù)據(jù)分析和機(jī)器學(xué)習(xí)平臺,用于實現(xiàn)基于Apache Spark的數(shù)據(jù)處理,為快速增長的海量數(shù)據(jù)的處理和決策需求分析提供了良好的支撐!禔pache Spark大數(shù)據(jù)分析:基于Azure Databricks云平臺》詳細(xì)介紹基于Azure Databricks云平臺來使用Apache Spark完成大規(guī)模數(shù)據(jù)處理和分析的方法。本書總計11章,首先介紹大規(guī)模數(shù)據(jù)分析相關(guān)的概念;然后介紹受管的Spark及其與Databricks的關(guān)系,以及Databricks的版本差異和使用方法(涵蓋工作區(qū)、集群、筆記本、Databricks文件系統(tǒng)、數(shù)據(jù)導(dǎo)入/導(dǎo)出等內(nèi)容);接著介紹使用SQL和Python分別實現(xiàn)數(shù)據(jù)分析的過程,數(shù)據(jù)提取、變換、加載、存儲、優(yōu)化技巧等高階數(shù)據(jù)處理方法以及外部連接工具、生產(chǎn)環(huán)境集成等內(nèi)容;最后探討了運行機(jī)器學(xué)習(xí)算法、合并數(shù)據(jù)更新以及通過API運行Databricks、Delta流處理等高階主題。 作為數(shù)據(jù)分析領(lǐng)域的入門書,本書具有很強(qiáng)的實用性,可供數(shù)據(jù)工程師、數(shù)據(jù)分析師和決策分析人員等學(xué)習(xí)和參考。
 你還可能感興趣
 我要評論
您的姓名   驗證碼: 圖片看不清?點擊重新得到驗證碼
留言內(nèi)容