關(guān)于我們
書單推薦
新書推薦
|
大數(shù)據(jù)技術(shù)入門——Hadoop+Spark
本書基礎(chǔ)理論、應(yīng)用開發(fā)以及實際案例相結(jié)合,圍繞Hadoop、Spark生態(tài)圈循序漸進(jìn)地介紹關(guān)于大數(shù)據(jù)技術(shù)領(lǐng)域中的基礎(chǔ)知識、應(yīng)用開發(fā)技術(shù)和基于Spark的常見機(jī)器學(xué)習(xí)算法,最后以兩個實戰(zhàn)案例全面、系統(tǒng)地應(yīng)用了本書介紹的基礎(chǔ)知識和應(yīng)用開發(fā)方法。全書共14章,分別為大數(shù)據(jù)概述、Hadoop簡介及安裝部署、HDFS、MapReduce計算框架、Hive數(shù)據(jù)倉庫、HBase分布式數(shù)據(jù)庫、Spark基礎(chǔ)、Spark RDD彈性分布式數(shù)據(jù)集、Spark SQL、Spark Streaming實時計算框架、Spark Streaming與Flume、Kafka的整合、Spark MLlib 機(jī)器學(xué)習(xí)、實戰(zhàn)案例——分布式優(yōu)惠券后臺應(yīng)用系統(tǒng)和實戰(zhàn)案例——新聞話題實時統(tǒng)計分析系統(tǒng),書中的每個知識點(diǎn)都有相應(yīng)的實現(xiàn)代碼和實例。
本書主要面向廣大從事大數(shù)據(jù)分析、應(yīng)用開發(fā)、機(jī)器學(xué)習(xí)、數(shù)據(jù)挖掘的專業(yè)人員以及從事高校信息技術(shù)專業(yè)的教師和高等院校的在讀學(xué)生及相關(guān)領(lǐng)域的廣大科研人員。
你還可能感興趣
我要評論
|