關(guān)于我們
書(shū)單推薦
新書(shū)推薦
|
Cloudera Hadoop大數(shù)據(jù)平臺(tái)實(shí)戰(zhàn)指南
對(duì)于入門(mén)和學(xué)習(xí)大數(shù)據(jù)技術(shù)的讀者來(lái)說(shuō),大數(shù)據(jù)技術(shù)的生態(tài)圈和知識(shí)體系過(guò)于龐大,可能還沒(méi)有開(kāi)始學(xué)習(xí)就已經(jīng)陷入眾多的陌生名詞和泛泛的概念中。本書(shū)的切入點(diǎn)明確而清晰,從Hadoop 生態(tài)系統(tǒng)的明星 Cloudera 入手,逐步引出各類(lèi)大數(shù)據(jù)基礎(chǔ)和核心應(yīng)用框架。
本書(shū)分為18章,系統(tǒng)介紹Hadoop 生態(tài)系統(tǒng)大數(shù)據(jù)相關(guān)的知識(shí),包括大數(shù)據(jù)概述、Cloudera Hadoop平臺(tái)的安裝部署、HDFS分布式文件系統(tǒng)、MapReduce計(jì)算框架、資源管理調(diào)度框架YARN 、Hive數(shù)據(jù)倉(cāng)庫(kù)、數(shù)據(jù)遷移工具Sqoop、分布式數(shù)據(jù)庫(kù)HBase、ZooKeeper分布式協(xié)調(diào)服務(wù)、準(zhǔn)實(shí)時(shí)分析系統(tǒng)Impala、日志采集工具Flume、分布式消息系統(tǒng)Kafka、ETL工具Kettle、Spark計(jì)算框架等內(nèi)容,最后給出兩個(gè)綜合實(shí)操案例,以鞏固前面所學(xué)的知識(shí)點(diǎn)。 本書(shū)既適合Hadoop初學(xué)者、大數(shù)據(jù)技術(shù)工程師和大數(shù)據(jù)技術(shù)愛(ài)好者自學(xué)使用,亦可作為高等院校和培訓(xùn)機(jī)構(gòu)大數(shù)據(jù)相關(guān)課程的培訓(xùn)用書(shū)。
你還可能感興趣
我要評(píng)論
|