關(guān)于我們
書單推薦
新書推薦
|
PySpark原理深入與編程實(shí)戰(zhàn)(微課視頻版)
本書系統(tǒng)講述Apache Spark/PySpark大數(shù)據(jù)計(jì)算平臺(tái)的原理,以及如果將Apache PySpark應(yīng)用于大數(shù)據(jù)的實(shí)時(shí)流處理、批處理等各個(gè)場(chǎng)景。通過原理深入學(xué)習(xí)和實(shí)踐示例、案例的學(xué)習(xí)應(yīng)用,使讀者了解并掌握Apache Spark/PySpark的基本原理和技能,接近理論與實(shí)踐的距離。
全書共分為8章,主要內(nèi)容包括:Spark架構(gòu)原理與集群搭建、開發(fā)和部署PySpark應(yīng)用程序、PySpark核心編程、PySpark SQL、PySpark SQL高級(jí)分析、PySpark結(jié)構(gòu)化流、PySpark結(jié)構(gòu)化流高級(jí)處理、Spark大數(shù)據(jù)處理綜合案例。本書源碼全部在Apache Spark 3.1.2上調(diào)試成功,所有示例和案例均基于Python 3.x語言。 為降低讀者學(xué)習(xí)大數(shù)據(jù)技術(shù)的門檻,本書除了提供了豐富的上機(jī)實(shí)踐操作和范例程序詳解之外,本書作者還為購(gòu)買和使用本書的讀者提供了搭建好的Hadoop、Hive數(shù)倉(cāng)和PySpark大數(shù)據(jù)開發(fā)和學(xué)習(xí)環(huán)境。讀者既可以參照本書的講解自行搭建Hadoop和PySpark環(huán)境,也可直接使用作者提供的開始和學(xué)習(xí)環(huán)境,快速開始大數(shù)據(jù)和PySpark的學(xué)習(xí)。 本書系統(tǒng)講解了Apache Spark/PySpark大數(shù)據(jù)計(jì)算平臺(tái)的原理和流、批處理的開發(fā)實(shí)踐,內(nèi)容全面、實(shí)例豐富、可操作性強(qiáng),做到了理論與實(shí)踐相結(jié)合。本書適合大數(shù)據(jù)學(xué)習(xí)愛好者、想要入門Apache Spark/PySpark的讀者作為入門和提高的技術(shù)參考書,也適合用作大中專院校大數(shù)據(jù)專業(yè)相關(guān)的學(xué)生和老師的教材或教學(xué)參考書。
你還可能感興趣
我要評(píng)論
|