本書由新零售數(shù)據(jù)分析項(xiàng)目貫穿始終,以項(xiàng)目為導(dǎo)向,全面地介紹了數(shù)據(jù)分析的流程和Python數(shù)據(jù)分析庫的應(yīng)用,詳細(xì)地講解了利用Python解決企業(yè)實(shí)際問題的方法。本書共7個(gè)項(xiàng)目,項(xiàng)目1~6介紹了如何使用Python實(shí)現(xiàn)新零售智能銷售項(xiàng)目,涵蓋項(xiàng)目的背景、項(xiàng)目所使用的Python數(shù)據(jù)分析工具的安裝與操作方法、Python基礎(chǔ)及其常用的數(shù)據(jù)分析庫,以及使用數(shù)據(jù)可視化分析新零售智能銷售庫存結(jié)構(gòu)、用戶行為、銷售情況,并較為全面地闡述了如何使用Python進(jìn)行企業(yè)綜合案例數(shù)據(jù)分析。項(xiàng)目7基于大數(shù)據(jù)挖掘建模平臺(tái)和可視化平臺(tái)實(shí)現(xiàn)新零售智能銷售用戶分析。項(xiàng)目1~6都包含技能拓展,該環(huán)節(jié)補(bǔ)充了Python在數(shù)據(jù)分析中的應(yīng)用。此外,項(xiàng)目2~6都包含知識測試、技能測試,通過練習(xí)和操作實(shí)踐,幫助讀者鞏固所學(xué)的內(nèi)容。本書可以作為職業(yè)院校數(shù)據(jù)分析相關(guān)專業(yè)的教材,也可以作為數(shù)據(jù)分析愛好者的自學(xué)用書。
胡志齊,北京市信息管理學(xué)校信息技術(shù)系主任,工信行指委中職分委會(huì)委員,全國中職信息技術(shù)類專業(yè)目錄和標(biāo)準(zhǔn)研制專家,全國中職實(shí)訓(xùn)基地標(biāo)準(zhǔn)研制專家,主編十四五規(guī)劃教材一本,副主編十四五規(guī)劃教材一本,主編出版教材累計(jì)10本,獲首屆國家教材成果獎(jiǎng)二等獎(jiǎng),電子工業(yè)出版社優(yōu)秀作者等榮譽(yù)。
項(xiàng)目1 分析新零售智能銷售項(xiàng)目背景 1
1.1 了解項(xiàng)目背景與目標(biāo) 2
1.2 了解數(shù)據(jù) 2
1.2.1 了解訂單數(shù)據(jù) 3
1.2.2 了解商品數(shù)據(jù) 3
1.3 熟悉項(xiàng)目流程 4
項(xiàng)目2 熟悉與安裝Python數(shù)據(jù)分析工具 8
2.1 熟悉Python數(shù)據(jù)分析工具 9
2.1.1 了解常用的數(shù)據(jù)分析工具 9
2.1.2 了解Python數(shù)據(jù)分析的優(yōu)勢 10
2.2 安裝Python的Anaconda發(fā)行版 11
2.2.1 系統(tǒng)準(zhǔn)備 11
2.2.2 下載與安裝Anaconda發(fā)行版 12
2.3 使用Jupyter Notebook 15
2.3.1 了解Jupyter Notebook 15
2.3.2 Jupyter Notebook的基本功能 16
2.3.3 Jupyter Notebook的高級功能 19
項(xiàng)目3 Python基礎(chǔ)及其常用的數(shù)據(jù)分析庫 25
3.1 了解Python的基礎(chǔ)知識 26
3.1.1 了解Python基本語法 26
3.1.2 熟悉Python基本數(shù)據(jù)類型 30
3.1.3 熟悉Python常用運(yùn)算符 44
3.2 了解Python標(biāo)準(zhǔn)庫os模塊 46
3.2.1 導(dǎo)入Python庫 46
3.2.2 掌握os模塊的常用方法 46
3.3 了解常用的數(shù)據(jù)分析庫pandas 47
3.3.1 了解pandas庫 47
3.3.2 讀/寫文件 48
3.3.3 查看DataFrame的基本屬性 51
3.3.4 掌握DataFrame的查、改、增、刪方法 52
3.3.5 了解DataFrame的描述性統(tǒng)計(jì) 60
項(xiàng)目4 數(shù)據(jù)可視化——分析新零售智能銷售庫存結(jié)構(gòu) 67
4.1 技能與知識準(zhǔn)備 68
4.1.1 了解Python第三方繪圖庫 68
4.1.2 理解Matplotlib的基礎(chǔ)繪圖語法 69
4.1.3 配置Matplotlib的rc動(dòng)態(tài)參數(shù) 72
4.1.4 掌握Matplotlib的繪圖風(fēng)格及中文顯示 74
4.1.5 分組聚合DataFrame 76
4.2 讀取與清洗商品數(shù)據(jù) 83
4.2.1 讀取商品數(shù)據(jù) 83
4.2.2 清洗商品數(shù)據(jù) 84
4.3 繪制圖形,分析庫存結(jié)構(gòu) 85
4.3.1 繪制折線圖,分析售罄率 85
4.3.2 繪制點(diǎn)線圖,分析庫存成本 87
4.3.3 繪制折線圖,分析進(jìn)貨數(shù)量、庫存數(shù)量和銷售數(shù)量 88
4.3.4 撰寫庫存結(jié)構(gòu)分析報(bào)告 89
項(xiàng)目5 數(shù)據(jù)可視化——分析新零售智能銷售用戶行為 95
5.1 技能與知識準(zhǔn)備 96
5.1.1 排序 96
5.1.2 合并數(shù)據(jù) 101
5.2 讀取與處理訂單數(shù)據(jù) 112
5.2.1 讀取訂單數(shù)據(jù) 113
5.2.2 清洗訂單數(shù)據(jù) 113
5.2.3 歸約訂單數(shù)據(jù) 116
5.3 繪制圖形,分析用戶行為 119
5.3.1 繪制餅圖,分析用戶支付方式 119
5.3.2 繪制散點(diǎn)圖,分析客單價(jià) 123
5.3.3 繪制餅圖,分析用戶數(shù) 124
5.3.4 繪制折線圖,分析用戶的消費(fèi)時(shí)間 127
5.3.5 繪制環(huán)形圖,分析用戶的消費(fèi)時(shí)段 129
5.3.6 撰寫用戶行為分析報(bào)告 131
項(xiàng)目6 數(shù)據(jù)可視化——分析新零售智能銷售情況 143
6.1 技能與知識準(zhǔn)備 144
6.1.1 簡單統(tǒng)計(jì)法 145
6.1.2 3σ原則分析法 145
6.1.3 箱形圖分析法 147
6.1.4 缺失值檢查法 149
6.2 統(tǒng)計(jì)并查看新零售智能銷售數(shù)據(jù) 149
6.3 繪制圖形,分析整體銷售情況 150
6.3.1 繪制柱形圖,分析暢銷排名前10的商品 151
6.3.2 繪制條形圖,分析滯銷排名前10的商品 152
6.3.3 繪制折線圖,分析銷售金額 154
6.3.4 繪制柱形圖,分析銷售金額排名前10的設(shè)備 155
6.3.5 撰寫總體銷售情況分析報(bào)告 156
6.4 繪制圖形,分析區(qū)域銷售情況 159
6.4.1 繪制柱形圖,分析各區(qū)域銷售金額 159
6.4.2 繪制餅圖,分析各市銷售金額排名前5的商品占比 160
6.4.3 撰寫區(qū)域銷售情況分析報(bào)告 164
6.5 繪制圖形,分析各月銷售情況 168
6.5.1 繪制折線圖,分析訂單數(shù)量與設(shè)備數(shù)量的關(guān)系 168
6.5.2 繪制折線圖,分析各月利潤 170
6.5.3 繪制柱形圖,分析各月銷售金額排名前10的商品及其利潤 171
6.5.4 撰寫各月銷售情況分析報(bào)告 174
項(xiàng)目7 基于大數(shù)據(jù)挖掘建模平臺(tái)和可視化平臺(tái)實(shí)現(xiàn)新零售智能銷售用戶分析 182
7.1 知識準(zhǔn)備 184
7.1.1 初識大數(shù)據(jù)挖掘建模平臺(tái) 184
7.1.2 初識大數(shù)據(jù)可視化平臺(tái) 188
7.2 配置數(shù)據(jù)源 193
7.3 探索訂單數(shù)據(jù) 195
7.4 清洗訂單數(shù)據(jù) 196
7.4.1 處理缺失值 196
7.4.2 添加“市”字段 197
7.4.3 處理“商品詳情”字段 198
7.4.4 去除無意義數(shù)據(jù) 199
7.4.5 提取月份 200
7.5 統(tǒng)計(jì)訂單數(shù)據(jù) 201
7.6 繪制圖形,分析用戶行為 205
7.6.1 用戶支付方式占比餅圖 205
7.6.2 用戶消費(fèi)金額與消費(fèi)次數(shù)折線圖 207
7.6.3 各城市用戶數(shù)占比餅圖 209
7.6.4 每月用戶數(shù)占比餅圖 211
7.6.5 首次和最后一次消費(fèi)時(shí)間的用戶消費(fèi)次數(shù)折線圖 213
7.6.6 配置用戶分析可視化儀表盤與大屏 215