Python預(yù)測之美:數(shù)據(jù)分析與算法實戰(zhàn)
定 價:119 元
- 作者:游皓麟
- 出版時間:2020/6/1
- ISBN:9787121390418
- 出 版 社:電子工業(yè)出版社
- 中圖法分類:TP311.561
- 頁碼:396
- 紙張:
- 版次:01
- 開本:16K
Python 是一種面向?qū)ο蟮哪_本語言,其代碼簡潔優(yōu)美,類庫豐富,開發(fā)效率也很高,得到越來越多開發(fā)者的喜愛,廣泛應(yīng)用于Web 開發(fā)、網(wǎng)絡(luò)編程、爬蟲開發(fā)、自動化運維、云計算、人工智能、科學(xué)計算等領(lǐng)域。預(yù)測技術(shù)在當(dāng)今智能分析及其應(yīng)用領(lǐng)域中發(fā)揮著重要作用,也是大數(shù)據(jù)時代的核心價值所在。隨著AI 技術(shù)的進一步深化,預(yù)測技術(shù)將更好地支撐復(fù)雜場景下的預(yù)測需求,其商業(yè)價值不言而喻;赑ython 來做預(yù)測,不僅能夠在業(yè)務(wù)上快速落地,還讓代碼維護更加方便。對預(yù)測原理的深度剖析和算法的細致解讀,是本書的一大亮點。本書共分為3 篇。第1 篇介紹預(yù)測基礎(chǔ),主要包括預(yù)測概念理解、預(yù)測方法論、分析方法、特征技術(shù)、模型優(yōu)化及評價,讀者通過這部分內(nèi)容的學(xué)習(xí),可以掌握預(yù)測的基本步驟和方法思路。第2 篇介紹預(yù)測算法,該部分包含多元回歸分析、復(fù)雜回歸分析、時間序列及進階算法,內(nèi)容比較有難度,需要細心品味。第3 篇介紹預(yù)測案例,包括短期日負荷曲線預(yù)測和股票價格預(yù)測兩個實例,讀者可以了解到實施預(yù)測時需要關(guān)注的技術(shù)細節(jié)。希望讀者在看完本書后,能夠?qū)⒈緯木跁炌ǎM一步在工作和學(xué)習(xí)實踐中提煉價值。
高級數(shù)據(jù)分析師,在互聯(lián)網(wǎng)/電信/電力領(lǐng)域具有豐富的數(shù)據(jù)分析與挖掘建模經(jīng)驗。曾服務(wù)于華為技術(shù)軟件有限公司、深圳市康拓普信息技術(shù)有限公司、深圳市數(shù)聚能源科技有限公司等企業(yè),期間曾在小象學(xué)院兼職R語言數(shù)據(jù)挖掘講師。
第1 篇 預(yù)測入門
第1 章 認(rèn)識預(yù)測 . 2
1.1 什么是預(yù)測 . 2
1.1.1 占卜術(shù) . 3
1.1.2 神秘的地動儀 . 3
1.1.3 科學(xué)預(yù)測 . 5
1.1.4 預(yù)測的原則 . 7
1.2 前沿技術(shù) . 9
1.2.1 大數(shù)據(jù)與預(yù)測 . 10
1.2.2 大數(shù)據(jù)預(yù)測的特點 11
1.2.3 人工智能與預(yù)測 . 15
1.2.4 人工智能預(yù)測的特點 . 17
1.2.5 典型預(yù)測案例 . 18
1.3 Python 預(yù)測初步 . 26
1.3.1 數(shù)據(jù)預(yù)處理 . 27
1.3.2 建立模型 . 31
1.3.3 預(yù)測及誤差分析 . 34
第2 章 預(yù)測方法論 . 37
2.1 預(yù)測流程 . 37
2.1.1 確定主題 . 38
2.1.2 收集數(shù)據(jù) . 40
2.1.3 選擇方法 . 42
2.1.4 分析規(guī)律 . 43
2.1.5 建立模型 . 48
2.1.6 評估效果 . 51
2.1.7 發(fā)布模型 . 52
2.2 指導(dǎo)原則 . 53
2.2.1 界定問題 . 53
2.2.2 判斷預(yù)測法 . 55
2.2.3 外推預(yù)測法 . 56
2.2.4 因果預(yù)測法 . 58
2.3 團隊構(gòu)成 . 59
2.3.1 成員分類 . 59
2.3.2 數(shù)據(jù)氛圍 . 61
2.3.3 團隊合作 . 63
第3 章 探索規(guī)律 . 65
3.1 相關(guān)分析 . 65
3.1.1 自相關(guān)分析 . 65
3.1.2 偏相關(guān)分析 . 68
3.1.3 簡單相關(guān)分析 . 69
3.1.4 互相關(guān)分析 . 80
3.1.5 典型相關(guān)分析 . 82
3.2 因果分析 . 87
3.2.1 什么是因果推斷 . 87
3.2.2 因果推斷的方法 . 90
3.2.3 時序因果推斷 . 93
3.3 聚類分析 . 98
3.3.1 K-Means 算法 . 98
3.3.2 系統(tǒng)聚類算法 . 102
3.4 關(guān)聯(lián)分析 110
3.4.1 關(guān)聯(lián)規(guī)則挖掘 110
3.4.2 Apriori 算法 . 111
3.4.3 Eclat 算法 120
3.4.4 序列模式挖掘 . 123
3.4.5 SPADE 算法 124
第4 章 特征工程 . 136
4.1 特征變換 . 136
4.1.1 概念分層 . 137
4.1.2 標(biāo)準(zhǔn)化 . 138
4.1.3 離散化 . 141
4.1.4 函數(shù)變換 . 143
4.1.5 深入表達 . 144
4.2 特征組合 . 145
4.2.1 基于經(jīng)驗 . 145
4.2.2 二元組合 . 146
4.2.3 高階多項式 . 148
4.3 特征評價 . 151
4.3.1 特征初選 . 151
4.3.2 影響評價 . 152
4.3.3 模型法 . 167
4.4 特征學(xué)習(xí) . 172
4.4.1 基本思路 . 173
4.4.2 特征表達式 . 174
4.4.3 初始種群 . 183
4.4.4 適應(yīng)度 . 185
4.4.5 遺傳行為 . 187
4.4.6 實例分析 . 192
第2 篇 預(yù)測算法
第5 章 參數(shù)優(yōu)化 . 199
5.1 交叉驗證 . 199
5.2 網(wǎng)格搜索 . 201
5.3 遺傳算法 . 203
5.3.1 基本概念 . 203
5.3.2 遺傳算法算例 . 204
5.3.3 遺傳算法實現(xiàn)步驟 . 209
5.3.4 遺傳算法Python 實現(xiàn) 210
5.4 粒子群優(yōu)化 . 213
5.4.1 基本概念及原理 . 213
5.4.2 粒子群算法的實現(xiàn)步驟 . 214
5.4.3 用Python 實現(xiàn)粒子群算法 215
5.5 模擬退火 . 220
5.5.1 基本概念及原理 . 220
5.5.2 模擬退火算法的實現(xiàn)步驟 . 221
5.5.3 模擬退火算法Python 實現(xiàn) 222
第6 章 線性回歸及其優(yōu)化 226
6.1 多元線性回歸 . 226
6.1.1 回歸模型與基本假定 . 226
6.1.2 最小二乘估計 . 227
6.1.3 回歸方程和回歸系數(shù)的顯著性檢驗 . 228
6.1.4 多重共線性 . 229
6.2 Ridge 回歸 233
6.2.1 基本概念 . 233
6.2.2 嶺跡曲線 . 233
6.2.3 基于GCV 準(zhǔn)則確定嶺參數(shù) . 235
6.2.4 Ridge 回歸的Python 實現(xiàn) . 237
6.3 Lasso 回歸 . 237
6.3.1 基本概念 . 237
6.3.2 使用LAR 算法求解Lasso . 238
6.3.3 Lasso 算法的Python 實現(xiàn) . 240
6.4 分位數(shù)回歸 . 242
6.4.1 基本概念 . 242
6.4.2 分位數(shù)回歸的計算 . 245
6.4.3 用單純形法求解分位數(shù)回歸及Python 實現(xiàn) 246
6.5 穩(wěn)健回歸 . 248
6.5.1 基本概念 . 249
6.5.2 M 估計法及Python 實現(xiàn) . 250
第7 章 復(fù)雜回歸分析 . 254
7.1 梯度提升回歸樹(GBRT) . 254
7.1.1 Boosting 方法簡介 254
7.1.2 AdaBoost 算法 255
7.1.3 提升回歸樹算法 . 257
7.1.4 梯度提升 . 259
7.1.5 GBRT 算法的Python 實現(xiàn) 261
7.2 深度神經(jīng)網(wǎng)絡(luò) . 264
7.2.1 基本概念 . 264
7.2.2 從線性回歸說起 . 269
7.2.3 淺層神經(jīng)網(wǎng)絡(luò) . 272
7.2.4 深層次擬合問題 . 277
7.2.5 DNN 的Python 實現(xiàn) 278
7.3 支持向量機回歸 . 281
7.3.1 基本問題 . 281
7.3.2 LS-SVMR 算法 . 284
7.3.3 LS-SVMR 算法的Python 實現(xiàn) . 285
7.4 高斯過程回歸 . 286
7.4.1 GPR 算法 287
7.4.2 GPR 算法的Python 實現(xiàn) . 289
第8 章 時間序列分析 . 292
8.1 Box-Jenkins 方法 292
8.1.1 p 階自回歸模型 293
8.1.2 q 階移動平均模型 295
8.1.3 自回歸移動平均模型 . 296
8.1.4 ARIMA 模型 . 300
8.1.5 ARIMA 模型的Python 實現(xiàn) . 301
8.2 門限自回歸模型 . 309
8.2.1 TAR 模型的基本原理 309
8.2.2 TAR 模型的Python 實現(xiàn) . 310
8.3 GARCH 模型族 313
8.3.1 線性ARCH 模型 313
8.3.2 GRACH 模型 315
8.3.3 EGARCH 模型 . 315
8.3.4 PowerARCH 模型 . 316
8.4 向量自回歸模型 . 318
8.4.1 VAR 模型基本原理 318
8.4.2 VAR 模型的Python 實現(xiàn) . 320
8.5 卡爾曼濾波 . 324
8.5.1 卡爾曼濾波算法介紹 . 324
8.5.2 卡爾曼濾波的Python 實現(xiàn) 326
8.6 循環(huán)神經(jīng)網(wǎng)絡(luò) . 328
8.6.1 RNN 的基本原理 329
8.6.2 RNN 算法的Python 實現(xiàn) 332
8.7 長短期記憶網(wǎng)絡(luò) . 335
8.7.1 LSTM 模型的基本原理 . 336
8.7.2 LSTM 算法的Python 實現(xiàn) 341
第3 篇 預(yù)測應(yīng)用
第9 章 短期日負荷曲線預(yù)測 . 345
9.1 電力行業(yè)負荷預(yù)測介紹 . 345
9.2 短期日負荷曲線預(yù)測的基本要求 . 346
9.3 預(yù)測建模準(zhǔn)備 . 347
9.3.1 基礎(chǔ)數(shù)據(jù)采集 . 347
9.3.2 缺失數(shù)據(jù)處理 . 349
9.3.3 潛在規(guī)律分析 . 352
9.4 基于DNN 算法的預(yù)測 355
9.4.1 數(shù)據(jù)要求 . 356
9.4.2 數(shù)據(jù)預(yù)處理 . 356
9.4.3 網(wǎng)絡(luò)結(jié)構(gòu)設(shè)計 . 357
9.4.4 建立模型 . 358
9.4.5 預(yù)測實現(xiàn) . 359
9.4.6 效果評估 . 359
9.5 基于LSTM 算法的預(yù)測 361
9.5.1 數(shù)據(jù)要求 . 361
9.5.2 數(shù)據(jù)預(yù)處理 . 362
9.5.3 網(wǎng)絡(luò)結(jié)構(gòu)設(shè)計 . 362
9.5.4 建立模型 . 363
9.5.5 預(yù)測實現(xiàn) . 364
9.5.6 效果評估 . 364
第10 章 股票價格預(yù)測 . 367
10.1 股票市場簡介 . 367
10.2 獲取股票數(shù)據(jù) . 368
10.3 基于VAR 算法的預(yù)測 . 371
10.3.1 平穩(wěn)性檢驗 . 371
10.3.2 VAR 模型定階 372
10.3.3 預(yù)測及效果驗證 . 373
10.4 基于LSTM 算法的預(yù)測. 375
10.4.1 數(shù)據(jù)要求 . 375
10.4.2 數(shù)據(jù)預(yù)處理 . 376
10.4.3 網(wǎng)絡(luò)結(jié)構(gòu)設(shè)計 . 377
10.4.4 建立模型 . 377
10.4.5 預(yù)測實現(xiàn) . 378
10.4.6 效果評估 . 378
參考文獻 . 381