Excel+Python 飛速搞定數(shù)據(jù)分析與處理
定 價(jià):89.8 元
- 作者:[瑞士]費(fèi)利克斯·朱姆斯坦(Felix Zumstein)
- 出版時(shí)間:2022/3/1
- ISBN:9787115586766
- 出 版 社:人民郵電出版社
- 中圖法分類:TP391.13
- 頁(yè)碼:260
- 紙張:
- 版次:01
- 開(kāi)本:16開(kāi)
在如今的時(shí)代,大型數(shù)據(jù)集唾手可得,含有數(shù)百萬(wàn)行的數(shù)據(jù)文件并不罕見(jiàn)。Python是數(shù)據(jù)分析師和數(shù)據(jù)科學(xué)家的首選語(yǔ)言。通過(guò)本書,即使完全不了解Python,Excel用戶也能夠?qū)W會(huì)用Python將煩瑣的任務(wù)自動(dòng)化,顯著地提高辦公效率,并利用Python在數(shù)據(jù)分析和科學(xué)計(jì)算方面的突出優(yōu)勢(shì),輕松搞定Excel任務(wù)。你將學(xué)習(xí)如何用pandas替代 Excel函數(shù),以及如何用自動(dòng)化Python庫(kù)替代VBA宏和用戶定義函數(shù)等。
本書既適合Excel用戶,也適合Python用戶閱讀。
●針對(duì)零編程基礎(chǔ)人士量身打造,適合辦公室人群閱讀
無(wú)須豐富的編程經(jīng)驗(yàn)即可開(kāi)始使用Python,借助編程的力量,輕松突破Excel的瓶頸,避免人為錯(cuò)誤,將Excel和數(shù)據(jù)庫(kù)連接并獲取數(shù)據(jù),讓煩瑣的Excel任務(wù)自動(dòng)化,讓您能將更多寶貴的時(shí)間花在更有價(jià)值的任務(wù)上。
●xlwings創(chuàng)始人傾力打造,手把手教學(xué)
“將Python作為Excel的腳本語(yǔ)言”開(kāi)源Python庫(kù)xlwings的誕生很好地回答了這些問(wèn)題,它讓Excel和Python珠聯(lián)璧合。而作為xlwings的創(chuàng)始人,本書作者將展示如何借用Python的力量,讓Excel快得飛起來(lái)!
●更多設(shè)備,更簡(jiǎn)化的編程語(yǔ)言,一切只為更好的辦公
使用Visual Studio Code和Jupyter筆記本等便捷工具,用Python替代VBA、Power Query和Power Pivot,支持更多設(shè)備,讓您學(xué)習(xí)起來(lái)更加簡(jiǎn)單。
費(fèi)利克斯·朱姆斯坦(Felix Zumstein),流行開(kāi)源Python庫(kù)xlwings的創(chuàng)始人。xlwings幫助Excel用戶利用Python腳本將任務(wù)自動(dòng)化,從而實(shí)現(xiàn)效率飛躍。費(fèi)利克斯在工作中接觸了大量Excel用戶,這使他對(duì)Excel在各行各業(yè)中的使用瓶頸和解決思路擁有深刻的見(jiàn)解。
【譯者簡(jiǎn)介】
馮黎,Python愛(ài)好者,從事桌面應(yīng)用程序、Web應(yīng)用程序及游戲的開(kāi)發(fā)工作,曾供職于Singtel。熱衷于研究各類編程語(yǔ)言,自Python 2.x時(shí)期起開(kāi)始使用Python,深諳Python的語(yǔ)言特性。
前言 xiii
第 一部分 Python入門
第 1 章 為什么要用Python為Excel編程 3
1.1 Excel作為一門編程語(yǔ)言 4
1.1.1 新聞中的Excel 5
1.1.2 編程最佳實(shí)踐 5
1.1.3 現(xiàn)代Excel 10
1.2 用在Excel上的Python 11
1.2.1 可讀性和可維護(hù)性 11
1.2.2 標(biāo)準(zhǔn)庫(kù)和包管理器 12
1.2.3 科學(xué)計(jì)算 13
1.2.4 現(xiàn)代語(yǔ)言特性 14
1.2.5 跨平臺(tái)兼容性 15
1.3 小結(jié) 15
第 2 章 開(kāi)發(fā)環(huán)境 17
2.1 Anaconda Python發(fā)行版 18
2.1.1 安裝 18
2.1.2 Anaconda Prompt 19
2.1.3 Python REPL:交互式Python會(huì)話 21
2.1.4 包管理器:Conda和pip 22
2.1.5 Conda環(huán)境 24
2.2 Jupyter筆記本 24
2.2.1 運(yùn)行Jupyter筆記本 25
2.2.2 筆記本單元格 26
2.2.3 編輯模式與命令模式 28
2.2.4 執(zhí)行順序很重要 28
2.2.5 關(guān)閉Jupyter筆記本 28
2.3 VS Code 30
2.3.1 安裝和配置 31
2.3.2 執(zhí)行Python腳本 33
2.4 小結(jié) 36
第 3 章 Python入門 37
3.1 數(shù)據(jù)類型 37
3.1.1 對(duì)象 38
3.1.2 數(shù)值類型 39
3.1.3 布爾值 41
3.1.4 字符串 42
3.2 索引和切片 43
3.2.1 索引 43
3.2.2 切片 44
3.3 數(shù)據(jù)結(jié)構(gòu) 45
3.3.1 列表 45
3.3.2 字典 47
3.3.3 元組 49
3.3.4 集合 49
3.4 控制流 50
3.4.1 代碼塊和pass語(yǔ)句 50
3.4.2 if 語(yǔ)句和條件表達(dá)式 51
3.4.3 for 循環(huán)和while循環(huán) 52
3.4.4 列表、字典和集合推導(dǎo)式 55
3.5 組織代碼 56
3.5.1 函數(shù) 56
3.5.2 模塊和import語(yǔ)句 57
3.5.3 datetime類 59
3.6 PEP 8:Python風(fēng)格指南 61
3.6.1 PEP 8和VS Code 62
3.6.2 類型提示 63
3.7 小結(jié) 64
第二部分 pandas入門
第4 章 NumPy基礎(chǔ) 67
4.1 NumPy入門 67
4.1.1 NumPy數(shù)組 67
4.1.2 向量化和廣播 69
4.1.3 通用函數(shù) 70
4.2 創(chuàng)建和操作數(shù)組 71
4.2.1 存取元素 71
4.2.2 方便的數(shù)組構(gòu)造器 72
4.2.3 視圖和副本 73
4.3 小結(jié) 73
第 5 章 使用pandas進(jìn)行數(shù)據(jù)分析 74
5.1 DataFrame和Series 74
5.1.1 索引 76
5.1.2 列 79
5.2 數(shù)據(jù)操作 80
5.2.1 選取數(shù)據(jù) 80
5.2.2 設(shè)置數(shù)據(jù) 85
5.2.3 缺失數(shù)據(jù) 87
5.2.4 重復(fù)數(shù)據(jù) 89
5.2.5 算術(shù)運(yùn)算 90
5.2.6 處理文本列 91
5.2.7 應(yīng)用函數(shù) 92
5.2.8 視圖和副本 93
5.3 組合DataFrame 94
5.3.1 連接 94
5.3.2 連接和合并 95
5.4 描述性統(tǒng)計(jì)量和數(shù)據(jù)聚合 97
5.4.1 描述性統(tǒng)計(jì)量 97
5.4.2 分組 98
5.4.3 透視和熔化 99
5.5 繪圖 100
5.5.1 Matplotlib 100
5.5.2 Plotly 102
5.6 導(dǎo)入和導(dǎo)出DataFrame 104
5.6.1 導(dǎo)出CSV文件 105
5.6.2 導(dǎo)入CSV文件 106
5.7 小結(jié) 107
第6 章 使用pandas進(jìn)行時(shí)序分析 109
6.1 DatetimeIndex 110
6.1.1 創(chuàng)建DatetimeIndex 110
6.1.2 篩選DatetimeIndex 112
6.1.3 處理時(shí)區(qū) 113
6.2 常見(jiàn)時(shí)序操作 114
6.2.1 移動(dòng)和百分比變化率 114
6.2.2 基數(shù)的更改和相關(guān)性 116
6.2.3 重新采樣 118
6.2.4 滾動(dòng)窗口 119
6.3 pandas的局限性 120
6.4 小結(jié) 121
第三部分 在Excel之外讀寫Excel文件
第 7 章 使用pandas操作Excel文件 125
7.1 案例研究:Excel報(bào)表 125
7.2 使用pandas讀寫Excel文件 128
7.2.1 read_excel函數(shù)和ExcelFile類 128
7.2.2 to_excel方法和ExcelWriter類 133
7.3 使用pandas處理Excel文件的局限性 134
7.4 小結(jié) 135
第 8 章 使用讀寫包操作Excel文件 136
8.1 讀寫包 136
8.1.1 何時(shí)使用何種包 137
8.1.2 excel.py模塊 138
8.1.3 OpenPyXL 139
8.1.4 XlsxWriter 143
8.1.5 pyxlsb 145
8.1.6 xlrd、xlwt和xlutils 146
8.2 讀寫包的高級(jí)主題 149
8.2.1 處理大型Excel文件 149
8.2.2 調(diào)整DataFrame在Excel中的格式 152
8.2.3 案例研究(復(fù)習(xí)):Excel報(bào)表 157
8.3 小結(jié) 158
第四部分 使用xlwings對(duì)Excel應(yīng)用程序進(jìn)行編程
第 9 章 Excel自動(dòng)化 161
9.1 開(kāi)始使用xlwings 162
9.1.1 將Excel用作數(shù)據(jù)查看器 162
9.1.2 Excel對(duì)象模型 163
9.1.3 運(yùn)行VBA代碼 170
9.2 轉(zhuǎn)換器、選項(xiàng)和集合 170
9.2.1 處理DataFrame 171
9.2.2 轉(zhuǎn)換器和選項(xiàng) 172
9.2.3 圖表、圖片和已定義名稱 174
9.2.4 案例研究(再次回顧):Excel報(bào)表 177
9.3 高級(jí)xlwings主題 179
9.3.1 xlwings的基礎(chǔ) 179
9.3.2 提升性能 180
9.3.3 如何彌補(bǔ)缺失的功能 181
9.4 小結(jié) 182
第 10 章 Python驅(qū)動(dòng)的Excel工具 183
10.1 利用xlwings將Excel用作前端 183
10.1.1 Excel插件 184
10.1.2 quickstart命令 185
10.1.3 Run main 186
10.1.4 RunPython函數(shù)187
10.2 部署 191
10.2.1 Python依賴 191
10.2.2 獨(dú)立工作簿:脫離xlwings插件 191
10.2.3 配置的層次關(guān)系 192
10.2.4 設(shè)置 193
10.3 小結(jié) 194
第 11 章 Python包追蹤器 195
11.1 構(gòu)建什么樣的應(yīng)用程序 195
11.2 核心功能 197
11.2.1 Web API 198
11.2.2 數(shù)據(jù)庫(kù) 201
11.2.3 異常 208
11.3 應(yīng)用程序架構(gòu) 210
11.3.1 前端 211
11.3.2 后端 215
11.3.3 調(diào)試 217
11.4 小結(jié) 219
第 12 章 用戶定義函數(shù) 220
12.1 UDF入門 220
12.2 案例研究:Google Trends 225
12.2.1 Google Trends簡(jiǎn)介 225
12.2.2 使用DataFrame和動(dòng)態(tài)數(shù)組 226
12.2.3 從Google Trends上獲取數(shù)據(jù) 231
12.2.4 使用UDF繪制圖表 234
12.2.5 調(diào)試UDF 236
12.3 高級(jí)UDF主題 238
12.3.1 基礎(chǔ)性能優(yōu)化 238
12.3.2 緩存 240
12.3.3 sub裝飾器 242
12.4 小結(jié) 243
附錄A Conda環(huán)境 245
附錄B 高級(jí)VS Code功能 248
附錄C 高級(jí)Python概念 253