這是一本零基礎學習Python并進行數據處理和分析的學習指導用書。本書共9章,主要內容包括:Python語法基礎、Python數據結構、函數和類、正則表達式與格式化輸出、Numpy和Pandas、數據處理與分析、網絡爬蟲、數據可視化、應用案例分析。
本書內容豐富、簡單易懂,零基礎入門,適合本科生、研究生及對 Python 語言感興趣和擬使用 Python語言進行數據分析的讀者。
1.內容由淺入深,重點圖書。
2.配備視頻,邊學邊做
本書內容豐富,講解通俗易懂,非常適合本科生、研究生,以及對Python語言感興趣或者想要使用Python語言進行數據分析的廣大讀者。
余本國,博士,碩士研究生導師。于中北大學理學系任教,主講線性代數、微積分、Python語言、大數據分析基礎等課程。2012年到加拿大York University做訪問學者。出版有《Python數據分析基礎》等著作。
第 1章 Python語法基礎 1
1.1 Python概述 1
1.2 Anaconda 2
1.2.1安裝Anaconda 2
1.2.2 spyder 5
1.2.3 Jupyter Notebook 5
1.3 語法規(guī)范 8
1.4 程序結構 14
1.4.1 順序結構 14
1.4.2 判斷結構 17
1.4.3 循環(huán)結構 18
1.5 異常值處理 19
1.6 實戰(zhàn)體驗:一行代碼能干啥 22
第 2章 Python數據結構 25
2.1字符串 25
2.2列表 30
2.3元組 33
2.4字典 34
2.5集合 35
2.6實戰(zhàn)體驗:提取特定的字符 40
第3章 函數和類 41
3.1函數 41
3.1.1函數結構 41
3.1.2 參數結構 43
3.1.3 函數的遞歸與嵌套 46
3.2特殊函數 47
3.2.1匿名函數lambda 47
3.2.2 關鍵字yield函數 48
3.2.3 map()、filter()、reduce() 50
3.2.4 eval()函數 51
3.3類 52
3.4函數和類的調用 54
3.4.1 調用函數 55
3.4.2調用類 55
3.5實戰(zhàn)體驗:編寫階乘函數 56
第4章 正則表達式與格式化輸出 58
4.1正則表達式基礎 58
4.2 re模塊 60
4.2.1判斷匹配 61
4.2.2 切分字符串 61
4.2.3 分組 62
4.3貪婪匹配 63
4.4編譯 63
4.5正則函數 63
4.5.1 re.compile() 函數 64
4.5.2 re.match() 函數 64
4.5.3 re.search()函數 66
4.5.4 re.findall()函數 68
4.5.5 字符串的替換和修改 68
4.6格式化輸出 69
4.6.1 使用%符號進行格式 69
4.6.2 使用format()方法進行格式化 70
4.6.3 f方法格式化 72
4.7實戰(zhàn)體驗:驗證信息的正則表達式 73
第5章 Numpy和Pandas 76
5.1 Numpy庫 76
5.1.1 數組的創(chuàng)建 77
5.1.2數組的操作 83
5.1.3 數組的計算 94
5.1.4 統(tǒng)計基礎 95
5.1.5 矩陣運算 98
5.2 Pandas庫 100
5.2.1 數據類型 101
5.2.2 數據結構 101
5.2.3 數據導入 113
5.2.4 數據導出 116
5.3 實戰(zhàn)體驗:輸出符合條件的屬性內容 119
第6章 數據處理與分析 122
6.1 數據清洗與操作 122
6.1.1 異常值處理 122
6.1.2 數據抽取 128
6.1.3 插入記錄 141
6.1.4 修改記錄 143
6.1.5 交換行或列 145
6.1.6 索引排名 147
6.1.7 數據合并與分組 152
6.1.8 數據運算 158
6.1.9 日期處理 159
6.2 數據標準化 162
6.2.1 min-max標準化 163
6.2.2 Z-score標準化方法 163
6.3 數據分析 165
6.3.1 基本統(tǒng)計 165
6.3.2 分組分析 167
6.3.3 分布分析 169
6.3.4 交叉分析 171
6.3.5 結構分析 172
6.3.6 相關分析 173
6.4 實戰(zhàn)體驗:股票統(tǒng)計分析 174
第7章 網絡爬蟲 181
7.1 urllib庫 181
7.2 beautifulsoap 庫 183
7.3 實戰(zhàn)體驗:爬取豆瓣網數據 187
第8章 數據可視化 193
8.1 使用Matplotlib可視化數據 193
8.1.1Matplotlib的設置 193
8.1.2 Matplotlib繪圖示例 195
8.2 使用Echarts可視化數據 206
8.2.1 安裝及配置 206
8.2.2 基本圖表 210
8.2.3 坐標系圖表 218
8.2.4 地圖與地理坐標繪制 224
8.2.5 3D圖形 229
8.3 有向圖與無向圖 231
8.3.1模塊安裝 231
8.3.2 無向圖 231
8.3.3 有向圖 233
8.4 實戰(zhàn)體驗:標注貨物流向圖 234
第9章 應用案例分析 236
9.1案例1 微信好友數據分析 236
9.1.1需求介紹 236
9.1.2依賴庫介紹 236
9.1.3運行環(huán)境 238
9.1.4數據的獲取與處理 238
9.1.5數據的可視化 242
9.1.6下載圖像并合成圖像 245
9.1.7功能模塊代碼 247
9.2案例2 飛機航班數據分析 251
9.2.1需求介紹 251
9.2.2預備知識 252
9.2.3航班數據處理 255
9.2.4完整代碼 261
9.3案例三 豆瓣網絡數據分析 264
9.3.1數據處理 264
9.3.2 計算平均星級 265
9.3.3 計算均價 268
9.3.4完整代碼 273
附錄 277
A.常用函數與坑點 277
B.數據操作與分析函數速查 289
C 操作mySQL庫 292
C.1對MySQL的連接與訪問 292
C.2 對MySQL的增刪改查 293
C.3創(chuàng)建數據庫表 295
參考文獻 297