Python數(shù)據(jù)分析入門與實戰(zhàn)
定 價:69.9 元
叢書名:數(shù)字化人才職場賦能系列叢書
- 作者:開課吧組編 楊國俊 張植皓 潘海超 等編著
- 出版時間:2020/8/1
- ISBN:9787111660422
- 出 版 社:機械工業(yè)出版社
- 中圖法分類:TP311.561
- 頁碼:260
- 紙張:
- 版次:
- 開本:16開
本書系統(tǒng)地描述了如何利用Python語言進行數(shù)據(jù)分析。由淺入深的編寫方式可以幫助讀者輕松愉快地進入數(shù)據(jù)的世界。
全書從理論到實踐、從基礎語法到科學計算庫,循序漸進地講解了Python數(shù)據(jù)分析所需要學習的技能。搭配項目實戰(zhàn)幫助讀者更好、更快地掌握Python數(shù)據(jù)分析知識點。此外,還全面介紹了數(shù)據(jù)分析的必知必會技能。
本書提供代碼資源下載服務,每章均配有重要知識點串講視頻。
本書不僅適合零基礎喜歡數(shù)據(jù)分析的入門級讀者,還可助力數(shù)據(jù)分析從業(yè)者進行技術(shù)進階。
致數(shù)字化人才的一封信
前言
●第1章認識數(shù)據(jù)分析
1.1重新認識數(shù)據(jù)分析
1.1.1數(shù)據(jù)的定義
1.1.2分析數(shù)據(jù)的重要性
1.2數(shù)據(jù)的類別與變化
1.3數(shù)據(jù)處理
1.3.1數(shù)據(jù)處理的含義
1.3.2臟數(shù)據(jù)
1.3.3數(shù)據(jù)清洗
1.4數(shù)據(jù)分析
1.4.1數(shù)據(jù)分析的流程與方法
1.4.2Python數(shù)據(jù)分析常用庫
1.4.3數(shù)據(jù)分析的結(jié)論
●第2章環(huán)境安裝
2.1Python簡介
2.2Python的常用IDE
2.3Anaconda
2.3.1Anaconda安裝包的獲取
2.3.2Anaconda在不同系統(tǒng)中的安裝
2.4Jupyter Notebook 功能介紹
2.4.1Jupyter Notebook啟動方法
2.4.2常用快捷鍵
2.4.3常用功能
2.5安裝第三方庫
2.5.1pip網(wǎng)絡安裝
2.5.2pip本地安裝
●第3章Python基礎知識
3.1輸出和輸入
3.1.1輸出
3.1.2輸入
3.1.3格式化輸出
3.2變量
3.2.1變量的定義
3.2.2命名規(guī)則
3.2.3變量類型
3.3注釋
3.4運算符
3.4.1算術(shù)運算符
3.4.2賦值運算符
3.4.3比較運算符
3.4.4邏輯運算符
3.5結(jié)構(gòu)語句
3.5.1順序結(jié)構(gòu)語句
3.5.2選擇結(jié)構(gòu)語句
3.5.3循環(huán)結(jié)構(gòu)語句
3.5.4結(jié)構(gòu)語句中的特殊語句
3.6數(shù)據(jù)類型
3.6.1數(shù)值和字符串
3.6.2列表
3.6.3元組
3.6.4字典
3.7函數(shù)
3.7.1函數(shù)的定義
3.7.2函數(shù)的參數(shù)
3.7.3函數(shù)的返回值
3.7.4全局變量與局部變量
3.8模塊與文件
3.8.1三種模塊
3.8.2管理模塊的包
3.8.3文件的基礎操作
3.9異常報錯機制
3.10Python項目
3.10.1項目練習1
3.10.2項目練習2
●第4章數(shù)據(jù)靈魂基礎之NumPy
4.1NumPy 安裝
4.2數(shù)組的創(chuàng)建
4.3數(shù)組
4.4數(shù)據(jù)類型
4.5索引與切片
4.6通用函數(shù)
4.6.1統(tǒng)計函數(shù)
4.6.2隨機函數(shù)
4.6.3連接函數(shù)
4.6.4其他函數(shù)
●第5章數(shù)據(jù)規(guī)整之Pandas入門
5.1Pandas中的數(shù)據(jù)對象
5.1.1Series對象
5.1.2DataFrame對象
5.2數(shù)據(jù)索引與選取
5.2.1[]操作
5.2.2.loc[]與.iloc[]
5.2.3.at[]與.iat[]
5.3Pandas的常用方法
5.3.1Pandas的基本方法
5.3.2Pandas數(shù)值運算方法
5.3.3Pandas處理文本字符串
5.3.4Pandas的合并與連接
5.3.5Pandas操作應用方法
●第6章數(shù)據(jù)加載
6.1txt文件的讀寫操作
6.1.1讀取txt文件內(nèi)容
6.1.2with與readlines()
6.1.3寫入txt文件內(nèi)容
6.2CSV文件的讀寫操作
6.2.1讀取CSV文件內(nèi)容
6.2.2寫入CSV文件內(nèi)容
6.3Excel文件的讀寫操作
6.3.1讀取Excel文件內(nèi)容
6.3.2寫入Excel文件內(nèi)容
6.4JSON文件的讀寫操作
6.4.1讀取JSON文件內(nèi)容
6.4.2寫入JSON文件內(nèi)容
6.5SQL文件的讀取
6.5.1PyMySQL讀取MySQL數(shù)據(jù)庫內(nèi)容
6.5.2Pandas讀取MySQL數(shù)據(jù)庫內(nèi)容
●第7章數(shù)據(jù)預處理
7.1數(shù)據(jù)預處理是什么
7.1.1重復數(shù)據(jù)的處理
7.1.2缺失值的處理
7.1.3異常值的處理
7.2數(shù)據(jù)變換
7.2.1轉(zhuǎn)換數(shù)據(jù)類型
7.2.2數(shù)據(jù)標準化(Z-score標準化)
7.2.3數(shù)據(jù)歸一化(Min-Max標準化)
7.3高級數(shù)據(jù)預處理方法
7.3.1啞變量
7.3.2獨熱編碼
7.4數(shù)據(jù)預處理實戰(zhàn)
7.4.1數(shù)據(jù)觀察
7.4.2數(shù)據(jù)預處理實戰(zhàn)
7.4.3數(shù)據(jù)標準化
●第8章Pandas數(shù)據(jù)優(yōu)化
8.1多層索引
8.1.1多層索引的創(chuàng)建
8.1.2多層索引操作
8.1.3Series多層索引
8.1.4DataFrame多層索引
8.2groupby應用機制
8.2.1分組對象
8.2.2通過by參數(shù)進行分組
8.2.3通過level參數(shù)進行分組
8.2.4分組聚合
8.2.5agg聚合
8.2.6apply()函數(shù)
8.3時間序列
8.3.1創(chuàng)建時間索引
8.3.2通過日期時間索引獲取元素
8.3.3重采樣
8.4滑動窗口
●第9章數(shù)據(jù)可視化
9.1Pandas圖形繪制
9.2Matplotlib圖形繪制
9.2.1Figure繪圖參數(shù)詳解
9.2.2Matplotlib常用圖形繪制
9.3Seaborn圖形繪制
9.3.1設置Seaborn繪圖風格
9.3.2Seaborn常用圖形繪制
●第10章電商銷售數(shù)據(jù)分析
10.1數(shù)據(jù)準備
10.2數(shù)據(jù)清洗
10.2.1查看是否含有缺失值
10.2.2查看是否含有異常值
10.2.3數(shù)據(jù)整理
10.3具體目標分析
10.4案例結(jié)論