本書以Python為工具,全面講解概率論與數(shù)理統(tǒng)計的主要內容和多元統(tǒng)計分析常用技術。全書包括13章和4個附錄,內容翔實,講解深入淺出。概率論4章,講解概率論基礎知識,主要是隨機變量的相關理論;數(shù)理統(tǒng)計4章,主要是樣本理論、參數(shù)估計和假設檢驗;回歸分析2章,包括一元和多元回歸分析及其統(tǒng)計解釋;多元統(tǒng)計3章,主要講解主成分分析和因子分析理論。整書內容簡明,易上手,實用性強。本書不需要讀者有良好的數(shù)學基礎,4個附錄提供了Python基礎知識、微積分與線性代數(shù)的必要基礎,可滿足不同層次的讀者需求。本書的特色是將Python貫穿于內容之中,為讀者提供實踐練習,也便于讀者學習用Python解決實際問題的能力。
本書適用于大數(shù)據(jù)與人工智能專業(yè)的教師和學生,也適用于對數(shù)據(jù)科學感興趣的人士和企業(yè)界的工程師。
對于數(shù)據(jù)科學和人工智能的從業(yè)者和學生而言,概率論和數(shù)理統(tǒng)計是一門非常重要的基礎課,因為現(xiàn)代人工智能和大數(shù)據(jù)理論是建立在概率統(tǒng)計之上的模型系統(tǒng),它利用概率統(tǒng)計的語言完成人機交互和復雜系統(tǒng)的運行。筆者希望讀者通過本書的學習,能打好概率統(tǒng)計基礎,進而對后續(xù)人工智能、大數(shù)據(jù)挖掘等專業(yè)課起到良好的推動作用。
在廣義的計算機科學的學習過程中,很多初學者遭遇的挫折大多來自抽象的數(shù)學推導。傳統(tǒng)的概率論教學以板書的形式展開,強調理論的完整且細致的證明,這種帶有濃重的數(shù)學風格的教學模式給很多學生造成了一定程度的困擾,特別是理工科學生,他們不學習數(shù)學專業(yè),對數(shù)學的興趣也不算高,他們更喜歡實現(xiàn)具體的模型和算法。筆者認為,要理解一個算法的內在邏輯,沒有數(shù)學知識是不行的,但也不能一味地追求數(shù)學形式的完整,一般來講,學生具備必要的能讀懂文獻的數(shù)學基礎就可以工作了,不需要把書寫得那么數(shù)學化。
本書內容
本書旨在幫助讀者解決技術書籍過于數(shù)學化,一方面本書遵循概率論和數(shù)理統(tǒng)計的教學大綱,在數(shù)學方面不過于強調,沒有過多展開; 另一方面,利用Python工具,實現(xiàn)了大部分的理論和模型,使讀者通過實踐簡化學習過程,提高代碼編寫能力,增強動手能力,為進一步學習人工智能和大數(shù)據(jù)科學奠定良好的基礎。
本書特色
本書在附錄中提供了Python基礎、微積分基礎、線性代數(shù)基礎和NumPy基礎,零基礎的讀者也能入門。采用計算機程序模擬數(shù)學推導的方法使數(shù)學知識更為清晰易懂,對初學者更加友好。
本書適合大數(shù)據(jù)與人工智能相關專業(yè)師生和企業(yè)一線開發(fā)人員參考,也適合對數(shù)據(jù)科學有興趣的研究人員學習。
李爽
2023年1月
本書源代碼
教學課件(PPT)
第1章概率論的基本概念
1.1隨機試驗、樣本空間、事件
1.1.1隨機試驗
1.1.2樣本空間
1.1.3事件
1.2事件的關系與運算
1.2.1事件的關系與運算
1.2.2事件的運算律
1.3頻率與概率
1.3.1頻率
1.3.2概率
1.4等可能概型
1.4.1古典概型
1.4.2幾何概型
1.5條件概率與獨立性
1.5.1條件概率
1.5.2獨立性
1.6全概率公式與貝葉斯公式
1.6.1樣本空間的劃分
1.6.2全概率公式
1.6.3貝葉斯公式
1.7本章練習
1.8常見考題解析: 隨機事件和概率
1.9本章常用的Python函數(shù)總結
1.10本章上機練習
第2章隨機變量及其分布
2.1隨機變量
2.2離散型隨機變量及其分布律
2.2.1離散型隨機變量
2.2.2離散型隨機變量: 伯努利分布
2.2.3離散型隨機變量: 幾何分布
2.2.4離散型隨機變量: 超幾何分布
2.2.5離散型隨機變量: 二項分布
2.2.6離散型隨機變量: 泊松分布
2.3分布函數(shù)
2.4連續(xù)型隨機變量及其概率密度
2.4.1連續(xù)型隨機變量
2.4.2連續(xù)型隨機變量: 均勻分布
2.4.3連續(xù)型隨機變量: 指數(shù)分布
2.4.4連續(xù)型隨機變量: 正態(tài)分布
2.5隨機變量的函數(shù)分布
2.5.1離散型隨機變量的函數(shù)
2.5.2連續(xù)型隨機變量的函數(shù)
2.6本章練習
2.7常見考題解析: 隨機變量及其分布
2.8本章常用的Python函數(shù)總結
2.9本章上機練習
第3章多維隨機變量及其分布
3.1二維隨機變量及其分布函數(shù)
3.1.1二維隨機變量的分布函數(shù)
3.1.2二維離散型隨機變量
3.1.3二維連續(xù)型隨機變量
3.2邊緣分布
3.3條件分布
3.4相互獨立的隨機變量
3.5二維正態(tài)分布隨機變量
3.6隨機變量函數(shù)的分布
3.6.1隨機變量和的分布
3.6.2隨機變量商的分布
3.6.3隨機變量積的分布
3.6.4兩個隨機變量值與小值的分布
3.7本章練習
3.8常見考題解析: 多維隨機變量及其分布
3.9本章常用的Python函數(shù)總結
3.10本章上機練習
第4章隨機變量的數(shù)字特征
4.1數(shù)學期望
4.1.1離散型隨機變量的數(shù)學期望
4.1.2連續(xù)型隨機變量的數(shù)學期望
4.1.3隨機變量函數(shù)的數(shù)學期望
4.1.4數(shù)學期望的重要性質
4.2方差和標準差
4.2.1方差
4.2.2方差的性質
4.2.3正態(tài)分布的均值和方差
4.3協(xié)方差和相關系數(shù)
4.3.1協(xié)方差的性質
4.3.2相關系數(shù)的性質
4.3.3相關性與獨立性
4.4協(xié)方差矩陣
4.4.1協(xié)方差矩陣的性質
4.4.2多維正態(tài)分布的聯(lián)合密度
4.5本章練習
4.6常見考題解析: 隨機變量的數(shù)字特征
4.7本章常用的Python函數(shù)總結
4.8本章上機練習
第5章大數(shù)定律與中心極限定理
5.1大數(shù)定律
5.1.1切比雪夫不等式
5.1.2依概率收斂
5.1.3切比雪夫大數(shù)定律
5.1.4辛欽大數(shù)定律
5.1.5伯努利大數(shù)定律
5.2中心極限定理
5.3本章習題
5.4常見考題解析: 大數(shù)定律與中心極限定理
5.5本章常用的Python函數(shù)總結
5.6本章上機練習
第6章樣本、統(tǒng)計量及抽樣分布
6.1總體與樣本
6.1.1總體
6.1.2樣本
6.1.3樣本分布
6.2統(tǒng)計量與抽樣分布
6.2.1統(tǒng)計量
6.2.2經驗分布函數(shù)
6.3三大抽樣分布
6.3.1卡方分布(2分布)
6.3.2學生分布(t分布)
6.3.3F分布
6.4正態(tài)總體的抽樣分布
6.5簡單統(tǒng)計作圖
6.5.1頻率直方圖
6.5.2箱線圖
6.6本章練習
6.7常見考題解析: 樣本、統(tǒng)計量及抽樣分布
6.8本章常用的Python函數(shù)總結
6.9本章上機練習
第7章參數(shù)估計
7.1點估計
7.1.1矩估計法
7.1.2似然估計法
7.2估計量的評選標準
7.2.1無偏性
7.2.2有效性
7.2.3相合性
7.3區(qū)間估計
7.4正態(tài)總體均值與方差的區(qū)間估計
7.4.1單個正態(tài)總體
7.4.2兩個正態(tài)總體
7.5單側區(qū)間估計
7.6本章練習
7.7常見考題解析: 參數(shù)估計
7.8本章常用的Python函數(shù)總結
7.9本章上機練習
第8章假設檢驗
8.1假設檢驗的原理
8.2正態(tài)總體均值的假設檢驗
8.2.1單個正態(tài)總體均值的假設檢驗
8.2.2兩個正態(tài)總體均值的假設檢驗
8.3正態(tài)總體方差的假設檢驗
8.3.1單個正態(tài)總體方差的假設檢驗
8.3.2兩個正態(tài)總體方差的假設檢驗
8.4置信區(qū)間與假設檢驗之間的關系
8.5分布擬合檢驗
8.5.1單個分布的卡方擬合檢驗
8.5.2分布族的卡方擬合檢驗
8.6本章練習
8.7常見考題解析: 假設檢驗
8.8本章常用的Python函數(shù)總結
8.9本章上機練習
第9章一元線性回歸
9.1回歸分析概述
9.2一元線性回歸
9.2.1一元線性回歸的數(shù)學形式
9.2.2參數(shù)的普通小二乘估計
9.2.3參數(shù)的似然估計
9.2.4小二乘估計的性質
9.2.5回歸方程的顯著性檢驗
9.2.6決定系數(shù)
9.2.7殘差分析
9.2.8回歸系數(shù)的區(qū)間估計
9.2.9單值預測和區(qū)間預測
9.3本章練習
9.4常見考題解析: 一元線性回歸
9.5本章常用的Python函數(shù)總結
9.6本章上機練習
第10章多元線性回歸
10.1多元線性回歸模型的數(shù)學形式
10.2多元線性回歸模型的基本假定
10.3多元線性回歸模型的解釋
10.4回歸參數(shù)的估計
10.4.1回歸參數(shù)的普通小二乘估計
10.4.2回歸參數(shù)的似然估計
10.4.3參數(shù)估計的性質
10.4.4回歸方程的顯著性檢驗
10.4.5回歸系數(shù)的置信區(qū)間與擬合優(yōu)度檢驗
10.5本章練習
10.6常見考題解析: 多元線性回歸
10.7本章常用的Python函數(shù)總結
10.8本章上機練習
第11章多重共線性與嶺回歸
11.1多重共線性產生的原因及其影響
11.2多重共線性的診斷
11.2.1方差擴大因子法
11.2.2特征根判定法
11.3消除多重共線性的方法
11.3.1剔除不重要的解釋變量
11.3.2增大樣本量
11.3.3回歸系數(shù)的有偏估計與嶺回歸
11.3.4嶺回歸估計的性質
11.3.5嶺回歸k的選擇
11.4本章練習
第12章主成分分析
12.1總體主成分
12.1.1主成分的求法
12.1.2主成分的性質
12.1.3標準化變量的主成分
12.2樣本主成分
12.2.1樣本主成分的性質
12.2.2主成分的個數(shù)
12.3主成分分析的應用
12.4本章練習
12.5本章常用的Python函數(shù)總結
12.6本章上機練習
第13章因子分析
13.1因子模型
13.1.1因子載荷的統(tǒng)計意義
13.1.2變量共同度的統(tǒng)計意義
13.1.3公共因子的方差貢獻
13.2參數(shù)估計
13.2.1主成分法
13.2.2主因子解
13.2.3似然法
13.2.4主成分估計法的步驟
13.3本章練習
13.4本章常用的Python函數(shù)總結
13.5本章上機練習
附錄APython基礎
A.1Python開發(fā)環(huán)境
A.2Python基礎語法
A.2.1Python常用內置數(shù)據(jù)類型
A.2.2變量的賦值
A.2.3數(shù)字類型Numbers
A.2.4字符串類型String
A.3Python標準數(shù)據(jù)類型
A.3.1Python標準數(shù)據(jù)類型: 列表
A.3.2Python標準數(shù)據(jù)類型: 元組
A.3.3Python標準數(shù)據(jù)類型: 字典
A.3.4Python標準數(shù)據(jù)類型: 集合
A.4Python中的條件語句和循環(huán)語句
A.4.1Python條件語句
A.4.2Python循環(huán)語句
附錄B微積分基礎
B.1映射、函數(shù)與極限
B.1.1集合
B.1.2映射與函數(shù)
B.1.3極限與連續(xù)
B.2導數(shù)與微分
B.2.1一階導數(shù)
B.2.2高階導數(shù)
B.2.3泰勒公式
B.2.4函數(shù)的值與小值
B.2.5函數(shù)圖形的繪制
B.3不定積分
B.4定積分
B.5常微分方程
B.6多元函數(shù)的偏導數(shù)
B.7多元函數(shù)的極值
B.8重積分
附錄C線性代數(shù)基礎
C.1向量與矩陣
C.1.1數(shù)域
C.1.2向量的代數(shù)意義
C.1.3向量的代數(shù)運算
C.1.4向量的幾何意義
C.1.5矩陣
C.1.6常見特殊矩陣
C.1.7矩陣的運算
C.2線性方程組
C.2.1高斯消元法
C.2.2線性方程組的矩陣
C.2.3齊次線性方程組的解
C.3行列式
C.3.1二階與三階行列式
C.3.2排列與逆序數(shù)
C.3.3n階行列式
C.3.4行列式的性質
C.3.5行列式的展開
C.3.6克萊姆法則
C.4矩陣的逆
C.5矩陣的對角化
C.5.1矩陣的相似
C.5.2特征值與特征向量
C.5.3矩陣的對角化
C.5.4正交矩陣
C.5.5實對稱矩陣的對角化
附錄DNumPy基礎
D.1創(chuàng)建NumPy數(shù)組
D.1.1使用NumPy內部功能函數(shù)
D.1.2從Python列表轉換
D.1.3使用特殊的庫函數(shù)
D.2NumPy中的矩陣和向量
D.3數(shù)組屬性和操作
D.4數(shù)組的索引
D.4.1花式索引
D.4.2布爾索引
D.4.3缺省索引
D.4.4where()函數(shù)
D.5通用函數(shù)
D.5.1數(shù)學運算
D.5.2三角函數(shù)
D.5.3位運算函數(shù)
D.5.4比較函數(shù)
D.6矩陣計算
D.6.1矩陣和向量積
D.6.2矩陣的分解
D.6.3矩陣的特征值
D.6.4矩陣的逆和解方程
參考文獻