數(shù)據(jù)挖掘算法與Clementine實(shí)踐
定 價(jià):25 元
- 作者:熊平 著
- 出版時(shí)間:2011/4/1
- ISBN:9787302235019
- 出 版 社:清華大學(xué)出版社
- 中圖法分類:TP274
- 頁(yè)碼:237
- 紙張:膠版紙
- 版次:1
- 開本:16開
《數(shù)據(jù)挖掘算法與Clementine實(shí)踐》主要介紹了幾種最成熟的數(shù)據(jù)挖掘方法,并針對(duì)每種方法,介紹了應(yīng)用最廣泛的幾種實(shí)現(xiàn)算法。書中以Clementine12.0為平臺(tái),用實(shí)例介紹了每種算法的具體應(yīng)用。全書各章分別介紹了數(shù)據(jù)挖掘和Clementine軟件、決策樹分類方法(包括ID3、C4.5、C5.0、CART等算法)、聚類分析方法(包括K-Means算法和TwoStep算法)、關(guān)聯(lián)規(guī)則挖掘方法(包括Apriori算法、CARMA算法和序列模式挖掘算法)、數(shù)據(jù)篩選算法(包括特征選擇算法和異常檢測(cè)算法)、回歸分析方法(包括線性回歸算法和二項(xiàng)Logistic回歸)、神經(jīng)網(wǎng)絡(luò)構(gòu)建方法(包括多層感知器網(wǎng)絡(luò)、RBF網(wǎng)絡(luò)以及Kohonen網(wǎng)絡(luò)的構(gòu)建算法)、時(shí)間序列分析方法(包括指數(shù)平滑法和ARIMA模型構(gòu)建方法)。
21世紀(jì)是信息爆炸的時(shí)代。從紛雜無(wú)章的數(shù)據(jù)中發(fā)現(xiàn)潛在的知識(shí),進(jìn)而提供決策支持,是許多企業(yè)、部門增強(qiáng)自身競(jìng)爭(zhēng)力的有力手段。數(shù)據(jù)挖掘作為重要的知識(shí)發(fā)現(xiàn)技術(shù),經(jīng)過(guò)幾十年的發(fā)展,在理論上積累了豐碩的成果,許多高效的、智能的數(shù)據(jù)挖掘算法被提出并不斷得到改進(jìn)和完善。同時(shí),專用的或者通用的數(shù)據(jù)挖掘工具也不斷被推出和升級(jí)。因此,數(shù)據(jù)挖掘技術(shù)在電信、金融、信息安全等許多領(lǐng)域得到了廣泛的應(yīng)用。
本書在內(nèi)容安排上以理論聯(lián)系實(shí)際為指導(dǎo)原則。在理論上,著重介紹幾種最成熟的數(shù)據(jù)挖掘方法,針對(duì)每種方法,則介紹應(yīng)用最廣泛的幾種實(shí)現(xiàn)算法。在實(shí)踐上,以Clementine 12.0為平臺(tái),用實(shí)例介紹每種算法的具體應(yīng)用方法。
本書共分為9章。第1章和第2章分別對(duì)數(shù)據(jù)挖掘和Clementine軟件進(jìn)行簡(jiǎn)要的介紹。第3~9章中每章介紹一種數(shù)據(jù)挖掘方法。第3章介紹決策樹分類方法,以及構(gòu)建決策樹的C4.5算法和CART算法;第4章介紹聚類分析方法,以及實(shí)現(xiàn)聚類分析的K-Means算法和TwoStep算法;第5章介紹關(guān)聯(lián)規(guī)則挖掘方法,包括經(jīng)典的Apriori算法、CARMA算法以及序列模式挖掘算法;第6章介紹了兩種數(shù)據(jù)篩選算法,即特征選擇算法和異常檢測(cè)算法;第7章介紹了回歸分析方法,包括線性回歸方法和Logistic回歸方法;第8章介紹了神經(jīng)網(wǎng)絡(luò)建模方法,以及用于構(gòu)建神經(jīng)網(wǎng)絡(luò)的多層感知器方法、徑向基函數(shù)網(wǎng)絡(luò)構(gòu)建方法和用于聚類分析的Kohonen網(wǎng)絡(luò)構(gòu)建方法;第9章介紹時(shí)間序列分析方法,包括指數(shù)平滑法和ARIMA模型的構(gòu)建方法。
本書各章中的實(shí)驗(yàn)數(shù)據(jù)集可在http://jsjsyzx.znufe.edu.cn/downloads/dataset.rar下載。
本書得到中央高;究蒲袠I(yè)務(wù)費(fèi)專項(xiàng)資金資助。
由于作者自身水平有限,本書定有不妥及不足之處,懇請(qǐng)讀者及專家批評(píng)指正。
作 者
2008年5月
??
??
??
??
前言 III
第1章 數(shù)據(jù)挖掘概述
1.1 數(shù)據(jù)挖掘簡(jiǎn)介
1.2 數(shù)據(jù)挖掘過(guò)程
1.3 數(shù)據(jù)挖掘方法
1.4 數(shù)據(jù)挖掘工具及軟件
第2章 clementine概述
2.1 clementine簡(jiǎn)介
2.2 clementine基本操作
第3章 決策樹
3.1 分類與決策樹概述
3.2 id3、c4.5與c5.0
3.3 cart
第4章 聚類分析
4.1 聚類分析概述
4.2 k-means算法
4.3 twostep算法
第5章 關(guān)聯(lián)規(guī)則
5.1 關(guān)聯(lián)規(guī)則概述
5.2 apriori算法
5.3 carma算法
5.4 序列模式
第6章 數(shù)據(jù)篩選
6.1 特征選擇
6.2 異常檢測(cè)
第7章 統(tǒng)計(jì)模型
7.1 線性回歸
7.2 項(xiàng)logistic回歸
第8章 神經(jīng)網(wǎng)絡(luò)
8.1 神經(jīng)網(wǎng)絡(luò)原理
8.2 多層感知器與rbf網(wǎng)絡(luò)
8.3 kohonen網(wǎng)絡(luò)
第9章 時(shí)間序列分析與預(yù)測(cè)
9.1 時(shí)間序列概述
9.2 指數(shù)平滑法
9.3 arima模型
參考文獻(xiàn)