第1章常用數(shù)據(jù)挖掘方法介紹
1.1分類問題研究基本框架
1.2數(shù)據(jù)預(yù)處理
1.3數(shù)據(jù)表示
1.4特征選擇與特征抽取
1.5常用數(shù)據(jù)挖掘算法”
1.6常用深度學(xué)
1.7本章小結(jié)’
參考文獻(xiàn)。
第2章基于I)BN的高維稀疏文本數(shù)據(jù)分類研究’
2.1 引言
2.2國內(nèi)外研究現(xiàn)狀
2.3研究方法。
2.4實驗結(jié)果’
2.5本章小結(jié)’
參考文獻(xiàn)
第3章基于I)BN的代謝組學(xué)數(shù)據(jù)分類研究
3.1 引言
3.2研究方法
3.3生物樣本數(shù)據(jù)的制備
3.4實驗結(jié)果
3.5本章小結(jié)
參考文獻(xiàn)
第4章 基于SAE和SVM的代謝組學(xué)數(shù)據(jù)分類研究
4.1 引言
4.2研究方法
4.3實驗結(jié)果
4.4本章小結(jié)
參考文獻(xiàn)一
第5章基于棧式降噪自動編碼器的中文文本分類
5.1降噪自動編碼器
5.2棧式降噪自動編碼器
5.3激活函數(shù)
5.4實驗
5.5本章小結(jié)
參考文獻(xiàn)
第6章基于遺傳算法的移動機器人路徑規(guī)劃
6.1環(huán)境信息的表示
6.2初始設(shè)置
6.3適應(yīng)度函數(shù)的確定
6.4遺傳算子的設(shè)計...
65基于遺傳算法的動態(tài)路徑規(guī)劃設(shè)計
6.6路徑規(guī)劃的仿真結(jié)果及分析
6.7本章小結(jié)
參考文獻(xiàn)
第pan style="font-family: 宋體">章常用數(shù)據(jù)挖掘方法介紹
分類已經(jīng)應(yīng)用于我們生活的諸多方面且是數(shù)據(jù)挖掘中最常見的方法之一。我們主要研究了基于深度學(xué)本和代謝組學(xué)等數(shù)據(jù)的特征提取和分類問題。
pan style="font-family:宋體">.1 分類問題研究基本框架
對于分類問題來說,建立分類模括學(xué)試兩個過程n’。此類問題的學(xué)可以采用有監(jiān)督或無監(jiān)督的方法,目標(biāo)是將新數(shù)據(jù)劃分至一個或者多個的類別中,因為每個數(shù)據(jù)有可能屬于不同的類別口’。通常情況下,分類模型的構(gòu)建主括以下幾個方面:
(pan style="font-family:宋體">數(shù)據(jù)預(yù)處理
一 許多數(shù)據(jù)是半結(jié)構(gòu)化或非結(jié)構(gòu)化的、多維度的,通過預(yù)法可以讓數(shù)據(jù)具有統(tǒng)一和方便計算機識別的組織形式,行統(tǒng)一格式化的處理,便于后續(xù)的研究。
(2)數(shù)據(jù)表示
對于分類模型來說,預(yù)處理后的數(shù)據(jù)通常不能夠直接作為模型的輸入,也就是說原始數(shù)據(jù)不能夠被直行處理,需要將其轉(zhuǎn)換為適用于分類模型的數(shù)據(jù)而才能夠完成模型的建立及測試口]。
(3)數(shù)據(jù)的特征提取
待分類的數(shù)據(jù)中含了許多噪聲或無關(guān)的變量。通過特征提取方法能夠去掉這些噪聲,獲得代表樣本數(shù)據(jù)特征的低維數(shù)據(jù),從而能夠更加有效地完成分類。
(4)建立分類器
特征提取后的低維數(shù)據(jù)將輸入至分類器,可以采用不同的分類算法判別數(shù)據(jù)所屬類別。
(5)模型評價
模型評價的作用主要是對分類性能的優(yōu)劣給出一個定量的評估,評價可以采用不同的方法,選擇合適的方法能夠給予模型更加客觀、準(zhǔn)確的評……