關于我們
書單推薦
新書推薦

數據清洗

數據清洗

定  價:58 元

叢書名:大數據應用人才培養(yǎng)系列教材

        

  • 作者:劉鵬 張燕 李法平 陳瀟瀟
  • 出版時間:2018/6/1
  • ISBN:9787302493273
  • 出 版 社:清華大學出版社
  • 中圖法分類:TP274 
  • 頁碼:252
  • 紙張:
  • 版次:1
  • 開本:
9
7
4
8
9
7
3
3
2
0
7
2
3
數據清洗是大數據領域不可缺少的環(huán)節(jié),用來發(fā)現并糾正數據中可能存在的錯誤,針對數據審查過程中發(fā)現的錯誤值、缺失值、異常值、可疑數據,選用適當方法進行“清理”,使“臟”數據變?yōu)椤案蓛簟睌祿?br>本書共分為8章:第1章主要介紹數據清洗的概念、任務和流程,數據標準化概念及數據倉庫技術等;第2章主要介紹Windows和類UNIX操作系統下的數據常規(guī)格式、數據編碼及數據類型轉換等;第3章介紹ETL概念、數據清洗的技術路線、ETL工具及ETL子系統等;第4章介紹Excel、Kettle、OpenRefine、DataWrangler和Hawk的安裝及使用等;第5章介紹Kettle下文本文件抽取、Web數據抽取、數據庫數據抽取及增量數據抽取等;第6章介紹數據清洗步驟、數據檢驗、數據錯誤處理、數據質量評估及數據加載;第7章介紹網頁結構,利用網絡爬蟲技術進行數據采集,利用JavaScript技術進行行為日志數據采集等;第8章介紹RDBMS的數據清洗方法和數據脫敏處理技術等。
本書系統地講解了數據清洗理論和實際應用,適用于高職高專院校和應用型本科的大數據課程教學,也適用于希望了解數據清洗的廣大讀者。
 你還可能感興趣
 我要評論
您的姓名   驗證碼: 圖片看不清?點擊重新得到驗證碼
留言內容