語義萬維網所面臨的一個重大問題,就是如何處理海量語義數據,它一直被認為是制約語義技術發(fā)展的瓶頸。本書系統地介紹了海量語義數據處理的最新技術和進展,通過介紹LarKC項目所開發(fā)的海量語義處理平臺及其應用,來闡述海量語義數據處理技術的基本原理、實現方法和應用開發(fā)等一系列關鍵問題!逗A空Z義數據處理——平臺技術與應用》由黃智生、鐘寧著,全書共13章,分為上、下篇。上篇為技術篇,內容包括海量語義數據處理基本原理、海量語義數據處理平臺體系結構、識別與選擇技術、抽象與學習技術、推理與決策技術及LarKC平臺應用開發(fā)技術等。下篇為應用篇,內容涉及LarKC平臺開發(fā)的一系列應用系統,包括關聯生命數據集、基于語義技術的醫(yī)學文獻檢索、語義技術在生命科學中的應用、語義技術與城市計算以及語義技術在智能交通中的應用等。《海量語義數據處理--平臺技術與應用》不僅是一本介紹海量語義數據處理LarKC平臺及其技術與應用的參考書,同時對語義數據處理技術問題的研究人員、語義數據處理平臺實現的技術人員以及語義技術的應用開發(fā)人員均具有一定的參考價值。
語義網所面臨的一個重大問題就是如何處理海量語義數據,它一直被認為是制約語義技術發(fā)展的瓶頸問題。在這樣一個技術背景下,歐盟第七研究框架開展了語義網LarKC重大項目的研究。其研究目標在于開發(fā)海量語義數據處理平臺,并通過一系列應用開發(fā)為海量語義數據處理的技術研究提供科學實驗證據。經過三年多的努力,LarKC項目在海量語義數據技術方面取得了一系列重大進展!逗A空Z義數據處理——平臺技術與應用》由黃智生、鐘寧著,系統地介紹了海量語義數據處理的最新技術和進展,特別是通過介紹LarKC項目所開發(fā)的海量語義處理平臺及其應用,來闡述海量語義數據處理技術的基本原理、實現方法和應用開發(fā)等一系列關鍵問題。
北京市特聘專家(海聚工程特聘教授),北京工業(yè)大學國際WlC研究院學術帶頭人。日本東京大學博士,日本前橋工業(yè)大學研究生院及生命信息系教授,國際學術組織WebIntelligence Coortium(WlC)主席,國際學術期刊Web Intelligence andAgentSystems主編,IEEE計算智能學會腦信息學任務組主席。 黃智生(Zhisheng Huang)荷蘭阿姆斯特丹自由大學計算機系高級研究員,北京工業(yè)大學國際WIC研究院等多個大學兼職教授。主持歐盟第七研究框架重大語義技術研究項目LarKC中的推理工作組的研究。在國際期刊和會議上發(fā)表、交流學術論文百余篇。擔任近七十個國際學術會議組織委員會或程序委員會的委員或聯合主席。
第1章 導論 1.1 語義技術概述 1.2 海量語義數據處理 1.3 LarKC概述 1.3.1.LarKC項目 1.3.2 LarKC技術概述 1.3.3 LarKC海量語義數據處理平 第1章 導論 1.1 語義技術概述 1.2 海量語義數據處理 1.3 LarKC概述 1.3.1.LarKC項目 1.3.2 LarKC技術概述 1.3.3 LarKC海量語義數據處理平臺概述 1.3.4 LarKC應用技術開發(fā)概述 1.4 本章小結 參考文獻第一部分 技術篇 第2章 LarKC海量語義數據處理平臺 2.1 LarKC體系結構 2.2 LarKC平臺的安裝與使用 2.2.1 獲取LarKC 2.2.2 運行LarKC 2.2.3 一個簡單工作流實例 2.3 工作流設計器 2.3.1 工作流設計器概覽 2.3.2 安裝及主要操作 2.4 LarKC插件概述 2.5 用戶支持和版權信息 2.6 本章小結 參考文獻 第3章 識別與選擇 3.1 識別方法與識別插件 3.2 基于興趣的選擇方法與插件實現 3.2.1 基本原理與基本算法 3.2.2 方法的可擴展性與效率比較 3.2.3 基于興趣的選擇插件設計與實現 3.3 隨機索引選擇方法與插件實現 3.3.1 語義索引 3.3.2 基于隨機索引與Lcene索引的檢索比較 3.4 選擇方法與選擇插件的應用 3.4.1 基于興趣的選擇插件應用示例 3.4.2 隨機索引選擇插件應用示例 3.5 本章小結 附錄 第3.3.2 節(jié)相關詢問 參考文獻 第4章 抽象與轉換 4.1 機器學習 4.1.1 SUNS 4.1.2 機器學習插件 4.2 數據流 4.2.1 C-SPARQL 4.2.2 數據流插件 4.3 歸納與演繹結合的數據流推理 4.3.1 動機 4.3.2 數據流推理的結構框架 4.4 本章小結 參考文獻 第5章 推理與決策 5.1 LarKC推理與決策插件 5.2 常規(guī)語義推理 5.2.1 OWLAPI推理機 5.2.2 SPARQLDL推理機 5.3 并行與分布式推理 5.3.1 采用MapReduce技術的海量分布性推理 5.3.2 采用WebPIE進行OWL分布性推理 5.4 基于規(guī)則的推理 5.5 本章小結 參考文獻 第6章 非常規(guī)語義推理 6.1 不一致本體的推理 6.1.1 語義網與不一致性 6.1.2 基本方法 6.1.3 LarKC平臺下的PION系統 6.2 轉折推理 6.2.1 基本定義 6.2.2 計算方法和實現 6.2.3 轉折推理插件 6.3 嘈雜語義數據的推理 6.3.1 基本定義 6.3.2 韓國首爾RSM系統示例 6.4 本章小結 參考文獻 第7章 LarKC系統與應用開發(fā) 7.1 LarKC工作流開發(fā) 7.1.1 工作流圖 7.1.2 工作流描述 7.1.3 更復雜的一個示例 7.2 LarKC插件開發(fā) 7.2.1 LarKCMaven原型的使用 7.2.2 插件代碼編寫 7.2.3 整合插件到LarKC平臺 7.3 相關的開發(fā)工具 7.3.1 集成開發(fā)環(huán)境Eclipse 7.3.2 項目管理Maven 7.3.3 單元測試JUnit 7.3.4 版本控制SVN 7.4 本章小結 附錄 復雜的工作流描述示例 參考文獻第二部分 應用篇 第8章 關聯生命數據集 8.1 概況 8.2 關聯生命數據組成 8.3 語義關聯構造 8.4 關聯生命數據集的使用 8.4.1 關聯生命數據集關鍵詞查詢 8.4.2 關聯生命數據集SPARQL語義查詢 8.5 本章小結 參考文獻 第9章 生物醫(yī)學文獻語義檢索 9.1 需求分析 9.2 通過LLD進行醫(yī)學文獻檢索 9.3 醫(yī)學文獻語義標注 9.4 LarKC醫(yī)學文獻語義檢索插件 9.5 本章小結 參考文獻 第10章 海量語義數據處理與基因研究 10.1 概述 10.2 基因研究與語義數據 10.3 LarKC海量語義數據處理平臺用于GWAS研究 10.3.1 LarKC的GWAS插件 10.3.2 關鍵詞擴展推理器 10.3.3 GWAS識別器 10.3.4 GWAS工作流 10.4 本章小結 參考文獻 第11章 城市計算Ⅰ:交通與社交媒體 11.1 交通路線規(guī)劃 11.1.1 框架結構 11.1.2 交通預測 11.1.3 語義交通路線規(guī)劃 11.1.4 評價 11.1.5 小結 11.2 社交媒體分析 11.2.1 概況 11.2.2 框架結構 11.2.3 BOTTARI的LarKC工作流 11.3 本章小結 參考文獻 第12章 城市計算Ⅱ:路標管理 12.1 基本思想 12.2 RSM數據集與數據整合 12.2.1 RSM數據集 12.2.2 數據整合 12.2.3 路標的有效性審核 12.3 RSM語義數據處理 12.3.1 系統結構 12.3.2.RSM工作流 12.3.3 :RSM查詢與推理 12.4 RSM系統用戶界面 12.5 本章小結 參考文獻 第13章 海量語義數據處理技術展望 13.1 市場分析 13.1.1 語義技術的市場觀察和潛力 13.1.2 市場分析的結論 13.2 LarKC海量語義數據平臺應用展望 13.2.1 藥物研發(fā)海量語義數據處理 13.2.2 語義技術用于政治文化分析 13.2.3 智能交通系統 13.2.4 基于語義技術的電子病歷 13.3 海量語義數據處理研究展望 13.4 結束語 參考文獻