數(shù)據(jù)標(biāo)注工程——語言知識(shí)與應(yīng)用
定 價(jià):58 元
- 作者:于東
- 出版時(shí)間:2023/8/1
- ISBN:9787121459559
- 出 版 社:電子工業(yè)出版社
- 中圖法分類:TP274
- 頁碼:140
- 紙張:
- 版次:01
- 開本:16開
本書介紹了人工智能與語言知識(shí)的結(jié)合特點(diǎn)。通過理論概念講解、具體實(shí)例分析,介紹語言知識(shí)的構(gòu)建方法、類型案例、應(yīng)用領(lǐng)域,輔助學(xué)習(xí)者快速了解行業(yè)基礎(chǔ)和發(fā)展動(dòng)態(tài)。本書首先介紹語言知識(shí)庫的基本理論和構(gòu)建方法,通過例子介紹資源類語言知識(shí)、語料庫語言知識(shí)的概念和結(jié)構(gòu)。為了方便理解,本書結(jié)合大量案例介紹語言知識(shí)在自然語言處理及在司法、醫(yī)療、金融等垂直領(lǐng)域中的應(yīng)用,目的是幫助數(shù)據(jù)標(biāo)注者理解行業(yè)發(fā)展,建立語言知識(shí)理論和應(yīng)用的基本框架,為從事相關(guān)工作提供便利。
于東,北京語言大學(xué)信息科學(xué)學(xué)院副教授。中國(guó)中文信息學(xué)會(huì)青工委委員,語言與知識(shí)計(jì)算專委會(huì)委員。主要研究方向?yàn)橛?jì)算語言學(xué)、數(shù)字人文、語言資源建設(shè)。擅長(zhǎng)將語言學(xué)問題與計(jì)算語言學(xué)方法交叉,構(gòu)建新問題、研究新方法。主持國(guó)家自然科學(xué)基金項(xiàng)目、教育部人文社科基金,參與國(guó)家863計(jì)劃、國(guó)家社科基金項(xiàng)目多項(xiàng)。累計(jì)發(fā)表論文30余篇。多年主講《人工智能思想與方法》、《自然語言處理》等專業(yè)課程,主講課程獲批國(guó)家級(jí)一流本科課程。
目錄
第1章 人工智能與知識(shí)表示 001
1.1 智能與人工智能 001
1.1.1 智能 001
1.1.2 人工智能 002
1.2 基本方法和流派 003
1.2.1 基本方法 004
1.2.2 基本流派 004
1.3 知識(shí)表示 005
1.3.1 知識(shí)符號(hào)化 005
1.3.2 知識(shí)表示的概念 006
1.3.3 人工智能中的知識(shí)表示 007
1.4 一階謂詞邏輯的知識(shí)表示 008
1.4.1 命題邏輯 008
1.4.2 謂詞邏輯 010
1.4.3 使用謂詞表示知識(shí) 012
1.4.4 小結(jié) 014
1.5 產(chǎn)生式知識(shí)表示 015
1.5.1 產(chǎn)生式的概念 015
1.5.2 規(guī)則性知識(shí)的產(chǎn)生式 015
1.5.3 事實(shí)性知識(shí)的產(chǎn)生式 017
1.5.4 產(chǎn)生式系統(tǒng) 017
第2章 語言知識(shí)庫的構(gòu)建 023
2.1 語言知識(shí)的概念 023
2.1.1 語言知識(shí) 023
2.1.2 語言知識(shí)庫 024
2.1.3 語言知識(shí)庫的類型 025
2.2 語言知識(shí)的來源 026
2.2.1 結(jié)構(gòu)化數(shù)據(jù) 027
2.2.2 半結(jié)構(gòu)化數(shù)據(jù) 027
2.2.3 非結(jié)構(gòu)化數(shù)據(jù) 028
2.3 語言知識(shí)庫的構(gòu)建 028
2.3.1 構(gòu)建流程 028
2.3.2 規(guī)范和原則 029
2.4 語言知識(shí)獲取方法 031
2.4.1 人工標(biāo)注知識(shí) 031
2.4.2 自動(dòng)獲取知識(shí) 032
2.4.3 人機(jī)交互獲取知識(shí) 033
2.5 語言知識(shí)的存儲(chǔ) 033
2.5.1 數(shù)據(jù)庫及其類型 033
2.5.2 可擴(kuò)展標(biāo)記語言 034
2.5.3 數(shù)據(jù)交換格式 036
2.5.4 本體知識(shí)表示 037
第3章 資源類語言知識(shí) 042
3.1 資源類語言知識(shí)的概念 042
3.2 資源類語言知識(shí)的發(fā)展 043
3.2.1 語義網(wǎng)絡(luò) 043
3.2.2 語義Web 044
3.2.3 知識(shí)圖譜 049
3.3 常用的資源類語言知識(shí) 049
3.3.1 WordNet 049
3.3.2 FrameNet 050
3.3.3 ConceptNet 052
3.3.4 HowNet 054
3.3.5 同義詞詞林 055
第4章 語料庫語言知識(shí) 059
4.1 詞匯中的語言知識(shí) 059
4.1.1 詞性知識(shí) 059
4.1.2 分詞知識(shí) 061
4.2 句子中的語言知識(shí) 062
4.2.1 命名實(shí)體知識(shí) 063
4.2.2 實(shí)體關(guān)系知識(shí) 063
4.2.3 事件知識(shí) 064
4.3 句子結(jié)構(gòu)中的知識(shí) 065
4.3.1 句法結(jié)構(gòu)樹 065
4.3.2 淺層句法結(jié)構(gòu) 066
4.3.3 依存句法樹 067
4.3.4 抽象語義表示 069
4.4 常用漢語語料庫 070
4.4.1 大規(guī)模漢語語料庫 070
4.4.2 漢語標(biāo)注語料庫 072
第5章 語言知識(shí)的應(yīng)用:面向自然語言處理 077
5.1 自然語言處理的基本問題 077
5.1.1 語言模型問題 077
5.1.2 分類問題 080
5.1.3 序列標(biāo)注問題 081
5.1.4 語言結(jié)構(gòu)分析問題 083
5.1.5 語言生成問題 085
5.2 自動(dòng)問答 085
5.2.1 概念和歷史 085
5.2.2 開放領(lǐng)域自動(dòng)問答 087
5.2.3 基于知識(shí)的自動(dòng)問答 088
5.3 機(jī)器閱讀理解 090
5.3.1 概念和發(fā)展史 090
5.3.2 完型填空型任務(wù)和數(shù)據(jù)集 092
5.3.3 選擇型任務(wù)和數(shù)據(jù)集 093
5.3.4 片段抽取型任務(wù)和數(shù)據(jù)集 094
5.3.5 自由問答型任務(wù)和數(shù)據(jù)集 095
5.4 機(jī)器翻譯 096
5.4.1 概念和發(fā)展史 096
5.4.2 機(jī)器翻譯的基石:雙語平行語料庫 098
5.4.3 統(tǒng)計(jì)機(jī)器翻譯方法簡(jiǎn)介 099
5.4.4 神經(jīng)機(jī)器翻譯方法簡(jiǎn)介 100
第6章 語言知識(shí)的應(yīng)用:面向垂直領(lǐng)域 104
6.1 智能司法信息處理 104
6.1.1 概述 104
6.1.2 法律判決預(yù)測(cè)任務(wù) 106
6.1.3 相似案件匹配任務(wù) 107
6.1.4 司法領(lǐng)域自動(dòng)問答 108
6.2 智能醫(yī)療信息處理 110
6.2.1 概述 110
6.2.2 醫(yī)療信息知識(shí)庫構(gòu)建 111
6.2.3 智慧醫(yī)療的典型應(yīng)用 115
6.2.4 智慧醫(yī)療的未來發(fā)展 116
6.3 智能金融信息處理 117
6.3.1 概述 117
6.3.2 金融領(lǐng)域知識(shí)庫構(gòu)建與分析技術(shù) 118
6.3.3 智能金融的典型應(yīng)用 123