分布式人工智能:基于TensorFlow、RTOS與群體智能體系
定 價(jià):169 元
- 作者:王靜逸
- 出版時(shí)間:2020/9/1
- ISBN:9787111665205
- 出 版 社:機(jī)械工業(yè)出版社
- 中圖法分類(lèi):TP18
- 頁(yè)碼:0
- 紙張:
- 版次:
- 開(kāi)本:16開(kāi)
本書(shū)結(jié)合了分布式計(jì)算、大數(shù)據(jù)、機(jī)器學(xué)習(xí)、深度學(xué)習(xí)、強(qiáng)化學(xué)習(xí)等技術(shù),以群體智能為主線(xiàn),講述了分布式人工智能的原理和應(yīng)用。它介紹了分布式計(jì)算的框架技術(shù)、智能核心、分布式體系與架構(gòu)。本書(shū)介紹了大數(shù)據(jù)的框架、高速計(jì)算、海量存儲(chǔ);介紹了人工智能的經(jīng)典算法,并且結(jié)合分布式技術(shù),進(jìn)行大規(guī)模分布式架構(gòu)與演進(jìn);介紹了群體智能與博弈,結(jié)合分布式、大數(shù)據(jù)、智能核心,講解了群體智能技術(shù)系統(tǒng)的發(fā)展方向與開(kāi)發(fā)方式。
本書(shū)內(nèi)容通俗易懂,案例豐富,實(shí)用性強(qiáng),特別適合分布式、人工智能、大數(shù)據(jù)相關(guān)的入門(mén)讀者和進(jìn)階讀者閱讀,也適合游戲開(kāi)發(fā)、推薦系統(tǒng)、群體智能底層研究者等閱讀。另外,本書(shū)也適合作為相關(guān)培訓(xùn)機(jī)構(gòu)的教材使用。
前言
第1篇 基礎(chǔ)概念
第1章 分布式系統(tǒng)簡(jiǎn)介2
1.1 什么是分布式系統(tǒng)2
1.2 分布式系統(tǒng)的歷史與未來(lái)10
1.3 分布式系統(tǒng)與并行計(jì)算13
1.4 分布式系統(tǒng)與邊緣計(jì)算17
1.5 分布式與超算系統(tǒng)20
1.6 分布式多智能體21
1.7 單體人工智能22
1.7.1 TensorFlow的分布式方案22
1.7.2 Spark分布式機(jī)器學(xué)習(xí)24
1.7.3 Google聯(lián)合學(xué)習(xí)方案26
1.8 分布式與多人博弈27
1.9 分布式與群體智能決策29
1.10 分布式與群體智能的未來(lái)和價(jià)值30
1.11 本章小結(jié)31
第2章 分布式智能計(jì)算基礎(chǔ)33
2.1 常用的分布式計(jì)算框架33
2.2 Spark分布式框架介紹37
2.3 HLA高層聯(lián)邦體系41
2.4 Multi-Agent體系44
2.5 RTI與RTOS分布式計(jì)算核心47
2.6 分布式計(jì)算的原理和常用方法52
2.6.1 分布式計(jì)算規(guī)則52
2.6.2 分布式與同步55
2.6.3 分布式與異步59
2.6.4 處理同步與異步延時(shí)64
2.7 計(jì)算模型與任務(wù)分發(fā)70
2.8 代理模型與HLA智能體75
2.9 分布式與決策模型79
2.10 底層計(jì)算核心RTOS84
2.11 分布式智能計(jì)算的價(jià)值86
2.12 本章小結(jié)89
第2篇 計(jì)算框架
第3章 TensorFlow框架介紹92
3.1 什么是TensorFlow92
3.2 TensorFlow的結(jié)構(gòu)和應(yīng)用概念94
3.3 Graph與并行計(jì)算模型99
3.4 Session會(huì)話(huà)層108
3.5 TensorFlow中的數(shù)據(jù)類(lèi)型與計(jì)算函數(shù)112
3.6 TensorFlow與卷積神經(jīng)網(wǎng)絡(luò)120
3.7 準(zhǔn)備TensorFlow的系統(tǒng)環(huán)境128
3.8 下載和安裝TensorFlow135
3.9 啟動(dòng)第一個(gè)測(cè)試程序138
3.10 使用TensorFlow構(gòu)建算法框架148
3.10.1 使用CIFAR-10構(gòu)建卷積神經(jīng)網(wǎng)絡(luò)148
3.10.2 使用RNN構(gòu)建記憶網(wǎng)絡(luò)155
3.10.3 搭建生成對(duì)抗網(wǎng)絡(luò)160
3.11 TensorFlow的發(fā)展與價(jià)值165
3.12 本章小結(jié)166
第4章 分布式智能計(jì)算核心167
4.1 什么是SintolRTOS167
4.2 SintolRTOS支持的組織協(xié)議體系168
4.2.1 HLA高層聯(lián)邦體系168
4.2.2 數(shù)據(jù)分發(fā)服務(wù)171
4.2.3 Multi-Agent體系結(jié)構(gòu)173
4.3 SintolRTOS核心組件和系統(tǒng)架構(gòu)176
4.3.1 Core Soft Plateform178
4.3.2 Open Soft Plateform182
4.4 使用SintolRTOS系統(tǒng)組件的工作環(huán)境183
4.5 下載和安裝SintolRTOS183
4.6 SintolRTOS的分布式RTOSNode節(jié)點(diǎn)原理191
4.7 SintolRTOS的聯(lián)邦模型和文件定義196
4.7.1 FED聯(lián)邦模型文件定義196
4.7.2 IDL主題模型文件定義197
4.7.3 Agent代理模型定義199
4.8 編寫(xiě)AI聯(lián)邦模型和Agent代理200
4.9 分布式計(jì)算層的模型與數(shù)據(jù)204
4.9.1 重構(gòu)聯(lián)邦實(shí)體的處理類(lèi)204
4.9.2 DQN神經(jīng)網(wǎng)絡(luò)與PSintolSDK構(gòu)建計(jì)算層208
4.10 SintolRTOS智能計(jì)算組織Demo213
4.10.1 Demo分布式聯(lián)邦智能架構(gòu)設(shè)計(jì)213
4.10.2 使用UnrealRTOS和CSintolSDK搭建仿真演練場(chǎng)景214
4.10.3 運(yùn)行UnrealRTOS多智能體進(jìn)行聯(lián)邦對(duì)抗217
4.11 SintolRTOS與分布式人工智能的未來(lái)219
4.12 本章小結(jié)220
第5章 大數(shù)據(jù)與存儲(chǔ)系統(tǒng)框架221
5.1 什么是大數(shù)據(jù)221
5.2 大數(shù)據(jù)的關(guān)鍵技術(shù)222
5.3 大數(shù)據(jù)與機(jī)器學(xué)習(xí)224
5.4 Hadoop與分布式存儲(chǔ)框架225
5.5 搭建Spark運(yùn)行環(huán)境228
5.6 Spark、Hadoop與TensorFlow結(jié)合245
5.6.1 分布式的圖像數(shù)據(jù)處理和識(shí)別平臺(tái)245
5.6.2 分布式機(jī)器學(xué)習(xí)與分布式數(shù)據(jù)平臺(tái)252
5.7 分布式大數(shù)據(jù)與機(jī)器學(xué)習(xí)的未來(lái)252
5.8 本章小結(jié)253
第3篇 多智能體分布式AI算法
第6章 機(jī)器學(xué)習(xí)算法與分布式改進(jìn)256
6.1 邏輯回歸256
6.2 支持向量機(jī)263
6.3 決策樹(shù)271
6.4 分布式多算法結(jié)構(gòu)的決策樹(shù)279
6.5 多任務(wù)并行計(jì)算算法改進(jìn)281
6.5.1 數(shù)據(jù)并行282
6.5.2 模型并行284
6.6 單體算法與分布式算法的優(yōu)化287
6.6.1 單體算法優(yōu)化287
6.6.2 分布式異步隨機(jī)梯度下降290
6.7 機(jī)器學(xué)習(xí)算法的維數(shù)災(zāi)難293
6.8 深度學(xué)習(xí)的內(nèi)在發(fā)展需求294
6.8.1 解決維數(shù)災(zāi)難295
6.8.2 算法架構(gòu)設(shè)計(jì)295
6.8.3 深度學(xué)習(xí)與多任務(wù)學(xué)習(xí)297
6.9 自適應(yīng)學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)算法304
6.9.1 Momentum算法與優(yōu)化305
6.9.2 RMSProp算法與優(yōu)化305
6.9.3 Adam算法與優(yōu)化307
6.10 分布式與機(jī)器學(xué)習(xí)算法規(guī);陌l(fā)展與價(jià)值310
6.11 本章小結(jié)312
第7章 生成網(wǎng)絡(luò)和強(qiáng)化學(xué)習(xí)314
7.1 生成對(duì)抗網(wǎng)絡(luò)314
7.2 深度卷積生成對(duì)抗網(wǎng)絡(luò)316
7.3 分布式與多智能體對(duì)抗算法MADDPG330
7.4 常用的強(qiáng)化學(xué)習(xí)算法結(jié)構(gòu)336
7.5 Q-learning算法337
7.6 Sarsa-lamba算法346
7.6.1 Sarsa算法原理346
7.6.2 Sarsa-lamda算法的改進(jìn)347
7.6.3 算法實(shí)現(xiàn)347
7.7 深度Q網(wǎng)絡(luò)349
7.7.1 DQN算法原理349
7.7.2 DQN的模型訓(xùn)練350
7.7.3 訓(xùn)練DQN351
7.7.4 算法實(shí)現(xiàn)與分析352
7.8 其他強(qiáng)化學(xué)習(xí)基礎(chǔ)算法354
7.9 強(qiáng)化學(xué)習(xí)算法的發(fā)展與價(jià)值356
7.10 本章小結(jié)357
第8章 對(duì)抗和群體智能博弈358
8.1 群體智能的歷史358
8.2 博弈矩陣360
8.2.1 博弈矩陣簡(jiǎn)介360
8.2.2 博弈的線(xiàn)性規(guī)劃和納什均衡363
8.2.3 博弈的學(xué)習(xí)算法364
8.2.4 WoLF-IGA和WoLF-PHC算法366
8.2.5 分布式博弈矩陣368
8.2.6 學(xué)習(xí)自動(dòng)機(jī)369
8.2.7 仿真博弈環(huán)境371
8.3 網(wǎng)格博弈375
8.4 多智能體Q-learning算法378
8.5 無(wú)限梯度上升380
8.6 EMA Q-learning381
8.7 仿真群智博弈環(huán)境382
8.8 Multi-Agent系統(tǒng)開(kāi)發(fā)384
8.9 群體智能的發(fā)展與價(jià)值416
8.10 本章小結(jié)418
第4篇 分布式AI智能系統(tǒng)開(kāi)發(fā)實(shí)戰(zhàn)
第9章 體驗(yàn)群體智能對(duì)抗仿真環(huán)境420
9.1 群體智能仿真系統(tǒng)環(huán)境介紹420
9.2 導(dǎo)入多人對(duì)抗智能和仿真環(huán)境423
9.3 啟動(dòng)分布式多智能體和仿真環(huán)境432
9.4 啟動(dòng)人與多智能體進(jìn)行對(duì)抗434
9.5 啟動(dòng)數(shù)據(jù)回放436
9.6 啟動(dòng)多個(gè)智能體集團(tuán)博弈439
9.7 群體博弈仿真系統(tǒng)環(huán)境的代碼模塊441
9.8 本章小結(jié)495
第10章 開(kāi)發(fā)群體智能仿真對(duì)抗系統(tǒng)496
10.1 智能體強(qiáng)化學(xué)習(xí)的算法工程496
10.2 算法框架模塊功能說(shuō)明497
10.3 訓(xùn)練智能體實(shí)現(xiàn)任務(wù)AI交互514
10.4 使用訓(xùn)練好的模型進(jìn)行任務(wù)處理518
10.5 多智能體協(xié)作算法與RTOS結(jié)合523
10.5.1 多智能體協(xié)作算法MADDPG的應(yīng)用523
10.5.2 結(jié)合RTOS實(shí)現(xiàn)MADDPG的分布式結(jié)構(gòu)525
10.6 行為狀態(tài)機(jī)與AI結(jié)合529
10.7 分布式群體智能的計(jì)算與存儲(chǔ)531
10.8 本章小結(jié)534
后記535