任何足夠先進(jìn)的技術(shù)初看都與魔法無異。
自動駕駛汽車已經(jīng)在很多國家上路,網(wǎng)飛的算法能主動預(yù)測你喜歡的電影,DeepMind的計(jì)算機(jī)程序通關(guān)了雅達(dá)利游戲,AlphaGo在古老的圍棋領(lǐng)域攻克了人類智能的防線。
這一切是如何發(fā)生的?智能機(jī)器究竟如何思考?
在這本書中,作者用幾乎人人都能讀懂的語言展示了人工智能領(lǐng)域的前沿成果,深入解讀了感知算法、強(qiáng)化學(xué)習(xí)、智能體、卷積神經(jīng)網(wǎng)絡(luò)、深度語音識別、圖片識別等科技巨頭紛紛擁抱的概念,正是它們讓當(dāng)今的機(jī)器如此智能。
DARPA和ImageNet的挑戰(zhàn)賽給未來播撒了怎樣的種子?
網(wǎng)飛的電影推薦為什么如此準(zhǔn)確?
人工智能怎么打DOTA?
AlphaGo除了下圍棋還會做別的嗎?
神經(jīng)網(wǎng)絡(luò)如何做到能聽、能說、能記憶?
我們?yōu)槭裁匆粩嘀圃炷軓?fù)制人類智力和行為的機(jī)器?
這本書將為你打開機(jī)器學(xué)習(xí)與神經(jīng)網(wǎng)絡(luò)的黑匣子,讓你看懂魔法背后的機(jī)制。關(guān)于自動駕駛汽車、網(wǎng)飛算法、會玩游戲的人工智能以及AlphaGo,這本書幾乎囊括了你想知道的一切。
1. 這是一本技術(shù)小白和技術(shù)大咖都愛讀的機(jī)器學(xué)習(xí)指南。谷歌前工程專家、機(jī)器學(xué)習(xí)極客肖恩格里什的重磅作品。
2. 深度神經(jīng)網(wǎng)絡(luò)是新一波人工智能熱潮的推動引擎。圍繞這一前沿工具展開的對話,推動著自動駕駛汽車、網(wǎng)飛的推薦算法、AlphaGo,甚至?xí)駾OTA游戲的人工智能的發(fā)展,任何想要參與這一時(shí)代對話的人都應(yīng)該讀讀這本書。
3. 作者用通俗的類比和鼓舞人心的故事,厘清了許多神秘而前衛(wèi)的新概念:感知算法、強(qiáng)化學(xué)習(xí)、卷積神經(jīng)網(wǎng)絡(luò)、深度語音識別、圖片識別等。掌握這些概念,你才能更好地判斷,哪些關(guān)于人工智能的言論值得相信,哪些說得天花亂墜的謬論應(yīng)該被拋棄,這本書將助力你的AI創(chuàng)業(yè)與投資之路。
4. 微軟CTO凱文斯科特親筆作序、谷歌工程總監(jiān)雷庫茲韋爾、美國人工智能協(xié)會院士佩德羅多明戈斯、谷歌研究科學(xué)家凱文墨菲、微軟亞洲研究院副院長潘天佑、馭勢科技CEO吳甘沙鼎力推薦!
推薦序
10多年前,我遇見了肖恩。當(dāng)時(shí)我在谷歌領(lǐng)導(dǎo)團(tuán)隊(duì),負(fù)責(zé)開發(fā)為谷歌的搜索廣告業(yè)務(wù)提供支持的許多大型機(jī)器學(xué)習(xí)系統(tǒng)。肖恩是我們小組里最頂尖的工程師之一,當(dāng)時(shí)他正在研究機(jī)器學(xué)習(xí)前沿領(lǐng)域的一系列具有挑戰(zhàn)性的問題。我們一起工作以來,體現(xiàn)在統(tǒng)計(jì)機(jī)器學(xué)習(xí)技術(shù)中的各類人工智能已經(jīng)從相對難以觸及的神秘技術(shù)、研究人員和高科技公司的專屬領(lǐng)域,發(fā)展成為日益平易近人的、卓有成效的工具和技術(shù),值得每一位軟件開發(fā)人員使用。
目前機(jī)器學(xué)習(xí)領(lǐng)域取得的快速進(jìn)展,在一定程度上是由以下因素推動的:數(shù)據(jù)爆炸,高性能計(jì)算機(jī)體系結(jié)構(gòu)的復(fù)興,云提供商競相為開發(fā)人員和研究人員構(gòu)建可擴(kuò)展的人工智能平臺,人們將實(shí)時(shí)智能嵌入移動設(shè)備、汽車、其他消費(fèi)電子產(chǎn)品和日益普遍的連接到云端的計(jì)算設(shè)備的熱潮。這種快速進(jìn)步中包括一些驚世駭俗的成就,機(jī)器在許多狹窄的領(lǐng)域已經(jīng)接近于或超過了人類的能力,例如在圖像中標(biāo)記物體、識別語音、玩策略游戲以及翻譯語言,但我們?nèi)蕴幱谶@些技術(shù)發(fā)展的初期,擺在我們面前的是長達(dá)幾十年的創(chuàng)新和發(fā)現(xiàn)之旅。
對開發(fā)人員和研究人員而言,理解機(jī)器學(xué)習(xí)的工作原理是一個(gè)明智的職業(yè)選擇。目前,全球的科技巨頭公司對這些技術(shù)的專業(yè)知識都有很高的需求。微軟、亞馬遜、谷歌、蘋果、百度等許多公司都提供應(yīng)用程序接口、工具包和云計(jì)算基礎(chǔ)設(shè)施,將機(jī)器學(xué)習(xí)的開發(fā)工作交給全世界數(shù)以千萬計(jì)的開發(fā)人員。未來幾年,隨著越來越多的應(yīng)用程序包含智能功能,大多數(shù)開發(fā)人員都需要掌握一些機(jī)器學(xué)習(xí)技術(shù)。這正是這本書的寶貴價(jià)值所在。
這本書誕生自肖恩對了解現(xiàn)代機(jī)器學(xué)習(xí)成功之路的渴望。在用清晰易懂的方式描述這些系統(tǒng)的本質(zhì)時(shí),肖恩利用10多年的行業(yè)和學(xué)術(shù)經(jīng)驗(yàn)解決了機(jī)器學(xué)習(xí)帶來的一些最棘手的問題。鑒于機(jī)器學(xué)習(xí)系統(tǒng)能夠復(fù)制某些方面的人類智能,等到某個(gè)突破點(diǎn)臨近,原本由人類特有的創(chuàng)造詩意詞句的能力或許也會被機(jī)器復(fù)制。肖恩對這些技術(shù)嚴(yán)謹(jǐn)實(shí)用的描述反映了他在科研戰(zhàn)壕中的歲月,不時(shí)令人感到痛苦的反復(fù)試驗(yàn)讓戰(zhàn)壕中的人們了解到,機(jī)器學(xué)習(xí)并不是魔法。如果你知道如何應(yīng)用它,了解它的局限所在,它就是強(qiáng)有力的前沿工具;如果你不知道,它就幾乎一文不值。
肖恩通過列舉現(xiàn)實(shí)世界的例子,回避不必要的術(shù)語,使現(xiàn)代機(jī)器學(xué)習(xí)的概念變得通俗易懂。這本書假設(shè)讀者在機(jī)器學(xué)習(xí)或計(jì)算機(jī)科學(xué)領(lǐng)域的知識相對較少,因此對更廣泛的受眾而言非常友好。鑒于當(dāng)前圍繞機(jī)器學(xué)習(xí)和人工智能的對話頗為活躍,并且這些技術(shù)可能對我們的未來產(chǎn)生影響,任何想要參與這場對話的人都應(yīng)該盡可能地學(xué)習(xí)。由于市場上缺乏對機(jī)器學(xué)習(xí)通俗易懂的專業(yè)介紹,這本書將成為引導(dǎo)你理解底層技術(shù)的理想方法,它可以幫助你更好地判斷哪些言論值得相信,哪些說得天花亂墜的謬論應(yīng)該被拋棄。
微軟CTO(首席技術(shù)官)
凱文斯科特(Kevin Scott)
肖恩格里什(Sean Gerrish)
谷歌前工程專家,普林斯頓大學(xué)的機(jī)器學(xué)習(xí)博士,機(jī)器學(xué)習(xí)極客。
曾在高頻交易機(jī)構(gòu)泰莎科技擔(dān)任工程師,并在谷歌擔(dān)任機(jī)器學(xué)習(xí)和數(shù)據(jù)科學(xué)團(tuán)隊(duì)的工程專家。
推薦序 IX
前言 XIII
1 自動機(jī)的秘密
長笛演奏者 003
今天的自動機(jī) 005
鐘擺的擺動007
這本書中的自動機(jī) 008
2 自動駕駛汽車:挑戰(zhàn)不可能
沙漠中的百萬美元競賽 015
如何打造自動駕駛汽車 017
規(guī)劃路徑 021
路徑搜索 022
導(dǎo)航025
無人車挑戰(zhàn)賽的獲勝者 028
一場失敗的比賽 031
3 保持在車道內(nèi)行駛:自動駕駛汽車的感知
第二次無人車挑戰(zhàn)賽 035
自動駕駛汽車中的機(jī)器學(xué)習(xí) 037
斯坦利的架構(gòu) 038
避開障礙物 040
尋找道路的邊緣 043
開眼看路 045
路徑規(guī)劃 047
斯坦利大腦的各個(gè)部分如何相互交流 049
4 在十字路口避讓:自動駕駛汽車的大腦
城市挑戰(zhàn)賽 055
感知抽象 057
比賽 059
老板的高層次推理層 061
攻克交通堵塞 068
三層架構(gòu) 071
對自動駕駛汽車看到的物體進(jìn)行分類 076
自動駕駛汽車是復(fù)雜的系統(tǒng) 077
自動駕駛汽車的軌跡 078
5 網(wǎng)飛和推薦引擎的挑戰(zhàn)
百萬美元大獎 083
競爭者 084
如何訓(xùn)練分類器 085
比賽的目標(biāo) 089
龐大的評分矩陣 091
矩陣分解 096
第一年結(jié)束 102
6 團(tuán)隊(duì)融合:網(wǎng)飛獎的贏家
縮小競爭者之間的差距 107
第一年末 108
隨時(shí)間變化的預(yù)測 111
過度擬合 114
模型混合 115
第二年 119
最后一年 120
賽后 124
7 用獎勵教導(dǎo)計(jì)算機(jī)
DeepMind玩雅達(dá)利游戲 129
強(qiáng)化學(xué)習(xí) 132
教導(dǎo)智能體 134
為智能體編寫程序 36
智能體如何觀察環(huán)境 140
經(jīng)驗(yàn)金塊 141
用強(qiáng)化學(xué)習(xí)玩雅達(dá)利游戲 148
8 如何用神經(jīng)網(wǎng)絡(luò)攻克雅達(dá)利游戲
神經(jīng)信息處理系統(tǒng) 153
近似,而非完美 153
用作數(shù)學(xué)函數(shù)的神經(jīng)網(wǎng)絡(luò) 155
雅達(dá)利游戲神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu) 161
深入研究神經(jīng)網(wǎng)絡(luò) 170
9 人工神經(jīng)網(wǎng)絡(luò)的世界觀
人工智能的奧秘 175
國際象棋自動機(jī)土耳其人 177
神經(jīng)網(wǎng)絡(luò)中的誤導(dǎo) 179
識別圖像中的物體 180
過度擬合 183
ImageNet 185
卷積神經(jīng)網(wǎng)絡(luò) 188
為什么是深度網(wǎng)絡(luò)? 194
數(shù)據(jù)瓶頸 197
10 深入了解深度神經(jīng)網(wǎng)絡(luò)的內(nèi)部秘密
計(jì)算機(jī)生成圖片 203
壓縮函數(shù) 204
ReLU激活函數(shù) 207
機(jī)器人之夢 211
11 能聽、能說、能記憶的神經(jīng)網(wǎng)絡(luò)
對機(jī)器而言,理解意味著什么? 221
深度語音識別 222
循環(huán)神經(jīng)網(wǎng)絡(luò) 223
為圖像生成字幕 230
長短時(shí)記憶網(wǎng)絡(luò) 233
對抗數(shù)據(jù) 235
12 理解自然語言
宣傳噱頭還是人工智能研究的福音? 239
IBM的沃森 240
攻克《危險(xiǎn)邊緣》所遇到的挑戰(zhàn) 241
浩如煙海的知識 242
《危險(xiǎn)邊緣》挑戰(zhàn)賽的誕生 245
DeepQA 247
問題分析 249
沃森如何解讀句子 252
13 挖掘《危險(xiǎn)邊緣》的最佳答案
地下室基準(zhǔn) 261
生成候選答案 263
查找答案 266
輕量級過濾器 269
證據(jù)檢索 270
評分 274
匯總和排名 277
調(diào)整沃森 281
重新審視DeepQA 282
沃森有智能嗎? 283
14 用蠻力搜索找到好策略
通過搜索玩游戲 289
數(shù)獨(dú) 290
樹的大小 294
分支因子 297
游戲中的不確定性 297
克勞德香農(nóng)與信息論 302
評價(jià)函數(shù) 303
深藍(lán) 308
加入IBM 310
搜索與神經(jīng)網(wǎng)絡(luò) 311
西洋雙陸棋程序 313
搜索的局限 315
15 職業(yè)水平的圍棋
計(jì)算機(jī)圍棋 319
圍棋 321
通過抽樣走子來建立直覺 324
神之一手 330
蒙特卡洛樹搜索 333
單臂老虎機(jī) 337
AlphaGo是否需要如此復(fù)雜 339
AlphaGo的局限 341
16 實(shí)時(shí)人工智能與《星際爭霸》
構(gòu)建更好的游戲機(jī)器人 345
《星際爭霸》與人工智能 346
簡化游戲 348
實(shí)用《星際爭霸》機(jī)器人 351
OpenAI與《DOTA 2》 354
《星際爭霸》機(jī)器人的未來 357
17 50年后或更遙遠(yuǎn)的未來
人工智能起起伏伏的發(fā)展過程 363
如何復(fù)制這本書中的成功 364
數(shù)據(jù)的普遍使用 368
下一步去向何方 369
致謝 373
注釋 375