萬米高空正在飛行的飛機遇到突發(fā)情況,駕駛員如何快速制訂幾種應對方案并進行選擇?
多人車禍現(xiàn)場救護人員如何將受傷人員進行等級分類從而能使救護工作最優(yōu)化?
醫(yī)護人員如何根據(jù)有限的線索判斷患者是否心臟病發(fā)作而將其安排進重癥室?
現(xiàn)實生活中,我們無法在掌握全部信息后進行從容的分析與決策,總是在時間有限甚至緊迫、信息有限甚至匱乏的情形下做出抉擇,各種啟發(fā)式和慣性思維決定了我們的大多數(shù)判斷和決策。那么,這些基于啟發(fā)式和慣性思維的分類和決策是否科學?四位德國馬克斯·普朗克人類發(fā)展研究所成員給出了肯定的回答。
作者從認知心理學角度對分類思維進行了探討,將心理學研究中的分類規(guī)則擴展到充滿不確定性的現(xiàn)實決策中,闡釋了簡單、快捷、清晰的快速節(jié)儉分類法和快速節(jié)儉樹構建法,并展示它們在醫(yī)療、司法、軍事、金融監(jiān)管等領域的應用。
本書對于在突發(fā)事件中需要快速做出合理應對的公共管理者、企業(yè)管理人員具有極強指導作用,對于希望提高自己生活和工作中的選擇能力的一般讀者也有很大啟發(fā)意義。
本書德國馬普所適應行為與認知中心主任、副主任和其他研究員集體智慧的結晶。
有限理論概念是由諾貝爾獎獲得者、心理學家、經(jīng)濟學家赫伯特?西蒙所提出,指我們所能加工的信息數(shù)量是有限的,認知上具有局限性,因此決策過程的理性是有限的,人們的信息加工系統(tǒng)發(fā)展了適應性的策略,可以在搜尋、處理信息需要的認知資源和選擇絕對的最優(yōu)方案之間進行權衡。
在此基礎上,由德國馬克斯·普朗克人類發(fā)展研究所以吉仁澤(Gerd Gigerenzer,亦譯吉戈倫爾,本書的作者)教授為代表的適應行為與認知中心提出了生態(tài)理性(ecological rationality),即與環(huán)境要求相結合的理性。其基本思想是人類和動物的理性是有限的,當人們面對復雜的問題時人們不僅不能,也不必在完全認清事物本質的情況下才作出判斷和決策,也就是說這種理性觀要求人在面對復雜的問題時可以采用直覺的、簡單的和可行的方式來處理問題。這時只要做到人的理性能夠與現(xiàn)實環(huán)境(包括自然和社會環(huán)境)的要求相匹配,從生態(tài)的角度看就已經(jīng)足夠了,這種理性就稱生態(tài)理性。
本書系統(tǒng)講解在有限理性基礎上提出的生態(tài)理性所發(fā)展出的快速節(jié)儉分類方法,認知心理學的理論和機器學習相結合,展示了如何將心理學的分類研究擴展到不確定的現(xiàn)實世界中,展示了如何從最初的認知原則(人類計數(shù)和排序的能力)中推導出簡單、準確的分類規(guī)則,讓你在信息有限的現(xiàn)實事件中做出合理決策。此外,本書將機器學習的原理通過簡單易懂的文字介紹給讀者,使讀者可以在工作學習中科學、精準應對分類和決策問題。
引言:為什么研究現(xiàn)實情境中的分類
對確定性的需求是人類的天性,然而,這也是人類智慧的缺點。如果你要在某個未知天氣的日子帶孩子們野餐,他們會讓你就那天究竟是天氣晴朗還是下雨給出武斷的答案,當你不能確定時,他們會對你感到失望。
伯特蘭·羅素
想要將某個人歸入某一類別(朋友或敵人;值得信任或不值得信任)是人類與生俱來的天性,這種渴求為智力發(fā)展提供了基礎。如果我們不去構成類別,我們就只能注意到個例,而觸及不到任何總體性的思考。然而,我們是如何進行分類的呢?以及我們應該如何進行分類呢?
心理學家傾向于關注那些明確的環(huán)境,在那樣的環(huán)境中,待被分類的所有實體,其所有特征(包括概率)都是確定的。為了實現(xiàn)實驗控制的目標,典型的實驗室實驗需要人們將一些人造物體(如顏色、大小各不相同的圓形和三角形)進行分類,即根據(jù)精確已知、數(shù)目固定的幾個維度進行分類。
與此相反,本書離開了實驗室的確定性,而著眼于現(xiàn)實中根本的不確定性。與典型的心理實驗不同,現(xiàn)實情境指的是現(xiàn)實世界的環(huán)境,在這樣的環(huán)境中,未來是不可知的,而且不確定性不能有意義地簡化為概率。這種不確定性并不必然適用于所有現(xiàn)實世界的環(huán)境,例如賭場里的玩家是可以計算出獲勝概率的。然而,在大多數(shù)其他情況下,不確定性普遍存在,無論是選擇應該投資的金融產(chǎn)品還是選擇最合適的結婚對象,F(xiàn)代貝葉斯決策理論之父吉米薩維奇(Jimmie Savage)認為,即使是計劃野餐這樣的事情也不在他的理論范圍內(nèi),因為人們無法提前知道所有可能發(fā)生的事件。我們可能首先就無法獲得與事件相關的信息,甚至這些信息每天都在變化。這提出了一個問題,即現(xiàn)實情境中的分類是否能夠在實際上基于科學,對此我們的回答是肯定的。本書介紹了一些精確的、正式的分類模型,在應用心理學其他一些有趣且有用的研究中,我們通?床坏竭@些分類模型的身影。正如我們將看到的,這些正規(guī)的模型與從業(yè)者們的專業(yè)知識很好地結合在了一起。
機器學習的研究人員也研究分類問題。為應對實驗室實驗之外的復雜情況,他們已經(jīng)開發(fā)出了神經(jīng)網(wǎng)絡和隨機森林等工具。這些工具能夠應對復雜性和不確定性,不過它們通常并不透明。例如,當基于這些工具搭建的系統(tǒng)用于資金問題或應用于法庭時,貸款申請人和被告人通常弄不明白,為什么他們會被歸類為不可信的那類人,有的貸款申請被拒,有的不準予以保釋。在大多數(shù)情況下,此類系統(tǒng)不僅對銀行、法官不透明,對創(chuàng)造它們的工程師來說,也是不透明的。
本書致力于提高不確定性環(huán)境中的透明度,為讀者提供了易于理解、記憶、教授和執(zhí)行的工具。這些工具讓相關從業(yè)者可以在手邊沒有花哨的機器學習程序時(例如身處事故現(xiàn)場或自殺式襲擊現(xiàn)場)做出快速而準確的決策。本書還認為機器學習應首先構建透明的算法,而不是事后再去試圖解釋不透明的算法。
認知心理學和機器學習之間存在著另一個深刻的區(qū)別。心理學主要是描述性的,它回答人們實際上是如何進行分類的問題,而機器學習是規(guī)范性的,它回答的是人們應該如何進行分類的問題。本書整合了是和應該這兩個方面,我們關注一些啟發(fā)式,這些啟發(fā)式通常既具有描述性又具有規(guī)范性,也就是說,它們描述了有經(jīng)驗的相關從業(yè)者實際都做了什么事情,同時還對相關從業(yè)者可以如何改進工作實踐提出了建議。
我們在本書中呈現(xiàn)的分類工具屬于有限理性的范疇,有限理性這個術語是由赫伯特·西蒙(Herbert Simon)在20世紀50年代創(chuàng)造,他是人工智能的創(chuàng)始人之一,也是認知革命的先驅之一。有限理性的現(xiàn)代研究在西蒙的傳統(tǒng)中就是快速節(jié)儉啟發(fā)式程序,我們呈現(xiàn)的這些分類工具正是基于此程序?焖俟(jié)儉啟發(fā)式是對認知心理學和機器學習中現(xiàn)有模型的有益補充,使人們可以在不確定性環(huán)境中進行快速、透明和準確的分類。
本書為認知心理學和機器學習的相遇提供了一個接觸點,展示了如何將心理學的分類研究擴展到不確定的現(xiàn)實世界中,還展示了如何從最初的認知原則(人類計數(shù)和排序的能力)中推導出簡單、準確的分類規(guī)則。此外,本書有助于實現(xiàn)可解釋化的機器學習?焖俟(jié)儉的分類規(guī)則很容易理解和應用。
在本書中,我們提出了兩個關鍵論點:
簡單規(guī)則在現(xiàn)實情境中表現(xiàn)良好。在國際象棋、圍棋或人臉識別等穩(wěn)定的情況下,如果有大量數(shù)據(jù)可用,復雜算法的表現(xiàn)優(yōu)于快速節(jié)儉啟發(fā)式。相比之下,在現(xiàn)實情境中,未來是不確定的,而且未來可能以一種不可預測的方式不同于過去,無論可用數(shù)據(jù)規(guī)模是大是小,簡單的啟發(fā)式都可以勝過復雜的方法,我們稱此為不穩(wěn)定世界原則。
透明度是一個關鍵值。我們的生活越來越受到算法的影響,這些算法根據(jù)公民的信譽、健康狀況以及社會和政治態(tài)度對其進行分類,其底層邏輯通常是不透明的,無論這是算法固有的不透明屬性還是出于保護商業(yè)秘密的宗旨。而另一方面,快速節(jié)儉啟發(fā)式從設計上就是透明的。在健康、財富和司法等敏感領域,理解算法的能力對于身處參與性民主制度的公民來說是必不可少的。不同于機器學習部分的共識,即假設最準確的算法一定既是本質上復雜的又是不可解釋的,我們表明,透明的算法通常與黑匣子模型一樣準確,我們稱此為透明滿足準確原則。
在本書中,我們證實了這兩個論點可以一同發(fā)揮作用。我們并不是在使用難以理解的復雜算法與使用幾乎不準確的簡單算法之間做選擇。在現(xiàn)實情境中,簡單、透明并不是準確的對立面。
[希]康斯坦丁諾斯·V. 卡齊科普洛斯(Konstantinos V. Katsikopoulos),英國南安普頓大學研究與企業(yè)商學院副院長,行為科學教授,曾為德國馬克斯·普朗克人類發(fā)展研究所適應性行為和認知中心的研究員和副主任。
[土]奧祖爾·希姆謝克(zgr ?im?ek),巴斯大學計算機科學系副系主任、教授,曾為德國馬克斯·普朗克人類發(fā)展研究所適應性行為和認知中心的研究員。
[德]馬庫斯·巴克曼(Marcus Buckmann),德國馬克斯·普朗克人類發(fā)展研究所博士,英格蘭銀行高級分析部的高級數(shù)據(jù)研究分析師。
[德]格爾德·吉仁澤(Gerd Gigerenzer),柏林-勃蘭登堡科學院與德國科學院院士,社會心理學家,德國馬克斯·普朗克人類發(fā)展研究所適應性行為和認知中心前主任。
引 言:為什么研究現(xiàn)實情境中的分類
第一章 現(xiàn)實情境中分類的四個案例
13把進入白宮的鑰匙:6把為假,挑戰(zhàn)者獲勝 006
HIV篩查:為何要用快速節(jié)儉樹取代完整決策樹 012
保釋或是監(jiān)禁:治安法官如何做決定 019
世貿(mào)中心的急救處理:簡單檢傷分類和快速治療 027
實驗室與現(xiàn)實情境 030
第二章 快速節(jié)儉分類
急癥室的挑戰(zhàn):判斷心臟病是否發(fā)作的線索 042
分類與線索 044
快速節(jié)儉分類:計數(shù)與快速節(jié)儉樹 046
如何衡量分類器的表現(xiàn) 054
準確理解分類器的關鍵概念 062
擬合、樣本外預測與總體外預測 065
第三章 構建快速節(jié)儉分類器
單獨考慮每一條線索 073
建立計數(shù)規(guī)則 078
以數(shù)值線索構建分類 083
構建快速節(jié)儉樹的方法 086
其他方法與線上資源 095
現(xiàn)實環(huán)境中的應用 096
快速節(jié)儉樹與信號檢測理論 100
生態(tài)理性:找到條件,產(chǎn)出更好的結果 103
第四章 機器學習中的分類
機器學習是什么 117
成功的應用:識別、篩查、皮膚癌診斷、AlphaZero 118
失敗的應用:谷歌流感趨勢、DNA檢測 125
機器學習模型的透明度 134
快速節(jié)儉樹與機器學習:構建決策樹和決策列表 135
計數(shù)法與機器學習 146
在現(xiàn)實世界中分類問題上的表現(xiàn) 149
啟發(fā)式與機器學習的連接 157
第五章 認知心理學領域中的分類
什么是認知心理學 169
研究分類的兩種文化 172
現(xiàn)實情境中的分類 175
實驗室分類 184
兩種分類的研究策略 190
復雜性悖論:問題與解決方法 194
第六章 構建一個更安全的世界
朋友還是敵人:檢查站決策樹 208
狗與飛盤:金融監(jiān)管快速節(jié)儉樹 219
提高安全性需要更簡單的規(guī)則 231
第七章 總 結
參考文獻