以從業(yè)者視角探討如何在金融領(lǐng)域有效運(yùn)用大數(shù)據(jù)和機(jī)器學(xué)習(xí)。
近年來,機(jī)器學(xué)習(xí)和數(shù)據(jù)科學(xué)在投資中發(fā)揮著越來越大的作用。借助機(jī)器學(xué)習(xí)和大數(shù)據(jù),投資經(jīng)理能夠做出以往傳統(tǒng)模型無法實(shí)現(xiàn)的預(yù)測,進(jìn)而做出明智的決策。然而,并不是所有的數(shù)據(jù)集和機(jī)器學(xué)習(xí)技術(shù)都對金融投資有用,也不是所有的機(jī)器學(xué)習(xí)技術(shù)都可以即插即用。
《大數(shù)據(jù)、機(jī)器學(xué)習(xí)與量化投資》這本書由資深量化分析專家托尼·吉達(dá)主編,匯集了多位業(yè)內(nèi)頗具影響力的專家學(xué)者的前沿分享,闡釋如何應(yīng)用機(jī)器學(xué)習(xí)和大數(shù)據(jù)技術(shù)來解決投資問題并提高投資績效。這本書共有13章,理論嚴(yán)謹(jǐn),案例豐富,內(nèi)容涵蓋機(jī)器學(xué)習(xí)在投資管理中的應(yīng)用現(xiàn)狀和前景、另類數(shù)據(jù)和大數(shù)據(jù)在宏觀交易中的應(yīng)用、處理大數(shù)據(jù)集的難點(diǎn)和解決方案、挖掘社交媒體數(shù)據(jù)集分析企業(yè)文化、使用自然語言處理技術(shù)進(jìn)行投資者情緒分析、基于支持向量回歸的全球戰(zhàn)術(shù)性資產(chǎn)配置策略、強(qiáng)化學(xué)習(xí)和深度學(xué)習(xí)在投資組合優(yōu)化中的應(yīng)用等主題,可以作為量化投資從業(yè)者、金融算法研究人員、高等院校計(jì)算機(jī)專業(yè)和金融工程專業(yè)的師生以及機(jī)器學(xué)習(xí)愛好者的參考用書。
1.金融領(lǐng)域趨勢。近年來,機(jī)器學(xué)習(xí)和數(shù)據(jù)科學(xué)在投資中發(fā)揮著越來越大的作用。借助機(jī)器學(xué)習(xí)和大數(shù)據(jù),投資經(jīng)理能夠做出以往傳統(tǒng)模型無法實(shí)現(xiàn)的預(yù)測,進(jìn)而做出明智的決策。未來,機(jī)器學(xué)習(xí)技術(shù)和數(shù)據(jù)科學(xué)將成為金融投資領(lǐng)域的新主流。
2.內(nèi)容豐富,案例翔實(shí)。這本書不僅提供微觀方法的理論闡述、案例說明,還有宏觀視角的比較分析、趨勢展望,是量化投資領(lǐng)域稀缺的手冊型書籍。
3.全能作者團(tuán)隊(duì)。匯集來自買方、賣方及量化研究的多位業(yè)內(nèi)頗具影響力的專家學(xué)者的前沿分享,他們從不同方面審視了大數(shù)據(jù)和機(jī)器學(xué)習(xí)技術(shù)在金融投資領(lǐng)域中的應(yīng)用,將為從業(yè)者提供重要參考。
4.硬核譯者團(tuán)隊(duì)。這本書具有極強(qiáng)的專業(yè)性,包含了數(shù)學(xué)、計(jì)算機(jī)、金融投資等領(lǐng)域的專業(yè)內(nèi)容,來自國際國內(nèi)名校的畢業(yè)生和量化投資領(lǐng)域的專家組成的譯者團(tuán)隊(duì)和譯校團(tuán)隊(duì),對這本書做了精益求精的翻譯,力求為從業(yè)者和愛好者提供良好的閱讀體驗(yàn)。
量化投資是一種利用數(shù)學(xué)模型和計(jì)算機(jī)技術(shù)來進(jìn)行投資決策的方法。自20世紀(jì)中葉以來,經(jīng)過數(shù)十年來的探索,海外量化投資行業(yè)已在成熟市場中積累了豐富的實(shí)踐經(jīng)驗(yàn)。量化投資的歷史可以追溯到20世紀(jì)50年代,當(dāng)時(shí)一些先驅(qū)者開始嘗試用統(tǒng)計(jì)學(xué)和概率論來分析金融市場。*早的量化投資者之一是哈里·馬克維茨,他在1952年提出了現(xiàn)代投資組合理論,為量化投資奠定了重要的理論基礎(chǔ)。此后,1969年愛德華·索普推出首只量化基金,1988年詹姆斯·西蒙斯推出文藝復(fù)興大獎(jiǎng)?wù)禄,在成?0年來取得年化70%的驚人收益,1991年彼得·穆勒開發(fā)出Alpha系統(tǒng)策略,首次以計(jì)算機(jī)與金融數(shù)據(jù)結(jié)合的方法構(gòu)建投資組合。此后,股票多空、宏觀對沖、統(tǒng)計(jì)套利、事件驅(qū)動(dòng)、高頻交易、多因子等策略不斷發(fā)展涌現(xiàn),同時(shí)與傳統(tǒng)的主觀基本面投研結(jié)合,共同構(gòu)成了海外市場投資生態(tài)。目前,美國量化基金的交易規(guī)模已經(jīng)占到美股總交易量的70%左右。
與此同時(shí),我國量化投資行業(yè)在*近十幾年時(shí)間里也經(jīng)歷了蓬勃的發(fā)展。2010年開始,我國量化投資發(fā)展進(jìn)入快車道,量化投資機(jī)構(gòu)和產(chǎn)品數(shù)量大幅增加,涉及的市場和策略也更加多樣化,包括債券、基金、外匯、商品等,以及多因子、機(jī)器學(xué)習(xí)、人工智能等。2015年后,我國量化投資繼續(xù)不斷創(chuàng)新,量化投資機(jī)構(gòu)和產(chǎn)品不斷優(yōu)化和升級,利用大數(shù)據(jù)、云計(jì)算、區(qū)塊鏈等新技術(shù)來提高投資效率和風(fēng)險(xiǎn)管理能力。截至2023年一季度末,我國公募量化基金總規(guī)模已經(jīng)超過2 000億元,而私募量化基金的規(guī)模已經(jīng)突破1萬億元,其中不乏一些投資回報(bào)優(yōu)異穩(wěn)健的公司。但縱向?qū)Ρ,量化占公募基金總?guī)模仍不足1%,私募量化基金規(guī)模增長速度放緩;橫向?qū)Ρ,我國量化投資行業(yè)無論在規(guī)模上還是在技術(shù)發(fā)展上與海外仍然存在較大的差距。如何讓量化投資更適應(yīng)A股市場,如何讓量化策略更適應(yīng)波動(dòng)性更大的宏觀環(huán)境,如何打開量化的黑箱,增強(qiáng)其結(jié)果的穩(wěn)健性與可解釋性,都是需要在實(shí)踐之中思考的關(guān)鍵議題。
量化投資行業(yè)的發(fā)展,主要源于數(shù)據(jù)端和方法端的雙重驅(qū)動(dòng)。對數(shù)據(jù)端而言,除了*廣泛使用的量價(jià)數(shù)據(jù)外,基本面財(cái)務(wù)數(shù)據(jù)、宏觀指標(biāo)數(shù)據(jù)在應(yīng)用中也發(fā)揮越來越大的作用,各種另類數(shù)據(jù)也變得更加可用、更加高頻,并且出現(xiàn)了標(biāo)志著行業(yè)成熟化的專業(yè)數(shù)據(jù)供應(yīng)商,投資者得以從海量數(shù)據(jù)中掘金Alpha;對于方法端而言,隨著算力的提升和理論的發(fā)展,機(jī)器學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)等新技術(shù)被逐漸應(yīng)用于量化投資領(lǐng)域,為金融煉金術(shù)提供了先進(jìn)手段。此外,市場的環(huán)境和規(guī)則、投資者的需求和偏好也在不斷動(dòng)態(tài)進(jìn)化,對其進(jìn)化趨勢的理解變得十分重要。這些綜合因素相互作用,共同推動(dòng)了量化投資行業(yè)的創(chuàng)新和變革,同時(shí)帶來了機(jī)遇和挑戰(zhàn)。
本書是一本關(guān)于大數(shù)據(jù)與機(jī)器學(xué)習(xí)方法如何應(yīng)用于量化投資領(lǐng)域的*新著作,凝聚了以托尼·吉達(dá)為首的若干量化投資專家的重要研究成果與一線實(shí)踐經(jīng)驗(yàn),不僅有微觀方法的理論闡述、案例說明,還有宏觀視角的比較分析、趨勢展望,是量化投資領(lǐng)域稀缺的手冊型書籍。
本書具有極強(qiáng)的專業(yè)性,包含了很多來自數(shù)學(xué)、計(jì)算機(jī)、金融投資領(lǐng)域的專業(yè)術(shù)語,在譯者團(tuán)隊(duì)的努力下,終于完成了本書的翻譯工作。徐照宜、薛揚(yáng)榮、陳宇翔負(fù)責(zé)全書翻譯工作的整體統(tǒng)籌把控,周康林、李劍雄、崔鼎茗負(fù)責(zé)完成全書專業(yè)性的審核以及專業(yè)術(shù)語索引系統(tǒng)的建立,其他譯者負(fù)責(zé)完成部分章節(jié)的初稿翻譯與校對工作。
特別鳴謝清華大學(xué)全球私募股權(quán)研究院首席專家、證監(jiān)會(huì)市場監(jiān)管二部原副主任、一級巡視員、湖南大學(xué)金融與統(tǒng)計(jì)學(xué)院劉健鈞教授從金融市場的角度為本書提供指導(dǎo)建議并作推薦語;特別鳴謝中國國家創(chuàng)新與發(fā)展戰(zhàn)略研究會(huì)副會(huì)長、中國科學(xué)院大學(xué)經(jīng)濟(jì)與管理學(xué)院呂本富教授從數(shù)字經(jīng)濟(jì)的角度為本書提供指導(dǎo)建議并作推薦語。
特別鳴謝乾象投資創(chuàng)始合伙人兼首席技術(shù)官鮮染先生、中信證券研究部高級副總裁丁奇先生、分享通信創(chuàng)始人兼董事會(huì)主席蔣志祥先生從量化投資的一線實(shí)踐與產(chǎn)業(yè)應(yīng)用的視角為本書提供了寶貴建議和傾情推薦。
特別感謝清華大學(xué)產(chǎn)業(yè)創(chuàng)新與金融研究院、清華大學(xué)新百年發(fā)展基金、北京大學(xué)對沖基金協(xié)會(huì)、北京大學(xué)金融校友聯(lián)合會(huì)、西南財(cái)經(jīng)大學(xué)金融投資協(xié)會(huì)對本書翻譯與研討工作的大力支持。
此外,張聞凡、朱震、徐皓鈳、郭仲星、胡展暢、侯承鈺、盧波、汪慧潔、楊天鳴參與了本書的閱讀與校正工作,高孝森、劉書涵、劉明鑫、趙菁雨、朱良盛、陳欣然、張?jiān)脐俊钜院、沈良翰、楊天凱參與了本書的宣傳與推廣工作,在此一并感謝。
*后,衷心感謝中信出版社編輯團(tuán)隊(duì)對本書精心負(fù)責(zé)的排版校對工作,若沒有大家精益求精的協(xié)同合作,本書的中文版本不可能如此順利地與讀者們見面。
由于譯者水平有限,譯文難免出現(xiàn)瑕疵,還望讀者朋友批評指正,多多包涵,也歡迎與譯者團(tuán)隊(duì)進(jìn)行探討。希望本書能為國內(nèi)量化投資領(lǐng)域的從業(yè)者帶來有益參考價(jià)值,共同推動(dòng)我國量化投資行業(yè)邁向更美好的明天。
精彩文摘 (摘自第1章 算法能構(gòu)建出
托尼·吉達(dá),倫敦一家老牌養(yǎng)老基金的資深量化投資基金經(jīng)理,負(fù)責(zé)管理多因子股票投資組合。在此之前,曾在EDHEC RISK Scientific Beta 擔(dān)任高級顧問,負(fù)責(zé)聰明貝塔和風(fēng)險(xiǎn)配置,就如何構(gòu)建和配置風(fēng)險(xiǎn)溢價(jià)向資產(chǎn)所有者提供專業(yè)建議。在加入EDHEC之前,他在UNIGESTION工作了8年,擔(dān)任高級研究分析師。他曾是Minimum Variance Strategies研究和投資委員會(huì)的成員,負(fù)責(zé)領(lǐng)導(dǎo)機(jī)構(gòu)客戶因子投資研究小組。他擁有法國薩沃伊大學(xué)計(jì)量經(jīng)濟(jì)學(xué)和金融學(xué)學(xué)士和碩士學(xué)位。曾多次發(fā)表關(guān)于量化投資現(xiàn)代方法的演講,并多次舉辦關(guān)于機(jī)器學(xué)習(xí)應(yīng)用于量化投資的研討會(huì)。
第1章 算法能構(gòu)建出具有人類智慧的alpha嗎
1.1導(dǎo)讀
1.2重復(fù)或是重塑
1.3用機(jī)器學(xué)習(xí)重塑投資
1.4信任問題
1.5經(jīng)濟(jì)存在主義∶一項(xiàng)宏大設(shè)計(jì)抑或一次偶然事件
1.6這一系統(tǒng)究竟是什么
1.7動(dòng)態(tài)預(yù)測與新方法論
1.8基本面因子、預(yù)測與機(jī)器學(xué)習(xí)
1.9結(jié)論:尋找投資中的釘子
第2章 駕馭大數(shù)據(jù)
2.1導(dǎo)讀
2.2使用另類數(shù)據(jù)的驅(qū)動(dòng)因素
2.3另類數(shù)據(jù)類型、形式與范圍
2.4如何判斷哪些另類數(shù)據(jù)有用
2.5另類數(shù)據(jù)需要多少成本
2.6案例研究
2.7使用另類數(shù)據(jù)的明顯趨勢
2.8結(jié)論
第3章 機(jī)器學(xué)習(xí)在投資管理中的應(yīng)用現(xiàn)狀
3.1導(dǎo)讀
3.2數(shù)據(jù)無處不在
3.3人工智能應(yīng)用圖譜
3.4行業(yè)間的相互聯(lián)系和人工智能的實(shí)施推動(dòng)者
3.5行業(yè)發(fā)展前景
3.6關(guān)于未來
3.7結(jié)論
第4章 在投資過程中使用另類數(shù)據(jù)
4.1導(dǎo)讀
4.2量化浩劫:激勵(lì)人們尋找另類數(shù)據(jù)
4.3利用好另類數(shù)據(jù)爆炸帶來的好處
4.4選擇要進(jìn)行評估的數(shù)據(jù)源
4.5評估技術(shù)
4.6基本面基金管理者與另類數(shù)據(jù)
4.7若干例證
4.8結(jié)論
第5章 使用另類數(shù)據(jù)和大數(shù)據(jù)交易宏觀資產(chǎn)
5.1導(dǎo)讀
5.2理解大數(shù)據(jù)和另類數(shù)據(jù)的一般概念
5.3傳統(tǒng)建模方法與機(jī)器學(xué)習(xí)
5.4大數(shù)據(jù)和另類數(shù)據(jù):在宏觀交易中的廣泛使用
5.5案例研究:使用大數(shù)據(jù)和另類數(shù)據(jù)深入挖掘宏觀交易
5.6結(jié)論
第6章 大即為美,從電子郵件收據(jù)數(shù)據(jù)預(yù)測公司銷售額
6.1導(dǎo)讀
6.2Quandl的電子郵件收據(jù)數(shù)據(jù)庫
6.3大數(shù)據(jù)工作中的挑戰(zhàn)
6.4預(yù)測公司銷售額
6.5實(shí)時(shí)預(yù)測
6.6案例研究:亞馬遜銷售案例
第7章 將集成學(xué)習(xí)應(yīng)用于量化股票:多因子框架中的梯度提升算法
7.1導(dǎo)讀
7.2提升樹入門
7.3數(shù)據(jù)和方案
7.4建立模型
7.5結(jié)果和討論
7.6結(jié)論
第8章 企業(yè)文化的社交媒體分析
8.1導(dǎo)讀
8.2文獻(xiàn)綜述
8.3數(shù)據(jù)與樣本構(gòu)建
8.4推斷企業(yè)文化
8.5檢驗(yàn)結(jié)果
8.6結(jié)論
第9章 能源期貨交易的機(jī)器學(xué)習(xí)與事件檢測
9.1導(dǎo)讀
9.2數(shù)據(jù)說明
9.3模型框架
9.4表現(xiàn)
9.5結(jié)論
第10章 財(cái)經(jīng)新聞中的自然語言處理
10.1導(dǎo)讀
10.2新聞數(shù)據(jù)來源
10.3實(shí)際應(yīng)用
10.4自然語言處理
10.5數(shù)據(jù)及方法論
10.6結(jié)論
第11章 基于支持向量機(jī)的全球戰(zhàn)術(shù)性資產(chǎn)配置
11.1導(dǎo)讀
11.2過去50年的全球戰(zhàn)術(shù)性資產(chǎn)配置
11.3經(jīng)濟(jì)學(xué)文獻(xiàn)中的支持向量機(jī)
11.4基于支持向量回歸的全球戰(zhàn)術(shù)性資產(chǎn)配置策略
11.5結(jié)論
第12章 金融中的強(qiáng)化學(xué)習(xí)
12.1導(dǎo)讀
12.2馬爾科夫決策過程:決策的一般框架
12.3理性及決策的不確定性
12.4均值-方差的等價(jià)性
12.5回報(bào)
12.6組合價(jià)值與財(cái)富
12.7具體案例
12.8結(jié)論與進(jìn)一步的工作
第13章 金融深度學(xué)習(xí),基于LSTM網(wǎng)絡(luò)的股票收益預(yù)測
13.1導(dǎo)讀
13.2相關(guān)工作
13.3金融市場的時(shí)間序列分析
13.4深度學(xué)習(xí)
13.5循環(huán)神經(jīng)網(wǎng)絡(luò)
13.6長短期記憶網(wǎng)絡(luò)
13.7金融模型
13.8結(jié)論
附錄
參考文獻(xiàn)
譯者簡介