關(guān)于我們
書單推薦
新書推薦

Python深度強(qiáng)化學(xué)習(xí)——使用PyTorch, TensorFlow 和OpenAI Gym

Python深度強(qiáng)化學(xué)習(xí)——使用PyTorch, TensorFlow 和OpenAI Gym

定  價(jià):69 元

叢書名:電子信息前沿技術(shù)叢書

        

  • 作者:[印]尼米什·桑吉(Nimish Sanghi)著,羅俊海 譯
  • 出版時(shí)間:2022/10/1
  • ISBN:9787302607724
  • 出 版 社:清華大學(xué)出版社
  • 中圖法分類:TP311.561 
  • 頁碼:244
  • 紙張:
  • 版次:1
  • 開本:
9
7
6
8
0
7
7
3
7
0
2
2
4
本書重點(diǎn)突出深度強(qiáng)化學(xué)習(xí)理論的基本概念、前沿基礎(chǔ)理論和Python應(yīng)用實(shí)現(xiàn)。首先介紹馬爾可夫決策、基于模型的算法、無模型方法、動(dòng)態(tài)規(guī)劃、蒙特卡洛和函數(shù)逼近等基礎(chǔ)知識(shí);然后詳細(xì)闡述強(qiáng)化學(xué)習(xí)、深度強(qiáng)化學(xué)習(xí)、多智能體強(qiáng)化學(xué)習(xí)等算法,及其Python應(yīng)用實(shí)現(xiàn)。本書既闡述獎(jiǎng)勵(lì)、價(jià)值函數(shù)、模型和策略等重要概念和基礎(chǔ)知識(shí),又介紹深度強(qiáng)化學(xué)習(xí)理論的前沿研究和熱點(diǎn)方向。本書英文版出版之后,廣受好評(píng),已成為深度強(qiáng)化學(xué)習(xí)領(lǐng)域暢銷教材,也可為人工智能和機(jī)器學(xué)習(xí)等領(lǐng)域的科研工作者、技術(shù)工程師提供參考。
 你還可能感興趣
 我要評(píng)論
您的姓名   驗(yàn)證碼: 圖片看不清?點(diǎn)擊重新得到驗(yàn)證碼
留言內(nèi)容