taiwanren.cc - 最全的電商商品價格比較,價格查詢,歷史價格查詢站點
首页
深度強化式學習 F1384
搜索
前一张
下一张
深度強化式學習 F1384 價格比較,價格查詢,價格歷史信息
價格 $
900.0
點擊這裡查看商品
facebook
linkedin
mastodon
messenger
pinterest
reddit
telegram
twitter
viber
vkontakte
whatsapp
複製鏈接
深度強化式學習 F1384 歷史價格(單位:新台幣)
描述
深度強化式學習 (Deep Reinforcement Learning, DRL),就是將深度學習與強化式學習結合的技術。要讓 AI 應用落地,DRL 是必不可缺的技術。近期由兩位劍橋大學博士所帶領的 Wayve 團隊就利用了 DRL 技術,開發出可以自行從新環境中學習的自動駕駛技術,取代以往完全仰賴感測器的做法。除此之外,工廠內的自動化機器人, 或是打敗世界棋王的 AlphaGo 等,背後運作的演算法也都與 DRL 息息相關。 然而 DRL 的演算法五花八門,讓人看了眼花繚亂。事實上,它們都是為了應付各式各樣的任務而發展出來的改良版本,其核心概念的差異不大,都是立足於 DRL 最基本的 DQN (Deep Q-Network) 之上。因此本書會花費較多的篇幅,一步步帶您把 DQN 的架構完全摸透,並時時提點各個技術細節的重點,讓您可以因應不同的任務或問題,加入適當的技術或技巧來克服,再進一步實作出各種進階的演算法。 本書一共分成兩篇:基礎篇及進階篇。在基礎篇中,讀者將學習如何從無到有,建構出自己的第一個RL演算法,並用該演算法來解決多臂拉霸機問題。接著,讀者會認識RL中較為經典的演算法,如DQN、策略梯度法、A2C等。同時,各章節皆搭配數個專案,確保讀者可以在學習理論的過程中,培養實作出演算法的能力,不再只是紙上談兵。 在進階篇中,作者將會介紹較為新穎,也較為複雜的RL演算法。基本上,這些演算法都是以DQN為出發點,再加上特殊的技巧,便能處理現實中的難題。舉個例子,利用平均場DQN,學者們成功模擬出了電子的自旋狀況,進而解決了RL中的多代理人問題。同時,讀者們還將學到如何將attention機制與DQN做結合,進而實作出關聯性DQN(relational DQN),提高演算法的可解釋性。 本書提供了完整的學習架構,循序漸進地介紹各種演算法,包括: ● Deep Q-Network (DQN) ● 策略梯度法(Policy gradient methods) ● 優勢值演員-評論家(Advantage Actor-Critic, A2C) ● 分散式優勢值演員-評論家(Distributional Advantage Actor-Critic, DA2C) ● 進化演算法(Evolutionary algorithm) ● 分散式DQN(Distributional DQN) ● 鄰近Q-Learning(Neighborhood Q-Learning) ● 平均場Q-Learning(Mean field Q-Learning) ● 關聯性DQN(Relational DQN) 除了 RL 相關演算法之外,書中也介紹了近期應用 RL 而發展出來的熱門模型,相信可以提升讀者的硬實力,其中包括: ● 圖神經網路(Graph Neural Network, GNN) ● Transformer模型 ● Attention模型(Attention model) 總的來說,本書是最全面、最白話的強化式學習演算法實戰解析。只要您有基本的深度學習知識,並且想要認識強化式學習領域,那麼您就是本書在尋找的合適讀者! 本書特色: ●囊括各種強化式學習的基礎及進階演算法,學習架構完整 ●適當地補充數學及統計基礎,必要知識直接回顧,不用東翻西找其他資源 ●重點整理深度強化式學習的基本架構,打好基礎、再先進的改良模型也看得懂 ●以日常案例來實踐 DRL,理解起來事半功倍 ●利用Python+PyTorch實作各章專案,不會只是紙上談兵 ●所有程式皆已整理成Colab筆記本,一鍵即可檢驗結果 ●本書由施威銘研究室監修,內容易讀易懂,並加入大量「編註」與「小編補充」以幫助理解及補充必要知識。 作者簡介: Alex Zai 曾任 Codesmith 的首席技術長(Codesmith 為沉浸式 coding bootcamp,Alex 至今仍在其中擔任技術顧問)、Uber 的程式設計師、以及 Banjo 和 Amazon 的機器學習工程師。他同時也是開源深度學習架構Apache MXNet 的貢獻者之一。Alex Zai 還是一名創立了兩間公司的企業家,其中一間為 Y-combinator 的子公司。 Brandon Brown 自幼學習程式設計、並在大學時期兼職當軟體工程師,但最後他選擇進入了醫學行業。目前,他仍在醫療科技領域從事軟體工程工作。Brandon 目前是一名醫生,並從事與計算精神醫學(computational psychiatry,該領域即是受 DRL 啟發)有關的研究。 目錄: 第一篇:基礎篇 第1章:強化式學習的基本觀念 第2章:模型化強化式學習問題:馬可夫決策過程 第3章:Deep Q-Network 第4章:利用『策略梯度法』選擇最佳策略 第5章:演員-評論家模型與分散式訓練 第二篇:進階篇 第6章:進化演算法 第7章:分散式DQN 第8章:培養代理人的好奇心 第9章:多代理人的環境 第10章:具解釋性的模型:attention與關聯性模型 第11章:回顧與學習規劃 第A章:數學、深度學習及PyTorch之額外知識補充
商品選項
屬性
用戶評測
分享鏈接
facebook
linkedin
mastodon
messenger
pinterest
reddit
telegram
twitter
viber
vkontakte
whatsapp
複製鏈接
相關商品
深度強化式學習 F1384
【大享】 深度強化式學習 9789863126522 旗標 F1384 1000
深度強化式學習 【金石堂】
《度度鳥》深度強化式學習│旗標科技│Alexander Zai、Brandon Brown│全新│定價:1000元
精靈寶可夢 寶可夢集換式卡牌遊戲 POKEMON PTCG 劍 盾 迷途深淵 強化擴充包 中文版 1包5張 台中恐龍電玩
強化版軟式珪藻土吸水地墊60x40cm-歲月深紫
華泰 安全帽 K-F8 按扣式強化V鏡 抗UV400 透明 淺茶色 深茶色 電鍍 三扣 強化 鏡片
華泰 安全帽 K-F8 按扣式強化V鏡 抗UV400 透明 淺茶色 深茶色 電鍍 三扣 強化 鏡片
EvoShield PRO-SRZ 2.0 強化型 雙黏式 打擊護肘 萬磁王必備 (WB5726503L)深藍
《THISTLE》角蛋白結構式深層護髮霜【250ml】(深層修護/強化保濕)
立坽『加強式深層護髮』喜徠化粧品公司貨 Framesi雲緹佛媚絲 媚力 彩色年代護色修護霜500ml IH04 IH05
深度強化型 120mm PVC水管 帶電電線探測 牆體異物 牆體探測器
書 【電腦 0 】深度強化學習圖解
【正版新書】深度強化學習--算法原理與金融實踐入門
【正版新書】深度強化學習理論與實踐
【正版新書】Python深度強化學習——使用PyTorch, TensorFlow 和OpenAI Gym
【正版新書】深度強化學習(王樹森、黎彧君聯合導師北大張志華作品)(圖靈出品)
【正版新書】深度強化學習圖解
2【電腦2023】深度強化學習理論與實踐
2【電腦2023】深度強化學習實戰
PW2【電腦】深度強化學習落地指南
PW2【電腦】深度強化學習實踐(原書第2版)
PW2【電腦】深度強化學習核心算法與應用
2【電腦2022】深度強化學習圖解
2【電腦2022】深度強化學習(王樹森、黎彧君聯合導師北大張誌華作品)(圖靈出品)
新一代AI霸主:深度強化學習從基礎開始到專案開發
【大享】實戰人工智慧之深度強化學習|使用PyTorch x Python9789865021900碁峰ACD017700
《度度鳥》新一代AI霸主:深度強化學習從基礎開始到專案開發│深智數位│董豪/丁子涵/仉尚航│定價:980元
【大享】 一代AI霸主:深度強化學習從基礎開始到專案開發 9789860776829 深智 DM2208 980
【大享】 動手做深度強化學習 9789864344307 博碩 MP11812 690
2【電腦2022】Python深度強化學習——使用PyTorch, TensorFlow 和OpenAI Gym
益大資訊~實戰人工智慧之深度強化學習|使用 PyTorch x Python ISBN:9789865021900
2【電腦2023】邊做邊學深度強化學習:PyTorch程序設計實踐
利器五金 地下金屬探測器 2公尺 液晶顯示 螢幕 探測深度強化金屬探測 探寶器 金銀銅鐵 地下金屬探測器 UMD200A
工仔人 地下金屬探地雷達 金屬探測儀 金屬探測機 金屬探測器 深度強化 200公分 MET-UMD200A
2【電腦2023】機器學習在算法交易中的應用(第2版)人工智能叢書 動手學深度學習強化學習 深入淺出python算法交
Previous
Next
服務條款
聯繫我們
關於我們
隱私政策
© 2026 www.taiwanren.cc All Rights Reserved. 最全的電商商品價格比較,價格查詢,歷史價格查詢站點 版權
价格列表1
价格列表2
价格列表3
价格列表4
价格列表5