AlphaGo的主要工作原理是“深度學習”。“深度學習”是指具有多個層的人工神經網絡以及訓練它的方法。壹層神經網絡會以大量的矩陣數作為輸入,通過非線性激活方法得到權值,然後生成另壹個數據集作為輸出。這就好比生物神經大腦的工作機制。通過適當數量的矩陣和多層組織鏈接在壹起,形成壹個神經網絡“大腦”,進行精確復雜的處理,就像人識別物體、標記圖片壹樣。\ x0d \ x0d \主要包括四部分:\x0d\1。PolicyNetwork,根據當前情況預測/采樣下壹步行動。\x0d\2。Fastrollout,目標和1壹樣,但速度比1快1000倍,適當犧牲棋質。\x0d\3。ValueNetwork,鑒於目前的情況,估計白勝或者黑勝會贏。\x0d\4。montecalotreesearch(MCTS)將以上三部分連接起來,形成壹個完整的系統。\x0d\\x0d\ AlphaGo是通過兩個不同的神經網絡“大腦”的合作來提高下棋水平。這些大腦是多層神經網絡,在結構上與谷歌圖像搜索引擎識別的大腦相似。他們從多層啟發式二維過濾器入手處理圍棋棋盤的定位,就像圖像分類器網絡處理圖片壹樣。過濾後13全連接神經網絡層對看到的情況產生判斷。這些層可以進行分類和邏輯推理。
上一篇:信息技術專業職業規劃書下一篇:銀行卡可以辦什麽業務?