蒙地卡羅樹搜尋
From Wikipedia, the free encyclopedia
以教一個人工智能程式捉棋爲例:現實世界入面啲棋類遊戲好多時都複雜得好交關;譬如係圍棋噉,圍棋個棋盤有成 10170 個可能形勢;事實表明,就算用好先進嘅電腦嚟推算形勢,都要嘥極大量嘅時間先至能夠睇勻嗮所有嘅可能性,令到人工智能程式响短嘅時間內俾唔到答案。所以喺實際應用上,靠窮舉式(即係冚唪唥考慮嗮啲可能性再揀個最好嘅選擇)嘅演算法就唔扂[3]。
於是廿一世紀初嘅遊戲人工智能領域當中就有咗 MCTS 嘅諗法。簡單噉講,MCTS 旨在由手上嘅可能性嗰度,有技巧噉揀一細部份可能性出嚟集中睇。用 MCTS 嘅程式會有一啲特定嘅方法嚟決定「邊啲可能性最值得睇」,然之後就集中考慮呢啲可能性,令到部電腦能夠喺相對短嘅時間內俾到個輸出出嚟睇[3]。MCTS 呢個諗法喺 2010 年代後半橛經已成功咁嚌-例如人工智能程式 AlphaGo 就用咗 MCTS,並且喺 2016 年因為打低九段圍棋棋手李世石而出咗名[4][5]。