Googleのチェス・将棋AI「AlphaZero」、わずか24時間の自己学習で最強AIを上回る


世界最強の囲碁AI「AlphaGo Zero」を開発したDeepMind(Google関連会社)が、チェスと将棋のAIに関する論文を発表しました。AlphaGo Zeroと同様の手法を使い、24時間で既存の最強AIを超える実力に至ったとのこと。

AlphaGoは2017年5月、世界トップ棋士である中国の柯潔(かけつ)九段に3戦全勝した囲碁AI。もともと人間同士の棋譜(対局データ)を学習させていましたが、進化したAlphaGo Zeroでは人間の棋譜を用いず、AIによる自己対戦のみで強くする「強化学習」が用いられました。

今回の論文では、AlphaGo Zeroで用いられた手法を「AlphaZero」という名称で一般化し、チェスと将棋にも適用。24時間の学習の結果、チェスでは既存の最強AIとして知られる「Stockfish」相手に100戦して28勝0敗72引き分け、将棋でも同じく最強AIである「elmo」相手に90勝8敗2引き分けという戦績を残しました。 (抜粋)

0