AlphaGo対李世乭 (アルファご・たい・イ・セドル)は、韓国 のプロ棋士 である李世乭 と、Google DeepMind が開発したコンピュータ囲碁 プログラムAlphaGo の五番勝負である。
対局はコミ 7目半の中国ルール で、持ち時間は2時間で、切れると1手1分の秒読み 、ただし1分単位で合計3回の考慮時間がある[ 1] 。
勝者(勝ち越し者)は100万米ドル の賞金を得る。もしAlphaGoが勝利すれば、賞金はUNICEF を含むチャリティーへ寄付される[ 2] 。賞金に加えて、李世乭は全5戦の対局料として15万米ドル、1勝につき2万米ドルを得る[ 1] 。
概要
囲碁は長い間、AI の分野における難問と見なされており、チェス や将棋 でコンピュータがプロ相手に勝利を収めているなか、2015年の時点でもプロ棋士の棋力には遠く及ばず、AlphaGo以外の囲碁プログラムは3子のハンディキャップを貰った置き碁 でも勝ったことがなかった。しかし2015年10月、AlphaGo はヨーロッパ碁コングレス で優勝経験のあるプロ棋士である樊麾 と非公開の五番勝負を行い、5勝0敗で破っていた。
そして2016年、今度はトッププロ棋士との対局を企画されたのがこの対戦である。
対局の模様は中国語、日本語、朝鮮語、英語の解説付きでライブ配信された。朝鮮語の配信はBaduk TVを通じて行われた[ 3] 。英語のオンライン配信はマイケル・レドモンド とアメリカ囲碁協会 副会長のChris Garlockによって行われ、平均視聴者は8万人、第1局の終局近くには視聴者が10万人に達し、古力 と柯潔 が解説を行った中国語での第1局の配信はテンセント とLeEco によって提供され、視聴者は約6千万人 に達する[ 4] など大いに注目を集めた[ 5] 。
この対局は1997年に行われたディープ・ブルーとガルリ・カスパロフ との間の歴史的なチェス 対局と比較されている。
対局者
AlphaGo はGoogle DeepMindによって開発された、囲碁 を打つためのコンピュータプログラムである。AlphaGoのアルゴリズムは機械学習 とモンテカルロ木探索 の組み合わせを用いており、人間の棋譜による教師あり学習 と、自己対戦による強化の組み合わせで成り立っている。まずAlphaGoは、ネット対局場 のKGS の6段以上のアマ高段者の棋譜約16万局、約3000万手を教師にして[ 6] [ 7] 人間の打つ手を模倣できるように訓練され[ 8] 、実際に打たれた手を57%の確率で模倣できるようになった[ 9] 。次に旧バージョンのAlphaGo自身と考慮時間が極端に短い対局を繰り返す強化学習 を行った[ 10] 。その結果、他の囲碁プログラムと500戦し499勝を収めるまでの棋力に至った[ 9] 。
李との対局に使用されるAlphaGoのバージョンは、樊麾との対局と同等のコンピュータパワー(1,202 CPU 、176 GPU )を使う[ 11] 。システムは着手の「データベース」は活用しない。AlphaGoの作成者の一人は次のように説明した[ 12] 。
我々はAlphaGoに囲碁を打つようプログラムしたが、どんな手を思い付くのかは全く分からない。AlphaGoの手は訓練からの
創発 現象である。我々は単にデータセットと訓練アルゴリズムを作成しただけだ。しかし、AlphaGoが思い付く手は我々の手を離れており — そして碁打ちとして我々が思い付くものよりもずっと優れている。
李世乭(2012年) 李世乭 は韓国棋院 に所属する[ 13] 。1996年に12歳でプロに昇段し、それ以降に18回の世界王者となっている[ 14] 。李は出身の韓国において「国民的英雄」と呼ばれており、型にはまらない創造的なプレーでも知られている[ 15] 。李世乭は当初AlphaGoを「大勝」で破るだろうと予測した[ 15] 。対局の数週間前、李は韓国の名人戦 で勝利した[ 15] 。
ルール
対局は五番勝負で行われ、賞金は100万米ドルである[ 2] 。中国ルールでコミは7目半。持ち時間は2時間で切れると1手1分の秒読み、ただし1分単位で合計3回の考慮時間がある[ 1] 。対局は3月9日から15日までの1週間で行われ、13時(日本・韓国標準時)から始まる[ 16] 。
対局
この対局は韓国ソウル のフォーシーズンズホテル で2016年 3月に行われ、ライブでストリーミング配信される[ 17] [ 18] [ 19] 。DeepMindチームのメンバーでアマチュア6段の黄士傑 がAlphaGoの代わりに盤面に着手する。AlphaGoはアメリカ合衆国に位置するサーバを使ったGoogleのクラウドコンピューティングによって動作する[ 20] 。
概要
対局
日付
黒番
白番
結果
手数
第1局
2016年3月9日
李世乭
AlphaGo
AlphaGo中押し勝ち
186
第2局
2016年3月10日
AlphaGo
李世乭
AlphaGo中押し勝ち
211
第3局
2016年3月12日
李世乭
AlphaGo
AlphaGo中押し勝ち
176
第4局
2016年3月13日
AlphaGo
李世乭
李世乭中押し勝ち
180
第5局
2016年3月15日
李世乭
AlphaGo
AlphaGo中押し勝ち
280
結果: AlphaGo 4 – 1 李世乭
第1局
AlphaGo(白)が第1局を勝利した。李は一局の大半を通して主導権を握っているように見えたが、AlphaGoが最後の20分に優位に立ち、李が投了した[ 21] 。李は終局後に、序盤に大きなミスを犯したと述べた。李は、序盤におけるコンピュータの戦略は「卓越」しており、AlphaGoは人間の棋士なら打たないような手を打ったと述べた[ 21] 。GoGameGuruでこの対局を解説したDavid Ormerodは、李の黒7を「序盤でAlphaGoの実力を試す奇妙な手」と説明した。この手を疑問手と見なし、AlphaGoの応手を「正確かつ効果的」と見なした。Ormerodは序盤はAlphaGoがリードし、李は黒81から挽回を始めたが、黒119と黒123が疑問手であり、黒129が敗着になったと説明した[ 22] 。韓国棋院の趙漢乗 は、AlphaGoの打ち回しは2015年10月に樊麾を破った時よりも大きく改善されていたと論評した[ 22] 。プロ囲碁棋士マイケル・レドモンド は、コンピュータの打ち方は樊との対局時よりも積極的であったと述べた[ 23] 。
金成龍 によれば、李世乭は102手目のAlphaGoの強手に驚かされたようである[ 24] (この手の後に李は10分以上長考した)[ 24] 。
第2局
AlphaGo(黒)が第2局に勝利した。李は対局後に、「AlphaGoはほぼ完璧な碁を打った」[ 25] 、「序盤から自分がリードしたと一度も感じなかった」と述べた[ 26] 。
AlphaGoの作成者の一人デミス・ハサビス は、解説者がどちらが優勢か判断できなかったゲームの中盤からAlphaGoが勝利を確信していたと述べた[ 26] 。AlphaGoの打った37手目、四線の石に対する肩ツキ はそれまでの囲碁の常識にはなかった手で、見守っていた人々を驚愕させ、「新たなパラダイムを示した」と評された[ 27] 。韓国棋院の安永吉 (英語版 ) は、特にAlphaGoの黒151、157、159を賞賛した[ 28] 。
黒167は李に紛れを求めるチャンスを与えたようにも見え、ほとんどの解説者は悪手だと断言した。しかし、のちにこの手も多少の損の代わりに勝利を確実なものにするための正しい判断だったと考えられるようになった[ 28] 。
第3局
AlphaGo(白)が第3局に勝利した[ 29] 。
第2局の後、棋士の間では、AlphaGoの真の実力について、まだ強い疑いがあった。第3局ではこの疑いが晴れた。Ormerodは以下のように論評した。
AlphaGoは、経験を積んだ棋士たちが抱くその強さに対する疑いを全て晴らすように、文句の付けようのない形で勝利した。AlphaGoは恐ろしさを覚えるほど非常にうまく打ちまわした ... 李はAlphaGoに非常に厳しく一方的な攻めを見せたが、結果的にこれまで気付かれていなかったAlphaGoの真の力を明らかにしてしまった ... 李は攻めによる得を得ることができなかった ... 最高の中盤戦の名人である彼が、はっきり明確にお株を奪われたのだ
[ 30] 。
安永吉とOrmerodは、この一局は「AlphaGoが全ての人間の棋士よりも単純に強い」[ 30] ことを示したとした。AlphaGoは今までの2局では現れなかった、コンピュータには判断が難しいとされてきたコウ でもミスは犯さなかった[ 31] 。安とOrmerodは、白148が特に注目に値すると考えた。複雑なコウ争いが起きているなか、AlphaGoはコウ争いに勝てると自信を見せ、上辺の大場に先着したのである[ 30] 。
黒番の李は高中国流 を採用したが、AlphaGoは白12と黒の大模様に打ち込んでいった。李としてはこの白を厳しく攻めて得を図りたいところだったが、AlphaGoに簡単にサバかれてしまった[ 30] 。安は李の黒31が敗着であった可能性が高いとしており[ 30] 、アメリカ囲碁協会 のAndy Jacksonは勝敗が黒35の時点で既に決していたと判断した[ 32] 。AlphaGoは白48から碁の主導権を握り、李は守勢を余儀無くさせた。李は黒77・79と反撃したが、AlphaGoは白90まで局面を簡明にすることに成功した。AlphaGoは下辺に大きな地模様を作り、白102から112まで、右辺や左上の白石の強化に回った。安は一連の進行を「洗練されている」と表現した[ 30] 。李は黒115から下辺の白地を荒らしに行ったが、AlphaGoは適切に対応した。黒131から複雑なコウを仕掛けたが、AlphaGoのミスを誘うことはできず、176手目に投了した[ 30] 。
100-176手目(122手目は113の位置、 154手目は 、 163手目は145、164手目は151、 166手目と171手目は160、169手目は145、 175手目は )
第4局
第4局は李(白)が勝利した。DeepMindのデミス・ハサビスは、AlphaGoは79手目にミスをし、その時点では勝率が70%と見積っていたが、87手目に、その推定値が突如急落したとしている[ 33] [ 34] 。Ormerodは87手目から101手目を典型的なモンテカルロベースのプログラムのミスと述べた[ 35] 。
李は、AlphaGoが「相場碁」(小さな得を積み重ねて勝ちを目指す碁)を好んでいるようであることから、アマシ 作戦を選択し、足早に辺や隅に地を取った[ 35] 。駆け引きに強いAlphaGoであるが、「生きるか死ぬか」の局面に誘導することで、AlphaGoのわずかな得を重ねる力がほとんど無意味になる可能性があると李は考えた[ 35] 。李は辺や隅に地を取ることに集中し、AlphaGoが中央に模様を張る展開となった。李は白40から46と上辺のAlphaGoの模様を荒らしに行った。AlphaGoは黒47とカタツキ で応じると、右辺の白と上辺の白をカラミ攻めにする構想を見せ、4子を捨て石にして黒69と上辺の白を制したかに見えた。李は白72から76としたがAlphaGoは適切に対応し、この時点で解説者らは李の打ち回しが勝ち目のないものだと感じ始めていた。しかし、「素晴らしい手筋 」と表現された、白78のワリコミ と82の強手によって、完全に形勢が逆転した[ 35] 。この手により、中央の白の一団は簡単には取られない石になり、難解な碁になった[ 36] 。しかし局後、78のワリコミに対し黒が正しく応手すれば手にならないことが判明した。実戦はワリコミが候補手になかったことでAlphagoは変化を読み切れず、最善を尽くせなかった結果の逆転となった。
黒83・85は適切だったが、黒87から101にかけてAlphaGoは大悪手を連発した。李は白92と中央に手をつけた時点で優勢となり、安は黒105を決定的な敗着とした。小ヨセに入った段階で、AlphaGoは逆転が不可能であると判断し投了した[ 35] 。これは、逆転の見込みが無いときには投了するべきだという人間の価値観に見合うよう、AlphaGoが勝率が20%未満であると判断した場合投了するよう設定されていたためである[ 36] 。
中国棋院 の古力 は、白78を「神の一手」と形容し、この手は全く想像していなかったと述べた[ 35] 。安も、この一局が「李世乭にとっての傑作であり、囲碁の歴史における名局となることはほぼ確実だろう」と称賛した[ 35] 。日本棋院 の井山裕太 も「勝てない相手ではないこと、人間が上回っている部分があることを証明してくれた。セドル九段に敬意を表したい」と李を称えた[ 37] 。李は試合後に、AlphaGoは白番の時が最も強かったと考えていると述べた[ 38] 。
Ormerodは、黒79から87までのAlphaGoの打ち方のまだ分析できていないが、モンテカルロ木探索を用いたアルゴリズムにおける既知の弱点によるものと考えている。モンテカルロ木探索では、重要ではないと判断された局面の木は刈り取られるようになる。そのため、ほぼ一本道の変化がある局面において、その変化の読みを省略してしまう危険があった[ 39] 。
100から180手目(177手目は 、178手目は )
第5局
AlphaGo(白)が第5局に勝利した[ 40] 。この一局は接戦だったと評された。ハサビスは、ゲームの序盤にAlphaGoが「大きな失敗」をしでかした後に追い上げたものであると述べている[ 40] 。
第5局の手番は新たにニギリを行って決するはずであったが、第4局終了後に李が「AlphaGoは白番の方が黒番より強い。強い白番相手に打ちたい」と希望し、ハサビスが即座にこれを快諾したため、李の黒番で行われた。黒番の李は第4局同様に地で先行する戦略を取り、AlphaGoは中央に大きな勢力を得た。形勢はそれまで互角であったが、 AlphaGoが右下において石塔シボリ の手筋 を読み落として白48から58としたことで、李が主導権を握ることになった。しかし、 AlphaGoは代償に中央から上辺に模様を広げ、李の黒69から81までの荒らしに対し黒を小さく生かすことに成功した。Ormerodは、この黒の一連の動きが慎重すぎたと指摘した。白90でAlphaGoは形勢を互角に戻し、Ormerodが「珍しいが、微妙に印象的である」と評した、わずかに得な手を打った。地合いで不利な李は黒167・169と仕掛けるもAlphaGoは冷静に対処した。AlphaGoは完璧なヨセで優勢を維持し[ 41] 、AlphaGoの中押し勝ちとなった。安は、終盤の白154、186、194と特に良い手だと指摘した。
100-199手目(118手目は107の位置、161手目は )
200-280手目(240手目は200の位置、271手目は 、 275手目は 、276手目は )
背景
数学者のI・J・グッド は1965年に以下のように記している[ 42] 。1965年の時点では、まだ初心者程度に囲碁を打てるプログラムすら存在しなかった。
コンピュータの碁においては– 単にルールを守った碁というより、理にかなった碁を打つようにコンピュータをプログラムするためには – 戦略の原理を形式化する、あるいは学習プログラムを設計する必要がある。囲碁の原理はチェスよりも質的かつ神秘的であり、判断力により依存する。したがって、理にかなった碁を打つようコンピュータをプログラムすることは、チェスの場合よりもさらにいっそう難しいだろうと私は考える
[ 43] 。
2015年まで、9路盤 では一部のプログラムがプロ棋士に対して勝利できるだけの力を備えていたが、19路盤ではプロ棋士に太刀打ちできていなかった[ 44] 。人工知能 の分野における多くの人々も、囲碁はチェス よりも人間の思考を模倣するためにより多くの要素を必要とすると考えていた[ 45] 。
AlphaGoはそれ以前のAIの取り組みとはニューラルネットワークを応用している点において最も大きく異なっている。ニューラルネットワークでは、評価経験則が人間によってハードコード されておらず、代わりにプログラム自身によって自分自身との対局を数千万回繰り返すことによってかなりの程度まで学ぶ。AlphaGoの開発チームでさえ、AlphaGoがどのように石の配置を評価し次の手を選択しているかを指摘することはできない。モンテカルロ木探索 もAlphaGoの推論効率を改善するための主要な方法として用いられている。
コンピュータ囲碁研究の結果は、認知科学 、パターン認識 、機械学習 といったその他の同様の分野に応用されている[ 46] 。
備考
第20回三星火災杯世界囲碁マスターズ 開催後、囲碁人口の減少による広報効果の減落により存続の危機に立たされていた。しかしこのAlphaGoの対局により韓国国民の囲碁に対する関心が復活し存続が決定。しかも「夢の木選抜戦」というアマチュアの予選まで追加した[ 47] 。
関連項目
脚注
^ a b c “이세돌 vs 알파고, ‘구글 딥마인드 챌린지 매치’ 기자회견 열려 ” (Korean). 韓国棋院 (22 February 2016). 22 February 2016 閲覧。
^ a b “Human champion certain he'll beat AI at ancient Chinese game ”. AP News (22 February 2016). 22 February 2016 閲覧。
^ http://www.tvbaduk.com/
^ “The Sadness and Beauty of Watching Google’s AI Play Go ”. WIRED (11 March 2016). 12 March 2016 閲覧。
^ “Künstliche Intelligenz: "Alpha Go spielt wie eine Göttin" - Golem.de ”. 2016年3月15日 閲覧。
^ 1975-, 大槻 知史 三宅 陽一郎, (2018.7). 最強囲碁AIアルファ碁解体新書 : 深層学習、モンテカルロ木探索、強化学習から見たその仕組み . Shōeisha. ISBN 9784798157771 . OCLC 1057382206 . http://worldcat.org/oclc/1057382206
^ しばしば「プロの棋譜を用いた」などとされることがあるが、KGSのプレイヤーはほとんどがアマチュアであり、正確ではない。
^ Metz, Cade (2016年1月27日). “In Major AI Breakthrough, Google System Secretly Beats Top Player at the Ancient Game of Go ” (英語). WIRED . 2016年2月1日 閲覧。
^ a b “AlphaGo: マシンラーニングで囲碁を ”. Google Japan Blog . 2018年12月22日 閲覧。
^ “Research Blog: AlphaGo: Mastering the ancient game of Go with Machine Learning ”. Google Research Blog (27 January 2016). 2016年3月11日 閲覧。
^ Demis Hassabis [@demishassabis] (2016年3月11日). "We are using roughly same amount of compute power as in Fan Hui match: distributing search over further machines has diminishing returns" . X(旧Twitter) より2016年3月14日閲覧 。
^ “Google’s AI Wins Pivotal Second Game in Match With Go Grandmaster ”. WIRED (10 March 2016). 12 March 2016 閲覧。
^ Lee SeDol . gobase.org. accessed 22 June 2010.
^ http://www.shanghaidaily.com/article/article_xinhua.aspx?id=322918
^ a b c Mark Zastrow. “'I'm in shock!' How an AI beat the world's best human at Go - New Scientist ”. New Scientist . 2016年3月11日 閲覧。
^ “AlphaGo ”. Google DeepMind. 10 March 2016 閲覧。
^ “Google’s AI AlphaGo to take on world No 1 Lee Se-dol in live broadcast ”. The Guardian (5 February 2016). 15 February 2016 閲覧。
^ “Google DeepMind is going to take on the world's best Go player in a luxury 5-star hotel in South Korea ”. Business Insider (22 February 2016). 23 February 2016 閲覧。
^ Novet, Jordan (2016年2月4日). “YouTube will livestream Google’s AI playing Go superstar Lee Sedol in March ”. VentureBeat . 2016年3月11日 閲覧。
^ “李世乭:即使Alpha Go得到升级也一样能赢 ” (Chinese). JoongAng Ilbo (23 February 2016). 24 February 2016 閲覧。
^ a b “Google's AI beats world Go champion in first of five matches” . BBC. (9 March 2016). http://www.bbc.co.uk/news/technology-35761246 9 March 2016 閲覧。
^ a b “AlphaGo defeats Lee Sedol in first game of historic man vs machine match ”. Go Game Guru (9 March 2016). 9 March 2016 閲覧。
^ Tanguy Chouard (9 March 2016). “The Go Files: AI computer wins first match against master Go player” . Nature . doi :10.1038/nature.2016.19544 . http://www.nature.com/news/the-go-files-ai-computer-wins-first-match-against-master-go-player-1.19544 .
^ a b “Surprised at his loss, Lee Se-dol says he’s looking forward to another chance ”. 2016年3月11日 閲覧。
^ “Google AI wins second Go game against world champion” . BBC. (10 March 2016). http://www.bbc.co.uk/news/technology-35771705 2016年3月10日 閲覧。
^ a b Sam Byford (10 March 2016). “Google's DeepMind beats Lee Se-dol again to go 2-0 up in historic Go series ”. The Verge . Vox Media. 2016年3月11日 閲覧。
^ 「人工知能は碁盤の夢を見るか? アルファ碁VS李世乭」 p.78 東京創元社
^ a b David Ormerdo (2016年3月10日). “AlphaGo races ahead 2–0 against Lee Sedol ”. Go Game Guru . 2016年3月11日 閲覧。
^ “Artificial intelligence: Google's AlphaGo beats Go master Lee Se-dol” . BBC. (12 March 2016). http://www.bbc.co.uk/news/technology-35785875 12 March 2016 閲覧。
^ a b c d e f g David Ormerod (12 March 2016). “AlphaGo shows its true strength in 3rd victory against Lee Sedol ”. Go Game Guru. 12 March 2016 閲覧。
^ Sam Byford (12 March 2016). “AlphaGo beats Lee Se-dol again to take Google DeepMind Challenge series ”. The Verge . Vox Media. 12 March 2016 閲覧。
^ Tanguy Chouard (12 March 2016). “The Go Files: AI computer clinches victory against Go champion” . Nature . doi :10.1038/nature.2016.19553 . http://www.nature.com/news/the-go-files-ai-computer-clinches-victory-against-go-champion-1.19553 .
^ Demis Hassabis. “Twitter post (12:09 a.m. – 13 Mar 2016) ”. 13 March 2016 閲覧。
^ Demis Hassabis. “Twitter post (12:36 a.m. – 13 Mar 2016) ”. 13 March 2016 閲覧。
^ a b c d e f g David Ormerod (13 March 2016). “Lee Sedol defeats AlphaGo in masterful comeback – Game 4 ”. Go Game Guru. 13 March 2016 閲覧。
^ a b Cade Metz (13 March 2016). “Go Grandmaster Lee Sedol Grabs Consolation Win Against Google's AI ”. Wired.com . 14 March 2016 閲覧。
^ “グーグル囲碁AI「4勝1敗」は人類の敗北か。プロ棋士から見た勝負の評価 ”. ニュースイッチ . 2018年12月22日 閲覧。
^ Lee Sedol in Google DeepMind Challenge Match 4 post-match press conference (13 March 2016)
^ https://gogameguru.com/lee-sedol-defeats-alphago-masterful-comeback-game-4/
^ a b Byford, Sam (15 March 2016). “Google's AlphaGo AI beats Lee Se-dol again to win Go series 4-1 ”. The Verge . 15 March 2016 閲覧。
^ Ormerod, David (16 March 2016), AlphaGo defeats Lee Sedol 4–1 in Google DeepMind Challenge Match , Go Game Guru, https://gogameguru.com/alphago-defeats-lee-sedol-4-1/ 16 March 2016 閲覧。
^ I. J. Good (1965年1月21日). “The Mystery of Go ”. New Scientist . 2016年3月11日 閲覧。
^ Go on a computer – In order to programme a computer to play a reasonable game of Go, rather than merely a legal game – it is necessary to formalise the principles of good strategy, or to design a learning programme. The principles are more qualitative and mysterious than in chess, and depend more on judgment. So I think it will be even more difficult to programme a computer to play a reasonable game of Go than of chess.
^ 日本棋院 が協力する電聖戦 では4子から3子のハンディキャップを付けていた
^ Johnson, George (1997-07-29), “To Test a Powerful Computer, Play an Ancient Game” , The New York Times , https://www.nytimes.com/1997/07/29/science/to-test-a-powerful-computer-play-an-ancient-game.html 2008年6月16日 閲覧。
^ Müller, Martin. Computer Go , Artificial Intelligence 134 (2002): p150
^ 【三星杯】'AlphaGo'が生かしたサムスン火災囲碁大会 nitro15