甲斐です。
ちょっと前の話題ですが、Googleが開発したAlphaGOという囲碁のソフトがトップレベルの棋士を破るという歴史的な事件がありました。
ここでブレイクスルーとなった技術はニューラルネットワークといって、人間の脳神経系の働きをコンピュータ上でシミュレートしたものの発展形です。
コンピュータが高度な知性を獲得していく過程が見られるこの時代はスリリングかと思います。
その歴史的な試合の翌週に電気通信大学でコンピュータ囲碁の大会が開かれました。
おそらくコンピュータ囲碁の大会としては世界最大の大会です。
実はKAIも開発メンバーとして参加しているチームが参加しておりまして、まぁ2勝5敗と客観的な成績は悪かったのですが、開発の進捗状況から言うと出来過ぎなくらいでした。
さて、このコンピュータ囲碁の世界では、モンテカルロ木探索という技術が主流で、おそらくAlphaGOもニューラルネットワークと併用して使っていると思うのですが、これに一つ面白い性質があります。
囲碁は相手よりも多くの土地を囲んだら勝ちというゲームなので、土地を沢山囲うようにプログラムするのが普通だと思います。
しかし、それよりも、勝つか負けるかだけを評価するようにした方が良い結果が出るんですね。
勝つなら100半目勝ちでも半目勝ちでも同じ価値、負けも何目負けかは気にしない、そういうソフトの方が強いんですね。
これってまさにゴールの発想と同じで過程は関係ないんですよ。