コンピューター将棋の世界で「呪いの装備」と呼ばれている戦い方がある。最強の攻め駒「飛車」を、中央から左側に動かして戦う「振り飛車」だ。飛車を振っただけでAIによる評価値はマイナスに傾くため、飛車を初期配置のままで戦う「居飛車」が戦いの主流を占める。

 だが、振り飛車は本当に不利なのだろうか?

 そんなはずはないと、振り飛車の可能性を追求し、現状の潮流に抗うAIがある。

 振り飛車特化型AIの中で最強と認められている「HoneyWaffle(ハニーワッフル)」だ。

第5回電竜戦で飛車を振って戦うハニーワッフル。1秒間に1億5千万局面を読む=2024年11月30日、東京都渋谷区、杉村和将撮影

 昨年11月30日~12月1日に開催された「第5回世界将棋AI電竜戦」では、32チームが参加した予選を突破してトップ10入りし、決勝リーグに勝ち進んだ。最終結果は9位だったが、随所で振り飛車の強さを印象づける戦いを見せた。

 なぜ振り飛車で戦うのか。

 ハニーワッフルを開発した都内在住のITエンジニア・渡辺光彦さん(43)に聞いた。

 ――ハニーワッフルにはどんな特徴があるのでしょうか

 まず、将棋AIは「探索部」「評価関数」「定跡」の大きく三つの要素から構成されています。

 指し手を先の先まで読むのが「探索部」、形勢を判断する基準が「評価関数」、ある局面における指し手の候補を蓄積したデータベースのようなものが「定跡」です。

 今回のハニーワッフルは、他の開発者がつくって公開している探索部と評価関数を有料で使わせて頂いていて、個性と言えるのは、定跡の部分になります。

 将棋AIの世界では振り飛車は評価されませんので、AIが自動的に指し手を選ぶとすれば、振り飛車が現れることはまずありません。そこでハニーワッフルの場合、定跡によって、最初から振り飛車の手を指すように設定しています。

――定跡とはどのようなものなのですか

 将棋AI同士が対戦するインターネットのサイトがあり、そこでハニーワッフルに何局も対局させています。勝った将棋の指し方は基本的にそのまま定跡として蓄積し、負けた将棋の場合は指し手を改良して、修正した手順を定跡としてファイルに反映させています。

 ハニーワッフルでは先手と後手で合わせて約60万局面が定跡として登録されています。勝ちやすい手を積み重ねたものなので、攻めが好きとか守りが得意といった棋風のようなものはありません。

――そもそも、渡辺さんが将棋AIに振り飛車を指させるのはどうしてですか

 私が将棋AIに関心を持ったのは、AIとプロ棋士が対戦した企画「電王戦」(2010~17年)がきっかけです。電王戦で活躍したAIのプログラムが公開されたため、それを参考にしながら最初の1年は全て自作する「フルスクラッチ」で個人的に始めました。

 しかし自作では強さの面では到底及ばなかったため、公開されているものを使わせて頂いています。ただ、そのまま使うのでは他の開発者の努力にただ乗りしているだけですので、何か個性を持たせられないかと、振り飛車で戦うことにしました。

 私自身が「観る将(観る将棋ファン)」として、振り飛車が好きということもあります。

――振り飛車のどこが好きですか

 振り飛車の将棋は芸術点が高いというか、爽快感があるんです。

 例えば、ある局面で歩を突くと、飛車と角の道が両方一気に開き、駒が躍動する。感触のいい手を指すときに「指がしなる」という言葉がありますが、まさにそんな感覚です。プロの将棋も振り飛車党の先生の将棋を観戦するのが大好きです。

東京の旧将棋会館の前で笑顔を見せる渡辺光彦さん。持っているのは振り飛車党の大家・藤井猛九段の扇子=2024年11月30日、東京都渋谷区、杉村和将撮影

――定跡には、プロ棋士の棋譜も取り入れているのでしょうか

 いえ、一切入っていません。

 コンピューター将棋の世界では、学習には膨大な棋譜が必要だとされています。 AI同士の対戦で日々生み出される量と比べると、プロの棋譜は少なすぎます。

 また、AIに学習させるには評価値が必要ですが、プロの棋譜には評価値がないため、学習が難しいという理由もあります。それ以前に、そもそもプロの棋譜の一部にしかアクセスできません。

 ハニーワッフルの定跡は、結果としてプロの棋譜と合流するものもあると思いますが、地続きではありません。

 プロの戦法を学ばせて、AIの力で伸ばすというようなこともしたくないです。その戦法を人生を懸けてつくり出した棋士に対して失礼ですし、逆に万が一、その戦法で敗れた場合、その戦法が弱かったということにもなりかねません。そんなことは絶対にできないという思いがあります。

――AIの世界で振り飛車はなぜ評価が低いのでしょうか

 難しいところで、理由がはっきりしていません。推測ですが、飛車を動かす一手を手損とみてマイナスに見ているという説や、初期配置の時点で相手の弱点である角頭に飛車がロックオンしているのに、その飛車をあえて角頭から外すのがマイナスになるという説などがあります。

 AI同士の対局では、互いに局面をどう評価しているのか読み筋や評価値が見えるのですが、こちらが飛車を振る手を指した瞬間、相手の評価値が150~200程度下がります。一般的には、歩1枚の価値が100点程度とされています。

――その数字をどう判断していますか

 飛車を動かすだけで評価がマイナスになるのですから、振り飛車は、コンピューター将棋の世界で「呪いの装備」と言われることがあります。

オレンジはハニーワッフル、ブルーは対戦相手が示す評価値グラフ。ハニーワッフルが飛車を振った直後から、対戦相手の評価値だけがマイナスに傾いている

 でも本当にそうなのか。私は、この最初のマイナス評価を、理不尽な数字と疑っています。

 最初はマイナスでも、戦いが…

共有
Exit mobile version