将棋AIの開発8

既存プログラムを用いて、pythonで、機械学習させることはできた。

次は自己対局させ強化学習していくことに挑戦する。

数学的な理論は後からかも。

少しの歩幅になるがいったんは前進。

欲張らず進んでいこうと思う。

自己対局と強化学習だが、これは策と調査が必要だ。

まず材料として、機械学習部分はある。

これをどうやって、組み合わせて、回していくかだ。

しかし、よく考えてみると自己対局部分がない。

さらに考えてみるとランダムにさして、勝った棋譜をよしとして、それを積み上げて学ばせていくしかないのかも。

もしかすると数学的なところから入っていくしかないかもしれない。

調査は続く。