Update 2024.11.26
DQNの方式と、トランスフォーマーの方式で強化学習する仕組みをつくりあげたが
自己対局だけでは強くはならなかった。
だが、あきらめません。
次はc++で実装することに挑戦します。