本稿では、「TensorFlow.js Example:Reinforcement Learning: Cart Pole」で公開されている、「強化学習:カートポール」サンプルをもとに、TensorFlow.jsによる強化学習の方法を探っていきます。
とはいえ、このサンプルは、モデルの保存や読み込み、訓練回数やモデルの隠れ層の数などを変更できる機能を備えているので、非常に複雑です。そこで、以降では、モデルの保存や読み込み、カスタマイズ機能などを取り払った、できるだけシンプルなものにしています。