2020-06-29から1日間の記事一覧

【Tensorflow2】強化学習アルゴリズムPPOを実装してみる【CartPole】

Python 強化学習機械学習

どうもこんにちは。エンジニアの竹内です。強化学習、とりわけ方策や価値関数をニューラルネットによって近似する深層強化学習と呼ばれるものにはDQNを始めとして実に様々な手法が存在します。今回はその中でもDQNと並んで割とポピュラーなProximal Policy…