2020-03-11から1日間の記事一覧

【DQfD】人間のプレイを参考にして学習する強化学習アルゴリズムを実装してみる【前半】

機械学習強化学習 DQfD

はじめに前提とする知識 DQfDとは解説デモンストレーションからのサンプル損失関数の追加事前学習その他まとめ参考文献はじめにこんにちは。モリカトロンでエンジニアをやっている竹内です。ゲーム×AIと聞いてまず最初に思い浮かぶのは、やはり囲…