Morikatron Engineer Blog

モリカトロン開発者ブログ

OSS

【DQfD】人間のプレイを参考にして学習する強化学習アルゴリズムを実装してみる【後半】

はじめに Montezuma's Revengeについて 実装 学習の大枠 10ステップ分の状態遷移を保存 リプレイバッファの改造 Atariラッパーの追加 デモの作成 損失関数の導入 実験 結果 まとめ References はじめに こんにちは。モリカトロンでエンジニアをやっている竹…

ガイスターのプログラムを紹介します

こんにちは、モリカトロン株式会社チーフエンジニアの松原です。 今日は、モリカトロンがオープンソースとして公開しているガイスターのプログラムとその周辺情報を紹介します。この記事の対象読者はゲームAIに興味がある人、ボードゲームが好きな人、ガイス…