Morikatron Engineer Blog

モリカトロン開発者ブログ

OSS

【DQfD】人間のプレイを参考にして学習する強化学習アルゴリズムを実装してみる【後半】

DQfD 機械学習強化学習 OSS

はじめに Montezuma's Revengeについて実装学習の大枠 10ステップ分の状態遷移を保存リプレイバッファの改造 Atariラッパーの追加デモの作成損失関数の導入実験結果まとめ References はじめにこんにちは。モリカトロンでエンジニアをやっている竹…

ガイスターのプログラムを紹介します

OSS ボードゲーム Python

こんにちは、モリカトロン株式会社チーフエンジニアの松原です。今日は、モリカトロンがオープンソースとして公開しているガイスターのプログラムとその周辺情報を紹介します。この記事の対象読者はゲームAIに興味がある人、ボードゲームが好きな人、ガイス…