はじめに Montezuma's Revengeについて 実装 学習の大枠 10ステップ分の状態遷移を保存 リプレイバッファの改造 Atariラッパーの追加 デモの作成 損失関数の導入 実験 結果 まとめ References はじめに こんにちは。モリカトロンでエンジニアをやっている竹…
こんにちは、モリカトロン株式会社チーフエンジニアの松原です。 今日は、モリカトロンがオープンソースとして公開しているガイスターのプログラムとその周辺情報を紹介します。この記事の対象読者はゲームAIに興味がある人、ボードゲームが好きな人、ガイス…
引用をストックしました
引用するにはまずログインしてください
引用をストックできませんでした。再度お試しください
限定公開記事のため引用できません。