UE4.26 に新規追加されたUE4MLを試す

機械学習 Unreal Engine

どうも、モリカトロン株式会社でプログラマおじさんを営んでいる岡島です。先日正式リリースされた Unreal Engine 4.26.0 に UE4ML という機械学習関係っぽい名前のプラグインが追加されたという情報を見つけたので、早速試してみました。 UE4ML はブログ執…

2020-12-07

自動微分+XLA付き機械学習フレームワークJAXを使用してMNISTを学習させてみる

機械学習 Python JAX

こんにちは、エンジニアの竹内です。深層学習を行う際によく利用されるフレームワークといえばGoogleが開発しているTensorflowとFacebookが開発しているPytorchの２大巨頭に加えて、Kerasなどが挙げられるかと思いますが、今回はそのような選択肢の一つとし…

2020-10-28

CEDEC2020 質疑応答

CEDEC2020 強化学習機械学習

こんにちは、モリカトロンでプログラマをやっています。馬淵です。先日発表させていただいたCEDEC2020ですが、講演時でのコメントやアンケートが届いたため、今回はそれらに寄せられた質疑応答を私が代表してここに書かせていただきます。発表時のスライド…

2020-10-12

【GAIL】逆強化学習とGANを組み合わせた模倣学習アルゴリズムを実装してみる【CartPole】

機械学習強化学習 GAIL Python

こんにちは、エンジニアの竹内です。以前の記事でDQNに模倣学習の仕組みを取り入れたDeep Q-Learning from Demonstrationsというアルゴリズムを紹介しましたが、模倣学習には他にもいろいろなアプローチが存在します。特にエキスパートの行動軌跡から環境の…

2020-10-06

CEDEC2020の補足ー格闘ゲーム編その2ー

CEDEC2020 機械学習強化学習

どうも、モリカトロンのプログラミングおじさん、岡島です。馬淵の記事で予告された通り、今回は僕から用意した環境ではUE4の描画を切ることが出来ず(その辺りの話は岡島さんが書いてくれると思います) の部分について補足説明をします。 UE4とPythonを通…

2020-09-18

CEDEC2020の補足ー格闘ゲーム編その1ー

CEDEC2020 NEAT Python 強化学習機械学習

お久しぶりです。モリカトロンでエンジニアをやっております、馬淵です。前回私がブログを書いたのがNEATに関して書いたとき*1(2020年2月24日)で、これを書き始めているのが2020年9月8日なので、私がブログを書くのは実に6ヶ月強ぶりになります。何故これ…

2020-06-29

【Tensorflow2】強化学習アルゴリズムPPOを実装してみる【CartPole】

Python 強化学習機械学習

どうもこんにちは。エンジニアの竹内です。強化学習、とりわけ方策や価値関数をニューラルネットによって近似する深層強化学習と呼ばれるものにはDQNを始めとして実に様々な手法が存在します。今回はその中でもDQNと並んで割とポピュラーなProximal Policy…

2020-04-15

【DQfD】人間のプレイを参考にして学習する強化学習アルゴリズムを実装してみる【後半】

DQfD 機械学習強化学習 OSS

はじめに Montezuma's Revengeについて実装学習の大枠 10ステップ分の状態遷移を保存リプレイバッファの改造 Atariラッパーの追加デモの作成損失関数の導入実験結果まとめ References はじめにこんにちは。モリカトロンでエンジニアをやっている竹…

2020-03-11

【DQfD】人間のプレイを参考にして学習する強化学習アルゴリズムを実装してみる【前半】

機械学習強化学習 DQfD

はじめに前提とする知識 DQfDとは解説デモンストレーションからのサンプル損失関数の追加事前学習その他まとめ参考文献はじめにこんにちは。モリカトロンでエンジニアをやっている竹内です。ゲーム×AIと聞いてまず最初に思い浮かぶのは、やはり囲…

2020-02-26

NEATでCartPole問題を解く

機械学習 NN NEAT GA

はじめまして。モリカトロン株式会社でAIの研究をしている馬淵です。最近ですが、ニューラルネットと遺伝的アルゴリズム(以下GA)を組み合わせた Neuro Evolution of Augmenting Topologies(以下NEAT)という手法で OpenAI gymのCartPole問題を解いていたので…

Morikatron Engineer Blog

モリカトロン開発者ブログ

機械学習