dwangoのlisで遊んでみる

dwangoのlisで遊んでみるディープラーニングと強化学習を組み合わせたプロジェクトということで、以前から興味を持っていたのですが、Unityを使うということで心理的な壁がありなかなか手をつけられずにいました。年末年始のお休み中ということでやってみようと思います。

準備

READMEにある通り。Macなので、リポジトリをクローンして、

$ git clone git@github.com:wbap/lis.git

必要なものをインストールして、

$ pip install -r python-agent/requirements.txt

データを持ってきます。これ40分くらいかかりました。

$ ./fetch.sh

サーバーを動かします。

$ cd python-agent
$ python server.py

Unityを起動して、 unity-sample-environment をOpenしました。おそらく、プロジェクトファイルがないというようなアラートが出ましたが、そのまま、進んだらプロジェクトが起動しました(Unity初心者)。

Unity 5 5 0f3 Personal 64bit sample unity unity sample environment PC Mac Linux Standalone Personal OpenGL 4 1

この状態で、数分待ちました。

動き出す

なんか、変な視点で動き出しました!

Dec 29 2016 01 54 52

なにやら、緑の箱にぶつかると報酬を得られる様子。そして、最初は避けていたのに、どんどん自分から当たっていく?

視点変えられた。こんなんなったー。なんか可愛い。

Dec 29 2016 02 01 19

報酬履歴を見る

$ cd python-agent
$ python plot_reward_log.py

これで見れると思ったら、下記のエラーが出ました。

$ python plot_reward_log.py
Traceback (most recent call last):
  File "plot_reward_log.py", line 1, in 
    import matplotlib.pyplot as plt
ImportError: No module named matplotlib.pyplot

エラーで検索して、matplotlibをインストール。

$ pip install matplotlib

次はこれ。

Traceback (most recent call last):
  File "plot_reward_log.py", line 2, in 
    import pandas as pd
ImportError: No module named pandas
$ pip install pandas

再度、実行してみました。

Figure 1 and python agent Python plot reward log py 134×54 and dwangoのlisで遊んでみる and MarsEdit and Pythonで機械学習するための環境を構築してみた MacOS X Qiita

でました〜。やった。まだ回数が少ないながらも、少しずつrewardが獲得できるようになっている?

ということで、lis動かせて楽しかった😁

その後…

数時間起動して、LISの動きを見て見たら、ちゃんと緑のブロックにあたりに行ってる!

Figure 1 and python agent Python plot reward log py 134×54 and イーロン マスク氏が関わるOpenAIの人工知能プラットフォーム Universe を動かしてみる

うれしかった…。

参考

Pocket
LINEで送る

You may also like...