DQN

1/5ページ

TensorFlowでDQNを実装(したかった・・・)

下記のような記事を読み、DQN(Deep Q-Network)って面白そうだな~と感心。最近話題のAlpha-GoもDQNの延長・・・なのかな?(よく分かってない) DQNの生い立ち + Deep Q-NetworkをChainerで書いた 倒立振子で学ぶ DQN (Deep Q Network) Chainerで機械学習と戯れる: 足し算ゲームをChainerを使って強化学習できるか? そんなわけで、TensorFlowで実装してみよ […]

オセロ〜「実装 ディープラーニング」の三目並べより(2)

概要 前回の続き、コードの説明を行いたいと思います。 前回はこちらです。 オセロ~「実装 ディープラーニング」の三目並べより(1) http://qiita.com/Kumapapa2012/items/cb89d73782ddda618c99 後続の記事はこちら。 オセロ~「実装 ディープラーニング」の三目並べより(3) http://qiita.com/Kumapapa2012/items/3cc20a75c745dc91e826 […]

Deep Q-Networkの概要

はじめに 本日はDeep Q-Network(通称、DQN)について、既に結構詳しく説明した記事とかもあるようなので、エッセンスだけを抑えた簡単な概要を書こうと思います。 DQNとは、Deep learningとReinforcement learningを”うまく”組み合わせて、センサーの入力などの高次元の入力に既存の強化学習を適用させる技術です。 作者も論文内で幾度も強調している通り、単にそれらを組み合わせただけでなく、工夫して組み […]

Model-Free Episodic Controlモデルで学習させてみる

過去11回でパソコンを自作した後に、Ubuntu14.04、CUDA、cuDNN、chainer、dqn、LIS、Tensorflow、OpenAIGymを順次インストールし、いくつかモデルを走らせた。特に前回はPseudo-countを学習させるべく進めたが、dependenciesのインストールにおいてopencv3がうまくインストールできず、挫折している。 http://qiita.com/masataka46/items/cad […]

DQN(Deep Q Network)を理解したので、Gopherくんの図を使って説明

概要 強化学習のDQN(Deep Q-Network)について理解したので、ゆるくGopherくんを使って説明を試みました。 DQNは人間を打ち負かしたAlphaGoでも使われています。 強化学習は書籍もネットの記事も難解なものが多いので、なるべく図で具体的に記載しました。 強化学習とは ある状態における最適な行動を学習する、機械学習の手法の一つ。 モデル化 ゴーファーくんがケーキを食べるために、最適な行動を学習することを例に考えてみま […]

【強化学習】UnityとPythonを使ってDQNアルゴリズム実装してみた

前置き Pythonには科学計算をするため様々なライブラリやフレームワークが揃っており、強化学習をやるのにとても便利です。 しかし、強化学習をするためにはアルゴリズムの実装だけでなく、行動するエージェントや、変化する環境などのゲーム部分も実装していく必要があります。 残念ながら、Pythonはそういったゲーム部分を実装するのはとても面倒です。 一方で、Unityは初心者でもわりとクオリティの高いゲームを作れる環境が整っています。 なので […]

TMLSメモ

下記に行ってきました。 http://www.meetup.com/tokyomachinelearning/events/227883055/ 備忘のためメモを残します。 挨拶 DeepLearningやベイジアンモデルについても話していきたい、とのこと 次回は3月くらいに実施する、とのこと Groovenautsさん Groovenauts. Inc googleのクラウド上でサービス提供している 本発表ではgoogleのサービスや […]

【深層強化学習】『2018年最強手法(?)』Ape-X 実装・解説

Keras + TensorFlow で Ape-X を実装しました。 コードはgithubにあげてあります。 https://github.com/utarumo/rl_implementation/blob/master/apex_atari.py 強化学習の知識として、 DQNまでは知っているとわかりやすいと思います。 DQNまでの勉強では以下のサイトが非常に参考になります。 ・ゼロからDeepまで学ぶ強化学習 ・強化学習について […]

1 5