 |
 |
 |
[ 移動ロボットへの行動発現チップの実装と自己組織的行動 獲得の検証 ] |
 |
 |
サブプロジェクトリーダー:石川 |
|
 |
|
 |
 |
価値および好奇心に基づく移動ロボットの脳型行動創発 |
(1) |
サブプロジェクトの概要
行動獲得サブプロジェクトは、何をすべきかを教えなくても行動できる、真に自律的なロボットの構築を目的としています。学習や発達に寄与する重要な要因として、生存価値、特殊的好奇心、拡散的好奇心、新奇性を取り上げます。これらの内部報酬は出来るだけタスク依存性の小さなモデル化を行います。内部報酬と外部報酬をあわせ用い、捕食動物および獲物が存在するロボットフィールドでの強化学習実験を、シミュレーション及び実機ロボットを用いて行います。
ここではバッテリー水準をあるレベル以上に保つことを生存価値と考え、バッテリー水準が閾値以上の場合に捕食動物は好奇心及び新奇性に基づいて環境を効率的に学習し、閾値以下の場合には獲物を追跡・捕獲します。これにより、内部報酬や外部報酬を反映する知的な行動を創発させます。脳や発達に着想を得、ロボットを用いた行動創発アプローチが従来法による性能を凌駕することを実証する。
|
 |
(2) |
構成メンバーと役割分担
理論・モデル分野の石川眞澄、永松正博、章宏、デバイス分野の山川烈、ロボット分野の石井和男、神経科学分野の中川秀樹という分野横断的体制を採り、理論・モデル分野の研究員及び大学院生の萩原隆男、山本尚幸、桐明芙三子、西田武彦がシミュレーション及び実機実験を担当した。
|
 |
(3) |
主要な成果
 |
図1.生存価値を内部報酬とする強化学習により求めた行動価値関数 |
 |
図2.捕獲までの行動回数、Case 1:追跡者のみ学習し獲物は反対方向に逃げる。Case 2:追跡者のみ学習し獲物はランダム方向に逃げる。Case 3:双方が学習。 |
|
 |
 |
 |
図3.ロボットフィールド、 赤:ロボット、 青:移動障害物 |
 |
図4.ポテンシャル図 |
 |
図5.提案法による占有グリッド地図 |
 |
図6.従来法による占有グリッド地図 |
|
 |
 |
 |
図7.ロボットフィールド |
 |
図8.新奇性検出例 |
 |
図9.新奇性未検出例 |
|
 |
 |
|
|
 |
研究業績 詳細は、http://www.brain.kyutech.ac.jp/~ishikawa/ 参照 |
[1] |
石川眞澄, 永松正博, 萩原隆男, 山本尚幸, 桐明芙三子, 西田武彦, 山川烈, 石井和男, 中川秀樹, 章宏, 価値および好奇心に基づく移動ロボットの脳型行動創発, 電子情報通信学会総合大会, 2008
|
[2] |
M. A. Muslim, M. Ishikawa, T. Furukawa, Task segmentation in a mobile robot by mnSOM: A new approach to training expert modules, Neural Computing and Applications, Vol.16, Issue 6, pp.571-580, 2007.
|
[3] |
M. A. Muslim, M. Ishikawa, T. Furukawa, Task Segmentation in a Mobile Robot by mnSOM and Clustering with Spatio-temporalContiguity (to appear in ICONIP2007 post-proceedings)
|
[4] |
T. Furukawa, K. Tokunaga, S. Yasui, H. Tamukoh, K. Ishii, M. Ishikawa, K. Horio and K. Natsume, Modular network self-organizing map: Can it be an artificial cortex?, Brain-Inspired IT III, Volume 1301, pp. 43-47, 2007
|
[5] |
M. Ishikawa, K. Ishii, T. Yamakawa, M. Nagamatsu, H. Nakagawa, H. Zhang and T. Furukawa, Brain-inspired emergence of behaviors in mobile robots, Brain-Inspired IT III, Volume 1301, pp. 48-51, 2007.
|
[6] |
M. A. Muslim, M. Ishikawa and T. Furukawa, Training expert modules for a mobile robot using mnSOM, Brain-Inspired IT III, Volume 1301, pp.172-175, 2007.
|
[7] |
F. Linaker, M. Ishikawa, Robot Localization Using Vision, Trends in Neural Computation, pp.483-512, Springer, 2007.
|
[8] |
A. Ahrary, A. Nassiraei, M. Ishikawa, A study of an autonomous mobile robot for sewer inspection system, Artificial Life and Robotics, Vol.11, No.1, pp.23-27, 2007.
|
[9] |
K. Kamei, M. Ishikawa, Dependency of values of parameters in reinforcement learning for navigation of a mobile robot on the environment, Neural Information Processing---Letters and Reviews, Vol.10, Nos.7-9, pp.219-226, 2006.
|
[10] |
石川眞澄, 井出徳隆, 磯村修一, 物品判別方法および物品判別装置ならびにプログラム, 特許第3865316号, 2006.10.13
|
|
|
|