最小行動規範によって生じる確率共鳴

私たちが提案する最小行動規範は,非常に単純で一般的な行動ルールです.ある時刻tにおけるエージェントの行動を定めるn次元の運動指令ベクトルのi番目の要素をuitとし, 時刻t+1における運動指令ベクトルの各要素を

に従って生成するというものです.ここで,Rはランダムな値(例えばホワイトガウシアンノイズ),ηiはi番目の要素に加わるノイズの強さ,ΔAtは時刻tにおいて どの程度エージェントの状態が改善したかを表す量を意味します.つまり,「状態が改善したなら(どの程度かに依らず)前の行動を繰り返し,状態が悪化したなら(どの程度かに依らず)ランダムに行動する」 というルールに,ノイズの影響で全く同じ行動を繰り返すことは出来ないという条件を加えたものと表現できます.

この最小行動規範は,「どの程度改善したか?」という勾配情報を用いないため,一見は評価の勾配に沿った行動ができないように見えますが,実は,ノイズが加わることによって行動には勾配情報が反映される という面白い現象が生じます.この研究では,この現象が確率共鳴と呼ばれる現象に相当する現象であることを数値シミュレーションによって示したほか,そのエージェントが最も高確率でとる行動は, その時刻tにおいて評価を最も向上させる行動(つまり,評価関数の最急勾配方向に移動する行動)に一致することを理論的に証明しました.

Reference

  • Shuhei Ikemoto, Fabio DallaLibera, Koh Hosoda, and Hiroshi Ishiguro, "Minimalistic Behavioral Rule derived from Bacterial Chemotaxis in a Stochastic Resonance Setup", Physical Review E: Statistical, Nonlinear, and Soft Matter Physics, Vol. 85, No. 2, pp. 021905, 2012.
  • Shuhei Ikemoto, Fabio DallaLibera, and Hiroshi Ishiguro, "Stochastic Resonance Emergence from a Minimalistic Behavioral Rule", Journal of Theoretical Biology, Vol. 273, No. 1, pp. 179-187, 2011.

最小行動規範を応用したロボットの適応的行動の生成

最小行動規範は,その単純さゆえに,適用するさいにはロボットのハードウェアや環境に関する情報をほとんど必要としません. よって,動作環境が急激に変化した場合や,ハードウェアが故障して通常の行動がとれなくなった場合などにおいても, その状態・時刻において最も評価を向上させる行動が最も高確率で選択されるという特性が失われることがありません. この研究では,車輪移動型ロボットにおいて,タイヤのパンクや車軸の変形といったロボットの故障,ロボットへの制御信号がある頻度でロボットに到達しないといった不具合などを再現し, その場合でも最小行動規範の確率的な特性が失われないことを確認しました.

Reference

  • Fabio DallaLibera, Shuhei Ikemoto, Hiroshi Ishiguro, and Koh Hosoda, "Control of real-world complex robots using a biologically inspired algorithm", Artificial Life and Robotics, Vol. 17, No. 1, pp. 42-46, 2012.
  • Fabio DallaLibera, Shuhei Ikemoto, Takashi Minato, Hiroshi Ishiguro, Emanuele Menegatti and Enrico Pagello, "Biologically inspired mobile robot control robust to hardware failures and sensor noise", RoboCup Symposium 2010.
  • Fabio DallaLibera, Shuhei Ikemoto, Takashi Minato, Hiroshi Ishiguro, Emanuele Menegatti and Enrico Pagello, "A parameterless biologically inspired control algorithm robust to nonlinearities, dead-times and low-pass filtering effects", 2nd International Conference on Simulation, Modeling and Programming for Autonomous Robots, 2010.

複数素子の疑似相関を利用した確率共鳴の最適化

確率共鳴の工学的応用としては,「センサ解像度未満の微小な信号を検出する」という試みが最も広く行われてきました. これらの応用において,確率共鳴を生じさせるためには,その微小な信号の分布に応じた適切な確率分布を持つノイズがシステムに加わる必要があります. しかし,この要求に改めて注目すると,検出したい対象である微小な信号の分布を予め知ることが適切なノイズ強度を求めるのに必要であることが分かります.

私たちは,この確率共鳴の工学的応用における重大な問題の解決に取り組み,その解決策の一つとして,一つの微小な信号に対して確率共鳴によってセンシングを行う素子を複数用意し, その間の相関(疑似相関)を用いてノイズ強度を調節する手法を提案し,シミュレーションと実験によってその妥当性を示しました.

Reference

  • Shuhei Ikemoto, Fabio DallaLibera, Koh Hosoda, and Hiroshi Ishiguro, "Spurious Correlation as an Approximation of the Mutual Information between Redundant Outputs and an Unknown Input", Communications in Nonlinear Science and Numerical Simulation, Vol. 19, No. 10, pp. 3611-3616, 2014.
  • Nagisa Koyama, Shuhei Ikemoto, and Koh Hosoda, "Parameter Tuning in the Application of Stochastic Resonance to Redundant Sensor Systems", Journal of robotics and mechatoronics, Vol. 27, No. 3, pp. 251-258, 2015.

確率共鳴に基づく生物規範型アクチュエータの制御

確率共鳴によるノイズの利用は,一見すると上手く動くように見えないぐらい単純なシステムでも目的を達成できる可能性を広げます. 私たちは多数の収縮・弛緩の2状態しかとれないアクチュエータが集めて一つのアクチュエータとしたヒトの骨格筋のようなアクチュエータの制御に注目し, ノイズを利用すれば同一の閾値による比較演算だけの単純な装置で収縮するアクチュエータの数を連続的に制御できることを示しました.

Reference

  • Shuhei Ikemoto, Yosuke Inoue, Masahiro Shimizu and Koh Hosoda, "Minimalistic decentralized control using stochastic resonance inspired from a skeletal muscle", IEEE/RSJ International Conference on Intelligent Robots and Systems, 2013.
  • Shuhei Ikemoto, Yosuke Inoue, Masahiro Shimizu and Koh Hosoda, "Minimalistic decentralized modelling for a skeletal muscle based on stochastic resonance", 6th International Symposium on Adaptive Motion of Animals and Machines, 2013.

© Copyrights Shuhei Ikemoto. All Rights Reserved