私たちが提案する最小行動規範は,非常に単純で一般的な行動ルールです.ある時刻tにおけるエージェントの行動を定めるn次元の運動指令ベクトルのi番目の要素をuitとし, 時刻t+1における運動指令ベクトルの各要素を
に従って生成するというものです.ここで,Rはランダムな値(例えばホワイトガウシアンノイズ),ηiはi番目の要素に加わるノイズの強さ,ΔAtは時刻tにおいて どの程度エージェントの状態が改善したかを表す量を意味します.つまり,「状態が改善したなら(どの程度かに依らず)前の行動を繰り返し,状態が悪化したなら(どの程度かに依らず)ランダムに行動する」 というルールに,ノイズの影響で全く同じ行動を繰り返すことは出来ないという条件を加えたものと表現できます.
この最小行動規範は,「どの程度改善したか?」という勾配情報を用いないため,一見は評価の勾配に沿った行動ができないように見えますが,実は,ノイズが加わることによって行動には勾配情報が反映される という面白い現象が生じます.この研究では,この現象が確率共鳴と呼ばれる現象に相当する現象であることを数値シミュレーションによって示したほか,そのエージェントが最も高確率でとる行動は, その時刻tにおいて評価を最も向上させる行動(つまり,評価関数の最急勾配方向に移動する行動)に一致することを理論的に証明しました.
最小行動規範は,その単純さゆえに,適用するさいにはロボットのハードウェアや環境に関する情報をほとんど必要としません. よって,動作環境が急激に変化した場合や,ハードウェアが故障して通常の行動がとれなくなった場合などにおいても, その状態・時刻において最も評価を向上させる行動が最も高確率で選択されるという特性が失われることがありません. この研究では,車輪移動型ロボットにおいて,タイヤのパンクや車軸の変形といったロボットの故障,ロボットへの制御信号がある頻度でロボットに到達しないといった不具合などを再現し, その場合でも最小行動規範の確率的な特性が失われないことを確認しました.
確率共鳴の工学的応用としては,「センサ解像度未満の微小な信号を検出する」という試みが最も広く行われてきました. これらの応用において,確率共鳴を生じさせるためには,その微小な信号の分布に応じた適切な確率分布を持つノイズがシステムに加わる必要があります. しかし,この要求に改めて注目すると,検出したい対象である微小な信号の分布を予め知ることが適切なノイズ強度を求めるのに必要であることが分かります.
私たちは,この確率共鳴の工学的応用における重大な問題の解決に取り組み,その解決策の一つとして,一つの微小な信号に対して確率共鳴によってセンシングを行う素子を複数用意し, その間の相関(疑似相関)を用いてノイズ強度を調節する手法を提案し,シミュレーションと実験によってその妥当性を示しました.
確率共鳴によるノイズの利用は,一見すると上手く動くように見えないぐらい単純なシステムでも目的を達成できる可能性を広げます. 私たちは多数の収縮・弛緩の2状態しかとれないアクチュエータが集めて一つのアクチュエータとしたヒトの骨格筋のようなアクチュエータの制御に注目し, ノイズを利用すれば同一の閾値による比較演算だけの単純な装置で収縮するアクチュエータの数を連続的に制御できることを示しました.
© Copyrights Shuhei Ikemoto. All Rights Reserved