赤ちゃんロボットを用いた物体志向動作の獲得nabesima/pdf/oral_007.pdf · 4·1 赤ちゃんロボット実験では，実際に乳児が遊ぶ玩具を用いて，ロボッ

赤ちゃんロボットを用いた物体志向動作の獲得○安本雅啓 (東京大学/JST) 鍋嶌厚太 (東京大学) 國吉康夫 (東京大学/JST)

Acquisition of Object-oriented behaviors using baby robot

*Masahiro YASUMOTO (Univ. of Tokyo/JST) , Cota NABESHIMA (Univ. of Tokyo) ,Yasuo KUNIYOSHI (Univ. of Tokyo/JST)

Abstract— This paper proposes an acquisition model of “object-oriented behaviors.” Object-orientedbehaviors are the behaviors that objects afford for the agent. Since it is difficult to implement all theobject-oriented behaviors for robots, it is necessary to learn them as babies learn how to play with toys. Wepropose acquisition model of object-oriented behaviors based on the knowledge of developmental psychology.To evaluate the model, we implemented proposed model in the baby robot and the robot acquire the object-oriented behavors for various objects (rattle, castanet, keyboard and mobile). In the experiments, the robotcan acquire a variety of object-oriented behaviors including unexpected ones as babies also have various waysto play with toys, which showed that the model can explain the developmental aspects of babies.

Key Words: affordance, humanoid, cognitive development, baby, toys

1. はじめにはさみは一見，何かを切るだけの物体に見える．し

かし実際は，はさみの先端を用いて飲料缶のタブを開けたり，風で紙が飛ばされないように紙の上にはさみを乗せたりできる．このように実世界の物体に対する働きかけ方（物体志向動作）は，一見一つに見えても，実際には複数存在している場合が多い．人間の物体志向動作は乳児の頃から始まっている．乳

児は成長するにつれて環境中の物体で遊べるようになり [1]，その働きかけ方は非常に多様である．乳児はあらゆる物体を玩具の様に扱い，様々な働きかけを楽しむため，その物体志向動作は非常に多様となる。一方，現在のロボットの物体志向動作は設計者が意

図したものに限定されている．実世界に存在する物体の，全ての物体志向動作を事前に設計する困難さのためと考えられる．しかしながら，もしロボットが乳児のように遊びによって物体志向動作を獲得できるならば，その物体志向動作は設計者の意図を越えて多様になり得る．本研究では，物体志向動作に関する乳児の知見を参

考に，物体志向動作の獲得モデルを提案する．提案したモデルを赤ちゃんロボットに実装し，実際に乳児が行うような物体志向動作を獲得させることで，提案モデルの妥当性を評価する．

2. 物体志向動作2·1 物体志向動作の定式化

エージェントは動作によって対象に物理的にはたらきかけることが可能で，センサによって反応を取得することができるとする．このエージェントが，ある物体に対して動作 aを行ったとき，その物体から際立った反応 ro を得られたとする．この時，P (ro | a) > µ

(µは経験的に決められた値)を満たす a，roについて，予測関数 fobj を定義する．fobj を定義できることは，a

に対して roの再現性が高いことを意味する．1つの物体について fobj は複数存在しうる．その集合を Fobj と

定義する (式 (1))．式 (1)を満たす aを物体志向動作と定義する．aを獲得することは，Fobj について知ることに相当する．

Fobj ≡ {fobj | ro = fobj(a), P (ro | a) > µ} (1)

最初，エージェントは fobj に関する情報を持っていないとする．このとき，aと ro の関係は不定となる．エージェントは，動作 aを制御することで，正確かつ効率的に複数の fobj を獲得しなければならない．先行研究 [2, 3] でも同様に，動作 aに対する roの予

測可能性を評価関数とした物体志向動作の獲得が行われている．しかしこれらの研究の多くは，あらかじめ予想された動作が出るように動作 aのバリエーションを決めており，結果として得られる物体志向動作は全て設計者の意図したものとなっていた．複数の物体志向動作を学習するには，様々な動作の獲得を許容するような仕組みが必要と考えられる．

2·2 乳児の物体志向動作獲得

乳児の物体志向動作がどのように獲得されるかは，発達心理学の分野でいくつか研究が行われている．Rovee-Collierらは，仰向けに寝ている乳児の足に紐をつけ，その紐の先を頭上にぶらさがっているモビールに繋げたところ，乳児がモビールを揺れ動かすためにキック動作の頻度を増加させることを示した [5]．Thelenらは乳児が特定の運動を行うとモビールが動くように外的拘束条件を変化させた場合に，乳児が自ら運動パターンを変化させて，モビールを動かすための特定の運動が生成されることを示した [6]．また，WatanabeとTagaは，上肢を含めた全身の自発運動もまた，外的な拘束条件に応じて柔軟に変化させることができることを示した [7]．文献 [6, 7] の他に，乳児の物体志向動作獲得に関す

る観察的な知見は少ない．しかしながら，乳児向けの玩具は乳児の物体志向動作に関する重要な証拠と考え

られる．乳児向けの玩具は対象年齢別に作られている場合が多く，特に古典的な玩具は経験的に，各々の年齢児の平均的な知覚・認知・運動能力を発揮させるように作られている．本研究では，ロボットにこれらの玩具に対する物体志向動作を獲得させ，乳児の物体志向動作を比較することで，提案モデルが実際の乳児の振る舞いを再現できるかを評価する．

3. 物体志向動作獲得モデル本研究の提案するモデルは，(I)動作表現，(II)学習

方法，(III)獲得評価から成る．(I)動作表現：ある時刻 tにおけるエージェントの状態を s(t)とする．時刻 tから時刻 t + 1にかけて状態の遷移 s(t) → s(t + 1) を行い，その後一定時間静止する．この遷移を動作 aとする．動作に要する時間は一定とする．そのため遷移距離の長い動作ほど速い動作となる．(II)学習方法：ある状態 sA，sB間の遷移動作 a : sA →sB の最中に物体から得られるセンサの値 rが，ある閾値を越えていた場合，その動作の生起確率 P (sB | sA)を増加させる (式 (2))．wは任意の学習係数とする．反復運動の促進のために，この動作とは逆方向の動作の生起確率 P (sA | sB)も同時に増加させる．反復運動を生成しやすくすることで，再現性のある物体志向動作が獲得されやすくなる．偶発的な反応を排除するため，センサ情報の値がある閾値を越えていなかった場合は，生起確率を減少させる．

∆P (sB | sA) =

{w (r > threshold)−w (r ≤ threshold)

(2)

(III)獲得評価：物体志向動作が獲得されたかを評価するため，過去 n回の動作における，センサの値がある閾値を越えていた確率と，エントロピーの減少量の 2つの指標を用いる．エントロピーは式 (3)によって計算される．S はエージェントが取り得る状態の集合を表す．

H(S) = −∑s∈S

P (s) log P (s) (3)

4. 物体志向動作獲得実験4·1 赤ちゃんロボット

実験では，実際に乳児が遊ぶ玩具を用いて，ロボットに物体志向動作を獲得させる．実験では，我々の研究室で開発された赤ちゃんロボットを用いた．このロボットは生後 9ヶ月児相当の知覚・運動能力を兼ね備えており，サイズや重量も似せて作られているため，乳児用玩具とのインタラクションに適している．3 章のモデルにおける状態 sを片手の関節角度とし，動作 a

を関節角度間の遷移とする．実験では，sは 3次元とする（肩ピッチ，肩ロール，腕ロール）．関節角度の可動域は，肩ピッチ方向に [50, 150] deg，肩ロール方向に[0, 100] deg，腕ロール方向に [0, 100] degとした．さらにそれぞれの可動域を 20deg間隔に 5分割し，その中から角度が選択される．動作はこれらの関節角間の遷移とし，動作にかかる時間は 300 ms，動作後に静止する時間は 900 msとした．

4·2 実験

実験では，ロボットの手にくっついて動く玩具（ガラガラ），鳴らすのが難しい玩具（カスタネット），環境に据え付けられた玩具（キーボード）を対象とした．また，発達心理学で行われている実験を模擬するため，モビールも対象とした．学習の初期では，ロボットはランダムに動作を生成

する．その中に反応が返る動作があるとその動作の生起回数が増え，結果としてその動作に収束する．収束するとエントロピーが減少するため，動作が獲得されたと判定される．実験に用いた玩具とそこから得られる反応および，実

験の結果として獲得された物体志向動作を Table1 に示す．

Table 1 獲得された物体志向動作

玩具名反応 r 獲得された動作 a

ガラガラ音の大きさ手を左右に振る

足にぶつける

カスタネット音の大きさ止める時の反動を利用

頭にぶつける

キーボード optical flow 手を降り下ろす

表面を撫でる

モビール optical flow 手を上下に動かす

ガラガラロボットの手にガラガラを持たせた状態で手を動か

した．観測した音をフーリエ変換し，1000∼3000Hzの周波数成分の大きさを rとして用いた．大きく腕を振ることで音を鳴らす動作 (Fig.1)と，ガラガラを自分の足にぶつけることで音を出す動作 (Fig.2)が獲得された．

Fig.1 ガラガラを左右に振る動作

Fig.2 ガラガラを足にぶつける動作

カスタネット手にカスタネットを持たせた状態で手を動かした．観

測した音をフーリエ変換し，1000∼3000Hzの周波数成分の大きさを rとして用いた．

カスタネットを手の平と垂直に持たせた場合には，カスタネットを体に当てた時の反動を利用して音を鳴らす動作が獲得された．例えば，カスタネットを額に当てたときの反動を利用して音を鳴らす動作 (Fig.3) と，腹に当てた時の反動を利用する動作 (Fig.4)などが獲得された．カスタネットを手のひらと水平に持たせた場合には，

カスタネットを額にぶつけることによって音を鳴らす動作が獲得された (Fig.5)．

Fig.3 額に当てたときの反動を利用する動作

Fig.4 腹に当てたときの反動を利用する動作

Fig.5 額にぶつける動作

キーボードロボットの正面にキーボードとモニタを配置し，実験を行った．キーボードのキーを押すことでモニターには大きく文字が表示される．観測されたカメラ画像の時系列からオプティカルフローを抽出し，その大きさを反応 rとした．手を上から下に降り下ろすことでキーを叩く動作 (Fig.6) と，キーボードの表面を撫でるように手を横にスライドさせてキーを押す動作 (Fig.7)が獲得された．

Fig.6 手を降り下ろす動作

モビールThelenらの実験 [6]に倣い，モビールを揺らすとい

う反応に対して，ロボットの肩とモビールとをゴムで

Fig.7 キーボード表面を撫でる動作

繋いだ場合と，ロボットの手とモビールとをゴムで繋いだ場合で，獲得される動作が異なるかを検証した．オプティカルフローの大きさを rとした．まず，Fig.8のように，肩とモビールとをゴムで繋い

だ．肩には，体の中心に近い方から順に，ピッチ角とロール角の自由度があるが，ゴムはこの２自由度の間に取り付けた．結果は，肩を大きく振ることでモビールを揺らす動作が獲得された．動作の質を定量的に評価するため，各関節角ごとのエントロピー変化を計算した．各関節角のエントロピーの時間変化を Fig.9に示す．肩ピッチ角のエントロピーのみが減少し，肩ロール角と肘ロール角のエントロピーは変化していない．肩ピッチ角の動作のみが収束し，他の関節角は収束せずにランダムな動作となっているといえる．

Mobile

Baby Robot

Elastic String

Fig.8 肩とモビールを繋いだ場合

1

1.5

2

2.5

3

3.5

4

4.5

5

0 100 200 300 400 500 600 700 800 900

entr

opy

steps

elbow_rollshoulder_roll

shoulder_pitch

Fig.9 肩とモビールを繋いだ場合の各関節角のエントロピー変化

次に，Fig.10のように，ロボットの手の先とモビー

ルとをゴムで繋いだ．この時の角関節角のエントロピーの時間変化を，Fig.11に示す．エントロピーは全ての関節角について減少しているが，肩ロール角のエントロピーが特に大きく減少している．赤ちゃんロボットの構造上，肩ロール角が最も手先の可操作度に寄与することが，この結果に繋がったと考えられる．

Mobile

Baby Robot

Elastic String

Fig.10 手とモビールを繋いだ場合

1

1.5

2

2.5

3

3.5

4

4.5

5

0 50 100 150 200 250 300 350 400 450

entr

opy

steps

elbow_rollshoulder_roll

shoulder_pitch

Fig.11 手とモビールを繋いだ場合の各関節角のエントロピー変化

4·3 考察

実験で獲得された動作は非常に多様であった．その中には自己との接触や，動作を止める際の反動を用いる動作など，我々が普段想像する玩具の使用方法とは異なるものが存在した．これらの動作は，赤ちゃんロボットに固有の力学的性質（身体性）を通して初めて生成され，獲得されたと言える．実際の乳児は身体に固有の性質を用いて動作生成していると考えられており [8]，この点で実験結果は妥当と言える．従来のように一つの動作を事前に設計するのではな

く，提案モデルは様々な動作を許容する動作表現を用いて探索する．このことが，身体性を通して動作を生成できた要因と考えられる．実験では 3自由度の系で物体志向動作獲得が可能であったことから，少なくとも反応 rが抽出されている仮定において，提案モデルは十分に機能することが示された．

5. 結論本研究では，物体志向動作を定義し，それを獲得す

るモデルを提案した．乳児に関する知見を参考に実験

を設定し，赤ちゃんロボットを用いて玩具に対する物体志向動作の獲得実験を行った．結果として，玩具に通常期待される動作の他に，赤ちゃんロボット固有の身体性を用いた動作が獲得された．冒頭のはさみの例のような臨機応変な道具使用は，本

研究のモデルで獲得された物体志向動作を，他の物体に適用することで可能になると考えられる．例えば，提案モデルと Nabeshimaらのモデル [9]を組み合わせることが考えられる．本研究では，赤ちゃんの一人遊びによる物体志向動

作の獲得を扱った．しかしながら提案モデルは，他者とのインタラクション要素を取り入れることで，より豊かな物体志向動作を獲得できると考えられる．提案モデルに，特に養育者とのインタラクション要素を組み込み，より包括的な赤ちゃんの発達モデルとすることが今後の課題である．また，本研究では，反応 rの閾値を玩具ごとに恣意

的に決めていたが，より汎用的な基準を用いることで，様々な玩具の様々な反応に対応することができると考えられる．r を抽出する基準の候補として，saliencymap[10]や異常値検出などの手法を用いることが考えられる．

参考文献

[1] P. Rochat: “The Infant’s World,” Harvard Univ.Press, 2001.

[2] G. Metta and P. Fitzpatrick: “Early Integration of Vi-sion and Manipulation,” Adaptive Behavior, pp. 109–128, 2003.

[3] A. Stoytchev: “Behavior-Grounded Representation ofTool Affordances,” ICRA 2005, pp. 3060–3065, 2005.

[4] S. Nishide, T. Ogata, J. Tani, K. Komatani, H.G.Okuno: “Predicting Object Dynamics from VisualImages through Active Sensing Experiences,” Ad-vanced Robotics , Vol. 22, No. 5, pp. 527–546, 2008.

[5] C. Rovee-Collier: “Reactivation of infant memory:Implications for cognitive development,” Advances inChild Development and Behaviour, vol. 20, pp. 185–238, 1987.

[6] E. Thelen: “Three-Month-Old Infants Can LearnTask-Specific Patterns of Interlimb Coordination,”Psychological Science, Vol. 5, No. 5, pp. 280–285,1994.

[7] H. Watanabe and G. Taga: “General to specific devel-opment of movement patterns and memory for contin-gency between actions and events in young infants,”Infant Behavior and Development, vol. 29, No. 3, pp.402–422, 2006.

[8] E. Thelen, D. Corbetta, K. Kamm, J. P. Spencer,K. Schneider and R. F. Zernicke: “The Transition toReaching: Mapping Intention and Intrinsic Dynam-ics,” Child Development, Vol. 64, No. 4, pp. 1058–1098, 1993.

[9] C. Nabeshima, Y. Kuniyoshi and M. Lungarella: “To-wards a Model for Tool-Body Assimilation and Adap-tive Tool-Use,” Proceedings of The 6th IEEE Inter-national Conference on Development and Learning(ICDL-2007), London, United Kingdom, July, 2007.

[10] L. Itti, C. Koch and E. Niebur: “ A model of saliency-based visual attention for rapid scene analysis,” IEEETransactions on Pattern Analysis and Machine Intel-ligence, Vol. 20, No. 11, pp. 1254–1259, 1998.

Documents

赤ちゃんロボットを用いた物体志向動作の獲得nabesima/pdf/oral_007.pdf · 4·1 赤ちゃんロボット 実験では，実際に乳児が遊ぶ玩具を用いて，ロボッ

赤ちゃんロボットを用いた物体志向動作の獲得nabesima/pdf/oral_007.pdf · 4·1 赤ちゃんロボット実験では，実際に乳児が遊ぶ玩具を用いて，ロボッ