随筆:「論文を読んで」

by ご近所のきよきよ


 
 人工知能学会論文誌22巻5号D(2007年)「自己増殖型ニューラルネットワークを用いたヒューマノイドロボットの発達的言語獲得」を読み、大いに啓発されました。
 内容は、「物体に関連する発話(音声情報)とその物体から抽出した画像情報とを統合し、その物体の意味(概念)を獲得する」という研究です。ここに、意味(概念)は名前、色、形状の3つで、それぞれ音声と視覚情報対で概念づけられるもの。ニューラルネットは誤差逆伝搬でなくて、コーネンのSOMであるようです。だから自己増殖(ノードの暫時追加)ができ、段々に概念数を増やしていけるわけです。
 
 で、ふと思ったのです。話者が何をフォーカスして話しているのかって、以心伝心で聴手は分かっているのではないでしょうかと。色なのか、名前なのか、形状なのかがわかるようにプロトコルが決まっているのではないでしょうか。例えば、単語一つだと、名前だとか、2つだと、前の単語は形容詞すなわち属性であり、後ろの単語が名前であるとか。そして、色と形状は同じ形容詞ですが、同じような形状(大きさ)の物体をさして、形容詞を発したら色を言ってると判断できる。色々な大きさの物体があるときに形容詞を発したら、形状であると判断できる。この辺、曖昧性がありますが決め打ちでいく。それはプロトコルなのですね。デフォルトプロトコル。
 こんな例は、2次元図形を観て3次元物体を簡単にイメージできることからもいえることです。要はプロトコルなのです。当然間違えて錯視になったりしますが、大抵は上手くいく。人間には雷同という共振状態がありますから、そんなプロトコルがあるとして、そんな間違いはないでしょう。
 
 それと、音声を生で学習されているのが面白かったです。記号化しないのですね。記号化の手順を踏めば、概念の頑健性は向上しますよね。音を伸ばしたり、アクセントを変えても記号化のレベルで吸収すれば標準的な入力から概念が構成できます。でも、ある意味、この研究の良さがあるのです。つまり、音声を記号と対応づけるとしたら、この研究のようにすることになるでしょう。(「言葉」でなくて「記号」としたのは、認知の基本的なことがらで、直に言語と結びつかない概念を思ったからです。犬でも猫でも種の間では以心伝心のプロトコルがあるようですから。昆虫にもカエルにもあります。ミラーニューロンがそれに当たるのではないかと思えます。)
 
 物体のもつ概念って、どんなものがあるか考えてみました。
(1)オブジェクト(名前)/空間
・ 閉曲線の中はオブジェクト
・ 閉曲線の外は空間
(2)属性
・ テクスチャ
・ 色(HSB)
・ 光沢
・ 面積比
(3)構造
・ 重なり/並置/接続(接触)
・ 上下
・ 左右
・ 前後
(3)動き
・ 運動(直線運動、曲線運動、回転)
・ 静止
 
以上のようなもので尽くすのではないでしょうか。
 

おわり


[参考文献]
・「自己増殖型ニューラルネットワークを用いたヒューマノイドロボットの発達的言語獲得」(人工知能学会論文誌22巻5号D(2007年))岡田将吾、賀小淵、小島量、長谷川修