考察:「ロボットと人工知能の接点について3」

by 小山明雄



(例文1)列車に乗っていたのは誰か?


 この問いに答える為の知識ベースの内容が、「長野行きの列車に乗った信子は混み具合に困惑した」といったように、「列車に乗る」が名詞を修飾しているというような文パターンで記述されているとは限らないということに気がつきました。「信子は列車に乗った。列車は混んでいた。信子は困惑した。」という文章で記述されていても、例文1に答えねばなりません。


 実は、和葉では「長野行きの列車に乗った信子は・・・」を「信子は長野行きの列車に乗った。信子は混み具合に困惑した。」というように知識に記述しています。ちょっとこの辺にバグがあったり、文によっては変な解釈になったりしていますが、そのうち克服したいと考えています。もっとも、まだ「混み具合」と「列車は混んでいた」との連想は和葉にはまだできていません。厳密なマッチングは、まだ、できません。この辺もおいおいと解決を図っていきたく思っています。


 ロボットに人工知能を埋め込む場合の技術についてでした。詰まるところ、センサー系と知識ベース系の整合を取るにはどうするかという問題として、「ロボットと人工知能の接点について」を議論してきました。今回はもう少し具体的にして考えていきたく思います。人の脳は、脳幹があって、旧皮質(扁桃体とかの大脳辺縁系)、新皮質という構造が乗っています。新皮質も視覚野とか聴覚野とか感覚を解析する部分があります。こうした構造は上位方向の神経情報の投射だけでなく、上位から下位への投射もあります。ということで、感覚系の上に感情系を置き、それらの上に知識処理(人工知能)を置くだけでなく、知識処理から感情系や感覚系にデータを送って処理していくことも必要になってくることが予想されます。実際、情報の抑止とか促通とかのフォーカス機能は必要になるはずです。また、感覚系と感情系を情報処理のピボットとして・・・・・ハブとして人工知能の問題解決分野の連絡を広範囲に行っていくことも考えられます。


(例文2)オオカミが来る。


 この文から恐怖心が文章の背景に塗られるでしょう。そんな情報処理は、自然言語処理といった上位の情報処理から感情系への投射があってできることです。


 フォーカスですが、感情系までは超平行処理で、基本的に全ての情報はマスクしないで処理することになるはずです。それは、危険回避の為だし、将来もっと重要なことに出会うことが期待されるからです。並行処理していく。しかし、思考などの人工知能としての処理には基本的に1事象(一つの概念)を扱うだけです。フォーカスしていかねばなりません。行動の複数並行処理ですね。思考だけが一つの概念だけを扱う。

 この辺のプランニングの問題ですが、重みつけ投票によって具体的なアクションの選択とアクション遂行の管理を行っていくことになるでしょう。それは、人間にとってすごく簡単な朝の挨拶一つ取っても、複数の条件があって、固定の制御では扱えないので分かります。なんとなれば、挨拶には朝、昼、夜というステージの問題があります。また、相手がいるかどうかとか、今、初めてあったのか、すでに挨拶済みかとか、親しさのレベルとか、今忙しいかとか、相手の状況はどうかなどなど・・・・・行動起動条件に記述できません。可能なことはただ、それらの起動条件毎に、朝の挨拶・・・ある具体的な、「おはよう」の文生成アクションとの重み付け連想があるだけとう状況です。抑制性の連想もあるでしょう。そうして、今の感覚とか感情系、人工知能の他の状況の下で、行動に対して投票することで行動を引き起こします。ただこの場合、行動に一貫性を持たせる工夫とか優先順位をスケジュールしていくための工夫も必要です。今実行している行動をできるだけ大きな重みにして連想させるのですね。特権レーンとか、背景レーンとかのジョブスケジュール機構も参考になると思います。


 そこで、学習機構ですが、基盤はオントロジーであることはよろしいでしょうか。オントロジーにも感覚系、感情系、人工知能系のオントロジーのレベル分けがあると考えられます。もっとも基本的なのはクオリアで感覚系だと思います。感情系や人工知能系のオントロジーは感情系のオントロジーの記号セット・・・構造を持った記号セットとして自律で学習していくものだと思います。「思い」なんていう人工知能系のオントロジーもobjectとか、intelligentとかの感覚系に落とし込まれます。ただ、パターンマッチングしていくことの効率で人工知能系のオントロジーを設けるだけです。固まりを切り取るオントロジーも感覚系ベースのものでしょう。感情系とか人工知能系のオントロジーは基本的にモデルとして成長の基本概念として存在していることでしょう。

 追記いたしますと、オントロジー記号はテキストだけでなく、マップもあり得ますね。画像認識とか音声認識を考えるとマップになります。3次元とか2次元とか1次元のマップですね。各、点にはテキストのオントロジーが配置します。




おわり