考察:「記号の接地問題」

by ご近所のきよきよ


 
 意味理解というものをもう少し掘り下げてみようと、本を物色しました。そして、次の本を読みました。
・「知の創成」 R.Pfeifer、C.Scheier共著 共立出版
・「ブルックスの知能ロボット論」 Rodney A.Brooks著 オーム社
 
 体を動かし、環境と相互作用するから知能が生まれるということ。そのように知能を構成していれば、比較的簡単に知能を実現できる・・・ということです。読んでいてすごく感銘を受けました。この4年間の体験を明晰な形で示された思いで、読了しました。読んでない人は買って、是非読みましょう。
 
 基本的に、「身体性認知科学」に則れば、フレーム問題とか、記号の接地問題は簡単にクリアできるということです。しかもエレガントな知能が実現できるということ。記号世界だけでは、フレーム問題と接地問題は解決しませんから。私も、苦しんで「文脈空間」という、イメージからオンデマンドで記号化した意味を抽出するというアイデアに至りました。それは青葉プロジェクトで挑戦していく課題であるとして、当面、未夢プロジェクトで接地問題は解決を見たいと思うに至りました。
 それはつまり、未夢を何らかの環境に働きかけるシステムの中に組み込めば実現できること・・・というのが、R.Pfeiferさんらのアドバイスなわけです。で、考えてみました。未夢に、そのようにするとどんなメリットが生まれるかということを。
(1)接地点が、連想のピボットとなる。
(2)知識を構造化(論理構造、物理的構造など)して利用できる。
(3)語られていない情報を推論で得られる。
(4)学習機能との接点ができる。
 
 以下、これらのことを説明していきましょう。
 
 
1.連想のピボット
 人間には、生物、知的、2本足歩行とか色々属性が付いています。「生物」に「自力で動き回る」とか「食べ物を食べる」というような定義があれば、人間にもそれらが適用できるということです。記号事に定義するのでなくて、プリミティブ(クオアリア)記号を持ってすれば、そこをピボットにして検索することで様々な単語を連想することができます。
 基本的に、この場合には接地しないで、プリミティブ記号でいいのですが、プリミティブ記号体系を設計するときには、クオアリアといった、接地を念頭にして行く必要があるでしょう。
 
 
2.知識の構造化
 知識は構造を持っています。「学校」には生徒がいて、教師がいて、机があって、授業があって、などなど、様々な事柄が構造を持って埋め込まれています。所謂、フレームを形作っているのです。そういう構造を、入力した文のみからでは構成できません。あらかじめ知識として持っているべきです。しかも、連想を豊富に働かせるために、最土台のスロット要素はプリミティブ、すなわち接地している必要があります。
 論理も構造を持ちます。推論できるような枠組み、フレームを知識として持っていたいものです。
 
 
3.語られない情報の推論
(例文3.1)瑞樹は花のようだ。
    花:prittey(80),fevorite(80)  ・・・「美しいという感覚80度」
                  ・・・「好ましいという感覚80度」
(例文3.2)ぬくぬくは氷のようだ。
氷:prittey(60),fevorite(30)
 
(例文3.3)私はだれが好きなのか?
この例文1.3の回答はfevorite(80)を取って、「瑞樹」と推論できます。
 
 
4.学習機能との接点
 自動学習はロボットとして、外界に働きかける能力も持ったシステムによって実現されるでしょう。そのとき、学習の対象が生なクオリアなデータですから、記号体系のベースをクオリア(プリミティブ)として接地してあれば、自然言語処理にシームレスに学習機構を埋め込む事ができます。
 
 
 
5.未夢とデータベースアクセス
 未夢が意味を理解能力をもっていることを試すために、問い合わせ応答システムを考えました。データベースをアクセスして、問い合わせに答えるのです。
(例文5.1)これから戸隠にいきたいんだけど、バスある?今、長野駅にいる。
 
 この文を解析しましょう。
・「これから」からcurrent_timeが抽出されます。
・「戸隠に行く」から(move),Case(target 戸隠)が抽出されます。
・「バスある?」からCase(use_a バス);?:−Squedule(バス)が抽出されます。
・「今、長野にいる」からcurrent_location:-Case(location 長野駅)が抽出されます。
 
 データベース問い合わせは、「バスのスケジュール表」を検索することと、そこから、長野発戸隠行きのエントリーを全て抽出すること、そして、現在の時間以降のものを絞り込んで回答すること・・・ということになります。
 
 データベース側では、データベース、あるいは表計算ソフトでスケジュール表を持っているはずですから、それらが、「バス」とか「スケジュール表」とかで検索できるようになっていることが必要です。しかも、その内容も検索して、ヒットした項目を収集できるようにシステムを作っておく。つまり、検索ナビとなる知識ベースを作り、オブラートする事になりますね。それはXML表現になると思います。
 
 さらに、未夢とこのような検索システムとの間には未夢のフレームデータから検索データに変換する知識ベースが介在しますが、未夢の出力はプリミティブでできているから、未夢とは独立に構築することができます。要は規約の問題なのです。これも、XMLを使うことになるのかもしれません。一階述語論理プログラムはXMLで表現できますから、どっちでも表現としてはいいでしょう。
 
 
6.構造化知識の利用
(例文6.1) 瑞樹は椅子に座った。
 
 この例文ですと、瑞樹の立場からしか状況を述べていません。これに対して、「椅子には誰が座っていたか?」というような問いかけがあったとすると、視点を椅子に置いた状況表現が必要になります。これを、文章解析のなかでやるのは負担が大きいですし、そもそも視点変更が必要なのは、問い合わせ応答システムの中だけのことです。解析部分でやるような処理ではありません。
 ということで、こういった付加的な知識はシミュレータの中で利用していく事になります。香澄プロジェクトのお仕事ですね。
 
 ただ、文章は単なる単語の組み合わせではありません。
(例文6.2) 瑞樹はリンゴを食べた。
(例文6.3) 瑞樹は試験に合格した。
なんかですと、GOODな体験ということですし、例文6.3なら努力が報われたというような情報を醸し出します。そういった情報は意味理解の仕事、特に文章解析の中で捉えるべき問題だと思います。無論、シミュレータでも必要な情報ですが、文解析の曖昧性除去の為にもここは文章解析機構のなかでも利用できるような仕組みが欲しい所です。
 
 

おわり