考察:「フレームと意味理解」

by ご近所のきよきよ


 
 文の意味の理解というものを評価する方法に面白いものが提案されています。文章を指定して、文がその文章と同じ内容であるかどうかをシステムに判断させ、人間が見てその判断が正しいときにそのシステムは文を正しく理解していると評価しようという考えです。チューイングテストみたいなものですね。
 意味理解を、文を理解して正しい行動を選択していくという身体性な評価方法もあります。文章選択で評価すべきか、行い選択で評価すべきか・・・という問題ですが、両者も中間にフレームという技術を介在させねばならないということで、同じ評価方法だと思います。
 文を読むだけでは、単語とか句とかのレベルで付加されている元々の情報だけしか与えられなく、本来の目標である話者が伝えたいことの全てを表現していない場合だ殆どであると思えます。例えば、
(例) 「静かさや岩にしみいる蝉の声」は「山寺に登っていて静寂を感じました。でもそれは虫の音という音で気がついたのでした」と言う文章と等価か・・・
 
 というように考えてみますと、人間にはかなりの確信度でこれら2文は等価と判断されるわけですが、前者の文を解析しただけでは、多分無相関になるでしょう。確かに「静かさ」と「静寂」、「岩」と「山寺」とは相関があると言えなくもないですが、前者の文の言ってることは「蝉の声が岩にしみ込んでいく」という感覚です。そういうものからの発想の展開は文章とは別の、体験的枠組み・・・そうフレームとしての情報が必要になってくるのです。体験の記憶は、日本語の単語の数より沢山人間はもっているでしょう。その体験をピボットにして、他の文章と内容を比較したり、なにか正しい組織だった行動を展開していくことになります。山形に行ってみようとか、写真展に行ってみたい、句会に参加しようとか。すべて、フレームが文章の意味理解の基盤に成っていることが分かります。
 フレームは基本的ににイメージのオントロジーでサポートされた、情報空間ですが、情報空間内のオブジェクトを捉えたとき、単独のオブジェクトの表現することと2つのオブジェクト間の関係を表現することは記号で十分でしょう。言語を見ますと2項関係は単語の組み合わせで上手く表現できるのが分かりますから。3体問題以上は難しい。動詞の格で表現できる範囲だけです。
 
 フレームがあれば、フレーム内に定義される単語、単語の組み合わせ(単語とか単語の組み合わせのオントロジー情報)とを用いて、文からフレームを予想し、そのフレームをピボットにして、フレーム内に記述されている内容と比較したり、フレーム間連想を行い、展開しながら他の文章との一致性を評価していくことになります。こんな風にして意味理解とは実現されていくのでしょう。
 私も、未夢という文章解析プログラムの他にフレームを扱う未来(みき)というプログラムを興しました。未夢でも文章の曖昧性管理にフレームが必要ですから、その部分の拡張も未来の出来次第で実現していきたいと思います。その時には未夢のプログラム構造は考察「多重処理」で説明した技術を採用したものになるはずです。作り直しですね。未来は対話検索プログラムです。セマンティックWebみたいなものを実現しています。苦しんで作っています。
 
 フレームの記述ですが、上で説明したことでおわかりと思いますが、単純なスロットという単語レベルの情報の集まりというのでは足りないです。推論が働かせる知能性が無くてはなりません。私としては、XMLでなくて、推論に特化した表現を採用しています。ただ、Prologでは力不足で、様相論理とか文脈依存文法が表現できるようにProlog文法を拡張して簡易てきなスクリプト言語を作って対応しています。そのスクリプトに、言語情報とか言語外情報とかを記述してフレームにして、オントロジー記号の対応を取りながら、フレーム内、フレーム間推論を実現しようというわけです。
 様相論理の必要性は、視点によって意味が異なったり(状況意味論)、信憑性、多義性を制御したくなったりするからです。
(例文1)ポップコーンをほおばり、コーラを飲んでいた。でも話しては駄目、しかられる。
(例文2)主人公は、刃を抜いた。宇宙船が近づいて来たのだ。
 
(例文1)と(例文2)とは「映画館」の記述としては相同ですが、普通別のシーンと判断されます。
 
 文脈依存な文法にしないといけないのは、記号パターンのマッチングを行い、行動を選択していかねば成らないからです。
 
 機械翻訳という技術でのフレームの必要性を考えてみましょう。
(日本語例文)ムシャクシャと人工知能を考えていた。これどうする、あれどうすると考え考えしていた。結局、これはフレームで片づけようということになった。
(対訳文)I bothered around the Artificial Intelligent. I kicked surround many ideas that spring up in my head. And at last, I came to the conclusion to use a frame technology.
 
 日本語と英語の表現の違いというものを意識して翻訳を考えてみました。逐語訳から一歩踏み込むと、訳文の体系というもの、単語選択の状況というものを、ある枠組みとして管理しなくてはならなくなります。結局フレーム技術にたよることになるわけです。無論、そういうフレームは無数に、単語の数より多くあるわけです。現実問題、「学習機構」で自律的にフレームとか、単語とかを獲得していくシステムを構築していかねばならにのですが。
 
 とにかく、意味理解には知能性を持ったフレームシステムが重要になるようです。

 

おわり