考察:「文パターン10」

by 小山明雄


 

 人工知能関係のオープンソースライブラリが色々ありますね。どこでビジネスが広がっていくのでしょう。人工知能とかロボットとかはアートだと感じるこの頃です。デザインとか性格、能力は最終設計者の感性によってなって、建築とか音楽とか絵画のような作品として売れるものになる・・・そんなビジネス世界が見える気がしてきます。もちろん、音声とか画像とか、自然言語処理とかの土台となるライブラリ群も好きな人はもっといいものをと追及していくことでしょう。やはり、何か個性的で、使いやすいシステムというものは永久に追及されていくものだからです。ハードウェアとソフトウェアの関係もあります。より小さく、より高密度に、高速に・・・・・・と。ま、コンピュータもこの頃芸術みたいなものに見えてくることがあります。コンピュータの世界にも建築家みたいな職業が成立していくのでしょうか。


1.パターンマッチング


【例文1】のろしが上がった。武田信玄は甲州を発った。上杉謙信が迫っていた。

【例文2】連絡が信濃からあって、武田信玄が出陣した。

【例文3】武田信玄は信濃で上杉謙信を迎え撃った。


 例文1、例文2、例文3は厳密には異なる文ですが、意味的にはほぼ同じことを言っています。ドキュメントの内容を理解しているかどうか、問を発した時、このどの記述においても検索結果として抽出されねばなりません。もちろん、視点による揺らぎはありますが、いかなる揺らぎの範囲でも人間ならばこれらは同じ意味として抽出してくるでしょう。今回は、このことを可能とする機構を考えてみます。もちろん和葉、七海、飛雄ベースの技術で考えるのですが。

 知識ベースはモデルを単位に管理しています。モデル内にモデルの特性とかモデルが実行したエピソードとか、意味連想関係とかを記述しています。例えば「武田信玄」というモデルです。

【モデル:武田信玄】

・武田信玄は、上杉謙信と信濃の領地を争って、善光寺とか川中島の近辺で数度戦った。

・武田信玄は、甲州に居城をかまえていた。

・戦争(いくさ)に出ることを出陣という。

・戦うために出陣することは迎え撃つという。

・・・・・・・・


【モデル:のろし】

・煙を使った連絡手段

・・・・・・・・


【モデル:発つ】

・でかける

・出陣する

・・・・・・・


 例文2は上杉謙信への言及がありません。これは武田信玄のモデルの情報とマッチングすることで、「上杉謙信」を・・・そして信濃でのいくさ・・・を補完して、5W1H1Fを完成します。

 例文1は武田信玄のモデルから、いくさが信濃であるとの情報を補完します。これも5W1H1Fで捕えます。

 あとは、各動詞とかのモデルで意味的に同じ語を同定するとかオントロジー意味論によって相同な意味を推論して、同じ内容の文かどうかを判断します。


 とにかく、パターンマッチング処理がものすごく多いというのが、これからの解決していく課題でしょう。超平行を可能とさせたい・・・・・・・ですが。「常識」とはかくも重たい処理の結果なのです。




2.深い意味理解

 深い意味理解はイメージとして文章を把握していくことでしょう。またはオブジェクトの包含関係で捕えていく手法もあります。そんな議論を前にやりましたが、その時に使う、文を解析するコマンドパターンをここに記述してみたいと思います。それは、次のデータから成ります。

・ スラックスマッチング記号セットの提示

・ マッチングする文パターンの提示

・ 描画命令とかオブジェクトの包含関係を示すデータの提示


【和葉具体例】

【例題4】私はリンゴを彼女にあげる。

【例文4を解析するコマンドパターン】

(COMMAND;(KEYS;+give)(SENTENCE;(TERM,CASE=directobject;(ID;2)(TYPE;ND))(TERM,CASE=to;(ID;1)(TYPE;ND))(TERM;(MEAN;+give)))(SET;(TERM,CASE=owner;(ID;1)(TERM,CASE=belong;(ID;2)))

【コマンドの結果】

・「リンゴ」オブジェクトを「彼女」オブジェクトに所属(belong)させる。




 

おわり