考察：「格フレーム」

by ご近所のきよきよ

　自然言語処理の基礎は文の解析と生成にあるでしょう。この頃ずっと画像認識に打ち込んできていますが、ふと昔を懐かしんで自然言語処理を考えることがあります。少し間を置いて考え直すと、今までよりずっとよいアイデアを得ることができるようです。

　文の解析特に格の解析をどうしていくか。曖昧性のある状況でどう統一的に格を解析するアルゴリズムを展開していくか、問われるところです。

（例文１）リンゴまで食べた。

（例文２）信子まで食べた。

　例文１の「リンゴ」は目的格ですが、例文２では「信子」は主格です。同じ助詞「まで」が文脈により格が違ってくるのです。例文１ですと、リンゴは食べられるものという暗黙知があります。信子は食べられるものでなく食べるものであるとの暗黙知が働きます。このように、表層では格は曖昧な情報なのです。その曖昧性を克服していかねばなりません。どうするか。ここで英語の知識が役に立つわけです。英語の「SV構文」、「SVO構文」、「SVOO構文」といったテンプレートを解析に持つのです。これは表層では現れません。動詞にこの構文テンプレートを連想させて、そのスロットに名詞を埋め込んでいくという解析をしていく。スロットにはどんなカテゴリーの名詞が入るかを記述します。カテゴリーは意味記号で表現されますが、文脈によりもやもやと決まる場合も考慮して、ある意味モデルという物がくることもあります。意味モデルは学習によって獲得される物です。

（例文３）信子は明雄が好き。

　これは格が曖昧な文ですが、「明雄は信子に結婚を申し込んだ」という文があれば、「明雄は信子のことが好き」という文脈を連想して、例文３を解析するテンプレートに埋め込む情報を制御していくことになります。それは、「誰それが誰それを好き」というモデルがあって、そこに「誰それが誰それに結婚を申し込んだ」というエントリーがあるとします。その名詞の対向関係から主格と目的格を決定していくことになります。

　モデルの学習は、「好きならば結婚する」というような文から、「誰それが誰それを好き」ならば「誰それは誰それと結婚する」というような連想を基盤に構築していきます。無数の連想を整理して、一つの「好き」という単語のモデルのなかにまとめていくことになります。この辺の技術も結構考えていく価値があるものですね。

おわり