考察:「日本語意味の曖昧性と群論」

by ご近所のきよきよ



 曖昧性をどう捉えていくとスッキリするか。考えてみました。意味を変えないで、表現を変更することができるか・・・というような問いかけで曖昧性というものを捉えていくと数学的な把握ができそうです。数学の良いところは無限の表現が有っても全て同じ意味ならば一つの記号で表現できることです。意味が主、表現は従・・・で、一つの具体的な表現で意味を代表させることもできます。背後に無限の表現があるということで。
 次の例文について考えてみましょう。
(例文1)信子は明雄が好きだ。
 これは「信子は明雄のことが好きだ」というのと「明雄が信子のことが好きだ」の二つの意味があります。もっと、「信子は綺麗だ」とかの意味があるかも知れません。とにかく色々な意味をくみ取れます。だから、これらの間で文章を変化させても(例文1)は成り立つわけです。
 そこで、例文1に意味をM1と記号で表し、M1を保って、文章の書き換え操作をしていきましょうと考える。文章表現が「体の元」で、M1を犯さない文章の書き換えが、この「体の元」の「置換群」をなす事が分かります。文章表現を「体」として、その文章一つ一つを「体の元」と見なすと、文章表現の置換は「群」をなし、意味の曖昧性一つは文章表現の「置換群」の「部分群」を構成するということです。
(例文2)花は美しく咲いていた。
(例文3)美しい花が咲いていた。
 例文2と例文3は副詞と形容詞の置換によって意味を変えないということから、文章の意味は同じであると議論出来ます。
 
 さっすれば、部分群を更に小さな部分群に分割していくという曖昧性縮小の系列を議論出来るようになります。曖昧性を縮小するのは鍵と鍵穴システムを導入するとスッキリ表現できます。鍵穴のキーを考えられる部分群ごとに違えて付していくことで、曖昧性を管理する体系が自動的にできていきます。その表現は代表元(コーパス)となる表現に鍵穴として付されますから、適切な鍵を与えれば、求めるレベルで曖昧性を管理できる事になります。鍵は、鍵穴と双対ですから、自分がどんな文脈を構成するかが鍵穴体系から分かりますので、鍵穴の値のセットで表現できるでしょう。
 
 これで、曖昧性管理という物が厳密に定義できたと思えます。鍵と鍵穴の設定を整理して、文章変換の部分群を構成し、その中の代表表現をデフォルトにして、その表現で文章を表現しておけば、意味の相同性はパターンマッチングで評価できます。
 曖昧性の評価は、文章の生成処理で自前のコーパスを作っていく事で実現出来ます。異なる意味の表現が、同じ表現になったら曖昧性が起きたと判断するのです。そんな表現のオーバーラップを解析していき、鍵と鍵穴を生成していくといいでしょう。これはパターン発見装置の応用です。


おわり