考察:「未夢フレームワーク(久真理プロジェクト)」

by ご近所のきよきよ



 柔軟な自然言語処理を可能とするフレームワークを考えています。基本的に、オブジェクトはアドレスでなくて固有名と連想結合によって処理を記述しようという物です。

 固有名でオブジェクトを同定する為には名前をアドレスに変換するテーブルを設ければできますが、コレクションなどの構造化データの記述には工夫が必要です。今のJava等ですと、コレクションは明確に操作が可能です。固有名詞だけを足場に操作する未夢フレームワークではどう実現していったらよいでしょうか。

 考えたのです。コレクションなどのコネクション関係などはステージなどの視点カテゴリーを基盤に連想というコネクションを設けることで実現しようというものです。この技術の良いところは、ステージを指定することにより、関連オブジェクトを連想させることができることと、ステージにより視点という連想を制御する手段を得られることです。連想は何らかのステージを基盤に行われるわけで、それを素直に実現するものです。脳には海馬という領野がありますが、連想記憶の場で、しかもステージを表現する場であるといいます。このことを考えていて、海馬の働きを分かったように感じました。そうです、連想はステージを基盤に行うべきなのです。


 自然言語処理でのデータコネクションの例としては、動詞と名詞の格の情報の表現と、修飾関係の表現があります。日本語では順序はあまり意味を成しません。動詞にどんな格がコネクションされているかを問うばかりです。そう、動詞ステージの基で格が連想コネクションされるのです。名詞も格を持ちます。例えば、

 順序が重要となるのは時系列の文章でしょう。時系列はデータベースへの永続化で管理することになります。


 では、未夢フレームワークで日本語処理の分かち書き処理をシミュレートしてみましょう。

(例文)きのう信子は公園に行った。


 このような処理は断片的で、ある状況では処理し、ある状況では処理が実行してはなりません。それも試行錯誤的にどんどんとシステムに追加していく必要があります。手続き的なメソッドの構成論では処理の前後関係が重要に成るために、既存システムにこれら断片的処理を埋め込むことは容易な作業ではありません。しかし、データ駆動型の対症療法、曖昧性を許容する方式では新しい処理を簡単に組み込むことができます。その根本は、適者生存戦略で、処理結果の複数存在を許容することと、後でオーソライズされた評価によって曖昧性を低減すると言う技術で実現できます。柔軟な処理の改変ができます。ですが超並列処理を前提とする未来指向な点があって、今は現実的な解答ではないという欠点はあります。


 

おわり