by ご近所のきよきよ
夏雲を見上げると、かき立てられる物があります。夢に生きられた人生だった・・・感謝の気持ち。これで良かったのだという想い。ということで、今日も人工知能を考えています。今回は和葉のモジュール設計をしていきたく思います。
前から考えていたのですが、人工知能の解析などあいまいせいの有る中、物事を決定していかねばならないときには様々なプロセスを実行させて、その投票をもって行うのがよろしいと。様々な特徴を持つプロセスの結果を評価していくと良い結果がでると、ミンスキー博士の「脳の探検」のも書かれています。この投票法は今回の和葉のキーとなる技術になります。
1.SentenceAnalizer
文章の解析をして、意味を理解します。分かち書き化から係り受け解析、格解析をして、深層意味の把握までを管理します。
(1)WordAccessor
単語や連語を辞書から取り出します。分かち書きから、係り受け解析、意味把握に使います。
連語の場合、語順が問題になりますが、キーを単語群で検索する作業になります。インデックス検索でなく、全レコード検索にします。連語の場合、更に、品詞とか意味レベルでのマッチングもあるでしょう。「リンゴ」が分からなくても、「ミカン」で同類の連語があるかも知れないから、品詞と意味(fluts)でマッチングを求めることになります。
(2)MonoSentenceAccessor
単文を認識するための知識をアクセスします。動詞と名詞によって格とか係り受けが決まる場合が多いので、そんな知識を利用していきます。単語の持っている知識の中の単文、属性情報を解析しようとしている文の断片とを比較していきます。知識は単語をキーとするテーブルになります。RDBをベースにしているので、日本語単語を英字大文字に変換するテーブルを設定しないといけません。検索は意味レベルの内容検索になります。
(3)CaseKnowledgeAccessor
格解析用の助詞を含む形式での知識をアクセスします。連語アクセスと同じ処理になります。
(4)MeanAssembler
2項関係意味把握をしていきます。
(5)SentenseStructureDecider
文構造、意味の評価とフィックスを行います。
(6)データエリア
・WordList・・・・・文を構成する語を管理します。
・WordSet・・・・・分かち書き候補を管理します。
・Word・・・・・・・単語を管理します。係り受け、格、意味、投票を管理します。
・DeepMean・・・・・2項関係意味を管理します。
pretensionには要求と資格という曖昧性のある意味があります。これにも対応していかねばなりません。格にも曖昧性があります。それらは、コーパスとか言語知識によって解決していかねばなりません。現在単語が置かれている文章のこの文にある意味が、どうか、ステージとかシーンとかカットとかの言語でどう言う意味に扱われていたかをマッチングするのです。文章対文章のマッチングです。これも各単語との共起からなる投票によって解決していくことになります。これも、内容検索のプログラムになるでしょう。
2.SentenceGenerator
フォーカスが当たった知識をパターンマッチングして、単語、連語を想起し、文法に則り単文、複合文と生成していきます。
(1)SentenseFocusSetter
言おうとしている知識にフォーカスを与えます。ステージの主人公はなにか、各文で何を主語にするかということを管理していきます。
(2)WordSelector
意味から単語を検索します。これは意味記号から単語を連想するため、内容検索によって実現すべき技術です。言わんとしている意味記号群にマッチする単語を単語テーブルを全件検索することによって取り出します。候補は複数有ると思います。処理の流れ、シチュエーションの知識を得て、その中の単語を選択していきます。
(3)MonoSentenceSelector
単文構造を検索します。意味記号から文を連想するため、内容検索によって実現します。
(4)SentenceAssembler
完全な文を生成します。文法知識を読み込んで、コマンドパターンによる処理を実現します。
(5)データエリア
SentenceAnalizerに同じ
おわり