考察：「青葉詳細設計書の追記１」

　青葉詳細設計書を書いたあと、データエリア関係で考察が足りないことが分かった。行動のネットワークの構造と行動を表現するProcessFrameDataの構造、それと実際の動作環境との関係、行動制御の実現の仕方が明確でなく、プログラミングを開始できないなと気がついたわけである。今回は、コーディングできるレベルまで詳細設計をしていきたい。

１．行動のネットワーク表現

　行動の連鎖は自在に組み合わされるものである。常に決まった行動を起こすわけでない。状況に応じて行動は変化する。また、意識はおおざっぱな行動計画を想起し、実際に行動しながら、より具体的な個々の行動を実施していく。この個々の行動も状況によって適切なものが選ばれ、実施されていく。

　このように行動は入れ子構造であり、かつまた各要素行動は文脈の中で選択されて、文脈に影響していくものである。このようなネットワークの構造はどのようなものであるか。行動要素が無数にあるであろう。行動要素は上位の行動によって管理される。その管理は文脈という公開な場として実現されるべきであることが結論される。

　行動要素は条件知識（ondition）、コマンド知識（action）,次の行動とかサブ行動リストへのポインタ（nextaction）によって定義される。Conditionもaction,nextactionもそのポイント先の知識はまたポイントであったり、直値であったりする。知識はand条件、or条件、否定条件で複数の要素がクラスターとなっていても良いものでなくてはならない。こうしたデータ構造によって、行動のネットワークの必要条件が満足される。アトム知識ベースに埋め込み可能である。

２．ProcessFrameDataの構造

　行動要素ProcessFrameDataの表現を考えてみたい。基本的に知識ベースのACTIONテーブルのDATAフィールドに行動のコマンドを定義する。DATAフィールドの形式は次の通りである。

【コマンドの表現】

(command;condition=CONDITION_RID,action=ACTION_RID,nextaction=NEXTACTION_RID;COMMAND_NAME)

【条件の表現】

(condition;+FrameData_RID1&+FrameData_RID2|+FrameData_RID3・・・)

【条件と行動のFrameDataの表現】

(action;(agent;+human)

(directobject;+object)

(indirectobject;+human)

(verb:+v@give))

行動は格とアクションコマンド（verb）で定義する。もちろん、格にもアクションコマンドにもAttributeで属性を指定しておくことができる。

　この辺は、和葉との連携を考えての決定である。

３．動作環境との関係

　条件も行動もフォーカスの当たった知識群の構造とマッチングさせて、マッチしていたら実現していくという処理を取る。データ駆動型の制御である。自然言語処理（和葉）や画像認識処理（若葉）の処理とともに、処理しているデータにはフォーカスが当たっている。フォーカスは単語レベルから、シーン、ステージまでの幾層もの構造をもっている。データは全てFrameDataで表現されているので、それら条件のデータ構造とマッチングさせ、アクションを決定していくわけである。

４．行動制御の実現の仕方

　行動はネストしているとした。また連想によってどんどんシーケンシャルに展開してもいく。この制御は全て、文脈を操作することで、意志・評価・プランニングシステムから制御できるように成っているべきである。緊急性とか曖昧性無く行動を選択する必要があるときのみ直接、行動を選択する。行動選択の結果が文脈になることもあるのである。文脈には重要度とか実行可能性とかの評価が行われることにより、最終てきなフォーカスの当たった文脈となる。文脈とは目的設定でもあるのだ。目的設定して、現在の状況と、将来の見通しを評価システムによって与えられたものでもある。目標もFrameData表現していくので、意志・評価・プランニングシステムとの間も、ふつうの自然言語処理とか画像認識処理とかと同等に、同じ機構で実現されるであろう。データの置かれる場所が違うだけとなる。

５．モデル予測制御の実現

　行動のトレースPathオブジェクトはモデルである。このモデルを実現していく荷が現実と折り合いをつけていかねばならない。このモデルを現実にすり合わせていく過程を行動として実現していかねばならない。その為のクラスをAdaptiveEnvironmentとし、適用制御（モデル予測制御の適用部）を構築する。プラントの制御であれば、現実とモデルの誤差を指数関数的に減少させていく過程であり、ドアのノブ回しならば、感覚機器からの情報のフィットネス最大化制御をしていく過程である。この過程も実際には、１節で述べた行動のネットワークであり、学習によって獲得される。従って、モデル予測制御は、本体のPathとAdaptiveEnvironmentの２重の行動知識ネットワークで実現されていくことが分かる。知識データは汎用の知識FrameDataとして獲得されていくものである。無論、プリミティブな、生得的なFrameDataも存在している。

　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　おわり