考察:「和葉設計書4」

by ご近所のきよきよ



 いよいよ、夏雲を山の上に見る季節になりました。カモメールなぞも郵便局で買ってきました。夏というと日本語処理のプログラムを作っていますね。去年は英語の勉強していましたが、いつもはパソコンに向かっています。画像認識に今年は打ち込もうと思って春になりましたが、なんだか、もっと早くに自然言語処理技術を確立しなくては、信濃プロジェクトがビジネスにならないと思いまして、急遽、和葉の設計に掛かることにしました。言葉はちょっとしたゲームに応用できそうですし、画像認識は外界からのイメージデータから言葉を学習していく為の技術として考えていますので、やはり言葉はどうゆう物かを先ず知らねばということで、和葉を先行開発しようと決心したわけです。
 
 言葉は表層の単語列で提示されます。それを知識を基に解釈して、中間の作業データを生成し、最後には基本的な認識したといえるデータに落とし込むことです。認識したといえるデータはイメージからの認識とマッチするわけですが、この基本データがどんなものかを和葉を作りながら探っていくということです。プログラムは和葉の物ですが、同時に画像認識システム若葉の仕様も考えていくつもりです。今のところ、このデータはオントロジーのコアとなる記号セットとその組み合わせ表現ですねこれを決めていきたいと思います。これは、あくまでもたたき台で、和葉を作りながら、テストしながら、使える技術に成長させていくのです。
 
 ということで、当面の知識の表現を次のように定めます。これは、単語や連語の辞書の内容として提示しているものです。
(root;(surfasemean,id=xxx;
   (sentence,id=xxx;(term,id=xxx,case=agent;(word;?001)(mean;+human+life)(id;xxx))
      (term,id=xxx,case=directobject;(word;?001)(mean;+human+life)(id;xxx)))
(attribute,id=xxx;(target;(id;xxx))(modifier;(id;yyy)))
・・・・・・・・・・・・
(meanscheme,id=yyy;
 (actors,id=yyy;(actor;(id;yyy))(actor;(id;zzz)))
    (sentence,id=xxx;(term,id=xxx,case=agent;(word;?001)(mean;+human+life)(id;xxx))
      (term,id=xxx,case=directobject;(word;?001)(mean;+human+life)(id;xxx)))
 (attribute,id=xxx;(target;(id;xxx))(modifier;(id;yyy)))
 ・・・・・・・・・・・・
 
)
 
【説明】
・surfasemean:表層の意味記述を提示する。格とか自立語の関係を示す。
・meanscheme:2項関係を示す意味のセットを提示する。最終的な意味表記である。
・attribute:修飾、被修飾の関係を示す。
・actors:登場者を示す。
 

 

おわり