この10年、自然言語の意味処理の研究を少しずつ前進させてきました。この期間の成果を論文の形にまとめましたので、ご覧ください。
本論文のテーマをここに述べました。次の通りです。
自然言語処理で、文書の意味を認識することは重要な技術である。例えば、
「ジョバンニは銀河ステーションで汽車に乗った。すぐ後から、カンパネルラも乗り込んできた。汽車は石炭袋についた。」という文章を、次のように要約したいとしたらどうであろうか。
「ジョバンニとカンパネルラは汽車で、銀河ステーションから石炭袋に行った。」
これには、汽車に乗った2人が、汽車の移動によって、一緒に移動することを知らなければいけなし、重要な単語を認識できなくてはいけない。
言葉を換える、文章を変換させること、換言というものを実現するための意味処理技術を考えていきたい。換言は、文、文章の完全な認識を実現しなければできないことである。したがって、ここで議論するものは、意味処理というもの全般に関わる、重要な技術として発展していくものとなるであろう。
この論文で提起することは、次のことがらである。
(1)意味ネットワークに代わり、ステージ、シーン、カット、エピソードという、動画映像を管理する手法を導入する。この技術を動画システムと呼ぶこととする。
(2)別の単語に置き換えられない、根本の意味を担うプリミティブを追求していく。基本的に英語の単語の幾つかをプリミティブにする。
(3)動画システムの上の推論を定式化する。
例文で、動画システムの必要性を訴えています。
本論文のメインテーマである、動画システムの構造を示しました。
2つの文章の等価性を調べるアルゴリズムを例を追って概観してみました。
意味処理で重要と思われる要素技術をリストアップしてみました。
締めくくりとして、これからの応用を概観してみました。
意味処理で重要と思われるプリミティブ単語を一覧にしてあります。
推論を実現する方法を概略しました。
内容をお読みになるときは、次のPDFファイルをダウンロードしてください。
小山明雄