随筆:「攻めあぐねるプログラミング」

 
 「オブジェクト指向自然言語処理」を書き上げてからも、書き足りなかったことが次々と出てきて、なかなかコーディングに入れないでいます。
 大きなところでは、文法がしっかりしていない文を解析していくことです。自然言語処理としては重要なテーマです。これを考察してみたのが、「談話処理」です。補稿として公開します。そのほかに考えたことは、
(1)コーパスに構造を持たせること
 文章をコーパスとして保持しまして、文とか、情報の単位、単語とかをこの内部情報として管理するというものです。単語がどんな文章に使われるかという情報は大切なものです。この情報があれば、プライミングとか単語列からどんな文章かを推測するのにも役にたちます。
(2)知識ベースの構造について
 3つのテーブルでオブジェクトを表現することを考えましたが、これは冗長でよくないと気づきました。1オブジェクトは、1テーブルで表現して、配列や内部フレーム構造はフィールド値をXMLとかJSONで表現するのがよろしいと。JSONがお勧めですね。
(3)曖昧性表現について
 結構複雑になります。鍵と鍵穴を設定することも考えると大仕掛けになります。なんかエレガントにならないかと思うのですが、やはりこうした大仕掛けなものなのかなと観念しそうです。
(4)比喩とか視点の解決
 本質的にフレーム問題に遭遇する問題ですので、本格的な解決は先送りです。”文脈空間”に早く挑戦できるようになりたいものです。
 

「オブジェクト指向自然言語処理の補稿(談話処理)」本文は下記のPDF文書です。

「談話処理」PDF

 
 それと音声認識について、さらに勉強しました。図書館で、「音声工学:板橋秀一編著、森北出版」を見つけて、一気に読んでしまいました。本当につまびらかに音声認識とか、音声合成技術が語られていて、音声処理もいつか挑戦してみたいなとあこがれを抱きました。
 この本には、音声認識にホルマント情報は使われていないとありました。今まで呼んだ本には決まってホルマントによる認識が記述されていたので、てっきりホルマントベースで認識技術はなりたっていると思っていました。意外。ホルマントは崩れやすく、情報を取り出すのが難しいのだそうです。特に連続発話では難しいとか。
 私は、ホルマントでもうまくいくと直感するのですがどうでしょう。崩れても、崩れている前後のパートの周波数の固まりが干渉しあっているので、組み合わせ的には巧くすると、きれいなホルマントを推測できるのではないかと。人間の脳はそうしているし、オウムですらできる処理だからです。なんか、推測できる仕組みがあるようでなりません。3音節ぐらいで、言葉は認知できるとか、この本にはありました。ホルマントに執着してもなんとか道はあるような気がしますが。波形の時間のゆれも大切だとか。なんかおもしろいパターン認識技術が隠れていそうですね。



小山明雄