考察:「認識とは」

by ご近所のきよきよ


 

 自然言語処理も画像認識技術をベースにすると分かりやすいシンプルなシステムになります。認識とは「イメージを浮かべること」なのです。

(例文)レストランで食事を取った。餃子が出た。

(問い)レストランで何を食べましたか?------>餃子


 上記の例文を認識する手続きを考えてみましょう。

(1)「レストラン」がステージになります。これは「レストランで」という言葉からの連想でステージを表現していると推論するわけです。「レストラン」モデルを知識ベースで発火します。

(2)「食事を取った」からの連想で、テーブルと人物と箸などの食事のシーンを連想し、「レストラン」ステージに埋め込みます。「食事」を「取る」ことが、テーブルにある料理を食べる仕草と連想します。

(3)「餃子がでた」からの連想で、テーブルの上に「餃子」モデルをイメージとして埋め込みます。

(4)「何を食べました」から「食事を取った」シーンを解析して、「食べる」行為のオブジェクトが「餃子」と推測します。答えは「餃子」です。



 こんな感じで、自然言語処理には画像認識技術が必須であることが分かります。



 

おわり