随筆:「内容検索」

by ご近所のきよきよ


 

 データベースのレコードの内容からキー項目などを得る検索には専用のデータベースマシンを構成するしかないようにこの頃感じてます。それを以下に説明していきましょう。


 RDBでレコードにキーとフィールドを蓄えていきます。フィールドには複数の記号が記述してあるとします。この記号が内容で、キーはこの記号を含む概念とします。そして、検索は記号を与えてキーを得ていくというものです。キーはあるレコードでは内容記号としても現れるとすると、入れ子構造のオブジェクトが表現されるわけで、内容検索は当然このようなことを許すことになります。

 とすると、通常のインデクスをもうけるやり方では効率の向上は期待できません。結局、全レコード走査しかなくなるからです。


 そこで、データベースマシンの登場です。つまり、シリンダごと全レコード検索していくことで、しかもマルチコアプロセッサで並行処理で走査をしていくマシンを考えるわけです。データベースはプログラムからは通常のRDBのようにアクセスできるようになっていて、つまり通常のRDB見える。でも、あるSQLコマンドでは、シリンダーごとに並列に全レコード走査し、キーを検索ができるようになっている、そんなデータベースマシンですね。データベースのブロックに記号と一緒にキーへのポインタも付加して格納するようになっていればこんなことは可能でしょう。いろいろと工夫すべきことはあると思いますが。


 とにかく、内容検索には並列全レコード走査操作が必須と思います。


 頑張りましょう。


 
 

おわり