検索エンジン
構成
Index Manager
インデックスの構造を持つデータを管理する
インデックスはバイナリファイルで管理する
なので、二次記憶装置からの読み出し量をできるだけ減らしたい
Index Searcher
インデックスを用いて全文検索処理を行う
ユーザーから受け取った検索クエリに適合する結果を並び替えてその上位を返す
Indexer
インデックス構築をする
検索対象のテキスト文書からインデックスを作成する
テキスト文書を単語に分解して、インデックス構造に変換する
Document Manager
クエリに適合するものを取り出して返す
全文検索の方法
インデックスを用いる
事前にインデックスを作成しておく必要がある
文書の量が増えても検索速度が落ちにくい
検索システム
Python
検索エンジンの評価指標
参考
チューニング。機械学習の話
Pairs
論文集