generated at
11/17/2024, 10:46:43 AM
全文検索
データを
Elasticsearch
等につっこめば検索は簡単にできる
検索結果のソートが重要だと思う
単語がたくさん連呼されていたら重要というわけでもないし
scrapboxの場合、更新日時が古くても重要なページもある
テキストの量が多ければ重要というわけでもない
とりあえず
Page Rank
っぽい物を作ってソートしてみている (2021/3時点)
被リンク数が多いページが重要
たくさんの被リンク数が多いページからリンクされているページがもっと重要
最終更新日も少し加味する
アルゴリズムが隠蔽されていると不安になる
隠されたスコアによる謎のソートではなく、理由を明示して納得させるUIを選んだのが
HeadWord