Scrapboxでベクトル検索するUserScript作りたい
Scrapboxでベクトル検索するUserScript作りたい

LLMなしでもできるかな?
LLM代を払う気があればすぐできそう
バイトしようかなー

inlineのインデックスを一気に作った日のbillingがこんなもん

ページ数どのくらいだろうな、ページ数というよりtoken数なのだろうけど
井戸端との比較にはならないけど、1000倍も無いでしょう、位は言えるのでは?

さんならもっと詳しそう
というか

さん、井戸端のインデックス作ったりしてないのかな?
僕がやらないとハプンしないことがありすぎて後回しになり続けてる

> あ、違うな、長いページがオーバーラップしながら分割されるので大雑把に2倍
いまembeddingのAPIがもっと安くなっている
1年前の記事

今確認したらこの時点から4倍安くなってて、さらに5倍安い新しいAPIができてる
新しく始めるなら後者のAPIを使った方がいいんじゃないかな
この前open ai apiのdocsみてたら、いろいろ新しいAPIが生えてて、embedding使わなくてもいけるんじゃないかと思ったりもしました

function callingでscrapboxのAPIを呼び出させるとか
うまい棒6,7本分くらいかな。それなら課金しても怒られなさそう

(何を気にしているんだ)
確か今先払い式になっているので、それを超えたらエラーになると思われます

ベクトルインデックスは中度半端にできてもある程度機能するので、金額決めてできる限り作るとかでも良さそう
やってみます!

spending limitってやつですね

githubとかherokuにもある
無料版はメモリ制限があるから井戸端全部はいるかな?
本文をオンメモリのペイロードにつむと難しいんじゃないかな

リンク先を出すだけなら本文はいらないよね
JSでcodingしなおすか、WASMでなんとか高速化できなかいかと考えています

なるほど~

これは機械学習してモデルを作るほうのアルゴリズムだから違うか
コサイン距離など何らかの距離関数でソートして取り出せれば何でも良さそう

それよりインデックスをうまいこと作って高速化するとかそのへんが気になる
inlineのベクトル検索のUI
ベクトル検索による関連ページリストが表示されているページを見つけようとしたが、探し出せなかった

関連ページリストの中に紛れ込んで出てます

sim: ページ名
となっているのがそれ
noneとなっているのは、実装都合です・・
これは自分しか見えないようにしている(全文検索が遅いので・・)
つまり、

さん意外は、関連ページリスト内からベクトル検索した結果しか表示されないということですか?(たぶんちがう)
