generated at
Scrapboxでベクトル検索するUserScript作りたい
Scrapboxでベクトル検索するUserScript作りたいtakker
LLMなしでもできるかな?
文章ベクトルを作る事ができるならLLMである必要はなさそうinajob
LLM代を払う気があればすぐできそう
バイトしようかなーtakker
inlineのインデックスを一気に作った日のbillingがこんなもんinajob
ページ数どのくらいだろうな、ページ数というよりtoken数なのだろうけど
井戸端との比較にはならないけど、1000倍も無いでしょう、位は言えるのでは?
nishioさんならもっと詳しそう
というかnishioさん、井戸端のインデックス作ったりしてないのかな?
僕がやらないとハプンしないことがありすぎて後回しになり続けてるnishio
> $0.0004 / 1K tokens
> 5ドルくらい?意外と安い
> あ、違うな、長いページがオーバーラップしながら分割されるので大雑把に2倍
いまembeddingのAPIがもっと安くなっている
1年前の記事nishio
今確認したらこの時点から4倍安くなってて、さらに5倍安い新しいAPIができてる
新しく始めるなら後者のAPIを使った方がいいんじゃないかな
この前open ai apiのdocsみてたら、いろいろ新しいAPIが生えてて、embedding使わなくてもいけるんじゃないかと思ったりもしましたtakker
function callingでscrapboxのAPIを呼び出させるとか
うまい棒6,7本分くらいかな。それなら課金しても怒られなさそうtakker
(何を気にしているんだ)
確か今先払い式になっているので、それを超えたらエラーになると思われますinajob
ベクトルインデックスは中度半端にできてもある程度機能するので、金額決めてできる限り作るとかでも良さそう
やってみます!takker
spending limitってやつですねtakker
githubとかherokuにもある
ベクトル検索はQdrantの無料プランを使っている
無料版はメモリ制限があるから井戸端全部はいるかな?
本文をオンメモリのペイロードにつむと難しいんじゃないかなnishio
リンク先を出すだけなら本文はいらないよね
遅くて良いなら Scrapbox ChatGPT Connector の中でやってる方法でローカルでPython使って検索させることもできるはず
JSでcodingしなおすか、WASMでなんとか高速化できなかいかと考えていますtakker
inlineベクトル検索はLLMを使っているんですか?takker
はいOpenAIのEmbeddings APIをつかっています、というか上のomoikane-embed-coreそのままですinajob
なるほど~takker
Geminiとか使えば無料の範囲でできるのかな?
15RPMだからちょっと厳しそう

JSから使えるものとしてTensorflowがあるけど、これはベクトル検索関係ない?takker
これは機械学習してモデルを作るほうのアルゴリズムだから違うか
コサイン距離など何らかの距離関数でソートして取り出せれば何でも良さそうinajob
それよりインデックスをうまいこと作って高速化するとかそのへんが気になる

inlineのベクトル検索のUI
ベクトル検索による関連ページリストが表示されているページを見つけようとしたが、探し出せなかったtakker
関連ページリストの中に紛れ込んで出てますinajob
sim: ページ名 となっているのがそれ
noneとなっているのは、実装都合です・・
リンクのない逆リンクを検索の結果も出している
これは自分しか見えないようにしている(全文検索が遅いので・・)
つまり、inajobさん意外は、関連ページリスト内からベクトル検索した結果しか表示されないということですか?(たぶんちがう)takker