generated at
ベクトルDBの限界
AIにリソースとして与えるデータ構造について


結論
ベクトル表現は、データポイントを数値ベクトルとして意味的にエンコードし、Word2vecやBERTのようにテキストデータを効率的に処理する

しかし、ベクトルはデータ間の明確な関係を欠き、高次元空間での検索と解釈が難しくなる。
また、文脈の手がかりが失われ、複数のベクトル間の多段階推論や説明可能な類似性スコアが困難。

>・ベクトルはデータ間の明示的な構造化された関係を欠いています。接続は暗黙的に推測されなければなりません。
>・ベクトル空間は非常に高次元になり、検索と解釈が困難になります。距離的なメトリックが意味を失います。
>・ 位置、シーケンス、ソース階層などの重要な文脈手がかりは、ベクトルとしてエンコードすると失われます。
>・ 明示的な接続がなければ、複数のベクトルをまたいでの多段階推論は困難です。
>・ ベクトルの類似性スコアには固有の説明が不可能です。類似性マッチは直感に反することがあります。