generated at
高次元においてコサイン類似度0.2は激レア
400次元程度の高次元においてコサイン類似度0.2は1万回に1回の激レア
本当は768次元で試したかったんだけど100万回試しても0だった
:
dimover 0.20over 0.22over 0.24
2429742454177
10276025542379
100 22814076
2002591
300541
400100

py
import numpy as np for dim in [2, 10, 100, 200, 300, 400]: over020 = 0 over022 = 0 over024 = 0 for i in range(10000): x = np.random.randn(dim) x = x / np.linalg.norm(x) if x[0] > 0.2: over020 += 1 if x[0] > 0.22: over022 += 1 if x[0] > 0.24: over024 += 1 print(dim, over020, over022, over024)