generated at
よくある表記揺れは機械で対応
のりしろ
>17:00-17:20 Helpfeelの検索技術の面白いところ全部見せます!teramotodaiki

よくある表記揺れは機械で対応
そのうちいくつか紹介する
動詞・形容詞の活用
ブラウザ上で形態素解析するのは高負荷
kuromoji.jsだと重すぎるのかなtakker
どうするか
事前にサーバーで形態素解析する
そのデータをもとにクライアントで語幹・活用を予測する
英語のNLPの文脈だと確か見出し語化とかStopwordsという名前がついているアプローチ。mgn901
人力意図表現作成を生成AIで援助する
few-shot promptingというプロンプトの与え方をしているらしい。
これをエンジニアとテクニカルライターが共創しているのがおもしろいところ
エンジニア:cosense上でOpenAI APIを使えるUserScriptを作る
えっなにそれほしいtakkerseibeはるひbsahdyosider基素
CSPで許可されていたのは、これのためか
テクニカルライター:自分でブロンプトを調整する
ベクトル検索OpenAI Embedding APIが発表されたことで注目度が上がった。
Embedding APIは端的に言えばword2vecの文章版というべき存在。

ばくそくで実装した
お問い合わせフォームのほうに実装してみた
自然文なため、予測が難しかった
かなり精度が上がった
検索にも使えないか
ユーザーが思いついた言葉と意図予測とを結びつけるところに使った
どうしたか
キーワード検索でインクリメンタルに即時反映させる
キーワード検索が出てこなくなったとき、裏でベクトル検索を走らせて、返って来次第結果を出す
「優れたユーザーインファーフェスとちょうどいいアルゴリムの組み合わせ」
職能で分けていたら、この境地には至らなかっただろう