Keichoのログから生成するRegroupマップの付箋レイアウト
バージョン7
行間を開けたが、もっと開けないとあんまり意味がないな
バージョン5,6
バージョン4
スコアで足切りしたキーワードの最初の出現場所に付箋を追加
思いついたこと
一定以上に長い文章の入ってる付箋のメニューてspawnを選ぶと、その内容が入った複数行インポートダイアログが開くと良い
そこでどういう分割をしたかのデータを取っておけば学習データに使える
できた
バージョン3
これは一発言ごとのローカルな特徴抽出
やはりこっちの方がよい
こっちでは対話全体にわたる特徴が捨てられてしまう
そこでバージョン2からスコアの高いキーワードだけ取り出してはどうか
バージョン2では「2回以上」としたが、回数ではなくスコアで足切りすべきだ
バージョン2
2回以上出現したものだけに限定したもの
キーワード抽出の結果なので短すぎる断片が多い
バージョン1
単なるキーワード候補になったものを全部並べただけだとゴミが多い。2回以上出現したものに限るとよさそう。
右端の「回答全文」は当然字が細かくなるが、Regroup上ならズームインして読むことができるし「最悪これを見ればすべての情報がある」を担保することで、情報を失う不安を感じたり、チャットログとRegroupを行き来して見比べたり、ということがなくなる。
質問、回答、回答を刻んだもの、スコアの高いキーワード
当初はキーワード全部入れるイメージだったが、実際にやってみるとゴミっぽいのでスコアの高いものだけにした
同じものが繰り返し表示されないようにした
「場所」「関係」「時間」もありかな