ParallelTalkは、時間を超越したインターフェースのために時間軸のannotationが必要
生徒は時間の進行にある程度縛られていて、だからこそネタバレしなかったりみたいなうれしさがある
時間軸が分岐するならなおさら
これ好き

これ好き

音声を全部聞き直さなくても、ここが何の話をしているかというのがざっくり分かる必要が有る
ここは、人間の
小人さん的パワー + 音声認識/自然言語処理の両方が使えそう
これは、参加者の善意と小人さん的行動を前提とすれば、不要そう?

逆に、不特定多数がいる環境なら大事

でも、これ上手く作れば一つの製品として切り出しできるんだよね。

自社でプラグイン的に作るみたいなことができる
なのでリソースが余ったら、機能を抽象化させる方向は割とおすすめかも
OpenAIのWhisperが使えそう?

+1

多分LLMを使うほうが楽
まあでもあえて人間に作業させる意味はある