Cotomo
キャラクターのアイコンにしたらキャラクターとしゃべっている感覚になった
この利用方法はかなり意識されてそう
ドキドキする
わかる

ボタンの出し方がいけてる
AI「いつでも話しかけられるようにしたいんだ」→iOS許可設定出す
AI「声を変えてみる?」として複数の声を出したあとに設定ボタンが1つだけ出てくる
のファインチューニングモデルでは?と言われている

独自モデルらしいがそれがFTなのかな

ChatGPTを使ってると答えるけどアライメントがかなり緩い

ChatGPTが伏字にする部分をローカルLLMで埋めてるのかな
話してるそばから反応されるので、話をかぶせるのにとても気を使ってしまう。実際には無視してくれるのかな?
今使える技術で自然に会話をできるように気を使うとこうなった、という感じのプロダクト
初めて会った人間と話してる感覚なのでMPを大量消費した
マネタイズが気になるところだ
ローカルなのか

タイトル変更されている予感

えっw

すごい、なんか応答が早い

LLMで複数回答を作って小出しにしている?
ChatGPT with voiceと比較
フィラーというか、相づちみたいなのがちゃんとしている
これがリアル感を相当引き上げている感じがある

声がかわいい、というか人間に近い
ChatGPT with voiceは合成音声感がある
Cotomoは若い年齢の声・人格にチューニングされている感がある
相手の話を遮って声の入力ができる
まぁ会話が衝突すると、相手は話を引っ込めてしまうが・・
会話用にチューニングされている
性格もはいってそう
短文が返ってくる
これはChatGPT with Voiceでもテクニックがありそう、事前になにか言っておくと良さそう
過去の会話を覚えておいて文脈に織り込んでくれる
以下にも類似の構造があることを教えてくれた
色の名前
確かに、赤と青の間が紫で、更にその間に青紫とかがある
ピッチャーの投球の名前
ストレートとかフォークとかの間に微妙な軌道がある
これは未来だ
音声会話の
不気味の谷を感じる程度には、本物の会話に近い気がする
ちょっと試してみた

おもったよりぐいぐい質問してきたな
初回の自己紹介のあたりは、会話の流れが固定化しやすいので、いい具合に調教されてそう

その後自由に話すモードになると、様子が変わった気がする
自由モード…なんかこう、なんともいえない背後にプロンプトを感じる会話体験だった

レスポンスの良さ、音質の悪さが音声通話しているようでそこはすごいなと思った
cotomo
娘の情報を覚えている様子
家族構成は覚えておく仕組みがありそう
結晶化の暴力については話した
暴走族、珍走団みたいな例を出して、と話したけど微妙
おばさん→お姉さん
社会的に悪いとかじゃないしな・・
中二病 → 中二
謎のチョイス
話した内容の書き起こしを見る方法が無さそう
概要だけ残してくれる
会話がループする事がよくある
だんだん裏側が透けてきた
> ユーザーがしゃべった内容は音声認識技術で解析され、データをもとにStarleyが自社開発したLLMを使って最適な返事を生成。それを音声合成技術によってアプリで再生する仕組みという。
自社開発のLLMだった

会話に出していない人のことを言ってきたみたいなのがSNSにレコメンドされて出てきててちょっと怖いとも思っちゃう
