generated at
StyleTTS 2
>style diffusionlarge speech language models (SLMs)による敵対的学習を活用し、人間レベルのTTS合成を実現するtext-to-speech(TTS)モデルであるStyleTTS 2を紹介する
>large speech language modelsは、敵対的学習において識別器として用いられ、音声言語モデルの知識を音声生成タスクに転移することで、音声の自然さを向上させる。