generated at
ピッチシフトマグロナシステム(2020年8月)
注意:タイトルは筆者が勝手につけた。こういう単語は放送中には出ていません
簡易マグロナシステムあたりが参考にされるが、古いのでアップデート
簡易テストにバ美声
恋声(0.4s)より遅延が小さい
130%超えで品質劣化するが、男声→女声変換は130%では足りない
パラメータをテストして一瞬の可愛さがでるかを確認する
ボイスチェンジャーは完璧にM→Fにするものではない。聞いていて辛いもの(デバフ)である
このデバフを話し方・声の出し方で減らすことになる
ASIOに対応したオーディオIFをつかう
お勧めIF
[Babyface Pro FS - Synthax Japan Inc. シンタックスジャパン]の無印 中古
レイテンシは100-120msまではギリ歌える
ルーティング
Voicemeter Bananaは体感80-100数十msぐらい持っていかれる。使っていない
Mixなどの諸問題はNETDUETTOとDAWの併用でだいたい解決
長時間使うと遅くなる
この辺りの不満に10万円出せるならBabyface ProのTotalMixを使うと完全解決らしい
>TotalMix FX:レイテンシーの無いサブミックスと完全な ASIO ダイレクト・モニタリング
仮想ルーターをつかう必要がない
HWにどの音を入出力するかが選べる
1:22:00 ここからガチ勢向け
周波数ごと(20分割ぐらい?)に切り分けて変換してmix
音程によってパラメタのスイートスポットが違う
普通の声で良くても低い声にすると全然かわいくない、みたいになる
全体て平均値を出すセッティング
欠点
音が濁る。
同じトラックを重ねている。リミッターをかけているので、ちょっとしたため息とかでコンプがかかる
基素ここ理解できてない
2019年 MTransformerでのモジュレーションで、高い声/低い声ごとにスペクトルエンベロープが設定できるので頑張っていたが、人間のやる作業ではなかった
基素 ここら辺FANBOXにも書いてた
現環境:可変ピッチで声のレンジを女性にする
変換前の音のクリアさの向上(これは必要が出たらやればいい)
オーディオIFをUA55→Babyface Pro
上(8000kHz↑)の倍音がボイチェンでは重要
生声では気にならないが、ボイチェンをかけると影響が出る
16kHzより上は削ってもいいと言うのがボーカルの常識だが、実際に消してみると消すと声の抜け間がなくなってしまう
高周波の音のパワーは弱いし、ピッチシフトをするとノイズになる(EQで削ってるのと同じ)
Aston Microphones Spiritで解像度が足りない(高周波が潰れる)
2:07:00 男性と女性で喉がゴロゴロする領域が違うと言う考察
男性の方がゴロゴロ領域がでかい
上に合わせると
ピッチシフトしたときに、低い声が低くならない
中間も違和感のある声になる
下に合わせると
高い声が上がりきらない
基素
ここ配信中の図を見た方がいい
ゴロゴロを出すなというのはここでも言われている(ここでは「エッジ」と表現されている)
アイデアの要点:元音声の検出ピッチごとにシフトする量を変える
動画2:18:00ごろ
MTransformerのmodulation
低い声なら+5、高い声なら+7.5みたいにする
ステップ的に遷移するようにする
これをGraillon2でやる
Mtransformがしゃりしゃりするので
プラグインの組み合わせで面倒なので、はじめはMtransformで探索した方が良い
BlueなんとかPich Analyzerにピッチに対してMIDI CCの数値を出力する機能があった
ただしこの値は線形
MIDI curveと言うプラグインに通す
MIDI ccの値をグラフに応じて上昇幅を変更する
このエンベロープの設定は気合で見つける
DAWのside chain(他のプラグインのパラメータを参照してプラグインのパラメータを動かす)をつかう
簡易マグロナシステムのモニタリングはできなくなる
ボイチェン特性の考察
音域(女性の方が広い)
周波数帯域におけるゴロゴロ音の広さ(女性の方が狭い)
ボイトレで地声の高音域を伸ばすことでいけるのでは?
Reafirのノイズ検出はレイテンシが大きい
iZotope RX7の方が上位互換 10-20msぐらい?
全体構成
iZotope ゲート・コンプ・リミッター
RX7 ノイズとる
Graillon2に通す
可変ピッチでもループバックで聞いているので歌は歌える