ComfyUI VLM nodes
各種LVM
llama-cpp-pythonを使っているので、ほとんどのggufモデルをフォルダ(
ComfyUI\models\LLavacheckpoints
)に入れて読み込むだけで使うことが出来る
プロンプト生成
音楽生成
出力形式は、GPT-4ですら数字だけで答えろ、と言っても余計なフィラー挟んでくるので、こうして制限できるのは非常に使いやすい

🤔LLaVaの出力で数字の羅列か空白しか出力されない
カスタムノードへのフルパスの中に日本語があると多分正常に動かない
