Janus Pro
タイトルが紛らわしい(多分記者も勘違いしてるのだろうが…)が、モデル自体はDeepSeekライセンス。商用利用などの制限はないようだがMITではない。

最初見たときなんか派手に発表してる割には(ここ数ヶ月の)
Vlmとしてそこまで特筆するべき所も無さそうな…と思ったらよく見たらまさかの(Vision)v2i(Image)出来るモデルなのね…(新設カテゴリすぎて最初わからなかった)

比較対象のVisionモデルが、こう今となっては「
llavaとか懐かしいなー」ってなる名前だったので…(llm老人会)

公開されてるデモページのUIではVision2Imageをするメリットはあまり見られない(i2iなどはできていない)のでComfyUIなりでi2iして見ないとこの構造の利点は今の時点では判らない

あまりにも壊れすぎてるので、もしかしたら意図的に著名な版権は
LECO等で消してるのかもしれない(単に実写ベースに全振りしてるのかもだが)
その後の報告(各種の投稿)も見るに、どうも実写系でも得意と下手でかなりブレ幅が大きい模様。
Visionモデルが統合されれば顔も手も破綻しない、そう思ってた時代が私にもありました…(あまり関係なかった)
