> 早速 Alibaba の出した最新モデルQVQ-72B-Previewに東大数学2015年の問題を解かせてみた。
> 結果2回目で正解のm=32を導き出して、十分性の確認までしてくれた。
>Qwen2-VL-72Bをベースにしたマルチモーダル推論のオープンウェイトモデルであるQVQを作成しました。QVQは、AIの視覚的理解と複雑な問題解決能力の大きな飛躍を表しています。QVQはMMMUで70.3のスコアを達成し、Qwen2-VL-72B-Instructと比較して、数学関連のベンチマーク全体で大幅な改善を示しています。