generated at
GPT-4oの性能評価の結果

テキスト評価

推理力の向上
GPT-4oは、DROPをのぞく、MMLUGPQAMATHHumanEvalMGSMSoTAを記録した。


自動音声認識の性能評価

音声ASR性能
GPT-4oは、すべての言語、特に低リソース言語において、Whisper-v3に比べて音声認識性能を劇的に向上させた。


音声翻訳の性能評価

音声翻訳性能
GPT-4oは、CoVoST-2という音声翻訳ベンチマークにおいて、新たな最先端を打ち立てた。


M3ExamZero-Shotの結果

GPT-4oはすべての言語においてGPT-4より優れた。


画像認識の評価

視覚理解テスト
GPT-4oは視覚認識ベンチマークで最先端の性能を達成。