DeepSeek、OpenAI、Kimi 视觉推理哪家强,港中文 MMLab 推出推理基准 MME-COT
02月22日0评
无一大模型及格!北大 / 通研院提出超难基准 LooGLE,专门评估长文本理解生成
2024.08.070评