AI基准

DeepSeek、OpenAI、Kimi 视觉推理哪家强，港中文 MMLab 推出推理基准 MME-COT

02月22日0评

无一大模型及格！北大 / 通研院提出超难基准 LooGLE，专门评估长文本理解生成

2024.08.070评