AI 测试
别让大模型被基准评估坑了!测试集乱入预训练,分数虚高,模型变傻
2023.11.09
0评