「世界开源新王」Reflection 70B 跌落神坛?重测跑分暴跌实锤造假
10月07日0评
“最强开源模型”Reflection 被打假,英伟达科学家称现有测试基准已不靠谱
09月13日0评
开源大模型新王 Reflection 70B 超越 GPT-4o:新技术可纠正自己幻觉,数学 99.2 分刷爆测试集
09月06日0评