「世界开源新王」Reflection 70B 跌落神坛?重测跑分暴跌实锤造假
2024.10.070评
“最强开源模型”Reflection 被打假,英伟达科学家称现有测试基准已不靠谱
2024.09.130评
开源大模型新王 Reflection 70B 超越 GPT-4o:新技术可纠正自己幻觉,数学 99.2 分刷爆测试集
2024.09.060评