消息称亚马逊正开发推理模型 Nova:又要快又要能深度思考
18:170评
1/30 训练步骤复刻 DeepSeek-R1-Zero,沈向洋姜大昕张祥雨等开源推理模型 RL 训练方法
02月22日0评
阶跃星辰推理模型 Step R-mini 上线:宣称“文理兼修”,AIME 等数学基准测试成绩超 o1-preview
01月17日0评
参数量仅 0.25B,成都人形机器人创新中心全国首发 R-DDIRM 高速推理模型
2024.11.230评