美团开源 LongCat-Flash-Prover 大模型:5600 亿参数,刷新两项 SOTA 水平
03月21日 0评
豆包提出全新稀疏模型架构 UltraMem,推理成本较 MoE 最高可降 83%
2025.02.12 0评
元象发布中国最大 MoE 开源大模型:总参数 255B,激活参数 36B
2024.09.13 0评
MiniMax 稀宇科技发布万亿参数 MoE 模型 abab 6.5,核心能力接近 GPT-4
2024.04.17 0评
开源大模型超越 GPT-3.5!爆火 MoE 实测结果出炉,网友:OpenAI 越来越没护城河了
2023.12.12 0评
深度揭秘爆火 MoE:GPT-4 关键架构,成开源模型逆袭杀手锏
2023.12.11 0评