蚂蚁集团推出两款 MoE 大模型,用国产芯片训练成本显著降低
03月24日0评
图灵奖得主杨立昆:大语言模型发展已接近瓶颈,AI 仅靠文本训练无法实现人类级智能
03月23日0评
鸿海首个大语言模型 FoxBrain 发布:具备推理能力,未来计划部分开源
03月10日0评
清华大学与瑞莱智慧联合团队推出 RealSafe-R1 大模型,相比 DeepSeek 安全性显著提升
02月24日0评
树莓派 Zero“硬核改造”:8 年老设备实现本地运行大语言模型
02月18日0评
UC 伯克利等最新研究:大语言模型就是比人类啰嗦,“提问的艺术”仍难参透
01月30日0评
26 年前的古董 Win98 电脑成功运行大语言模型:搭载奔腾 II 处理器、128MB 内存
2024.12.300评
美国哥伦比亚大学研究:大语言模型正在变得越来越像人类大脑
2024.12.200评
Salesforce 首席执行官:大语言模型可能已接近技术上限,AI 的未来是智能体
2024.11.250评
Nature:「人类亲吻难题」难倒 LLM,所有大模型全部失败
2024.11.160评
麻省理工研究:生成式 AI 未能对世界形成连贯的理解
2024.11.110评
联发科新一代天玑旗舰芯片针对谷歌 Gemini Nano 多模态 AI 进行优化,支持图像和音频处理
2024.10.080评
Meta 发布 Llama 3.1 开源大语言模型:128K 上下文长度,405B 版可与 GPT-4o 和 Claude 3.5 Sonnet 媲美
2024.07.230评
商汤大语言模型应用 SenseChat 向香港用户免费开放,支持广东话聊天
2024.07.090评
面壁智能开源“小钢炮”MiniCPM-S AI 模型,主打高效低能耗
2024.07.050评
开源 AI 大模型“洗牌”:阿里通义千问 Qwen2-72B 成“王者”,傲视 Meta Llama-3、微软 Phi-3 等群雄
2024.06.280评
斯坦福大模型评测榜 Claude 3 排名第一,阿里 Qwen2、零一万物 Yi Large 国产模型进入前十
2024.06.220评
ChatGPT 真能记住你的话吗?DeepMind 与开源大佬揭示 LLM 记忆之谜
2024.06.010评
商汤推出粤语版商量语言 / 多模态大模型,可深入理解粤语俚语、粤文化
2024.05.300评
用 AI 预报未来 0-15 日天气状况,中国气象局发布气象预报大模型示范计划
2024.05.240评