大模型一对一战斗 75 万轮,GPT-4 夺冠,Llama 3 位列第五
13:280评
GPT-4 整治学术不端:人大 / 浙大团队实测 7000 篇论文,撤稿预测与人类 95% 一致
04月15日0评
融合视觉能力,OpenAI 向开发人员提供 GPT-4 Turbo with Vision
04月10日0评
OpenAI 创始大神手搓千行 C 代码训练 GPT,附 PyTorch 迁移教程
04月09日0评
GPT-4 推理能力为 0?开发者悬赏 1 万美金被打脸,神秘提示正确率直冲 100%
04月08日0评
报告称 OpenAI 采集了超一百万小时的 YouTube 视频来训练 GPT-4
04月07日0评
苹果研究人员称其设备端模型 ReALM 性能优于 GPT-4,可大幅提升 Siri 智能程度
04月02日0评
和 GPT-4 并列第一,LMSYS 基准测试显示 Claude-3 模型表现优异
03月28日0评
OpenAI 的 GPT 商店审核失控:被指充斥侵权和垃圾内容
03月21日0评
OpenAI CEO 阿尔特曼:GPT-4“有点糟糕”,今年将推出新模型
03月19日0评
OpenAI 官方博客提前泄露 GPT-4.5 Turbo,有望今年夏天发布
03月13日0评
万物皆可《毁灭战士》,专家利用 GPT-4V 模型运行该游戏
Claude 3 成功破解未公开算法?智商测试 101 分碾压 GPT-4
03月06日0评
新王 Claude 3 实测!各项能力给跪,打麻将也会,确实比 GPT-4 好用
03月05日0评
打脸奥特曼,GPT-4 今年比去年还懒!网友在线实测出炉
02月05日0评
谷歌 Gemini 大逆转?斯坦福 Meta 华人证明其推理性能强于 GPT-3.5
01月02日0评
GPT-4 抽象推理 PK 人类差距巨大!多模态远不如纯文本,AGI 火花难以独立燃烧
01月01日0评
GPT-4 API 曝出重大漏洞:15 个样本微调,一句 prompt 秒生恶意代码供出私人信息
2023.12.270评
GPT-4 搞科研登 Nature!布洛芬配方轻松拿捏,诺奖得主提出的复杂反应也能完成
2023.12.210评
谷歌 Gemini Pro 实测不如 GPT-3.5,CMU 深入对比研究:保证公平透明可重复
2023.12.200评