4 月 15 日消息,据外媒报道,美国 AI 数据标签企业 Scale AI 于当地时间 4 月 13 日宣布,最新一轮融资后该公司估值73 亿美元。
Scale AI 由时年 19 岁的Alexandr Wang在 2016 年创立,先后为美国自动驾驶汽车公司 Waymo、丰田汽车 Toyota、美国网约车公司 Lyft 等客户公司提供用于机器学习的数据标记服务。
▲ Scale AI 创始人 Alexandr Wang
2016 年,年仅 19 岁的 Alexandr Wang 从麻省理工大学辍学,同年在完成了硅谷创业扶持公司 Y Combinato 的孵化项目后,和 22 岁的 Lucy Guo 一同创办了 Scale AI。
Alexandr Wang 出生在美国新墨西哥州,父母均是物理学家。早在高中的时候,Wang 因在编程比赛上的出色表现,陆续接到科技公司的工作邀约,并在硅谷开启了自己的职业生涯。
在接受采访时,Wang 回忆道,“我在硅谷工作的这段时间里,看到人工智能领域目前存在的形形色色的问题,因而了解到机器学习的重要性。”
▲Alexandr Wang(左一)和 Scale 员工
Scale 帮助企业整理和标注用来训练 AI 系统的数据,这个过程通常需要为数万个示例添加标签。
从最初为自动驾驶汽车处理图像和视频数据,发展到如今为金融、物流企业和政府提供广泛的视觉和自然语言数据支持,Scale 已经成为了这一领域主要的公司之一。
Wang 告诉美媒 Fortune,该公司去年的销售额翻了一番,并且有望在 12 个月内实现 1 亿美元的收入。
2020 年 9 月,这家年轻的独角兽企业首次和美国军方达成合作,一举拿下美国国防部的 9100 万美元大单,协助美国军方试验、开发以及更新用于机器学习和 AI 的标注数据集。
在线支付服务商 PayPal 和社交网站 Pinterest 都曾是 Scale 的客户,该公司还曾与丰田、通用汽车等主要汽车制造商合作。此外,该公司的员工人数也从去年的约 100 人增至300 人。
机器学习正在逐渐取代传统的软件编程,来帮助公司将任务自动化。“数据就是新的代码。数据是系统建设、培训和测试的基础,也是关键,”Wang 说,“公司需要利用和操纵数据,就像他们过去利用和操纵代码一样。”
创建五年以来,Scale 的业务已经从简单的数据标记发展为一整套基于软件的服务。它可以帮助企业收集、注释、管理和清理数据,以及建立和监控基于这些数据的机器学习模型。
其中,一个名为 Nucleus 的软件包可以让客户在数据中快速找到可能会降低 AI 算法性能的错误标签,并给数据添加新标签,对 AI 系统的弱点进行更多训练来改进其性能。
▲ Scale Nucleus 系统示意图
“在所谓的 90% 或 95% 准确率下,失败率也并不是均匀分布的,”特斯拉前高级机器学习工程师、如今领导 Scale Nucleus 团队的罗素・卡普兰(Russell Kaplan)说。
所有的 AI 系统都有统计偏差,即犯错的倾向。这些错误通常涉及“边缘情况”,即在训练数据中没有充分体现的罕见事件。
卡普兰将 Nucleus 比作软件调试工具,但它被用于数据,而非软件代码。
美国时间 4 月 13 日,Scale 宣布已在最新一轮投资中筹集 3.25 亿美元。此次融资使该公司自 2016 年成立以来筹集的风险资本总额超过 6 亿美元。
2019 年 8 月,Scale 获得美国风投机构创始人基金(Founders Fund)的 1 亿美元投资,凭借 10 亿美元的估值一跃成为硅谷最年轻的独角兽企业之一。Scale AI 还陆续收到了 Index Ventures、Accel、Coatue Management 的投资。
2020 年 12 月,Scale 在上一轮融资后估值 1.55 亿美元,而此轮融资后其估值已经是这一数值的两倍多。
最新一轮的投资由美国投资公司 Dragoneer、Greenoaks Capital,以及科技投资公司 Tiger Global 领投,投资管理公司 Wellington Management 和 Durable Capital 也参与了这轮融资。
Wang 在接受采访时透露,公司目前没有计划上市,但“一直在关注市场”。亚马逊前高管杰夫・威尔克(Jeff Wilke)将作为 CEO 特别顾问加入 Scale。
结语:由机器学习衍生,数据标注自动化
随着 AI 技术的发展,用于机器学习的数据标签催生了一个全新的行业。帮助企业对数据进行标签的公司如雨后春笋般涌现。对于想从人工智能热潮中获利的投资者来说,数据标签和管理已经成为一种流行的“掘金”方式。
旧金山初创公司 Labelbox 运营着一个软件平台,帮助企业管理数据标签任务,这家公司的融资总额达到了 3900 万美元。还有特拉维夫的初创公司 Dataloop,在 2020 年 10 月完成了 1100 万美元融资。
AI 算法大大提高了数据标注的效率,这种算法为主、人工为辅的标注模式指明了未来机器学习训练数据整理的趋势。
广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。