AI 模型的训练过程,能不能再快一点?!
这不,谷歌 AI 研究员、Keras 之父 Francois Chollet,刚刚就投资了一家加速自动标注的创业公司:
V7 Labs。
这家公司关注的重点是 CV 和自动识别 / 分类对象及其他数据,来加快 AI 模型的训练速度。
V7 Labs 表示,现在只需要100 个人工标注,模型就能快速 get 任务具体要干啥。
凭此,V7 Labs 完成了3300 万美元新融资,历史总融资额约 3600 万美元,目前估值为 2 亿美元。
能获得 3300 万美元的新融资,自动化是 V7 Labs 最吸引投资人的卖点。
据估计,在 AI 训练模型过程中,一个人工团队约 80% 的时间都花在管理训练数据上:
标记数据、分辨什么时候该标记错误、重新思考分类数据等……
V7 Labs 把这个过程称为“程序化标签”,并使用AGI 和自己的算法来分割和标注图像。
与此同时,任何标记为不清楚的内容都会返回人工审查。
将 V7 Labs 开发的自动标注技术结合人工标注,有助于高效完成工作,并起到互相检查作用。
该公司的 CEO 表示,利用自家平台,只需要100 个人工标注,就能训练好模型。
据了解,这轮融资将用来招聘更多工程师,并扩大业务运营。
除了 Keras 之父本人,这波投资者中还有其他 ML 和 AI 领域的老朋友们。
比如 DeepMind 首席科学家Oriol Vinyals、Elixir 语言创造者Jose Valim、Adept AI 的联合创始人Ashish Vaswani(Transformer 一作),以及一些来自 Open AI、Twitter 和亚马逊的匿名投资者。
现在来了解一下这家 2018 年创立的自动标注公司~
V7 Labs 团队秉承着这样一个观念:
训练模型的数据输入方式还处于一个低效阶段,完全可以改进。
因此,公司的主要业务就是开发 AI 模型训练所需的自动标记和其他数据分类技术,让视觉 AI 在最少的人工监督下从训练数据中持续学习。
为什么是视觉 AI 领域?
人类视觉皮层有 6 个公认的区域,即 V1 到 V6。
初级视觉皮层 V1 使我们的大脑能够识别基本形状,而之后的视觉皮层则提取颜色、形式和运动方面的复杂含义。
团队解释道,V7 代表着想为机器创造第 7 个领域,让机器能够感知世界,能力能够超越人类大脑。
V7 Labs 目前专注的领域是医学和科学。
利用 V7 Labs 这个平台训练 AI 模型,可以帮助端到端自动驾驶和通过机械臂分拣核废料等工作,以及在扫描中识别早期癌症和其他疾病问题。
至于为什么选择把视觉 AI 的业务应用在医学领域,该公司 CEO 表示:
我们决定专注的,是那些已经将基于 AI 的应用商业化的垂直领域,
或者那些大量视觉处理工作都由人工完成的领域。
在 V7 Labs 看来,医学就是这么一个“从未在内部开发过这种技术”,但“肯定会使用这项技术”的市场。
目前,V7 Labs 有300 多家客户,其中包括通用电气医疗、Paige AI 和西门子,以及其他《财富》500 强公司和规模很大的私营企业。
作为训练 AI 模型过程中举足轻重的环节,加速处理训练数据,越来越受到资本市场追逐。
因此,除了 V7 Labs,还有很多初创公司涌现,致力于提高 AI 数据训练效率、缩短 AI 模型设计和应用之间的时间。
比如同在 2018 年创立的 SuperAnnotate,就是 V7 Labs 的直接竞争对手,他俩同样在研究如何以最快的速度地构建最高质量的训练数据。
SuperAnnotate 官网宣称,自己的服务比普通 AI 标注快 3-5 倍。
最新消息是,SuperAnnotate 也在不久前获得了 1800 万美元的第三次融资。
目前,SuperAnnotate 的客户已经有 200 多家公司,其中包括 20% 的《财富》20 强,以及超过 10000 名个人 CV 爱好者。
值得一提的是,SuperAnnotate 的公司顾问团队里,有南开大学计算机系主任程明明。
以及,虽然 V7 Labs 在官网上列出了与 SuperAnnotate 的服务对比情况,但后者 CEO 在接受采访时,表达了从头发丝到脚趾头的拒绝:
他们的比较并不准确!
此外,走在同样创业路上的公司,还有最初专注于汽车行业的 Scale AI(目前估值约 70 亿美元),和谷歌等公司合作进行 AI 标签的 Labelbox,以及 Apache 软件基金开发的 Hive(目前估值约 20 亿美元)。
既然如此,就问一句:
加速处理训练数据的创业者们,不如卷得更猛烈一点吧?
(搓手手表示期待.gif)
参考链接:
[1]https://techcrunch.com/2022/11/28/v7-labs-computer-vision-ai/
[2]https://twitter.com/nathanbenaich/status/1597303560139833344
本文来自微信公众号:量子位 (ID:QbitAI),作者:衡宇
广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。