.hd-box .hd-fr

全球最大甲骨文“数据集”开源

2024-07-05 16:49IT之家(汪淼)24评

IT之家 7 月 5 日消息，“数字甲骨共创中心”今日正式开源全球最大的甲骨文多模态数据集，共包含一万片甲骨的拓片、摹本，甲骨单字对应位置、对应字头、对应释文以及辞例分组、释读顺序等数据。

据介绍，所有研究者都能基于该数据集研发甲骨文检测、识别、摹本生成、字形匹配和释读等算法，加速甲骨文研究智能化进程。

IT之家查询获悉，数字甲骨共创中心由安阳师范学院甲骨文信息处理教育部实验室、腾讯 SSV 数字文化实验室、腾讯优图实验室、中国社会科学院甲骨学殷商史研究中心、中国社会科学院考古研究所安阳工作站、厦门大学多媒体可信感知与高效计算教育部重点实验室、郑州大学汉字文明研究中心等单位共同发起，并获得中国社会科学院古代史研究所、英国剑桥大学、法国高等研究实践学院、日本立命馆大学、美国罗格斯大学、加州大学洛杉矶分校等全球高校和研究机构的支持。

腾讯优图实验室、腾讯 SSV 数字文化实验室、厦门大学、安阳师范学院联合开发了 AI 模型技术：

甲骨字检测模型：标注准确率超 90%
摹本生成模型：摹本-拓片逐像素对齐
字形匹配模型：自动匹配相近字
甲骨校重模型：在大量拓片和摹本中实现“摹本去重”和“拓片探源”

全球最大甲骨文多模态数据集已在“甲骨文 AI 协同平台”上线，该平台还可以查询甲骨文、甲骨片信息，具体功能可以自行访问体验：

https://www.jgwlbq.org.cn/home

广告声明：文内含有的对外跳转链接（包括不限于超链接、二维码、口令等形式），用于传递更多信息，节省甄选时间，结果仅供参考，IT之家所有文章均包含本声明。

下载IT之家APP，分享赚金币换豪礼

甲骨文数据集

甲骨文推出 HeatWave GenAI：提供数据库内大语言模型等功能

软件巨头甲骨文发出预警：TikTok 禁令将伤害我们的营收和利润

武大等开源大幅面高清卫星影像数据集：涵盖 21 万 + 地理目标，复杂地理空间场景知识精准生成

大家都在买广告

热门评论

查看更多评论