8TB!美国宇航局 JPL 创建全球最大 PDF 文档库,用于研究恶意软件

2023-06-16 13:27IT之家 - 故渊

IT之家 6 月 16 日消息,美国宇航局喷气推进实验室(JPL)数据科学家为推进 DARPA 安全文档(SafeDocs)计划,宣布创建全球最大的 PDF 文档库,用于恶意软件研究。

PDF 是便携式文档格式的缩写,是一种复杂的文件类型,可以包含图像,电影文件,交互式表单,3D 模型等等。

JPL 表示此前已收集了 800 万个 PDF 文件,完整的数据集总计约为 8 TB,使其成为同类中最大的公开可用语料库。JPL 通过和非营利组织 PDF 协会合作,开发多种工具来应对网络在线威胁。

IT之家翻译 JPL 数据科学家 Tim Allison 的内容如下:

PDF 格式用途广泛,合同、法律文档、3D 工程设计等都会用到。但 PDF 格式也很复杂,能以不同形式隐藏恶意代码。

为了应对 PDF 的这些和其他挑战,需要从互联网上收集大量真实世界的 PDF 样本,为软件专家创建一个共享的,免费可用的资源。

广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。

文章价值:
人打分
有价值还可以无价值
置顶评论
  热门评论
   文章发布时间太久,仅显示热门评论
   全部评论
   一大波评论正在路上
    取消发送
    软媒旗下人气应用

    如点击保存海报无效,请长按图片进行保存分享