搜故事,从300万个故事到海量知识百科的华丽转变!

Google使用3亿张图片大幅度改进图像识别算法

时间:2020-09-28

3张图3亿故事

Google和CMU的研究员使用3亿张图片,在图像识别算法的几个指标上取得了长足改进,而往常的训练一般只使用一百万张图片。

很多开发者在训练物体检测算法时会使用包含一百万张图片的。这个数据集从2011年起就没有新图片加入了。然而,在该数据集上训练的神经网络中的参数数量与日俱增,训练模型的GPU算力也在增加。卡内基梅隆大学(CMU)中Google的研究人员和科学家提出:如果增加训练数据量会如何?

于是,Google建立了一个,含有3亿张图片,标记为18291个类别。图片标注的来源包括原始网络信号,网页之间的联系,以及用户的反馈。因为不是由人标注的,所以含有20%的噪音。

结论是:增大数据量果然有益。虽然图片标记含有噪音,算法的准确率还是提高了3个百分点。很明显,数据量的增加克服了标记的噪音。研究人员发现算法的表现和数据量呈对数关系上升,如图所示。论文作者认为,现有的模型是基于一百万张图片建立的:如果对模型进行调整,准确率还有上升空间。

研究人员在微软的上进行了测试,结果喜人:平均正确率AP从34.3上升到37.4。Google和CMU在ICCV会议上发布了算法和评测,并发布了论文《》,可在arxiv自由获取。

查看英文原文:

本文永久更新链接地址:

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。
显示评论内容(4)
  1. 一页悠然2022-12-12 17:11一页悠然[广东省网友]103.244.18.80
    Google的图像识别算法一直是业界的领先者,通过使用这么多图片来改进算法,他们一定能取得更大的进步。
    顶6踩0
  2. 青音2022-05-25 12:50青音[国外网友]106.58.142.80
    我对Google的技术实力越来越佩服了。他们能够利用如此多的数据来改进图像识别算法,简直令人惊叹。
    顶0踩0
  3. Yina  、2021-11-05 08:29Yina 、[国外网友]43.241.80.23
    这是一个巨大的突破!3亿张图片的数据量肯定能够帮助Google提高图像识别的准确性。
    顶0踩0
  4. 昙花殇2021-04-18 04:08昙花殇[重庆市网友]203.55.93.177
    真是令人惊叹!Google通过使用如此庞大的图片数据库,成功改进了图像识别算法。
    顶45踩0