ImageNet:在线图像辨识测试系统【美国】
栏目分类:趣味工具 发布日期:2024-11-26 浏览次数:次
网站logo:
网站名称:ImageNet
所属国家:美国
网站缩略图:
ImageNet首页缩略图
【官网介绍】:
ImageNet 是根据 WordNet 层次结构组织的图像数据集。WordNet 中每个有意义的概念,可能由多个单词或词组描述,称为“同义词集”或“同义词集”。WordNet 中有超过 100,000 个同义词集;其中大多数是名词(80,000+)。在 ImageNet 中,我们的目标是平均提供 1000 张图像来说明每个同义词集。每个概念的图像都经过质量控制和人工注释。在完成后,我们希望 ImageNet 能够为 WordNet 层次结构中的大多数概念提供数千万张干净标记和排序的图像。
为什么选择 ImageNet?
ImageNet 项目的灵感来自计算机视觉研究中的两个重要需求。首先是需要在计算机视觉中建立一个明确的北极星问题。虽然该领域有大量的重要任务需要处理,从立体视觉到图像检索,从 3D 重建到图像分割,但对象分类被认为是人类和机器视觉最基本的能力之一。因此,对具有明确建立的评估指标的高质量对象分类基准的需求不断增长。其次,迫切需要更多数据来实现更通用的机器学习方法。自从数字时代的诞生和网络规模数据交换的可用性以来,这些领域的研究人员一直在努力设计越来越复杂的算法来索引、检索、组织和注释多媒体数据。但是好的研究需要好的资源。为了大规模解决这个问题(想想您不断增长的个人数字图像、视频或商业网络搜索引擎的数据库),为研究人员提供用于训练和测试的大规模图像数据库至关重要。这两个智力原因的融合促使我们构建 ImageNet。为研究人员提供用于培训和测试的大型图像数据库至关重要。这两个智力原因的融合促使我们构建 ImageNet。为研究人员提供用于培训和测试的大型图像数据库至关重要。这两个智力原因的融合促使我们构建 ImageNet。
网站介绍:
ImageNet 是由Google云端人工智慧暨机器学习首席科学家李飞飞与与普林斯顿大学教授李凯共同于2007年所发起的一个专案,是个开放给电脑视觉研究者使用的图像辨识测试数据库。
ImageNet 数据库含有近10万个同义词,其中八成为名词,以猫作为一个例子,ImageNet中有超过6万2千种,不同外观与不同姿势的猫咪, 并且横跨不同的种类。
自2010年起,ImageNet每年举办全球性的电脑视觉比赛ILSVRC,针对图像分类、物体检测与物体辨识物体等领域进行评比,这比赛成为科技巨头与顶尖研究者展现自我实力的场域。
2012年,加拿大辛顿(Hinton)教授将深度学习应用到ImageNet,结果图样辨识错误率仅为15.4%,到2016年,大赛中冠军团队的图像辨识错误率已经达到约2.9%,已经远远超过人类的5.1%。而在语音辨识研究方面,也有一个常用的巨型语料数据库Switchboard,现在IBM Watson已经可以将错误率降低到5.5%,而有经验的专业人员则可以低达4.0%。