首页 图画注释AI比人类更准确?

图画注释AI比人类更准确?

本年9月,微软在一篇论文中描绘了一种新的图片注释算法。微软表明,其开发的新算法在某些特定的测验中,精确度逾越了人类。现在,该AI体系已被用于更新微软为视障人士规划的帮手运用程序“SeeingAI”,并…

本年 9 月,微软在一篇论文中描绘了一种新的图片注释算法。微软表明,其开发的新算法在某些特定的测验中,精确度逾越了人类。

现在,该 AI 体系已被用于更新微软为视障人士规划的帮手运用程序“Seeing AI”,并将很快被整合到 Word、Outlook 和 PowerPoint 等微软其他产品中。到时,它将用于为图画创立代替文本之类的使命。这个功用关于进步可拜访性特别重要。

图|开发人员 Florian beijingers 正在运用“Seeing AI”,微软图片注释算法将被用于改善该类运用。

微软人工智能团队的软件工程司理 Saqib Shaikh 在一份新闻声明中说:“抱负情况下,一切人都应该为文件、网络和交际媒体中的图片增加代替文本,只要这样,才能使瞎子能够了解具体内容并参加对话。可是,现在人们并没有做到这一点。所以,咱们迫切需求一些运用程序来为图片增加代替文本。”

新算法功能是之前的两倍

这些运用程序包括微软在 2017 年初次发布的 Seeing AI。它运用核算机视觉技能,经过智能手机摄像头为视障人士描绘国际。它不只能辨认家用物品、描绘场景,还能扫描文本或协助阅览,甚至能辨认朋友。它还能够用于描绘其他运用程序中的图片,例如电子邮件、交际媒体等。

微软没有泄漏运用 Seeing AI 的用户数量,但 Azure AI 公司副总裁埃里克 · 博伊德在采访中表明,这款软件是“为瞎子或弱视人士供给的先进运用之一”。Seeing AI 现已接连三年被瞎子和弱视人士 iOS 用户社区 AppleVis 评为最佳辅佐运用。

微软的新图画注释算法将明显进步 Seeing AI 的功能,因为它不只能够辨认物体,还能更精确地描绘它们之间的联系。因而,算法能够在处理图片时,不只知道其间包括哪些物品和目标,还能知道它们是怎么交互的。微软表明,该算法功能比 2015 年开始运用的上一代算法好两倍。

微软团队在在 9 月份宣布的一篇预印本论文中对该算法进行了描绘,它在一项名为 “nocaps” 的图画注释基准测验中获得了有史以来的最高分数。“nocaps”是业界抢先的图片注释测验,当然,它有自己的约束条件。

nocaps 基准测验由逾越 16600 条人工生成的图片注释组成,这些注释描绘了来自敞开图画数据库的大约 15100 张图片。这些图片包括了一系列场景,从运动到休假,再到美食拍摄等等。

研究人员测验了该算法为这些图片创立注释的才能,并与人工生成的图片注释做了比照。

可是,需求留意的是,此次 nocaps 基准测验只触及了杂乱图画注释一般使命中的一小部分图片。微软在一份新闻稿中宣称,它的新算法“能像人相同描绘图片”,事实上,只要在处理 nocaps 中一小部分图片时,它才达到了这些作用。

“功能在 nocaps 上逾越人类,并不意味着图画注释难题现已处理了”

正如 nocaps 基准测验的创立者之一 Harsh Agrawal 说的那样:“该算法功能在 nocaps 上逾越人类,并不意味着图片注释难题现已处理。”Argawal 指出,在 nocaps 上测验功能的目标“仅与人类大致相关”,而基准测验自身“仅包括一切可视化概念的一小部分”。

Argawal 以为,与大多数基准测验相同,nocaps 基准只能表明算法在使命中的功能的一个大略目标,在 nocaps 上有逾越人类的体现,并不意味着 AI 体系在图画了解上逾越人类。

夸张 AI 的才能是现阶段科技公司的一个常见问题,因为在特定基准上的功能不足以揣度出在更遍及的根底使命上的功能。事实上,微软在过去也曾因对其算法了解文字的才能做出相似声明而遭到研究人员的批判。

不过,近年来,因为人工智能的呈现,图片注释的使命现已有了巨大的改善,微软的算法无疑是最先进的。除了被集成到 Word、Outlook 和 PowerPoint 中,这款配有图片注释的人工智能还将经过微软的云核算和人工智能渠道 Azure 作为独立模型供给。

本文来自网络,不代表本站立场。转载请注明出处: https://www.icollectbooks.com/show/4595.html
上一篇
下一篇

发表评论