亚博官方网站|搜狗获Cityscapes评测世界冠军,多项指标刷新世界纪录

亚博官方网站|搜狗获Cityscapes评测世界冠军,多项指标刷新世界纪录

亚博网页登录入口

亚博官方网站_最近,来自搜狗公司的视觉研究团队在国际自动驾驶领域的权威评价集Cityscapes中获得了实例分割评价的第一名,打败了Nvidia、Facebook、商汤等数十个强大的国际科研机构,创造了世界纪录,代表中国向世界强调了我们优秀的技术实力。这是今年搜狗时隔CVPR大会获得WAD自动驾驶认证挑战冠军后,获得的另一个桂冠。

短期内获得两项世界冠军,充分证明搜狗在计算机视觉上已经在业界领先。Cityscapes评价数据集是什么?众所周知,人工智能技术在自动驾驶领域具有非常广阔的市场空间,也是最受人们期待的应用。

如何要求AI识别道路状况信息的理解能力,其评价数据集的水平各不相同。Cityscapes评价数据集于2015年由奔驰公司推进,是目前自动驾驶领域最没有权威和专业性的图像语义评价集之一,关注现实场景下城市道路环境解读,任务可玩性更高,更符合自动驾驶等人气市场需求。在Cityscapes评价数据集中,共分为像素分割和实例分割两个子任务,其中与像素分割相比,实例分割的可玩性更大,也是计算机视觉领域最重要、最没有挑战的任务之一。

亚博网页登录入口

如何使机器看起来更聪明,没有足够的自学能力,是所有人工智能开发时的难题,可以说是国内外科技企业竞争研究的自动驾驶技术。Cityscapes的评价数据必须集中在差异化上,超过世界记录,意味着搜狗已经没有强大的AI技术硬实力。实例分割、自动驾驶曙光已经实例分割是一个非常综合的问题,融合了目标检查、图像分割、图像分类等多种AI技术。如名字所示,像素水平的语义分割是将图像中的各像素区分为对应的类别,即构筑像素水平的分类的明确对象,即实例。

那么,例子的分割不仅要展开像素水平的分类,还要根据明确的类别进行不同的例子。实例分割在汽车、机器人、视频监视等领域具有重要的最重要价值,受到世界科学研究开发界的关注。

Cityscapes评价集包括50个城市不同情况下的街道和30种物体的标志。这次搜狗参加的实例场景的图像语义分割评价,类别对象多,场景简单,挑战性非常高。面对简单的实例环境,搜狗展示的技术非常精致。

过去,我们经常不把AI的关注点放在单一的车道上,但实际的道路状况信息非常复杂变化,必须拒绝驾驶员具有充分的眼睛六路耳朵听八方能力,以纵览全局的眼睛仔细观察整个道路状况。基于这个原因,搜索犬通过所谓的全局代码模块,明显提高了全局信息在实例分割中的影响。全局代码模块可以很好地捕捉图片中的语义信息,并有选择地引人注目,表明与实例相关的特征是同一组织的,从而提高准确性。

另一方面,如果在训练过程中只是非常简单地称之为每个像素的分割损失,而不是在整个场景中注重信息,也不会导致相当严重的类别不平衡。针对这种现状,搜狗引进了全球实例编码损失函数GIE-loss。

这种损失函数不预测场景中经常出现的实例类别,加强网络自学全局语义信息的能力。与传统的像素损失函数不同,GIE-loss对所有物体,无论大小都同等对待,用于该损失函数后,对物体的分割效果显着反对。(比较图1)(比较图2)(比较图3)通过上述结果比较图,可以清楚地表现出全局代码模块的称呼,彻底改变了传统算法中远近物体无法考虑的缺点,近处物体可以识别,远小物体的分解效果也非常高,最后的AP100指标迄今为止,Cityscapes的评价还参加了约100支队伍,包括Facebook、香港中国大学、商汤和NVIDIA(英伟达)等国内外优秀的创造性企业和一流的学术机构。

值得注意的是,在过去的两年里,商汤、香港中文队伍和NVIDIA(英伟达)完全获得了所有图像分割评价的冠军。首次参加的搜狗队,各评价指标远远超过其他队伍,超过了世界纪录,以无争议的成绩获得了第一名。搜狗视觉研究团队通过大地算法积累和传递,建立了高效易懂的标准化检测分割框架,可以慢慢地转入任务算法模型,超过实际应用于市场需求。

亚博官方网站

CVPR2018WAD检测任务与本次实例分割任务使用的模型大致相同,检测了模型的高效易用性。同时,团队最近也实现了非常简单的实验。在少量代码变更的情况下,意味着训练数小时,之后有名的评价数据可以超过top的成绩。探讨计算自然交互科学知识,实现搜索犬人工智能未来的道路人工智能命题范围相当广,搜索犬自由选择的突破口小。

带面是王小川为搜狗计划的未来之路。至今为止,搜狗坚决计算自然交流科学知识的人工智能核心战略,专注于自然交流领域。

在语音领域,具有丰富现实语料数据优势的搜狗将语音识别与人机对话结合起来,发表了知音引擎,发售了世界上第一个商AI同传。除了分开的语音识别听的能力之外,搜狗还要突破制备方向的说话能力,自动自学的AI机器兼备听、说、翻译等多种能力,在业界领先。多模式输出已成为搜狗语音互动的研发焦点。

亚博网页登录入口

在视觉领域,搜狗也构筑了AI技术的巨大突破,使机器的自然交流更加全面。在2017年乌镇网络大会上,搜狗发表了业界首个唇语识别技术,构筑了视觉和听力的首次融合,协助机器以更多样化的维度解读用户的表达意见。

在车载、智能家居等横向场景下,精度高达90%。这次在Cityscapes的实例场景图像语义分割评价中获胜,反映了搜索犬视觉认识技术的积累,协助机器进一步提高各感觉能力的交互水平。倒数获得多项国际比赛冠军的搜狗,已经证明了自己在人工智能领域的丰富技术基础。

我们有理由相信,在未来的AI课程中,占有领先优势的搜狗一定能取得更好的成绩,用实际的AI产品切身提高用户的交流体验。版权文章允许禁止发布。下一篇文章发表了注意事项。

:亚博官方网站。

本文来源:亚博网页登录入口-www.shunxinlai.com

相关文章

评论已关闭。

网站地图xml地图