您现在所在的位置:首页 > 游戏资讯 >

腾讯YouTu实验室再次创造了Reid公开数据集的最高命中率近99%的纪录。

日期:2020-06-13 11:09:06;来源:文章来源于网络

最近,腾讯YouTu实验室在行人再识别(Reid)技术方面又取得了突破。通过引入交叉场景的里德,它的里德模型性能刷新了三个权威的主流里德公共数据集cuhk03、duke-mtmc和Market1501的记录。该算法的关键指标是第一个命中率(秩1精度)和平均精度均值(平均平均精度),在业界取得了最好的结果。

行人识别是指不同摄像机拍摄的行人图像(即相关的行人标识)之间建立身份对应关系,在整个场景中描述行人的行动路线。简单地说,在复杂的多场景中,人们也可以通过姿势等来识别人脸。与人脸识别技术相比,Reid对人体图像的遮挡、定位和清晰度具有很强的鲁棒性,对摄像机的清晰度、设定位置和角度没有很高的要求。因此,Reid技术已经成为继人脸识别技术之后的计算机视觉领域的又一个热门话题。

鉴于Reid技术的技术优势及其在各个领域的广泛应用前景,近年来,腾讯YouTu实验室在这方面进行了大量的技术投入和全面的技术布局,并在CVPR/tpami/AAAI/ijcai等国际顶级学术会议和期刊上发表了15多篇学术论文。

虽然里德技术已经发展了许多年,但现实中复杂多变的场景也使得交叉场景识别(交叉域识别)成为里德技术的一个主要问题。这一次,腾讯YouTu实验室更新了三大数据集引入的跨场景Reid,这是对这一难题的技术突破。

交叉场景识别的困难在于,由于环境照明、摄像机角度、背景等因素,不同的场景会对人类图像的视觉特征产生影响,如室内大型购物中心、小店侧和高俯视角度摄像机、户外道路、社区强光和夜间环境等。如何使Reid技术适应复杂多变的场景,实现跨场景行人图像的检索是一项重大的技术挑战,也是实现室内和室外行人线与整个城市之间联系的关键技术。突破这一技术难点,对于扩大雷德的着陆场景和格式,实现大规模行人识别具有重要意义。

为了解决Reid的技术难题,腾讯YouTu实验室通过对遮挡匹配、全角度匹配、跨域检索等业务问题的优化,以及在模型结构、损失函数、训练算法等方面的大量积累和创新,提出了一种基于图形卷积和双网络的跨场景行人识别技术框架。因此,神经网络具有较强的跨场景识别能力,如多方位、多姿态等。该技术可以对不同场景、不同拍摄角度、不同光照条件下的行人视觉特征进行统一的特征表示,有效地提高了Reid技术在行人图像室内、室外和交叉场景检索中的准确性。

通过引入交叉场景Reid、腾讯优酷实验室(TencentYouTuLab)来刷新这三个数据集中业界的最佳水平,市场排名-1501数据集的排名达到98.99%。作为衡量里德技术水平的核心指标,Reid1和MAP的命中率很高,这意味着该算法能够准确识别或匹配多幅图像中的一个。

在此基础上,腾讯YouTu实验室的Reid算法在多场景行人图像检索方面也处于行业领先水平,超越了现有算法,在跨场景Reid数据集mSMT-17上达到了最先进的水平。

腾讯优图实验室的Reid技术不仅在相关数据集方面取得了领先的性能,而且在各种场景中也达到了商业水平,并实现了广泛的登陆。依靠Reid技术的应用系统在各种场景中也达到了商业水平。未来,随着跨场景行人识别能力的逐渐成熟,腾讯优酷实验室的Reid技术也将在更多的场景和格式上获得价值。

上一篇:孙老大的父母有着独特的地位!赌博之王去世后,奚梦瑶、游君穿着红色的衣服
下一篇:最后一页