前言:
今天你们对“多媒体搜索算法”大体比较注意,我们都想要分析一些“多媒体搜索算法”的相关知识。那么小编也在网络上搜集了一些关于“多媒体搜索算法””的相关文章,希望咱们能喜欢,咱们一起来了解一下吧!来看看微软亚洲研究院的一些牛人推荐的计算机视觉项目,希望对我们的同学们在图像算法方向选择有所帮助。
主要分为目标检测,语义和实例分割,人体姿态估计,人脸对齐,高效轻量卷积神经网络结构设计,行人重新识别,视频目标检测,目标跟踪,最近邻搜索等领域。
目标检测
1. HRNet-对象检测
微软亚洲研究院视觉计算小组提出的一种新的骨干网络结构可以学习高分辨率表示并提高目标的空间精度,尤其是小目标。支持多规模同步训练。
论文:
源码:
2.可变形卷积网络
微软亚洲研究院视觉计算组提出的具有几何变形建模的卷积神经网络
论文:
源码:
3.关系网络
Microsoft计算研究小组的Visual Computing Group建议使用对象之间的相关性来提高对象检测器的性能。
论文:
源码:
语义和实例分割
1. HRNet-语义分割
微软亚洲研究院视觉计算组提出的一种新的骨干网络结构可以学习高分辨率表示,有效地提高语义分割的性能。
论文:
源码:
2.完全卷积的实例感知语义分割
由微软亚洲研究院的Visual Computing Group提出的基于完整卷积网络的端到端实例分割系统在COCO2016竞赛中赢得了冠军。
论文:
源码:
人体姿势估计
1. HRNet-人体姿态估计
微软亚洲研究院视觉计算组提出的一种新的骨干网络结构可以学习高分辨率表示,有效提高人体关键点热图空间的准确性。
论文:
源码:
2. SimplePose
微软亚洲研究院视觉计算组提出的网络结构用于检测人体的关键任务,简单有效。
论文:
源码:
3.整体人体花瓶
微软亚洲研究院的Visual Computing Group提出了一种集成操作,以处理3D人体姿势估计任务中的后处理/量化不可导出问题。
论文:
源码:
面部对齐
1. HRNet-面部 - 地标 - 检测
微软亚洲研究院视觉计算组提出的一种新的骨干网络结构可以学习高分辨率表示,有效地提高人脸检测的性能。
论文:
源码:
高效轻量级卷积神经网络结构设计
1.人力资源网络分类
由Microsoft Research Asia的Visual Computing Group提出的新的骨干网络结构可以学习多分辨率表征,然后结合多分辨率表征来进行图像识别。
论文:
源码:
2.交织群体卷积
微软亚洲研究院的Visual Computing Group提出的轻量级网络结构在分类和检测等任务中取得了比谷歌MobileNetv2更好的结果。
论文:
源码:
3.行人重新识别
深入学习的部分对齐表示
微软计算研究小组的视觉计算小组建议使用身体部位信息来提取行人代表。
论文:
源码:
2.部分对齐的双线性表示
微软亚洲研究院的视觉计算小组提出了一种双线性池化方法,将人类手势结合起来以提取行人代表性。
论文:
源码:
视频目标检测
1.深度特征低
由Microsoft Research Asia的Visual Computing Group提出的视频理解组的视频结构使用视频之间的光流信息来传达相邻帧之间的预测。
论文:
源码:
2.流引导特征聚合
由Microsoft Research Asia的Visual Computing Group提出的视频中的对象检测问题的框架使用光流来帮助组合相邻帧的表征。
论文:
源码:
目标跟踪
1.更深入,更广泛的暹罗网络
微软研究院多媒体搜索和挖掘小组提出的更深入和更广泛的双网络解决了目标跟踪问题。
论文:
源码:
最近邻搜索
1. SPTAG
微软Bing产品中使用了由Microsoft Systems Research Group和Microsoft Bing Group联合推出的能够处理数亿个数据的索引和搜索系统。
论文:
;rep=rep1&type=pdf
,
源码:
2.复合量化
由Microsoft Research Asia的Visual Computing Group提出的一种有效的紧凑编码(哈希)算法。
论文:
源码:
标签: #多媒体搜索算法