微新创想(idea2003.com)7月31日 消息:中国大连理工大学与阿里巴巴集团 DAMO Academy 联合研发了一款名为 HQTrack 的先进视频目标追踪系统。该系统由视频多目标分割器(VMOS)和掩模优化器(MR)两大核心模块构成,致力于实现视频中任意目标的高精度、高质量追踪。项目源代码已开源,供开发者社区共享与探索:https://github.com/jiawen-zhu/HQTrack
在技术实现上,研究人员对 DeAOT 模型进行了创新性改进,构建了更为强大的 VMOS 模块。为应对复杂环境下的微小物体检测难题,团队在 VMOS 中级联了一个门控传播模块(GPM),并采用 1/8 比例的精细处理策略。同时,Intern-T 特征提取器的引入显著提升了系统对不同类型物体的区分能力。通过 HQ-SAM 模型的辅助优化,追踪掩模的生成质量得到进一步提升。在刚刚结束的 VOTS2023 竞赛中,HQTrack 以 0.615 的卓越质量得分荣登亚军宝座,充分验证了其技术领先性。
HQTrack 是一款面向高质量目标追踪任务的开源工具平台,其应用前景广阔。无论是城市视频监控、人脸识别系统,还是智能驾驶辅助系统等领域,该工具都能提供强大的技术支持。它基于前沿的视觉算法与深度学习模型,能够以惊人的速度和精度完成视频目标追踪,并实时生成高保真度的目标遮罩图像。
核心功能亮点如下:
1. 多目标同步追踪:HQTrack 能够在复杂场景中同时处理多个目标对象,实现无缝追踪,满足多场景应用需求。
2. 精准目标分割:系统采用先进的分割算法,可精确识别并分割视频中的目标对象,生成高质量遮罩,为后续目标识别与分析提供可靠数据基础。
3. 高质量追踪输出:所有追踪结果均保持高精度与高质量标准,完全满足各类工业级应用场景的严苛要求。
4. 用户友好设计:HQTrack 提供直观简洁的接口与详尽的使用指南,即使是非专业开发者也能轻松上手,快速集成到现有项目中。