基于深度学习的视频多目标跟踪实现

发布时间：2021-05-01 16:27:27 所属栏目：传媒来源：互联网

导读：：使用目标检测算法将每帧中感兴趣的目标检测出来，得到对应的(位置坐标, 分类, 可信度)，假设检测到的目标数量为M； Step2：通过某种方式将Step1中的检测结果与上一帧中的检测目标(假设上一帧检测目标数量为N)一一关联起来。换句话说，就是在M*N个Pair中

：使用目标检测算法将每帧中感兴趣的目标检测出来，得到对应的(位置坐标, 分类, 可信度)，假设检测到的目标数量为M；

Step2：通过某种方式将Step1中的检测结果与上一帧中的检测目标(假设上一帧检测目标数量为N)一一关联起来。换句话说，就是在M*N个Pair中找出最像似的Pair。

对于Step2中的“某种方式”，其实有多种方式可以实现目标的关联，比如常见的计算两帧中两个目标之间的欧几里得距离(平面两点之间的直线距离)，距离最短就认为是同一个目标，然后通过匈牙利算法找出最匹配的Pair。当让，你还可以加上其他的判断条件，比如我用到的IOU，计算两个目标Box(位置大小方框)的交并比，该值越接近1就代表是同一个目标。还有其他的比如判断两个目标的外观是否相似，这就需要用到一种外观模型去做比较了，可能耗时更长。

在关联的过程中，会出现三种情况：

1）在上一帧中的N个目标中找到了本次检测到的目标，说明正常跟踪到了；

2）在上一帧中的N个目标中没有找到本次检测到的目标，说明这个目标是这一帧中新出现的，所以我们需要把它记录下来，用于下下一次的跟踪关联；

3）在上一帧中存在某个目标，这一帧中并没有与之关联的目标，那么说明该目标可能从视野中消失了，我们需要将其移的时候，通过之前的跟踪方式可以很准确的关联(A, A’)和(B, B’)。但是当目标运行速度很快（或者隔帧检测）时，在第二帧中，A就会运动到***帧中B的位置，而B则运动到其他位置。这个时候使用上面的关联方法就会得到错误的结果。

那么怎样才能更加准确地进行跟踪呢？

基于轨迹预测的跟踪方式

既然通过第二帧的位置与***帧的位置进行对比关联会出现误差，那么我们可以想办法在对比之前，先预测目标的下一帧会出现的位置，然后与该预测的位置来进行对比关联。这样的话，只要预测足够精确，那么几乎不会出现前面提到的由于速度

（编辑：唐山站长网）

【声明】本站内容均来自网络，其相关言论仅代表作者个人观点，不代表本站立场。若无意侵犯到您的权利，请及时与联系站长删除相关内容!

SIAL国际食品展伴您健	Meta开源全新移动端AI
腾讯会议网络招聘好帮	企业直播正变为企业向