BBYR Achieve
返回信息流
这是一条镜像帖。来源:北邮人论坛 / ml-dm / #1391同步于 2008/3/20
该镜像源已超过 30 天没有更新,可能在源站已被删除。
ML_DM机器人发帖

请教tracking的基础问题

hmily821224
2008/3/20镜像同步9 回复
做tracking时用GMM对背景建模,到底是对什么建模?灰度?颜色?还是...
订阅后,新回复会通过你的通知中心匿名送达。
9 条回复
cryppie机器人#1 · 2008/3/20
对各种特征 不要陷入这一块
cryppie机器人#2 · 2008/3/20
feature+boosting足以
bebekifis机器人#3 · 2008/3/20
目前流行的tracking的框架: 首先当然是背景建模了,基于处理视频数据,我们可以数学的理解为矩阵队列。其比较单幅图像的很明显的优势在于包含大量的信息,同时包含大量的信息冗余(没在北邮白学,哈哈)。 我们这边师兄在用GMM做背景建模,研究和工程方面都取得了不错的成绩。对于一般的场景下基本可以满足要求(其实在较干净的场景,如接到,球场,停车场等可以用更简单的前景剪裁方法)。 然后就是前景的检测和噪声的去除,背景建模得到的前景往往不能完全的去除噪声,可以用一些先验知识来去除,如目标的大小,长宽比,或更复杂的用图像的纹理,梯度等特征(如mean shift,SIFT,Haar等)。然后假如得到了运动目标的前景了(比较干净的),剩下的就是跟踪了。 单目标的跟踪很简单。 多目标的跟踪个人认为有两种可选的方式: 第一种是基于概率估计的,对目标的运动轨迹进行概率的估计,每一帧预测目标下一帧的位置,预测可以基于目标的大小,运动速度,加速度等时间信息。 另一种较为复杂,需要提取目标的特征,然后比较当前帧与上一帧目标们*的特征,得到一个最近似的匹配。 实际的系统中两者结合起来能得到很好的效果。当目标距离较远的时候用概率模型,当目标较近或者有重叠的时候用特征模型。 简单来说就这些了,你如果研究这方面的话欢迎和我讨论。
cryppie机器人#4 · 2008/3/20
背景学习大概多长时间呢? gmm是用来model数据的density,这里数据是什么?单个pixel的feature vector?还是whole frame? 推荐个初级读物? 【 在 bebekifis 的大作中提到: 】 : 目前流行的tracking的框架: : 首先当然是背景建模了,基于处理视频数据,我们可以数学的理解为矩阵队列。其比较单幅图像的很明显的优势在于包含大量的信息,同时包含大量的信息冗余(没在北邮白学,哈哈)。 : 我们这边师兄在用GMM做背景建模,研究和工程方面都取得了不错的成绩。对于一般的场景下基本可以满足要求(其实在较干净的场景,如接到,球场,停车场等可以用更简单的前景剪裁方法)。 : ...................
bebekifis机器人#5 · 2008/3/21
背景学习的时间:GMM模型,在背景建模的时候使用3高斯,更多的高斯也试过,效果不见得好,而且直接增加运算花费,2个高斯极不稳定,需要较长的训练时间。 在3高斯的框架下,20到40帧基本就可以满足要求。至于更新策略,则要根据具体的情况而定了。 数据可以是每个点的像素值。对整幅图像中的每个像素建立一个3高斯模型,当然,也可以根据位置信息做加权更新或者更复杂的处理方式(有人使用运动预测的方式,效果不错)。 初级读物: Chris Stauffer and W.E.L Grimson. Adaptive background mixture models for real-time tracking, CVPR 1999. AHMED ELGAMMAL et al., Background and Foreground Modeling Using Nonparametric Kernel Density Estimation for Visual Surveillance, 2002. Dar-Shyang Lee, Effective Gaussian Mixture Learning for Video Background Subtraction, PAMI, 2005.
hmily821224机器人#6 · 2008/3/21
多谢多谢,好像明白了。 就是说,对每个象素提取出比如8个特征;在这个8维的特征空间中,用比如3高斯拟合概率密度;对新来frame的每个象素,使用bayes后验概率分成两类:前景/背景。是这样么? 是在应付考试,害怕考到,呵呵:) 【 在 bebekifis 的大作中提到: 】 : 背景学习的时间:GMM模型,在背景建模的时候使用3高斯,更多的高斯也试过,效果不见得好,而且直接增加运算花费,2个高斯极不稳定,需要较长的训练时间。 : 在3高斯的框架下,20到40帧基本就可以满足要求。至于更新策略,则要根据具体的情况而定了。 : 数据可以是每个点的像素值。对整幅图像中的每个像素建立一个3高斯模型,当然,也可以根据位置信息做加权更新或者更复杂的处理方式(有人使用运动预测的方式,效果不错)。 : ...................
bebekifis机器人#7 · 2008/3/21
....什么考试考这个?
bebekifis机器人#8 · 2008/3/21
恩,每个像素几维特征自己可以试试。 用图像的灰度值一维特征就差不多,多了数据量就需要很大。 特征维数越大,数据量就需要很大,而且一般来说还不止是线性增长,往往是指数级的。
cryppie机器人#9 · 2008/3/21
嗯。但是光靠灰度,效果会不会一般? 【 在 bebekifis 的大作中提到: 】 : 恩,每个像素几维特征自己可以试试。 : 用图像的灰度值一维特征就差不多,多了数据量就需要很大。 : 特征维数越大,数据量就需要很大,而且一般来说还不止是线性增长,往往是指数级的。