BBYR Achieve
返回信息流
这是一条镜像帖。来源:北邮人论坛 / ml-dm / #3666同步于 2008/11/12
ML_DM机器人发帖

[合集] 寻做过图像识别的高手

PtwCJ
2008/11/12镜像同步0 回复
☆─────────────────────────────────────☆ beast (beast) 于 (Tue Oct 30 20:49:24 2007) 提到: 没有做过这方面的东西 要从图像分割 特征提取 做到分类识别 就知道大概流程具体方法还没思路 这方面比较熟悉的同学可以帮忙吗 做好请吃饭 嘿嘿 不胜感激 [em9][em9] 我自己实在是不行 天天看也看得没啥进展 5555555555555555555 ☆─────────────────────────────────────☆ Jarod (轻轻地我走了) 于 (Wed Oct 31 14:48:21 2007) 提到: 你具体想识别啥? ☆─────────────────────────────────────☆ zwcih (小威) 于 (Wed Oct 31 18:45:23 2007) 提到: 希望能够识别黄色和白色的立方体,能够跟随 ☆─────────────────────────────────────☆ bebekifis (肥狗) 于 (Wed Oct 31 21:38:06 2007) 提到: 单幅图像还是视频? ☆─────────────────────────────────────☆ beast (beast) 于 (Thu Nov 1 09:35:32 2007) 提到: 多幅图像多种目标 但是基本上背景和目标差别还是挺明显的 ☆─────────────────────────────────────☆ myou (杀手之黑桃K) 于 (Thu Nov 1 12:21:34 2007) 提到: 用matlab?我本科的毕业设计哈 ☆─────────────────────────────────────☆ beast (beast) 于 (Thu Nov 1 13:43:32 2007) 提到: matlab没学过 容易吗 是不是图像的分割 特征提取 分类都可以实现 ☆─────────────────────────────────────☆ bebekifis (肥狗) 于 (Thu Nov 1 14:37:03 2007) 提到: 图像如果是比较复杂的话,并且图像序列长度较长,可以用背景建模的方法或者帧差分的方法来提取出运动的目标。然后进行其他的处理。 如果单用色彩就能够从每一帧图像中确定目标所在区域,那直接判断色彩就行。 具体还是看你视频序列的情况了。 ☆─────────────────────────────────────☆ beast (beast) 于 (Thu Nov 1 14:44:09 2007) 提到: 【 在 bebekifis 的大作中提到: 】 : 图像如果是比较复杂的话,并且图像序列长度较长,可以用背景建模的方法或者帧差分的方法来提取出运动的目标。然后进行其他的处理。 : 如果单用色彩就能够从每一帧图像中确定目标所在区域,那直接判断色彩就行。 : 具体还是看你视频序列的情况了。 说的太专业我不太懂 图像都是静态的 ☆─────────────────────────────────────☆ cfin (随便看看) 于 (Thu Nov 1 15:35:12 2007) 提到: 专业! ☆─────────────────────────────────────☆ livingliving (living) 于 (Thu Nov 1 19:29:54 2007) 提到: 做过人脸识别 感觉跟lz的思路差不多 照着原理编程 基本框架就ok了 【 在 beast 的大作中提到: 】 : 没有做过这方面的东西 : 要从图像分割 特征提取 做到分类识别 : 就知道大概流程具体方法还没思路 : ................... ☆─────────────────────────────────────☆ Home (◆天行毽◆【毽招奇发】|伤城home) 于 (Thu Nov 1 21:07:23 2007) 提到: 最近也在看相关的内容,以后就跟着各位牛人混了~~ ☆─────────────────────────────────────☆ yexiangliu (NINA) 于 (Thu Nov 1 21:41:54 2007) 提到: 我也在做图像处理方面的毕设,不知从何开始。。。 ☆─────────────────────────────────────☆ xzckiller (蝎子草) 于 (Thu Nov 1 22:17:43 2007) 提到: ...R u working on Robot Soc? Right now I am working on this vision problem and slove it~But unfortunately u cannot buy me a dinner and discuss with it. Generally, the basic idea others talked about is not wrong. The details are a bit tough to solve~Good luck ☆─────────────────────────────────────☆ beast (beast) 于 (Fri Nov 2 10:49:29 2007) 提到: 谢谢各位 我发现即使别人提供思路给我我自己动手做起来还是会遇到很多预想不到的困难 看来还是得自己一点一点的解决 愁啊 ☆─────────────────────────────────────☆ PtwCJ (鲜的每日C|头像不是我,我是长毛贼~~) 于 (Fri Nov 2 13:47:03 2007) 提到: 思路是一回事,自己实践又是另一回事,最近我也深刻体会到了 二者皆不可少,加油~~ 【 在 beast 的大作中提到: 】 : 谢谢各位 : 我发现即使别人提供思路给我我自己动手做起来还是会遇到很多预想不到的困难 : 看来还是得自己一点一点的解决 : ................... ☆─────────────────────────────────────☆ hpttlook (3F) 于 (Fri Nov 2 15:04:51 2007) 提到: 【 在 beast 的大作中提到: 】 : 没有做过这方面的东西 : 要从图像分割 特征提取 做到分类识别 : 就知道大概流程具体方法还没思路 : ................... 露个面,我也在学习这方面的,打算先慢慢看点关于图像方面的书。 Matlab中还知道一点,都是现有的模块,很多可以直接拿来用,作图像也是很方便的,目前正学习C++的图像处理。什么都还不会···· ☆─────────────────────────────────────☆ myou (杀手之黑桃K) 于 (Fri Nov 2 15:08:10 2007) 提到: 我当时做的是基于dsp6000的数字图像处理系统,但是我导师带的其他几个同学有做图像识别的,好像是模式识别什么的,用matlab做的,应该是能做,matlab很强大,图像的分割 特征提取都是小case 【 在 beast 的大作中提到: 】 : matlab没学过 : 容易吗 : 是不是图像的分割 特征提取 分类都可以实现 ☆─────────────────────────────────────☆ Home (◆天行毽◆【毽招奇发】|伤城home) 于 (Fri Nov 2 16:18:21 2007) 提到: 【 在 hpttlook 的大作中提到: 】 : 露个面,我也在学习这方面的,打算先慢慢看点关于图像方面的书。 : Matlab中还知道一点,都是现有的模块,很多可以直接拿来用,作图像也是很方便的,目前正学习C++的图像处理。什么都还不会···· 一起努力~~~~ ☆─────────────────────────────────────☆ cryppie (北邮人) 于 (Tue Nov 6 18:17:33 2007) 提到: 说说图像分割吧 传统的图像分割方法有 [阈值方法]:根据图像特征空间的数据分布,建立直方图,之后根据自己的规则取一个阈值,以它作为决策标准。这里说得比较抽象一点,我说的特征空间既可以是图像的灰度,图像的RGB,也可以是各种滤波器的结果。 [Region Growing]: [Region Competion]:上述两个没怎么研究过,有待牛人来说吧。可以看看朱松纯老师和他的学生涂卓文的Paper吧,涂在他的网站上把他的代码share出来了。 ------------------------------spliter----------------------------------------------------------------- 说说现在比较流行的分割方法 看看CVPR'07的论文集吧,你会惊讶的发现,只要跟分割有关的文章,都用上了图的结构,跟进一步说几乎都在说用MRF或CRF的方法。汤晓鸥老师今年在CVPR的文章也是在说基于图的分割。这方面经典的工作有 施建波老师的NormCut,大意是根据给的图像,建立adjecent matrix,然后根据spectral graph theory中关于laplacian矩阵(或者矩阵论中的广义瑞利熵)的结论,计算laplacian matrix的svd,取第二小的特征向量作为分割的结果。对于基于adjacent matrix的分割的各种方法,以色列有个大牛写了一个综述,忘了他的名字了,Freeman的学生^.^。 另外一个重要的工作是Cornell的R.Zabih和他的学生提出的方法。Zabih用能量函数的方法描述分割问题,Energy=Energy_internal+Energy_external+Energy_smooth,分割的目标就是使Energy最小,Zabih引入了网络优化中最大流/最小割方法。网络中的流描述了pixel之间还有pixel与label之间的相似度。关于马尔科夫场的一些概念,可以看一下李子青老师的MRF in Vision。Zabin还有一项很有意思的工作,他比较了MRF的各种随机松弛方法。 还有一个重要的工作是以色列的E.Sharon的SWA算法,其实跟Zabih的模型差不多,但是引入了hierarchy的处理结构。他们的工作在06年的时候上了Nature。 -----------------------------------------spliter----------------------------------------------- CVPR'07给我的感觉,parsing的味道很浓。 -----------------------------------------spliter------------------------------------------------ 个人感觉,图像或者视觉上的工作五花八门,但是归根到底都是利用图的结构+概率。比如跟踪里面的Kalman filter,deformable template里面的pseudo 2DHMM,图像视频检索里面的concept induction,都是机器学习的Bayesian Network\Dynamic Bayesian Network, MRF\CRF的特例。 -----------------------------------------spliter----------------------------------------------- 个人的一些看法,欢迎大牛斧正。 ☆─────────────────────────────────────☆ cryppie (北邮人) 于 (Tue Nov 6 18:51:20 2007) 提到: 看到前面有人提到tracking 也来说说tracking 对背景建模,差分之后loacte,所有老师讲tracking的时候都要提到这个,因为它是很多系统的前端,也是最容易的。然而,我不认为这就是tracking,tracking是要能够预测物体未来的状态,比如物体的位置,物体的外观,物体的空间状态(这里的意思是在三维空间中物体各个面的法向量与camera之间的关系)等等。 最早的tracking的方法应该是Lucas的方法了吧,该方法的假设是物体的特征不随时间变化,I(x,y,t)=I(x',y',t+delta_t),泰勒展开,就可以得到物体的(x,y)的预测方程。 meanshift是不能不提的,借用parzon窗的方法,估计物体的特征的概率密度,然后计算概率密度函数的梯度方向,沿着该方向寻找最优点,听着像gradient descent吧。西北的吴郢老师和他的学生对meanshift的跟踪作了很多改进的方法,有代表性的应该是今年pami上的协作式多核跟踪模型吧。吴郢老师还提出了另外一种方法,通过EM迭代跟新运动参数。顺带提一下,OpenCV里面实现了Camshift,但是运行demo会发现,处理不了occlusion的情况。 现在,基于confidense或者learning-based的方法越来越多,有基于SVM的,Boosting的,也有基于贝叶斯滤波器的(粒子滤波)。 --------------------------------------------spliter--------------------------------------------- 欢迎大牛斧正补充 ☆─────────────────────────────────────☆ bebekifis (肥狗) 于 (Tue Nov 6 20:36:10 2007) 提到: 用预测进行tracking不能满足场景较复杂的情况,还是根据特征或者模型的方法比较通用,效果也好,最近在做这方面的工作。欢迎讨论。 ☆─────────────────────────────────────☆ cryppie (北邮人) 于 (Tue Nov 6 20:39:00 2007) 提到: 是什么场景? ☆─────────────────────────────────────☆ bebekifis (肥狗) 于 (Tue Nov 6 22:44:02 2007) 提到: 如行人的重叠,交互,分离等。 ☆─────────────────────────────────────☆ cryppie (北邮人) 于 (Tue Nov 6 22:59:07 2007) 提到: 你用的数据是哪里的?欧洲的? ☆─────────────────────────────────────☆ cryppie (北邮人) 于 (Tue Nov 6 23:12:28 2007) 提到: 以前小做过跟踪的demo,用gmm对face建模,gmm采用online的方式,采用六个参数的affine模型,通过em迭代更新运动参数,对scaling, occlusion, view-angle changing,lighting changing有一定的处理能力。吴郢的主页上有EM tracker的demo。我没做到像他们那种程度,现在觉得似乎少了一些brute force的东西,呵呵。吴郢的demo就有你说的那些场景。你说的基于模型的,我想跟这个是一样,事先对物体建模,之后利用模型计算出confidence map,在locate。Meanshift把confidence map称为weight image。 ------------------------------------------------------------------------------------------------------------- nips'05还是06,有一个人用eigenspace做tracking,他的主页上提供了他的数据,我个人觉得他的数据很有难度。忘了他的名字了^^ ☆─────────────────────────────────────☆ bebekifis (肥狗) 于 (Wed Nov 7 10:50:23 2007) 提到: 没那么复杂,SIFT+boosting就搞定了 ☆─────────────────────────────────────☆ cryppie (北邮人) 于 (Wed Nov 7 10:53:00 2007) 提到: SIFT自己写的? ☆─────────────────────────────────────☆ bebekifis (肥狗) 于 (Wed Nov 7 10:53:28 2007) 提到: 特征描述子很简单吧
订阅后,新回复会通过你的通知中心匿名送达。
0 条回复
暂无回复 · 你可以订阅本帖等待新回复。