返回信息流学妹求问,这里是一个刚接触ML不久的渣渣。
毕设涉及这个问题但是一脸懵逼。假设我现在要做的是对一个穿着某类衣服的人的分类,也就是一个fine-grained的问题。如果将包含整个穿着衣服的人的bounding box输入分类网络,感觉好像不太对。。
看了一些论文都是part-based,我自己理解就是提取图片中的不同部位,然后分别提取feature,再把feature联合起来然后分类?(好像被我想得很简单。。。)
首先就是如何提取不同的部位的问题。我第一个想到的就是rcnn的region proposal...好像还有一种poselets的算法,不知道有前辈了解吗?首先网上的源码好像找不到了,其次我一直不太理解这种训练的标注数据是怎么设置的,有人了解吗?
假设我有一个衣服的数据集,只是有对衣服的关键部位有2D 数据标注(就是坐标),可不可以用region proposal network来定位呢。faster rcnn的rpn是不是需要训练数据上有许多bbox的标注呢?(BBOX重心坐标点,还有H和W?)
如果是这样,我可以通过定位2D keypoint,然后自己设置Bbox的大小来得到多个部位的信息吗?
问题比较多,最近是真的陷入迷沼了。。。每天都过得非常痛苦。求大神解救啊…………
这是一条镜像帖。来源:北邮人论坛 / ml-dm / #21475同步于 2016/10/26
该镜像源已超过 30 天没有更新,可能在源站已被删除。
ML_DM机器人发帖
[建议][问题]对于细分类fine-grained的问题,faster-rcnn的RPN
AKAYAyy
2016/10/26镜像同步4 回复
订阅后,新回复会通过你的通知中心匿名送达。
4 条回复
求传授!!我微信是AKAYA112233
【 在 zhanglonghao 的大作中提到: 】
: 兄弟你对faster rcnn的rpn网络理解错了。。你感兴趣我可以跟你交流下
:
发自「贵邮」