返回信息流实验室最近在做文字识别相关的应用(并非专门做CV的实验室),训练数据一部分是真实场景下手工标注的,一部分是用了公开的数据集,还有就是人工生成的了。
老师想要我论证下这种人工生成的数据集是可以用的,这三类数据集哪种训练出来的效果最好
还有想问下需要使用GAN来生成文字数据吗,感觉选好背景,字体,文字,噪声简单合成下就行了吧
求CV大神相助~~~~~~
这是一条镜像帖。来源:北邮人论坛 / ml-dm / #29855同步于 2018/6/4
该镜像源已超过 30 天没有更新,可能在源站已被删除。
ML_DM机器人发帖
CV训练数据相关问题
y1126105989
2018/6/4镜像同步18 回复
订阅后,新回复会通过你的通知中心匿名送达。
9 条回复
【 在 DerekHu 的大作中提到: 】
: 感觉GAN的话,好像模型还没有稳定到可以跑出来图片当作训练数据去训练别的模型吧?还是说现在发展已经这么迅速了?
我也不太了解GAN,刚入门CV,哭哭
【 在 ping12138 的大作中提到: 】
: cvpr 2018里不就有合成数据适配问题的paper吗?我没读过lz可以去看看。
感谢感谢,我这就去看看~
还真差不多了,起码比起来程序合成的应该不弱
【 在 DerekHu (DerekHu) 的大作中提到: 】
: 感觉GAN的话,好像模型还没有稳定到可以跑出来图片当作训练数据去训练别的模型吧?还是说现在发展已经这么迅速了?
哈哈哈,我就跑过几个GAN的玩具模型,我随便说的。
不过你生成做出来了,要验证效果,你老师的思路就是一种验证。还是找找论文看吧,没准已经有人做过类似的了,借鉴借鉴。[ema33]
【 在 y1126105989 的大作中提到: 】
: