CV训练数据相关问题

2018/6/4镜像同步18 回复

实验室最近在做文字识别相关的应用（并非专门做CV的实验室），训练数据一部分是真实场景下手工标注的，一部分是用了公开的数据集，还有就是人工生成的了。老师想要我论证下这种人工生成的数据集是可以用的，这三类数据集哪种训练出来的效果最好还有想问下需要使用GAN来生成文字数据吗，感觉选好背景，字体，文字，噪声简单合成下就行了吧求CV大神相助~~~~~~

订阅后，新回复会通过你的通知中心匿名送达。

9 条回复

DerekHu机器人#1 · 2018/6/4

感觉GAN的话，好像模型还没有稳定到可以跑出来图片当作训练数据去训练别的模型吧？还是说现在发展已经这么迅速了？

ping12138机器人#2 · 2018/6/4

cvpr 2018里不就有合成数据适配问题的paper吗？我没读过lz可以去看看。

y1126105989机器人#3 · 2018/6/4

【在 DerekHu 的大作中提到: 】 : 感觉GAN的话，好像模型还没有稳定到可以跑出来图片当作训练数据去训练别的模型吧？还是说现在发展已经这么迅速了？我也不太了解GAN，刚入门CV，哭哭

y1126105989机器人#4 · 2018/6/4

【在 ping12138 的大作中提到: 】 : cvpr 2018里不就有合成数据适配问题的paper吗？我没读过lz可以去看看。感谢感谢，我这就去看看~

Mrxiaobai机器人#5 · 2018/6/4

你这个生成做出来就能发一篇paper了吧，嘻嘻嘻[ema9]

miner2344机器人#6 · 2018/6/4

还真差不多了，起码比起来程序合成的应该不弱【在 DerekHu (DerekHu) 的大作中提到: 】 : 感觉GAN的话，好像模型还没有稳定到可以跑出来图片当作训练数据去训练别的模型吧？还是说现在发展已经这么迅速了？

y1126105989机器人#7 · 2018/6/4

【在 Mrxiaobai 的大作中提到: 】 : 你这个生成做出来就能发一篇paper了吧，嘻嘻嘻哈哈哈，想把你的回复给老师看

y1126105989机器人#8 · 2018/6/4

【在 miner2344 的大作中提到: 】 : 还真差不多了，起码比起来程序合成的应该不弱那请问有什么可以参考的论文或者代码吗？

Mrxiaobai机器人#9 · 2018/6/4

哈哈哈，我就跑过几个GAN的玩具模型，我随便说的。不过你生成做出来了，要验证效果，你老师的思路就是一种验证。还是找找论文看吧，没准已经有人做过类似的了，借鉴借鉴。[ema33] 【在 y1126105989 的大作中提到: 】 :