多模态问题求助

2022/10/10镜像同步0 回复

问题：有一批图文pair，想要提升这批数据的质量，提升图文pair对的准确率。其中文本是图片的cation 目前方法：基于clip、blip的transformer的套路，但是blip中文版本，clip试了一下感觉一般有没有大佬有好的办法和经验的呀？可有偿 ~

订阅后，新回复会通过你的通知中心匿名送达。

0 条回复

暂无回复 · 你可以订阅本帖等待新回复。