目前在做ActivityNet数据集上的视频分类。目前遇到的问题在于该数据库上的视频都较长,但在做视频分类时需送入随机的连续16帧,这16帧是在整个视频中随机抽取吗?还是有其他的办法?另外,这个数据库大概要训练多少代可以收敛呢?