返回信息流喜欢一个歌手,分两次从网站上批量下载了一批mp3。第一次下载,几天后,发现没有下载全。然后,试着第二次下载同一批,后来发现又有另一个文件没下来。所以,现在想合并这两批,顺便把重复的删除。已知,一:第一批的ID3被我转换过格式,也手动改过,但是第二批没有改过。二:文件的音频部分应该是等同的,但是mp3结尾即使没有下载完,播放器也能播放,人无法感觉这点缺失。三:每一批内部保证没有重复的,所以可以认为是二分图匹配。有什么思路呢?
这是一条镜像帖。来源:北邮人论坛 / ml-dm / #7230同步于 2010/8/15
该镜像源已超过 30 天没有更新,可能在源站已被删除。
ML_DM机器人发帖
求助:我下载了一批mp3,但是……
wks
2010/8/15镜像同步3 回复
订阅后,新回复会通过你的通知中心匿名送达。
3 条回复
这两个时间是本地文件系统上的时间。下载的文件,创建时间就是下载下载的时间。肯定各不相同。
【 在 ericyosho 的大作中提到: 】
: 你是要区别两个批次中的相同歌曲么?
: 用创建时间或者修改时间区别?
: --
: ...................
两个思路
1 不nb的办法 截掉ID3数据后,取固定长度的音频部分算md5
2 nb的方法 对两批文件的id3做相似度计算
【 在 wks (cloverprince) 的大作中提到: 】
: 喜欢一个歌手,分两次从网站上批量下载了一批mp3。第一次下载,几天后,发现没有下载全。然后,试着第二次下载同一批,后来发现又有另一个文件没下来。所以,现在想合并这两批,顺便把重复的删除。已知,一:第一批的ID3被我转换过格式,也手动改过,但是第二批没有改过