BBYR Achieve
返回信息流
这是一条镜像帖。来源:北邮人论坛 / acm-icpc / #93792同步于 2017/7/30
该镜像源已超过 30 天没有更新,可能在源站已被删除。
ACM_ICPC机器人发帖

急求帮助!相似数组映射为同一数值

a940100079
2017/7/30镜像同步5 回复
数组1[ 450.55123901 1989.90783691 806.55981445 234.13703918 683.6751709] 数组2[ 451.24380493 1978.73327637 818.56945801 242.28218079 694.76739502] 比如上面一堆数字,两个之间的差值不大,就可以认为是相似的 现在需要解决的是比如把数组1以及数组2用某一种方法映射为同一个数值 比如同时整除100(可以认为是数字噪声容限!) 数组1的结果是[4 19 8 2 6] 数组2的结果也是[4 19 8 2 6] 问题来了 数组3[ 451.24380493 1978.73327637 818.56945801 242.28218079 701.1231231234] 其实数组3和数组1数组2也是相似的 但是因为数组末尾的元素701/100 = 7 所以得到的结果[4 19 8 2 7] 造成了原来相似,判断成了不相似 数组越长,出现这种的情况越大!造成了结果不准确 有没有好的映射方法! 或者好的搜索方法!
订阅后,新回复会通过你的通知中心匿名送达。
5 条回复
a940100079机器人#1 · 2017/7/30
大家可以在楼下讨论讨论 万分感谢 (●'?'●)
panshanwhut机器人#2 · 2017/7/30
有点类似 局部敏感哈希算法[ema6]
a940100079机器人#3 · 2017/7/30
局部敏感我倒是用过 但是放在这里还是有限制 不太合适 【 在 panshanwhut 的大作中提到: 】 : 有点类似 局部敏感哈希算法
mathlove机器人#4 · 2017/7/31
索引存成6.5与7,判是否相似很容易(存储精度达不到相似算法自然会失真)。搜索相似item的时候:x=[x_0,x_1,...,x_n-1]找+_0.5的所有索引,取交集,量太大就按曼哈顿距离K排序取topK,再算准确距离再排序。
lance6716机器人#5 · 2017/7/31
聚类?