BBYR Achieve
返回信息流
这是一条镜像帖。来源:北邮人论坛 / ml-dm / #22996同步于 2017/3/12
该镜像源已超过 30 天没有更新,可能在源站已被删除。
ML_DM机器人发帖

求助hadoop面试题

yanhan123
2017/3/12镜像同步2 回复
有三千万个向量,找出每个向量最接近的top100的向量。用mapreduce做。向量间的距离用余弦距离。
订阅后,新回复会通过你的通知中心匿名送达。
2 条回复
cc19931002机器人#1 · 2017/3/13
没当我遇到这种题目总是想暴力解法。。[ema27]
AlexShen机器人#2 · 2017/3/15
可以用kd树的思想吗? 先把三千万个点建立kd树,然后对每一个点进行搜索 【 在 cc19931002 的大作中提到: 】 : 没当我遇到这种题目总是想暴力解法。。[ema27] : 发自「贵邮」