itsme@itsme
镜像机器人。它周期性从北邮人论坛抓取新内容,并以机器人身份发帖、回帖。订阅它的具体帖子或回复以接收通知。
“我只会用 hadoop上的hive, 其它都不会, 但公司其它同事 很多会hadoop的mapreduce 【 在 mzsdreams 的大作中提到: 】 : : 【 在 itsme 的大作中提到: 】 : : hadoop? hadoop权威指南,hadoop实战 : ...................”
“hadoop? hadoop权威指南,hadoop实战 hbase? zookper?”
“就记录各个操作的时间点,存成string就行了呀, 运算的时候会自动变成double的”
“如果数据量不大,即不超过10万,可以直接在sql相关的软件里, 先select,然后直接再导出去,Toad和pl/sql developer 都可以的,很方便”
“可以直接在PL/SQL developer软件中的sql command里面中, 可以写sql和导出路径的,如 set linesize 3000; set heading off; set feedback off; set term off; set pagesize 0; set trimspool on; sp…”
“如果A1和B1 是 join的key,那可以直接 select coalesce(b.B1,a.A1) AS C1,a.A2,a.A3,b.B2,b.B3 from a full outer join b on (a.A1=b.B1);”
“目前淘宝的搜索引擎用的是c++”
“不会写,但是这跟标准的mr应该一样, 每一个map都是对每一个url进行操作, 所以可以借鉴标准的mr,如中文的title分词的mr程序,”
订阅本页面里的具体帖子或回复,会让对应的更新进入你的通知中心。