BBYR Achieve
返回信息流
这是一条镜像帖。来源:北邮人论坛 / ml-dm / #9219同步于 2012/6/1
该镜像源已超过 30 天没有更新,可能在源站已被删除。
ML_DM机器人发帖

写在KDDCUP即将结束之际

antinucleon
2012/6/1镜像同步13 回复
本想写一篇长点的文章。。。。结果没空 所以是个abstract。。。。 详细的估计要等好几个月后 1. 搞的一团糟只有三种情况:队友傻逼或自己傻逼,或都是傻逼。在这种情况下,高素质的队友必不可少(如果连机器学习的基本概念都没有的,这种队友趁早扔开。为了防止队友太强势,还是一人做一个Model最好,井水不犯河水,最后bagging还能提高效果。 2.年轻人得多读书,多看报。比如近几年的SIGIR,WWW,WSDM,SIGKDD,还是要看看的,看看其他人在干啥。蒙头瞎做就是坑队友。当然还有一种情况,就是被paper坑,比如我遭遇的被WWW-10的Jure大神的paper坑,这个是自己傻逼,没的救。这个对于paper都没读过的人来说,可以忽略。 2.5 年轻人要勤奋。这次认识了一个非常年轻的fresh PhD朋友(肯定不是敝校的),他最后是前50的样子。我们经常4am或者5am讨论一些比较诡异的pattern (有些无法理解的pattern居然最后在社会学里都找到了落脚点!)当然他比我勤奋多了,我是跑到社会学里看‘哦,对,这个是实际存在的规律。’而他把这些变成了code。所以我这种懒人活该比别人差。 3. 得多交流,和全世界人民都交流交流,看看他们Model效果怎么样。闭门造车那是隔壁他金三胖做的事,不是智商正常的人该干的。不要说什么找不到colleague啥的,换句话说,那是纯粹的懒。 4. 关于学校,,,,我知道的是台大,UCI之类的学校,都有一门Practical Data Mining的课,就是专门做KDDCUP等比赛。当然台大非常强势,今年那门课的Prof是连续三届的KDDCUP冠军,Caltech毕业,和libsvm的作者,那个四十多岁的IEEE Fellow带的学生。今年的第一——undergrads,本科生,是台大的还是上交的,目前搞不大清楚,反正就是这样了。当然非常感谢敝校张教授临时让我用了几天工作站,一个人吃了40GB内存,顺便感谢贵实验室的兄弟姐妹,我和cc最后几天通宵找latent topic num的时候干扰到你们的正常生活。 5. 结论:这次是第一次接触real data的data mining,全当攒经验了。最后和余同学在最后一周做到一百出头,一度到90名,觉得这样也马马虎虎了。明年应该就会更有经验一些,不会像今年一样踩着三个月的狗屎走来。 附:结果出来了。。。上交第一,上交去年第三。。。。 明年有机会找几个靠谱的队友,看能不能从今年的TOP 25%做到TOP 10% 顺便给我的窝打个小广告,嗯,欢迎访问www.antinucleon.com,但这几个月是不会有啥更新的。。。。因为没空、、、
订阅后,新回复会通过你的通知中心匿名送达。
9 条回复
ziyu机器人#1 · 2012/6/1
先顶给力师弟 然后仔细拜读~~
terrily机器人#2 · 2012/6/1
的确是书读的太少,还好,以后多读书多交流是王道!!!
ziyu机器人#3 · 2012/6/1
楼上也是萌师弟
michael2008机器人#4 · 2012/6/1
牛人学弟,啥时候我们开总结会的时候你过来给讲讲啊
douyu0814机器人#5 · 2012/6/2
好 !!!!!!!!!!!!!!!
AMY1990机器人#6 · 2012/6/2
赞 【 在 antinucleon (Requiem) 的大作中提到: 】 : 本想写一篇长点的文章。。。。结果没空 : 所以是个abstract。。。。 : 详细的估计要等好几个月后 : ...................
ekittying机器人#7 · 2012/6/2
赞一个~~哈哈,你看我ip就知道我是谁了……
lijingyi机器人#8 · 2012/6/2
先顶再看。
moonyellow机器人#9 · 2012/6/2
Leskovec 是我见过的最帅的科研工作者... LZ 也是本科吧