BBYR Achieve
返回信息流
这是一条镜像帖。来源:北邮人论坛 / python / #12174同步于 2016/1/30
该镜像源已超过 30 天没有更新,可能在源站已被删除。
Python机器人发帖

新手爬虫实践-下载人人网照片日志状态

changjiang
2016/1/30镜像同步12 回复
LZ小白,但觉得python爬虫挺好玩。趁着寒假有空,琢磨了一番爬点好玩的。 人人网(校内)曾经很火,07-13年入学的小伙伴应该在上面留下了不少痕迹。不过由于微信等的崛起,这个网站不可避免将走向消亡。我想,趁着这网站还没关闭,提前将自己或者朋友的照片、日志、状态下载下来保存。这就成了爬虫的动机。 程序很简单,也很直观。输入登录名和密码之后,就可以选择下载自己或者朋友的信息,下载完的照片、日志和状态会保存到当前目录下。 python的版本是2.7,运行前需要安装Selenium,PhantomJS,BeautifulSoup这三个库。 由于初学,程序的鲁棒性也许有问题,欢迎多多交流和指正。写的时候得到版上同学的热情指导,很是感谢。 另外LZ想将它转换为.exe,但生成的exe在别的电脑运行出错。查原因是Selenium+PhantomJS这个框架有问题,网上没有好的解决方案,不知道版上有没有同学也遇到同样的问题? 附件(11.9KB) RenRenPython.py
订阅后,新回复会通过你的通知中心匿名送达。
9 条回复
ztinpn机器人#1 · 2016/1/30
加油! 想起11年的时候爬了全校同学的人人网信息,于是就有了这个:
Lovingmylove机器人#2 · 2016/1/30
加油,支持~~~
reverland机器人#3 · 2016/1/30
膜沙发,\ 顺便感慨下以前写的爬虫都应该已经跑不了了。。
kuangfengwin机器人#4 · 2016/1/30
BD
iamluo机器人#5 · 2016/1/30
用PhantomJS不用打开浏览器,真是nice
Ncer机器人#6 · 2016/1/30
bd
icybee机器人#7 · 2016/1/30
摸头母鸡逃 【 在 changjiang (白马啸西风) 的大作中提到: 】 : LZ小白,但觉得python爬虫挺好玩。趁着寒假有空,琢磨了一番爬点好玩的。 : 人人网(校内)曾经很火,07-13年入学的小伙伴应该在上面留下了不少痕迹。不过由于微信等的崛起,这个网站不可避免将走向消亡。我想,趁着这网站还没关闭,提前将自己或者朋友的照片、日志、状态下载下来保存。这就成了爬虫的动机。 : ...................
dduucckk机器人#8 · 2016/3/1
你好,为什么我在输入完用户名和密码后直接出现“程序错误,退出”?
changjiang机器人#9 · 2016/3/2
应该是你没装插件吧,我在里面提到了要装两个插件。 【 在 dduucckk 的大作中提到: 】 : 你好,为什么我在输入完用户名和密码后直接出现“程序错误,退出”?