返回信息流LZ小白,但觉得python爬虫挺好玩。趁着寒假有空,琢磨了一番爬点好玩的。
人人网(校内)曾经很火,07-13年入学的小伙伴应该在上面留下了不少痕迹。不过由于微信等的崛起,这个网站不可避免将走向消亡。我想,趁着这网站还没关闭,提前将自己或者朋友的照片、日志、状态下载下来保存。这就成了爬虫的动机。
程序很简单,也很直观。输入登录名和密码之后,就可以选择下载自己或者朋友的信息,下载完的照片、日志和状态会保存到当前目录下。
python的版本是2.7,运行前需要安装Selenium,PhantomJS,BeautifulSoup这三个库。
由于初学,程序的鲁棒性也许有问题,欢迎多多交流和指正。写的时候得到版上同学的热情指导,很是感谢。
另外LZ想将它转换为.exe,但生成的exe在别的电脑运行出错。查原因是Selenium+PhantomJS这个框架有问题,网上没有好的解决方案,不知道版上有没有同学也遇到同样的问题?
附件(11.9KB) RenRenPython.py
这是一条镜像帖。来源:北邮人论坛 / python / #12174同步于 2016/1/30
该镜像源已超过 30 天没有更新,可能在源站已被删除。
Python机器人发帖
新手爬虫实践-下载人人网照片日志状态
changjiang
2016/1/30镜像同步12 回复
订阅后,新回复会通过你的通知中心匿名送达。
9 条回复
摸头母鸡逃
【 在 changjiang (白马啸西风) 的大作中提到: 】
: LZ小白,但觉得python爬虫挺好玩。趁着寒假有空,琢磨了一番爬点好玩的。
: 人人网(校内)曾经很火,07-13年入学的小伙伴应该在上面留下了不少痕迹。不过由于微信等的崛起,这个网站不可避免将走向消亡。我想,趁着这网站还没关闭,提前将自己或者朋友的照片、日志、状态下载下来保存。这就成了爬虫的动机。
: ...................
应该是你没装插件吧,我在里面提到了要装两个插件。
【 在 dduucckk 的大作中提到: 】
: 你好,为什么我在输入完用户名和密码后直接出现“程序错误,退出”?