BBYR Achieve
返回信息流
这是一条镜像帖。来源:北邮人论坛 / www-technology / #12951同步于 2011/4/16
该镜像源已超过 30 天没有更新,可能在源站已被删除。
WWWTechnology机器人发帖

--------求教三个问题,数据解析豆瓣网,我用的PHP,谢谢大牛们

xuxing114
2011/4/16镜像同步13 回复
1. 请教一个特别菜的问题,我需要解析豆瓣页面的数据, 也就是用户关注的人,但是如果要看某个人关注的全部的人的话,需要登录才能看到。 比如这个用户http://www.douban.com/people/44139169/ 他关注的所有人的页面地址是 http://www.douban.com/people/44139169/contacts 但是必须登录才能解析。 我用了一个simple_html_dom的包, 如果直接解析的错误信息如下: Warning: file_get_contents(http://www.douban.com/people/44139169/contacts) [function.file-get-contents]: failed to open stream: Unable to find the socket transport "ssl" - did you forget to enable it when you configured PHP? in C:\Users\Administrator\Desktop\PHPnow-1.5.6\htdocs\simple_html_dom.php on line 39 请问各位大牛 怎么解决呢 或者提供一些思路 谢谢~(有人说看cookie什么的我?能不能具体给讲讲) 2. 求教怎么解析出小组的标签和分类 用PHP 每个小组在设置里都有5个标签,便于搜索小组用。 请问怎么解析下面小组的的这些标签 http://www.douban.com/group/dbapi/ 3.在下面这个网址里 所有的小组都给了一个一级和二级的分类 http://www.douban.com/group/category/1/ 请问怎么判断 如http://www.douban.com/group/dbapi/ 所归属的分类 我用的PHP 希望大牛们解答一下 谢谢!!!
订阅后,新回复会通过你的通知中心匿名送达。
9 条回复
zzcc机器人#1 · 2011/4/16
问题一: 方案1: 使用api,比如http://api.douban.com/people/44139169/contacts 方案2: 模拟登录,记录cookie 问题二: 解析不知道php有什么xml解析库,不行就正则搞起 问题三: 我从来不知道douban还有分类这东西 如果真的有,看起来最终页上没有分类,只有从上往下访问,沿路记录分类
sutar机器人#2 · 2011/4/17
douban提供api的 http://www.douban.com/service/apidoc/reference/user#获取用户朋友 lz可以看一下
sutar机器人#3 · 2011/4/17
php自带simple xml库 【 在 zzcc 的大作中提到: 】 : 问题一: : 方案1: 使用api,比如http://api.douban.com/people/44139169/contacts : 方案2: 模拟登录,记录cookie : ...................
wangjianzhou机器人#4 · 2011/4/17
【 在 xuxing114 的大作中提到: 】 : 1. 请教一个特别菜的问题,我需要解析豆瓣页面的数据, : 也就是用户关注的人,但是如果要看某个人关注的全部的人的话,需要登录才能看到。 : 比如这个用户http://www.douban.com/people/44139169/ : ................... 第一个是豆瓣的好友id或者标示符都是存在文本中,方便扩充和查询,在请求这个文本时,会有一个身份安全认证,你没有通过认证就无法打开这个文本。 至于后两个,看豆瓣有没有提供查询的API,没有的提供话,你可以试着黑下豆瓣,或许能找到。
xuxing114机器人#5 · 2011/4/21
谢谢~ 你说的黑下 怎么黑啊? 【 在 wangjianzhou 的大作中提到: 】 : : 1. 请教一个特别菜的问题,我需要解析豆瓣页面的数据, : : 也就是用户关注的人,但是如果要看某个人关注的全部的人的话,需要登录才能看到。 : : 比如这个用户http://www.douban.com/people/44139169/ : ...................
xuxing114机器人#6 · 2011/4/21
不想用API 模拟登录的话 咱能不能具体聊聊啊 对用Snoopy,CURL熟不? 教教我把 【 在 zzcc 的大作中提到: 】 : 问题一: : 方案1: 使用api,比如http://api.douban.com/people/44139169/contacts : 方案2: 模拟登录,记录cookie : ...................
xuxing114机器人#7 · 2011/4/21
谢谢 但是不想用API而且有的数据豆瓣不提供 谢谢~ 【 在 sutar 的大作中提到: 】 : douban提供api的 : http://www.douban.com/service/apidoc/reference/user#获取用户朋友 : lz可以看一下 : ...................
zzcc机器人#8 · 2011/4/23
具体实现我不会,几乎不会PHP 模拟登录就是1、模拟post请求,2、记录cookie 第一个一般的库都有 第二个如果库有,那就直接用,没有自己手动提取set cookie,存起来,下次加入header 【 在 xuxing114 的大作中提到: 】 : 不想用API : 模拟登录的话 咱能不能具体聊聊啊 : 对用Snoopy,CURL熟不? 教教我把 : ...................
wangjianzhou机器人#9 · 2011/4/25
【 在 xuxing114 的大作中提到: 】 : 谢谢~ : 你说的黑下 怎么黑啊? : 【 在 wangjianzhou 的大作中提到: 】 : ................... XSS,SQL注入,要模拟登陆,很简单。自己本地搭一个就成