返回信息流1. 请教一个特别菜的问题,我需要解析豆瓣页面的数据,
也就是用户关注的人,但是如果要看某个人关注的全部的人的话,需要登录才能看到。
比如这个用户http://www.douban.com/people/44139169/
他关注的所有人的页面地址是
http://www.douban.com/people/44139169/contacts
但是必须登录才能解析。
我用了一个simple_html_dom的包, 如果直接解析的错误信息如下:
Warning: file_get_contents(http://www.douban.com/people/44139169/contacts) [function.file-get-contents]: failed to open stream: Unable to find the socket transport "ssl" - did you forget to enable it when you configured PHP? in C:\Users\Administrator\Desktop\PHPnow-1.5.6\htdocs\simple_html_dom.php on line 39
请问各位大牛 怎么解决呢 或者提供一些思路 谢谢~(有人说看cookie什么的我?能不能具体给讲讲)
2. 求教怎么解析出小组的标签和分类 用PHP
每个小组在设置里都有5个标签,便于搜索小组用。
请问怎么解析下面小组的的这些标签
http://www.douban.com/group/dbapi/
3.在下面这个网址里 所有的小组都给了一个一级和二级的分类
http://www.douban.com/group/category/1/
请问怎么判断 如http://www.douban.com/group/dbapi/
所归属的分类
我用的PHP 希望大牛们解答一下
谢谢!!!
这是一条镜像帖。来源:北邮人论坛 / www-technology / #12951同步于 2011/4/16
该镜像源已超过 30 天没有更新,可能在源站已被删除。
WWWTechnology机器人发帖
--------求教三个问题,数据解析豆瓣网,我用的PHP,谢谢大牛们
xuxing114
2011/4/16镜像同步13 回复
订阅后,新回复会通过你的通知中心匿名送达。
9 条回复
问题一:
方案1: 使用api,比如http://api.douban.com/people/44139169/contacts
方案2: 模拟登录,记录cookie
问题二:
解析不知道php有什么xml解析库,不行就正则搞起
问题三:
我从来不知道douban还有分类这东西
如果真的有,看起来最终页上没有分类,只有从上往下访问,沿路记录分类
douban提供api的
http://www.douban.com/service/apidoc/reference/user#获取用户朋友
lz可以看一下
php自带simple xml库
【 在 zzcc 的大作中提到: 】
: 问题一:
: 方案1: 使用api,比如http://api.douban.com/people/44139169/contacts
: 方案2: 模拟登录,记录cookie
: ...................
【 在 xuxing114 的大作中提到: 】
: 1. 请教一个特别菜的问题,我需要解析豆瓣页面的数据,
: 也就是用户关注的人,但是如果要看某个人关注的全部的人的话,需要登录才能看到。
: 比如这个用户http://www.douban.com/people/44139169/
: ...................
第一个是豆瓣的好友id或者标示符都是存在文本中,方便扩充和查询,在请求这个文本时,会有一个身份安全认证,你没有通过认证就无法打开这个文本。
至于后两个,看豆瓣有没有提供查询的API,没有的提供话,你可以试着黑下豆瓣,或许能找到。
谢谢~
你说的黑下 怎么黑啊?
【 在 wangjianzhou 的大作中提到: 】
: : 1. 请教一个特别菜的问题,我需要解析豆瓣页面的数据,
: : 也就是用户关注的人,但是如果要看某个人关注的全部的人的话,需要登录才能看到。
: : 比如这个用户http://www.douban.com/people/44139169/
: ...................
不想用API
模拟登录的话 咱能不能具体聊聊啊
对用Snoopy,CURL熟不? 教教我把
【 在 zzcc 的大作中提到: 】
: 问题一:
: 方案1: 使用api,比如http://api.douban.com/people/44139169/contacts
: 方案2: 模拟登录,记录cookie
: ...................
谢谢 但是不想用API而且有的数据豆瓣不提供
谢谢~
【 在 sutar 的大作中提到: 】
: douban提供api的
: http://www.douban.com/service/apidoc/reference/user#获取用户朋友
: lz可以看一下
: ...................
具体实现我不会,几乎不会PHP
模拟登录就是1、模拟post请求,2、记录cookie
第一个一般的库都有
第二个如果库有,那就直接用,没有自己手动提取set cookie,存起来,下次加入header
【 在 xuxing114 的大作中提到: 】
: 不想用API
: 模拟登录的话 咱能不能具体聊聊啊
: 对用Snoopy,CURL熟不? 教教我把
: ...................
【 在 xuxing114 的大作中提到: 】
: 谢谢~
: 你说的黑下 怎么黑啊?
: 【 在 wangjianzhou 的大作中提到: 】
: ...................
XSS,SQL注入,要模拟登陆,很简单。自己本地搭一个就成