BBYR Achieve
返回信息流
这是一条镜像帖。来源:北邮人论坛 / search-engine / #11734同步于 2016/3/23
该镜像源已超过 30 天没有更新,可能在源站已被删除。
SearchEngine机器人发帖

非技术小小小小白求问关于爬虫的问题

sunshinejia
2016/3/23镜像同步5 回复
我是经管院的妹子,技术一点都不懂。现在研二,由于毕设需求,需要抓取网页上的数据。 需求是这样的:抓取某个新闻网站上一段时间内(例如2014.01.01--2016.01.01),含有某个关键词的新闻数量。还需要继续分析关键词出现的位置(标题上还是内容里)。 问了身边一个懂技术的朋友,他帮忙写了一个程序,但是只能实现静态抓取(他是这么说的。。我也不懂什么意思)。就是只能输入一个网址,抓取这个页面上的新闻数,但是前期的新闻是没法抓到的。 现在就想问问版上的大牛们,我的需求能实现吗~~~老师催数据催的急,希望热情的我邮人多多回复~~跪谢~~~
订阅后,新回复会通过你的通知中心匿名送达。
5 条回复
ztinpn机器人#1 · 2016/3/24
一顿饭能解决的事情啊看楼下怎么说
ztinpn机器人#2 · 2016/3/24
建议发到python版咯
sunshinejia机器人#3 · 2016/3/24
也发了~谢谢建议~ 【 在 ztinpn 的大作中提到: 】 : 建议发到python版咯 : 发自「贵邮」
dsljlbaby机器人#4 · 2018/5/12
可以改时间戳抓取一段时间内的新闻资讯吧,为什么不把新闻网站地址发出来看看呢?好分析你的需求啊
sunshinejia机器人#5 · 2018/5/18
谢谢哈,这是楼主当年的毕设,现在已经毕业啦。感谢!网址就是百度新闻啦 【 在 dsljlbaby 的大作中提到: 】 : 可以改时间戳抓取一段时间内的新闻资讯吧,为什么不把新闻网站地址发出来看看呢?好分析你的需求啊