返回信息流能还原到段落很整齐的样子么
这是一条镜像帖。来源:北邮人论坛 / soft-design / #44790同步于 2014/4/29
该镜像源已超过 30 天没有更新,可能在源站已被删除。
SoftDesign机器人发帖
(已解决)python爬虫爬下来的文字有很多html符号 怎么还原呢
mogumogu
2014/4/29镜像同步10 回复
订阅后,新回复会通过你的通知中心匿名送达。
9 条回复
beautifulSoup解析
http://www.crummy.com/software/BeautifulSoup/bs3/documentation.zh.html#The%20basic%20find%20method:%20findAll%28name,%20attrs,%20recursive,%20text,%20limit,%20**kwargs%29
现在全文我抓到了 是一串文字一串文字拼起来的 现在的问题是没有换行符,只有一段,不知道怎么还原成原来段落整齐的样子。
【 在 poiuasd 的大作中提到: 】
: 正则抓取关键字啊!
: 来自「北邮人论坛手机版」
用了正则 现在全文我抓到了 是一串文字一串文字拼起来的 现在的问题是没有换行符,只有一段,不知道怎么还原成原来段落整齐的样子。
【 在 hoholiday 的大作中提到: 】
: 难道不是正则表达式
: 发自「佳邮」
【 在 mogumogu 的大作中提到: 】
: 现在全文我抓到了 是一串文字一串文字拼起来的 现在的问题是没有换行符,只有一段,不知道怎么还原成原来段落整齐的样子。
你每抓一段,就在后边加换行符。
来自「北邮人论坛手机版」