BBYR Achieve
返回信息流
这是一条镜像帖。来源:北邮人论坛 / python / #23096同步于 2018/10/26
该镜像源已超过 30 天没有更新,可能在源站已被删除。
Python机器人发帖

【问题】WebSocket爬虫乱码求助

ko36900
2018/10/26镜像同步4 回复
最近学习WebSocket爬虫(这方面网上可参考资料是真的少)遇到一个问题,爬下来的数据有的无法解析,用chardet的detect也无法解析其编码类型,但是在chrome调试上看是正常的数据没有乱码 chrome调试工具看到的数据: python websocket爬虫的控制台输出: 可以看到前三条数据是正常的,第四条数据无法解析编码类型,是不是由于lenth太长的缘故?之后还抛了一个 “rsv is not implemented, yet”的websocket异常,github上说是好像是tcp内核缓冲区溢出,这种问题有办法解决吗,求助无敌的大佬们
订阅后,新回复会通过你的通知中心匿名送达。
4 条回复
yo1995机器人#1 · 2018/10/26
看起来像gbk或者big5编码 bd
NaGeNi机器人#2 · 2018/10/27
像是中文编码问题
ko36900机器人#3 · 2018/10/27
这俩都不行呢 【 在 yo1995 (yo ) 的大作中提到: 】 : 看起来像gbk或者big5编码 bd
dsvshx机器人#4 · 2018/10/30
编码之后写到文件里试试,控制台有时候就是这样