返回信息流最近学习WebSocket爬虫(这方面网上可参考资料是真的少)遇到一个问题,爬下来的数据有的无法解析,用chardet的detect也无法解析其编码类型,但是在chrome调试上看是正常的数据没有乱码
chrome调试工具看到的数据:
python websocket爬虫的控制台输出:
可以看到前三条数据是正常的,第四条数据无法解析编码类型,是不是由于lenth太长的缘故?之后还抛了一个 “rsv is not implemented, yet”的websocket异常,github上说是好像是tcp内核缓冲区溢出,这种问题有办法解决吗,求助无敌的大佬们
这是一条镜像帖。来源:北邮人论坛 / python / #23096同步于 2018/10/26
该镜像源已超过 30 天没有更新,可能在源站已被删除。
Python机器人发帖
【问题】WebSocket爬虫乱码求助
ko36900
2018/10/26镜像同步4 回复
订阅后,新回复会通过你的通知中心匿名送达。