hcb 发布的文章

网页抓取数据时对content-Encoding=br的处理


网页抓取数据时对content-Encoding=br的处理今天在获取网页数据的时候 ,查看返回的结果是好多乱码。 好多方格符号,把代码调试了一下。发现了原因竟然是这个网页是内容编码采用br这个原因引起来的。 之前处理content-encoding的时候,先判断 是否是gzip,如果是按gzip来处理,如果不是的话,采用默认处理。 现在发现默认处理完以后,乱码了。 经过查找原- 阅读剩余部分 -