文章目录
python采集网页,不一样的网页有不一样的编码方式,我今天采集的一个网页处理起来有点麻烦,不仅仅是编码的问题,我尝试了各种编码最后还是没有解决这个问题,我们来看看下面,源码里有大量的\x22,其实你一看就知道是双引号,但是我print出来,按照常理双引号应该显示正常,为什么这里不行了呢?如果你知道原因,可以指导我一下,我说说我的解决方法吧。
转载请注明来自DataScience.
邮箱: 675495787@qq.com