推荐书: Python开发最佳实践

Python教程:[37]处理网页源码中的 x22字符

分享时@该用户已经被封, 我就能回答你的问题奥!

python采集网页,不一样的网页有不一样的编码方式,我今天采集的一个网页处理起来有点麻烦,不仅仅是编码的问题,我尝试了各种编码最后还是没有解决这个问题,我们来看看下面,源码里有大量的\x22,其实你一看就知道是双引号,但是我print出来,按照常理双引号应该显示正常,为什么这里不行了呢?如果你知道原因,可以指导我一下,我说说我的解决方法吧。

转载请注明来自DataScience.

邮箱: 675495787@qq.com