推荐书: Python开发最佳实践

Python教程:[34]根据网址采集网页

分享时@该用户已经被封, 我就能回答你的问题奥!

做数据分析的工作,大部分时间不是在处理数据而是在收集数据,使用python可以手机网页数据,今天我们就教给大家如何使用python的urllib2来获取网页源码,这是最简单的获取网页源码的方法,以后我们会逐步加大难度。

  • 引入模块urllib2
  • 设置要采集的地址
  • 使用urlopen方法来返回网页文件
  • 只能使用read方法来获得网页文件的内容
  • 看一下f的长度就知道是否真的返回了网页
  • 避免这样去看f的内容,你会疯掉的。

转载请注明来自DataScience.

邮箱: 675495787@qq.com