文章目录
做数据分析的工作,大部分时间不是在处理数据而是在收集数据,使用python可以手机网页数据,今天我们就教给大家如何使用python的urllib2来获取网页源码,这是最简单的获取网页源码的方法,以后我们会逐步加大难度。
- 引入模块urllib2
- 设置要采集的地址
- 使用urlopen方法来返回网页文件
- 只能使用read方法来获得网页文件的内容
- 看一下f的长度就知道是否真的返回了网页
- 避免这样去看f的内容,你会疯掉的。
转载请注明来自DataScience.
邮箱: 675495787@qq.com