文章目录
很多数据是从网上下载而来,数据的格式可能是csv,那么pandas可以很容易的从csv格式的文件中读取数据,下面我们来看看具体的过程:
- 引入pandas
- 使用pandas下的read_csv方法,读取csv文件,参数是文件的路径,这是一个相对路径,是相对于当前工作目录的,那么如何知道当前的工作目录呢?
- 使用os.getcwd()方法获取当前工作目录
- 读取前三后数据,查看一下是否读取正确,显然都是乱码,这是什么问题呢?
- 我们需要设定参数encoding,也就是编码方式,如果你不设定编码方式,默认是utf8,现在csv文件是gbk编码的,所以需要使用encoding=’gbk’
- 我用的编辑器是eric4,注意,eric4默认是不支持中文的,如果你想要显示中文,前提是设置正确的编码,在preferences中
- 设置成utf8即可
- 回到pandas,我们可以有更多选项来设置打开数据时的操作:
转载请注明来自DataScience.
邮箱: 675495787@qq.com