---
title: pandas-Dataframe增加行删除行
date: 2018-05-23 8:17:55
tags: [python, dataframe, 数据分析]
toc: true
xiongzhang: true

---
<span></span>
<!-- more -->

> 声明: 本文由[DataScience](http://mlln.cn)原创发表, 转载请注明[本文链接](http://mlln.cn)mlln.cn, 并在文后留言`转载`.

本文代码运行环境:

- windows10
- python3.6
- jupyter notebook

我使用pandas有很长时间了, 一个经常被问道的问题是, 如何增加或删除行, 今天我在这里做一个总结, 希望能帮助一部分人. 下面我们先引入用到的库, 并进行一些初始化的操作.

In [5]:
import pandas as pd
import random

In [12]:
df = pd.DataFrame({'a':list(range(100)), 'b':[random.random() for i in range(100)]})
index = pd.MultiIndex.from_product([list('abcd'), list(range(25))])
df.index = index
df.head()

Unnamed: 0,Unnamed: 1,a,b
a,0,0,0.579633
a,1,1,0.220929
a,2,2,0.729217
a,3,3,0.183624
a,4,4,0.088332


### 增加行

如果你确定知道要增加的行的索引是什么, 并且这个索引不在df.index中, 那么用如下方法是最简单的.

In [26]:
df.loc[('a', -1), :]=None 
df.tail()

Unnamed: 0,Unnamed: 1,a,b
d,21,96.0,0.869157
d,22,97.0,0.443904
d,23,98.0,0.946893
d,24,99.0,0.787945
a,-1,,


但是, 很多时候, 我们并不确定索引是否已经存在, 只想追加数据, 那么最好是使用`DataFrame.append`方法. 但是你需要事先创建一个dataframe实例, 用于存放被追加的数据.

In [31]:
data = pd.DataFrame({'a':[1,2,3], 'b':[4,5,6]})
data.index = pd.MultiIndex.from_tuples([('a', 1), ('b', 1), ('c', 1)])
data

Unnamed: 0,Unnamed: 1,a,b
a,1,1,4
b,1,2,5
c,1,3,6


In [33]:
new_df = df.append(data)
new_df.tail()

Unnamed: 0,Unnamed: 1,a,b
d,24,99.0,0.787945
a,-1,,
a,1,1.0,4.0
b,1,2.0,5.0
c,1,3.0,6.0


### 删除行

很多时候我们没必要做频繁的数据操作, 只需要建立一个DataFrame的视图即可, 比如选择a<10的所有数据:

In [51]:
df[df['a']<10]

Unnamed: 0,Unnamed: 1,a,b
a,0,0.0,0.579633
a,2,2.0,0.729217
a,3,3.0,0.183624
a,4,4.0,0.088332
a,5,5.0,0.757389
a,6,6.0,0.621999
a,7,7.0,0.907589
a,8,8.0,0.493122
a,9,9.0,0.884472


我们并没有删除这些行, 只是选择出了我们需要的行, 并建立了一个视图, 这个概念可以类比与mysql数据库的查询视图.

但是, 如果想要删除某些行, 那怎么办? 我常用的方法是`DataFrame.drop`, 它既可以删除行, 也可以删除列. 具体看代码:

In [57]:
# 删除index为('a', -1)的行
df.drop(('a', -1)).tail()

Unnamed: 0,Unnamed: 1,a,b,to_delete
d,20,95.0,0.599706,1
d,21,96.0,0.869157,1
d,22,97.0,0.443904,1
d,23,98.0,0.946893,1
d,24,99.0,0.787945,1


In [71]:
# 删除指定行
# 删除倒数第一行
df.drop(df.index[-1]).tail()

Unnamed: 0,Unnamed: 1,a,b
d,20,95.0,0.599706
d,21,96.0,0.869157
d,22,97.0,0.443904
d,23,98.0,0.946893
d,24,99.0,0.787945


In [61]:
# 删除多行

df.drop([('a', -1), ('d', 24)]).tail()

Unnamed: 0,Unnamed: 1,a,b,to_delete
d,19,94.0,0.593349,1
d,20,95.0,0.599706,1
d,21,96.0,0.869157,1
d,22,97.0,0.443904,1
d,23,98.0,0.946893,1


In [72]:
# 删除连续的多行
# 删除最后5行
df.drop(df.index[-5:]).tail()

Unnamed: 0,Unnamed: 1,a,b
d,16,91.0,0.838718
d,17,92.0,0.334192
d,18,93.0,0.110082
d,19,94.0,0.593349
d,20,95.0,0.599706


In [69]:
# 删除列
df.drop('to_delete', axis=1).head()

Unnamed: 0,Unnamed: 1,a,b
a,0,0.0,0.579633
a,1,,
a,2,2.0,0.729217
a,3,3.0,0.183624
a,4,4.0,0.088332


当然, 这些操作并没有真的删除这些数据, 想要在`df`上删除, 你需要使用参数`inplace=True`, 如:

In [70]:
df.drop('to_delete', axis=1, inplace=True)
df.head()

Unnamed: 0,Unnamed: 1,a,b
a,0,0.0,0.579633
a,1,,
a,2,2.0,0.729217
a,3,3.0,0.183624
a,4,4.0,0.088332


好啦, 这就是我用python pandas时删除和增加行的方法, 如果你有更好的方法, 请在这里留言.