脚本之家,脚本语言编程技术及教程分享平台!
分类导航

Python|VBS|Ruby|Lua|perl|VBA|Golang|PowerShell|Erlang|autoit|Dos|bat|

服务器之家 - 脚本之家 - Python - pandas DataFrame索引行列的实现

pandas DataFrame索引行列的实现

2021-07-02 00:11elephantnose Python

这篇文章主要介绍了pandas DataFrame索引行列的实现,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧

  • python版本: 3.6
  • pandas版本: 0.23.4

行索引

索引行有三种方法,分别是 loc iloc ix

?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
import pandas as pd
import numpy as np
 
index = ["a", "b", "c", "d"]
data = np.random.randint(10, size=(4, 3))
df = pd.dataframe(data, index=index)
 
"""
  0 1 2
a 9 7 1
b 0 0 7
c 2 6 5
d 8 2 5
"""

loc

loc通过行索引名字来确定行的

单行索引, 返回series对象

?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
df.loc["a"]
"""
0  9
1  7
2  1
name: a, dtype: int64
"""
 
df.loc["b"]
"""
0  0
1  0
2  7
name: b, dtype: int64
"""

多行索引, 返回dataframe对象

?
1
2
3
4
5
6
df.loc[["a", "c"]]
"""
  0 1 2
a 9 7 1
c 2 6 5
"""

iloc

通过行索引序号来确定行的

单行索引, 返回series对象

?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
df.iloc[0]
"""
0  9
1  7
2  1
name: a, dtype: int64
"""
 
df.iloc[1]
"""
0  0
1  0
2  7
name: b, dtype: int64
"""

多行索引, 返回dataframe对象

?
1
2
3
4
5
6
df.iloc[[0, 2]]
"""
  0 1 2
a 9 7 1
c 2 6 5
"""

ix(不建议使用)

通过行索引名字或序号来确定行的, 如果行索引 index 的类型为整型时, 使用 ix 方法索引时为按行索引名字进行索引, 如行索引名不存在则会报错

?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
index = [2, 3, 4, 5]
df = pd.dataframe(data, index=index)
 
"""
  0 1 2
2 9 7 1
3 0 0 7
4 2 6 5
5 8 2 5
"""
 
df.ix[2]
"""
0  9
1  7
2  1
name: 2, dtype: int64
"""
# 提示信息
"""
.ix is deprecated. please use
.loc for label based indexing or
.iloc for positional indexing
"""
 
# 如果 index 为整数, 则不能按行索引号进行索引
df.ix[0]
"""
...
keyerror: 0
"""

列索引

索引行有两种方法,分别是 . []

?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
import pandas as pd
import numpy as np
 
columns = ["i", "ii", "iii"]
data = np.random.randint(10, size=(4, 3))
df = pd.dataframe(data, columns=columns)
 
"""
  i ii iii
0 4  5  9
1 0  3  4
2 7  9  1
3 8  2  3
"""

通过 . 属性直接获取指定行, 返回series对象

?
1
2
3
4
5
6
7
8
df.i
"""
0  4
1  0
2  7
3  8
name: i, dtype: int64
"""

 []

单列索引, 返回dataframe对象

?
1
2
3
4
5
6
7
8
df[["i"]]
"""
  i
0 4
1 0
2 7
3 8
"""

多列索引, 返回dataframe对象

?
1
2
3
4
5
6
7
8
df[["i", "ii"]]
"""
  i ii
0 4  5
1 0  3
2 7  9
3 8  2
"""

同时索引行及列

通过指定索引名或切片方式进行索引

?
1
2
3
4
5
6
7
8
9
10
11
index = ["a", "f", "c", "h"]
columns = ["i", "ii", "iii"]
 
df = pd.dataframe(data, index=index, columns=columns)
"""
  i ii iii
a 4  5  9
f 0  3  4
c 7  9  1
h 8  2  3
"""

loc

通过指定行及列索引名进行索引, 返回dataframe对象

?
1
2
3
4
5
6
df.loc[["a", "f"], ["ii", "iii"]]
"""
  ii iii
a  5  9
f  3  4
"""

通过指定行及列索引名范围进行索引(包含边值), 返回dataframe对象

?
1
2
3
4
5
6
7
df.loc["a":"c", "ii":"iii"]
"""
  ii iii
a  5  9
f  3  4
c  9  1
"""

iloc

通过指定行及列索引号进行索引, 返回dataframe对象

?
1
2
3
4
5
6
df.iloc[[0, 1], [1, 2]]
"""
  ii iii
a  5  9
f  3  4
"""

通过指定行及列索引号范围进行切片索引(左闭右开), 返回dataframe对象

?
1
2
3
4
5
6
7
df.iloc[:3, 1:3]
"""
  ii iii
a  5  9
f  3  4
c  9  1
"""

ix(不建议使用)

通过指定行及列索引号范围或名字范围进行切片, 返回dataframe对象

?
1
2
3
df.ix["a":"c", "i":"iii"]
df.ix["a":"c", 1:3]
df.ix[:3, 1:3]

tips: 只有使用 iloc 或 ix 按索引号进行切片索引时才为左闭右开, 其余全闭

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持服务器之家。

原文链接:https://segmentfault.com/a/1190000019380372

延伸 · 阅读

精彩推荐