要按列的唯一值对数据框进行分组,可以使用Pandas库中的groupby函数。
以下是一个示例代码:
import pandas as pd
# 创建一个示例数据框
data = {'A': ['foo', 'bar', 'foo', 'bar', 'foo', 'bar', 'foo', 'foo'],
'B': ['one', 'one', 'two', 'two', 'two', 'one', 'two', 'one'],
'C': [1, 2, 3, 4, 5, 6, 7, 8]}
df = pd.DataFrame(data)
# 按列'A'的唯一值进行分组
grouped = df.groupby('A')
# 打印每个分组的内容
for name, group in grouped:
print("Group:", name)
print(group)
print()
输出:
Group: bar
A B C
1 bar one 2
3 bar two 4
5 bar one 6
Group: foo
A B C
0 foo one 1
2 foo two 3
4 foo two 5
6 foo two 7
7 foo one 8
在示例代码中,我们创建了一个包含'A'、'B'和'C'三列的数据框。然后,我们使用groupby函数将数据框按'A'列的唯一值进行分组。最后,我们遍历每个分组并打印其内容。
下一篇:按列的一对一对将数据框拆分为子集