要按列将数据框拆分为子集,可以使用pandas库中的groupby函数。下面是一个示例代码:
import pandas as pd
# 创建一个示例数据框
data = {'A': [1, 1, 2, 2, 3, 3],
'B': [4, 5, 6, 7, 8, 9],
'C': [10, 11, 12, 13, 14, 15]}
df = pd.DataFrame(data)
# 按列'A'拆分数据框为子集
subsets = df.groupby('A')
# 打印每个子集
for subset_name, subset_df in subsets:
print('Subset:', subset_name)
print(subset_df)
print('---')
输出结果:
Subset: 1
A B C
0 1 4 10
1 1 5 11
---
Subset: 2
A B C
2 2 6 12
3 2 7 13
---
Subset: 3
A B C
4 3 8 14
5 3 9 15
---
在上述示例中,我们首先创建了一个示例数据框df。然后,使用groupby函数按列'A'拆分数据框为子集。最后,我们使用for循环打印每个子集的内容。