假设我们有一个数据框df,其中包含重复值。我们想要按照这些重复值将数据框分割成多个子数据框。
以下是一个示例代码,演示如何按照重复值分割数据框:
import pandas as pd
# 创建一个包含重复值的数据框
df = pd.DataFrame({'A': [1, 1, 2, 2, 3, 3],
'B': [4, 5, 6, 7, 8, 9]})
# 根据重复值分割数据框
groups = df.groupby('A')
# 打印每个子数据框
for name, group in groups:
print(f"子数据框 {name}:")
print(group)
print()
输出结果为:
子数据框 1:
A B
0 1 4
1 1 5
子数据框 2:
A B
2 2 6
3 2 7
子数据框 3:
A B
4 3 8
5 3 9
在这个示例中,我们使用groupby
函数将数据框按列'A'中的重复值分组。然后,我们使用for循环迭代每个组,并打印出每个子数据框。
你可以根据自己的需求进一步处理每个子数据框,例如应用其他操作或保存到不同的文件中。