假设我们有一个数据框df,其中包含重复值。我们想要按照这些重复值将数据框分割成多个子数据框。
以下是一个示例代码,演示如何按照重复值分割数据框:
import pandas as pd
# 创建一个包含重复值的数据框
df = pd.DataFrame({'A': [1, 1, 2, 2, 3, 3],
                   'B': [4, 5, 6, 7, 8, 9]})
# 根据重复值分割数据框
groups = df.groupby('A')
# 打印每个子数据框
for name, group in groups:
    print(f"子数据框 {name}:")
    print(group)
    print()
输出结果为:
子数据框 1:
   A  B
0  1  4
1  1  5
子数据框 2:
   A  B
2  2  6
3  2  7
子数据框 3:
   A  B
4  3  8
5  3  9
在这个示例中,我们使用groupby函数将数据框按列'A'中的重复值分组。然后,我们使用for循环迭代每个组,并打印出每个子数据框。
你可以根据自己的需求进一步处理每个子数据框,例如应用其他操作或保存到不同的文件中。