以下是一个示例代码,演示如何按照唯一值进行分区:
import pandas as pd
# 创建一个示例数据集
data = {'Name': ['Alice', 'Bob', 'Charlie', 'Alice', 'Bob', 'Charlie'],
'Age': [25, 30, 35, 25, 30, 35],
'City': ['New York', 'London', 'Paris', 'New York', 'London', 'Paris']}
df = pd.DataFrame(data)
# 根据 'Name' 列的唯一值进行分区
partitions = df.groupby('Name')
# 打印每个分区的内容
for name, partition in partitions:
print(f"Partition: {name}")
print(partition)
print()
输出结果为:
Partition: Alice
Name Age City
0 Alice 25 New York
3 Alice 25 New York
Partition: Bob
Name Age City
1 Bob 30 London
4 Bob 30 London
Partition: Charlie
Name Age City
2 Charlie 35 Paris
5 Charlie 35 Paris
这个示例使用了pandas
库中的groupby
函数,根据 'Name' 列的唯一值将数据分成了三个分区,并打印了每个分区的内容。你可以根据自己的需要修改示例代码。