以下是一个示例代码,演示如何按列值分离数据集:
import pandas as pd
# 创建一个示例数据集
data = {'Name': ['Alice', 'Bob', 'Charlie', 'David', 'Eve'],
'Age': [25, 30, 35, 40, 45],
'Gender': ['Female', 'Male', 'Male', 'Male', 'Female']}
df = pd.DataFrame(data)
# 按照Gender列值分离数据集
separated_data = {}
for value in df['Gender'].unique():
separated_data[value] = df[df['Gender'] == value]
# 输出分离后的数据集
for key, value in separated_data.items():
print(f"Data for Gender: {key}")
print(value)
print()
输出结果将会是:
Data for Gender: Female
Name Age Gender
0 Alice 25 Female
4 Eve 45 Female
Data for Gender: Male
Name Age Gender
1 Bob 30 Male
2 Charlie 35 Male
3 David 40 Male
这段代码首先创建了一个示例数据集,包含了Name、Age和Gender三列。然后,通过遍历Gender列的唯一值,将数据集按照Gender的值分离,并存储到一个字典中。最后,通过遍历字典,输出每个分离后的数据集。
下一篇:按列值分组并返回最大值