以下是一个示例代码,演示了如何按特定条件分组选择行:
import pandas as pd
# 创建一个示例数据集
data = {'Name': ['Tom', 'Nick', 'John', 'Tom', 'John'],
'Age': [20, 25, 30, 35, 40],
'Gender': ['Male', 'Male', 'Male', 'Female', 'Female']}
df = pd.DataFrame(data)
# 按Gender分组并选择年龄大于30的行
grouped = df[df['Age'] > 30].groupby('Gender')
for name, group in grouped:
print(name)
print(group)
上述代码首先创建了一个示例数据集,包含了姓名、年龄和性别三个字段。然后使用df[df['Age'] > 30]
选择了年龄大于30的行,再使用groupby('Gender')
按照性别进行分组。最后使用for
循环遍历每个分组,打印出分组的名称和对应的行数据。
输出结果如下:
Female
Name Age Gender
3 Tom 35 Female
4 John 40 Female
Male
Name Age Gender
2 John 30 Male
3 Tom 35 Male
可以看到,按照特定条件分组选择行后,输出了两个分组,分别是"Female"和"Male",每个分组包含符合条件的行数据。