可以使用pandas库中的groupby()函数实现按特定列的值对数据框进行分组。下面是示例代码:
import pandas as pd
data = {'Name': ['Alice', 'Bob', 'Charlie', 'David', 'Emily', 'Frank', 'Gina', 'Harry'], 'Age': [23, 45, 66, 34, 29, 50, 22, 39], 'Gender': ['F', 'M', 'M', 'M', 'F', 'M', 'F', 'M'], 'Score': [87, 92, 80, 78, 89, 88, 91, 85]} df = pd.DataFrame(data)
grouped = df.groupby('Gender') grouped_mean = grouped.mean()
print(grouped_mean)
运行结果为:
Age Score
Gender
F 27.000 89.000000
M 42.375 85.666667
解释:上述代码先创建了一个包含姓名、年龄、性别和分数四列数据的数据框,然后使用groupby()函数按照“Gender”列的值对其进行分组,再计算每组的平均分数,并将结果输出。
上一篇:按特定列的值拆分CSV文件