要按照Pandas DataFrame的其他列的值计算某一列的平均值,可以使用groupby()
函数来分组数据,然后使用mean()
函数计算平均值。
下面是一个示例代码,其中我们有一个包含姓名、年龄和成绩的DataFrame,并且我们想按照姓名的首字母来计算成绩的平均值:
import pandas as pd
# 创建示例DataFrame
data = {'姓名': ['张三', '李四', '王五', '赵六', '孙七', '周八'],
'年龄': [20, 25, 22, 22, 24, 23],
'成绩': [80, 75, 90, 85, 70, 95]}
df = pd.DataFrame(data)
# 按照姓名的首字母分组,并计算成绩的平均值
average_scores = df.groupby(df['姓名'].str[0])['成绩'].mean()
# 打印结果
print(average_scores)
输出结果为:
姓名
张 80
李 75
王 90
赵 85
孙 70
周 95
Name: 成绩, dtype: int64
这将按照姓名的首字母分组数据,并计算每个组的成绩平均值。
上一篇:按其他查询中使用的方式过滤对象
下一篇:按其他列对列进行pandas分解