在Python中,可以使用pandas库来实现保持对其他列的访问的情况下进行分组操作。以下是一个示例代码:
import pandas as pd
# 创建一个示例数据集
data = {
'group': ['A', 'B', 'A', 'B', 'A'],
'value1': [1, 2, 3, 4, 5],
'value2': [6, 7, 8, 9, 10]
}
df = pd.DataFrame(data)
# 对 group 列进行分组,并计算每个分组中 value1 的平均值
df['value1_mean'] = df.groupby('group')['value1'].transform('mean')
# 打印结果
print(df)
输出结果如下:
group value1 value2 value1_mean
0 A 1 6 3.0
1 B 2 7 3.0
2 A 3 8 3.0
3 B 4 9 3.0
4 A 5 10 3.0
在上面的示例中,我们首先创建了一个包含 'group'、'value1' 和 'value2' 列的DataFrame。然后,我们使用 groupby() 方法对 'group' 列进行分组,并使用 transform() 方法计算每个分组中 'value1' 列的平均值。最后,我们将计算结果存储在一个新的 'value1_mean' 列中,以便保持对其他列的访问。
上一篇:保持对控制台应用程序的关注