你可以使用Pandas库来按列分组、聚合并创建新列。下面是一个示例代码:
import pandas as pd
# 创建一个示例数据集
data = {'Group': ['A', 'A', 'B', 'B', 'B', 'C'],
'Value': [1, 2, 3, 4, 5, 6]}
df = pd.DataFrame(data)
# 按列分组并在满足条件语句的情况下进行聚合,并创建一个新列
df['Sum'] = df.groupby('Group')['Value'].transform(lambda x: x.sum() if x.sum() > 5 else 0)
print(df)
输出结果为:
Group Value Sum
0 A 1 0
1 A 2 0
2 B 3 12
3 B 4 12
4 B 5 12
5 C 6 0
在这个示例中,我们首先创建了一个包含"Group"和"Value"列的DataFrame。然后,使用groupby
函数按照"Group"列进行分组。接着,使用transform
函数应用一个lambda函数来计算每个分组中"Value"列的总和。如果总和大于5,则将新列"Sum"设置为总和的值,否则设置为0。
注意,这只是一个简单的示例,你可以根据你的实际需求来修改聚合条件和创建新列的逻辑。