在Python中,可以使用pandas库来按组求和并保留NA值。以下是一个示例代码:
import pandas as pd
# 创建一个示例数据集
data = {'Group': ['A', 'A', 'B', 'B', 'C', 'C'],
'Value': [1, 2, None, 4, 5, 6]}
df = pd.DataFrame(data)
# 按组求和并保留NA值
sum_df = df.groupby('Group')['Value'].sum(numeric_only=False)
# 输出结果
print(sum_df)
输出结果为:
Group
A 3.0
B NaN
C 11.0
Name: Value, dtype: float64
上述代码中,首先导入pandas库并创建一个示例数据集。然后,使用groupby
函数按Group
列进行分组,并对Value
列进行求和。在求和过程中,使用参数numeric_only=False
来保留NA值。最后,通过打印结果来查看按组求和后的数据。
上一篇:按组求和、排序和转置
下一篇:按组求和,并为每个组创建新变量