下面是一个示例代码,演示了如何按时间序列分组并应用特定公式:
import pandas as pd
# 创建一个示例数据集
data = {'时间': ['2021-01-01', '2021-01-01', '2021-01-02', '2021-01-02'],
'数值': [10, 20, 30, 40]}
df = pd.DataFrame(data)
# 将时间列转换为日期时间类型
df['时间'] = pd.to_datetime(df['时间'])
# 按时间序列分组并应用特定公式
result = df.groupby(pd.Grouper(key='时间', freq='D')).apply(lambda x: x['数值'].sum())
print(result)
输出结果为:
时间
2021-01-01 30
2021-01-02 70
Freq: D, dtype: int64
在这个例子中,我们首先将时间列转换为日期时间类型。然后使用groupby
方法,通过pd.Grouper
按天('D'
)分组。最后,使用apply
方法应用特定的公式,这里是计算每天数值列的总和。最终结果是一个新的Series,其中索引为日期,值为每天数值列的总和。