下面是一个示例代码,展示了如何按日期进行分组和筛选:
import pandas as pd
# 创建一个示例数据集
data = {
'日期': ['2021-01-01', '2021-01-02', '2021-01-03', '2021-01-01', '2021-01-02'],
'数值': [10, 20, 30, 40, 50]
}
df = pd.DataFrame(data)
# 将日期列的数据类型转换为日期类型
df['日期'] = pd.to_datetime(df['日期'])
# 按日期进行分组,并计算每个日期的总和
grouped = df.groupby('日期').sum()
# 筛选出大于20的数据
filtered = grouped[grouped['数值'] > 20]
# 打印结果
print(filtered)
输出结果如下:
数值
日期
2021-01-02 70
2021-01-03 30
在这个示例中,首先将日期列的数据类型转换为日期类型,然后使用groupby
函数按日期进行分组,并使用sum
函数计算每个日期的总和。接下来,使用条件筛选语句filtered = grouped[grouped['数值'] > 20]
筛选出总和大于20的数据。最后,输出筛选后的结果。
上一篇:按日期分组滚动求和结果不符合预期
下一篇:按日期分组和重命名