以下是一个示例代码,演示了如何按日期分组并取每组的最后一行。
import pandas as pd
# 创建示例数据
data = {'日期': ['2021-01-01', '2021-01-01', '2021-01-02', '2021-01-02', '2021-01-03'],
'数值': [1, 2, 3, 4, 5]}
df = pd.DataFrame(data)
# 将日期列转换为日期类型
df['日期'] = pd.to_datetime(df['日期'])
# 按日期分组并取每组的最后一行
df_grouped = df.groupby(pd.Grouper(key='日期', freq='D')).last()
# 打印结果
print(df_grouped)
输出结果将是:
数值
日期
2021-01-01 2
2021-01-02 4
2021-01-03 5
在上述示例中,首先创建了一个包含日期和数值两列的示例数据框。然后使用pd.to_datetime()
函数将日期列转换为日期类型。接下来,使用groupby()
函数按日期列进行分组,并使用last()
函数获取每组的最后一行。最后,打印出分组后的结果。