以下是一个示例代码,按照日期排序,然后按item_id分组,取每组中的最后一条记录:
import pandas as pd
# 创建示例数据
data = {'date': ['2022-01-01', '2022-01-01', '2022-01-02', '2022-01-02', '2022-01-03'],
'item_id': ['A', 'B', 'A', 'B', 'A'],
'value': [1, 2, 3, 4, 5]}
df = pd.DataFrame(data)
# 将日期列转换为日期类型
df['date'] = pd.to_datetime(df['date'])
# 按日期排序
df = df.sort_values('date')
# 按item_id分组,取每组中的最后一条记录
df_last = df.groupby('item_id').last()
print(df_last)
输出结果为:
date value
item_id
A 2022-01-03 5
B 2022-01-02 4
这样,我们就按日期排序,并按item_id分组,取每组中的最后一条记录。
上一篇:按日期排序,仅显示文件名