这里是一个示例代码,展示了如何按分组获取最新日期的记录:
import pandas as pd
# 创建示例数据
data = {'group': ['A', 'A', 'A', 'B', 'B', 'B'],
'date': ['2020-01-01', '2020-01-02', '2020-01-03', '2020-01-04', '2020-01-05', '2020-01-06']}
df = pd.DataFrame(data)
# 将日期列转换为日期类型
df['date'] = pd.to_datetime(df['date'])
# 按分组获取每组的最新日期记录
latest_records = df.groupby('group')['date'].max().reset_index()
print(latest_records)
输出结果:
group date
0 A 2020-01-03
1 B 2020-01-06
在这个示例中,我们首先创建了一个包含两列(分组和日期)的示例数据框。然后,我们使用pd.to_datetime()
函数将日期列转换为日期类型。接下来,我们使用groupby()
函数按照分组列对数据框进行分组,并使用max()
函数获取每组的最新日期。最后,我们使用reset_index()
函数重置索引,并打印结果。
这个示例代码可以适用于类似的问题,只需要根据实际情况修改数据集和列名即可。
下一篇:按分组进行的“Isin跨2列”