我们可以使用Pandas库的groupby功能来按列分组。比较日期时,我们可以将日期列转换为Pandas日期时间对象,然后使用DatetimeIndex的方法进行比较。
以下是一个代码示例,将按“State”列分组,并比较“Date”列中的日期:
import pandas as pd
# 创建一个示例DataFrame
data = {
'State': ['NY', 'NY', 'NY', 'CA', 'CA', 'CA'],
'Date': ['2020-01-01', '2020-01-02', '2020-01-03', '2020-01-01', '2020-01-02', '2020-01-03'],
'Value': [1, 2, 3, 4, 5, 6]
}
df = pd.DataFrame(data)
# 'Date”列转换为日期时间类型
df['Date'] = pd.to_datetime(df['Date'])
# 按“State”列分组,并比较“Date”列中的日期
df.groupby('State').apply(lambda x: x[x['Date'] == x['Date'].max()])
输出结果:
State Date Value
State
CA 2 CA 2020-01-03 6
NY 2 NY 2020-01-03 3
上一篇:按列分组并标识关键行
下一篇:按列分组并查找另一列的前一个值