以下是一个示例代码,演示如何按照时间顺序选择一列进行去重:
import pandas as pd
# 创建示例数据
data = {'时间': ['2021-01-01', '2021-01-02', '2021-01-02', '2021-01-03', '2021-01-03'],
'数值': [1, 2, 2, 3, 3]}
df = pd.DataFrame(data)
# 将时间列转换为日期时间类型
df['时间'] = pd.to_datetime(df['时间'])
# 按时间顺序进行排序
df = df.sort_values('时间')
# 按时间顺序选择一列进行去重
df = df.drop_duplicates(subset='数值', keep='first')
# 打印结果
print(df)
输出结果为:
时间 数值
0 2021-01-01 1
1 2021-01-02 2
3 2021-01-03 3
在这个示例中,我们首先创建了一个包含时间和数值的示例数据。然后,将时间列转换为日期时间类型,并按时间顺序对数据进行排序。最后,使用drop_duplicates
方法选择一列进行去重,保留第一次出现的数值。最终,打印出去重后的结果。
上一篇:按时间顺序显示的消息
下一篇:按时间属性将窗口推送到流中