在Python中,可以使用datetime模块来处理时间。下面是一个示例代码,演示如何比较两个不同列的时间,并创建第三列来显示时间差异:
import pandas as pd
# 创建一个示例数据集
data = {'时间1': ['2022-01-01 10:00:00', '2022-01-02 12:00:00', '2022-01-03 15:00:00'],
'时间2': ['2022-01-01 09:30:00', '2022-01-02 11:30:00', '2022-01-04 14:00:00']}
df = pd.DataFrame(data)
# 将时间列转换为datetime类型
df['时间1'] = pd.to_datetime(df['时间1'])
df['时间2'] = pd.to_datetime(df['时间2'])
# 计算时间差异
df['时间差异'] = df['时间1'] - df['时间2']
# 显示结果
print(df)
运行以上代码,将输出如下结果:
时间1 时间2 时间差异
0 2022-01-01 10:00:00 2022-01-01 09:30:00 0 days 00:30:00
1 2022-01-02 12:00:00 2022-01-02 11:30:00 0 days 00:30:00
2 2022-01-03 15:00:00 2022-01-04 14:00:00 -1 days +01:00:00
在这个示例中,我们首先将时间列转换为datetime类型,然后通过相减操作计算时间差异,并将结果存储在新的“时间差异”列中。请注意,时间差异以timedelta对象的形式表示。
下一篇:比较两个不同列的值不起作用