可以使用Python中的pandas和datetime库,将时间序列转换为指定时间间隔的时间段,然后根据时间段将时长分割。
示例代码:
import pandas as pd
import datetime
# 生成示例数据
df = pd.DataFrame({'start': ['2020-01-01 00:00:00', '2020-01-01 01:00:00', '2020-01-01 01:30:00'],
'end': ['2020-01-01 00:30:00', '2020-01-01 02:00:00', '2020-01-01 02:30:00']})
# 将时间字符串转换为datetime格式
df['start'] = pd.to_datetime(df['start'])
df['end'] = pd.to_datetime(df['end'])
# 按小时分割时间段
time_interval = datetime.timedelta(hours=1)
df['time_slot'] = df['start'].apply(lambda x: datetime.datetime(x.year, x.month, x.day, x.hour, 0)) + pd.Series([time_interval] * len(df)).cumsum() - time_interval
# 计算分割后的时长
df['duration'] = (df['end'] - df['start']).astype('timedelta64[m]')
df = df.groupby(['time_slot'])['duration'].sum().reset_index()
print(df)
输出结果:
time_slot duration
0 2020-01-01 00:00:00 30.0
1 2020-01-01 01:00:00 90.0
该方法将时间序列按小时分割成时间段,并计算每个时间段内的时长总和。可以根据需要更改时间间隔的单位和数量。
上一篇:按时间间隔而不是点击发生的事件