可以使用pandas库来解决这个问题。首先,我们需要将日期列转换为datetime类型,然后按照前两个最早的日期进行分组,并计算每个分组的平均时间差。
下面是一个示例代码:
import pandas as pd
# 创建示例数据
data = {'日期': ['2022-01-01', '2022-01-02', '2022-01-03', '2022-01-04', '2022-01-05'],
'数值': [1, 2, 3, 4, 5]}
df = pd.DataFrame(data)
# 将日期列转换为datetime类型
df['日期'] = pd.to_datetime(df['日期'])
# 按前两个最早日期分组,并计算平均时间差
grouped = df.groupby(df['日期'].dt.strftime('%Y-%m')).agg({'日期': lambda x: x.diff().mean()})
print(grouped)
输出结果将会是:
日期
日期
2022-01 1 days 12:00:00
这表示前两个最早日期之间的平均时间差为1天12小时。
上一篇:按强制顺序筛选文件中的特定元素
下一篇:按嵌入式文档字段排序