以下是一个示例代码,演示了如何按列分组计算天数:
import pandas as pd
# 创建一个示例数据集
data = {'日期': ['2021-01-01', '2021-01-01', '2021-01-02', '2021-01-02', '2021-01-03'],
'类别': ['A', 'B', 'A', 'B', 'A']}
df = pd.DataFrame(data)
# 将日期列转换为日期类型
df['日期'] = pd.to_datetime(df['日期'])
# 按列分组计算每组的天数
result = df.groupby('类别')['日期'].nunique()
print(result)
输出结果为:
类别
A 3
B 2
Name: 日期, dtype: int64
这里使用了Pandas库来处理数据。首先,将日期列转换为日期类型,以便后续计算。然后,使用groupby
方法按照类别列进行分组,然后使用nunique
方法计算每个组的唯一日期数量。最后,将结果打印出来。
上一篇:按列分组计算日期之间的持续时间
下一篇:按列分组计算相邻行之间的距离。