以下是一个示例代码,用于计算表上每小时的组计数:
import pandas as pd
# 创建示例数据
data = {'时间': ['2021-01-01 08:30:00', '2021-01-01 08:45:00', '2021-01-01 09:00:00', '2021-01-01 09:15:00', '2021-01-01 10:00:00'],
'组': ['A', 'B', 'A', 'B', 'A']}
df = pd.DataFrame(data)
# 将时间列转换为日期时间类型
df['时间'] = pd.to_datetime(df['时间'])
# 按小时进行分组,并计算每小时的组计数
grouped = df.groupby(pd.Grouper(key='时间', freq='H')).size()
# 打印结果
print(grouped)
输出:
时间
2021-01-01 08:00:00 2
2021-01-01 09:00:00 2
2021-01-01 10:00:00 1
Freq: H, dtype: int64
以上代码中,首先导入了pandas
库,然后创建了一个示例数据框df
,其中包含了时间和组两列。接着使用pd.to_datetime()
将时间列转换为日期时间类型。然后,使用groupby()
方法按小时进行分组,并使用size()
方法计算每小时的组计数。最后,打印了结果。
请注意,示例数据中的时间列应该是包含日期和时间信息的字符串,如果你的数据类型不同,可能需要进行相应的调整。另外,代码中的freq='H'
表示按小时进行分组,你可以根据需要调整为其他的时间频率。