以下是一个按类别和时间戳对 Pandas DataFrame 进行分组的示例代码:
import pandas as pd
# 创建示例数据
data = {'Category': ['A', 'A', 'B', 'B', 'A', 'B'],
'Timestamp': ['2021-01-01 10:00:00', '2021-01-01 11:00:00',
'2021-01-01 10:30:00', '2021-01-01 11:30:00',
'2021-01-02 09:00:00', '2021-01-02 10:00:00'],
'Value': [1, 2, 3, 4, 5, 6]}
df = pd.DataFrame(data)
# 将 Timestamp 列转换为日期时间格式
df['Timestamp'] = pd.to_datetime(df['Timestamp'])
# 按 Category 和 Timestamp 进行分组,并计算每个组的平均值
grouped = df.groupby(['Category', pd.Grouper(key='Timestamp', freq='D')]).mean()
print(grouped)
输出结果为:
Value
Category Timestamp
A 2021-01-01 1.5
2021-01-02 5.0
B 2021-01-01 3.5
2021-01-02 6.0
在上述代码中,我们首先创建了一个示例数据,其中包含类别(Category)、时间戳(Timestamp)和值(Value)。然后,我们将 Timestamp 列转换为日期时间格式。接下来,我们使用 groupby
方法按 Category 和 Timestamp 进行分组,并使用 mean
方法计算每个组的平均值。最后,我们打印出分组后的结果。
上一篇:按类别和关键字对数组进行过滤
下一篇:按类别和帖子格式筛选