要按类别和不同的日期分组在同一列,可以使用Pandas库来实现。以下是一个示例代码:
import pandas as pd
# 创建一个示例数据集
data = {'日期': ['2022-01-01', '2022-01-01', '2022-01-02', '2022-01-02', '2022-01-03', '2022-01-03'],
'类别': ['A', 'B', 'A', 'B', 'A', 'B'],
'数值': [10, 20, 30, 40, 50, 60]}
df = pd.DataFrame(data)
# 将日期列转换为日期类型
df['日期'] = pd.to_datetime(df['日期'])
# 按类别和日期分组,并计算每组的总数
grouped = df.groupby(['类别', '日期']).sum().reset_index()
# 将类别列和日期列合并为一列
grouped['类别和日期'] = grouped['类别'] + ' - ' + grouped['日期'].dt.strftime('%Y-%m-%d')
# 输出结果
print(grouped[['类别和日期', '数值']])
运行以上代码后,将获得按类别和不同的日期分组在同一列的结果:
类别和日期 数值
0 A - 2022-01-01 10
1 A - 2022-01-02 30
2 A - 2022-01-03 50
3 B - 2022-01-01 20
4 B - 2022-01-02 40
5 B - 2022-01-03 60
在这个示例中,首先创建了一个包含日期、类别和数值的示例数据集。然后,将日期列转换为日期类型以便进行日期相关的操作。接下来,使用groupby
函数按照类别和日期进行分组,并计算每组的总数。最后,将类别列和日期列合并为一列,并输出结果。
上一篇:按类别过滤自定义文章类型
下一篇:按类别和关键字对数组进行过滤