假设我们有一个名为"data"的数据集,其中包含"territory_owner"和"registration_date"两列,我们可以按照以下步骤进行统计每个月份的注册数量:
import pandas as pd
import datetime
data = pd.read_csv("data.csv")
data["registration_date"] = pd.to_datetime(data["registration_date"])
data["month"] = data["registration_date"].dt.month
result = data.groupby(["territory_owner", "month"]).size().reset_index(name='registration_count')
完整的代码示例:
import pandas as pd
import datetime
# 读取数据集
data = pd.read_csv("data.csv")
# 转换日期格式
data["registration_date"] = pd.to_datetime(data["registration_date"])
# 添加一个新的列来提取月份
data["month"] = data["registration_date"].dt.month
# 按照territory_owner和month进行分组,并统计每个组的数量
result = data.groupby(["territory_owner", "month"]).size().reset_index(name='registration_count')
# 打印结果
print(result)
这样就可以得到按照territory_owner分类的每个月份的注册数量统计。