假设有一个大型数据集包含以下字段:日期(timestamp)、销售额(revenue)、产品名称(product name)等,需按年份筛选数据。下面是示例代码:
import pandas as pd
# 读取数据集
df = pd.read_csv('data.csv')
# 将日期转化为DatetimeIndex对象
df['timestamp'] = pd.to_datetime(df['timestamp'])
df.set_index('timestamp', inplace=True)
# 按年份筛选数据
df_year = df.resample('Y').sum() # 按年份汇总并计算总和
# 输出结果
print(df_year)
上述代码将数据集中的日期字段转化为DatetimeIndex对象后,使用resample方法按年份汇总,并计算销售额总和。最终结果将按年份分组的销售额输出。
上一篇:按年份筛选 JSON 数据
下一篇:按年份筛选某一列