要按日期对未排序的数据进行累积求和的pandas操作,可以按照以下步骤进行:
import pandas as pd
data = {'日期': ['2021-01-01', '2021-01-03', '2021-01-02', '2021-01-02', '2021-01-01', '2021-01-03'],
'数值': [1, 2, 3, 4, 5, 6]}
df = pd.DataFrame(data)
df['日期'] = pd.to_datetime(df['日期'])
df = df.sort_values('日期')
df['累积求和'] = df['数值'].cumsum()
完整的代码示例如下:
import pandas as pd
data = {'日期': ['2021-01-01', '2021-01-03', '2021-01-02', '2021-01-02', '2021-01-01', '2021-01-03'],
'数值': [1, 2, 3, 4, 5, 6]}
df = pd.DataFrame(data)
df['日期'] = pd.to_datetime(df['日期'])
df = df.sort_values('日期')
df['累积求和'] = df['数值'].cumsum()
print(df)
输出结果如下:
日期 数值 累积求和
0 2021-01-01 1 1
4 2021-01-01 5 6
2 2021-01-02 3 9
3 2021-01-02 4 13
1 2021-01-03 2 15
5 2021-01-03 6 21
下一篇:按日期对文本分类进行分词