按日期分组求和，并使用来自以前日期的剩余值填充所有缺失值，直到计数=1 _编程开发

按日期分组求和，并使用来自以前日期的剩余值填充所有缺失值，直到计数=1

创始人

2024-11-05 03:02:21

0次

我们使用 Pandas 库来解决这个问题。假设我们有一个名为 data 的 DataFrame，其中包含三列：Date、Group 和 Value。

要实现这个要求，我们首先需要将 DataFrame 按照 Date 和 Group 进行分组，并对每个分组的 Value 列进行求和。这可以使用下面的代码完成：

grouped = data.groupby(['Date', 'Group'])['Value'].sum()

现在，我们需要填充缺失值。为了实现这个目标，我们将使用填充技术，其中缺失值将被填充为之前的值。但是，填充必须遵循一定的限制条件，如按日期排序和计数至少为 1。

为了实现这个目标，我们可以使用 Pandas 的 forward fill 方法（ffill()）。这个方法将使用之前的非缺失值填充缺失值。

grouped = grouped.groupby(level='Group').apply(lambda x: x.ffill().bfill())

最后，我们需要确保每个分组至少有一个非缺失值。这可以使用 Pandas 的 transform 方法和 count 函数来实现。

grouped = grouped.groupby(level='Group').transform(lambda x: x if x.count() > 0 else np.nan)

最终代码如下：

import pandas as pd
import numpy as np

# Load data into a DataFrame
data = pd.read_csv('data.csv', parse_dates=['Date'])

# Group by date and group, summing the values
grouped = data.groupby(['Date', 'Group'])['Value'].sum()

# Fill missing values using forward fill and back fill
grouped = grouped.groupby(level='Group').apply(lambda x: x.ffill().bfill())

# Ensure each group has at least one non-missing value
grouped = grouped.groupby(level='Group').transform(lambda x: x if x.count() > 0 else np.nan)

这个代码将返回同样排过序的 DataFrame，其中包含日期、组和值。如果某个日期和组缺少值，则该值将被填满。

上一篇：按日期分组求和列值

下一篇：按日期分组然后按属性排序，以获取最高金额？

按日期分组求和，并使用来自以前日期的剩余值填充所有缺失值，直到计数=1

相关内容

热门资讯