以下是一个示例代码,用于按ID分组填充区间之间的值:
import pandas as pd
# 创建示例数据
data = {'ID': [1, 1, 1, 2, 2, 3, 3, 3],
'Start': [10, 15, 20, 5, 10, 8, 12, 18],
'End': [13, 18, 25, 8, 12, 10, 15, 20]}
df = pd.DataFrame(data)
# 按ID分组,并对每个分组进行处理
grouped = df.groupby('ID')
filled_df = pd.DataFrame()
for name, group in grouped:
# 对每个分组进行排序
group = group.sort_values(by='Start')
group.reset_index(drop=True, inplace=True)
# 填充区间之间的值
for i in range(1, len(group)):
start = group.loc[i-1, 'End']
end = group.loc[i, 'Start']
filled_values = list(range(start+1, end))
if filled_values:
filled_df = filled_df.append(group.loc[i-1])
filled_df = filled_df.append(pd.DataFrame({'ID': [name]*len(filled_values),
'Start': filled_values,
'End': filled_values}))
# 将当前分组的最后一行添加到结果中
filled_df = filled_df.append(group.iloc[-1])
filled_df.reset_index(drop=True, inplace=True)
print(filled_df)
这个示例代码首先创建了一个示例数据,包括ID、Start和End三列。然后使用groupby
函数按ID分组。接下来,对每个分组进行处理,首先将分组按Start进行排序,并重置索引。然后,遍历排序后的分组,找到区间之间的值,并添加到结果中。最后,将当前分组的最后一行添加到结果中,并重置索引。最终的结果存储在filled_df
中,并打印出来。