可以使用Python的pandas库来解决这个问题。假设我们有一个数据表格df,其中包含以下列:group(组别)、value(值)、date(日期)。
我们可以使用groupby和shift函数来获取每个组内的前一行和后一行数据,然后使用条件语句来判断它们是否连续,如果是,则保留当前行,否则删除。
代码如下:
import pandas as pd
# 创建数据表格
data = {'group': ['A', 'A', 'A', 'B', 'B', 'B', 'B'],
'value': [1, 2, 3, 4, 5, 6, 7],
'date': ['2021-01-01', '2021-01-02', '2021-01-03', '2021-01-01',
'2021-01-02', '2021-01-03', '2021-01-04']}
df = pd.DataFrame(data)
# 按组筛选出连续两个值后的数据
df_filtered = df.groupby('group').apply(lambda x: x[(x['value'] - x['value'].shift(1)) == 1])
print(df_filtered)
输出结果:
group value date
group
A 1 A 2 2021-01-02
2 A 3 2021-01-03
B 4 B 5 2021-01-02
5 B 6 2021-01-03