按联系人分组提取最近的两条记录_编程开发

按联系人分组提取最近的两条记录

创始人

2024-11-02 23:02:36

0次

以下是一个示例代码，用于按联系人分组提取最近的两条记录：

import pandas as pd

# 创建一个示例数据集
data = {'联系人': ['张三', '张三', '李四', '李四', '王五', '王五'],
        '记录': ['第一条记录', '第二条记录', '第一条记录', '第二条记录', '第一条记录', '第二条记录'],
        '日期': ['2021-01-01', '2021-01-02', '2021-01-03', '2021-01-04', '2021-01-05', '2021-01-06']}
df = pd.DataFrame(data)

# 将日期列转换为日期类型
df['日期'] = pd.to_datetime(df['日期'])

# 按联系人分组，并提取每个组的最近两条记录
df_grouped = df.groupby('联系人').apply(lambda x: x.sort_values('日期').tail(2)).reset_index(drop=True)

print(df_grouped)

输出结果：

  联系人      记录         日期
0  张三  第一条记录 2021-01-01
1  张三  第二条记录 2021-01-02
2  李四  第一条记录 2021-01-03
3  李四  第二条记录 2021-01-04
4  王五  第一条记录 2021-01-05
5  王五  第二条记录 2021-01-06

在示例代码中，我们首先创建了一个包含联系人、记录和日期的示例数据集。然后，我们使用pd.to_datetime()函数将日期列转换为日期类型，以便进行日期排序。

接下来，我们使用groupby()方法按联系人分组，并使用apply()方法对每个组应用一个函数。在这里，我们使用sort_values()方法将每个组的记录按日期排序，然后使用tail(2)方法提取最近的两条记录。

最后，我们使用reset_index()方法重置索引，并使用drop=True参数删除原始索引，以获得最终结果。

请注意，示例代码中的数据集和列名仅供参考，您可以根据实际情况进行修改。

上一篇：按链接条件进行分组

下一篇：按连续方式对多个字段进行分组

按联系人分组提取最近的两条记录

相关内容

热门资讯