我们可以使用Python的pandas库来实现这个功能。首先,我们需要读取包含名称和日期的数据集。然后,我们按照名称分组,并按日期排序。最后,我们通过将每个组中的日期和名称连接并用逗号分隔来创建新的一列。以下是示例代码:
import pandas as pd
# 读取数据集,假设文件名为data.csv,文件中有name和date两列
data = pd.read_csv('data.csv')
# 按名称分组,并按日期排序
grouped_data = data.groupby('name').apply(lambda x: x.sort_values('date'))
# 创建新一列,将每个组中的日期和名称连接并用逗号分隔
grouped_data['concatenated'] = grouped_data.apply(lambda x: ', '.join([str(x['date']), x['name']]), axis=1)
# 打印结果
print(grouped_data)
输出结果将包含每个分组中按照日期排序的原始数据,以及一个名为“concatenated”的新列,其中包含每个组中日期和名称的连接字符串。
上一篇:按名称分组后按日期排序连接字符串