SELECT column_name1, column_name2, MAX(date_column) FROM table_name GROUP BY column_name1, column_name2
上述SQL语句根据指定的分组列 column_name1、column_name2,获取对应的日期列 date_column 的最大值,并返回结果。
import pandas as pd
df = pd.read_csv('file_path.csv') df['date_column'] = pd.to_datetime(df['date_column']) df = df.sort_values('date_column', ascending=False).drop_duplicates(['column_name1', 'column_name2']).reset_index(drop=True)[['column_name1', 'column_name2', 'date_column']]
上述Python代码中,首先读取csv文件,并将日期列 date_column 转换为日期格式。然后根据指定的分组列 column_name1、column_name2和日期列 date_column,按照日期倒序排序并去除重复项,最后返回结果数据框。