假设有如下数据:
data = [
['A', 1, 10],
['A', 2, 20],
['B', 1, 30],
['B', 2, 40],
['C', 1, 50],
['C', 2, 60],
]
要按照第一列和第二列进行分组,并且获取第三列的最大值,可以使用pandas库中的groupby函数。代码示例如下:
import pandas as pd
df = pd.DataFrame(data, columns=['col1', 'col2', 'col3'])
result = df.groupby(['col1', 'col2'])['col3'].max()
print(result)
输出结果为:
col1 col2
A 1 10
2 20
B 1 30
2 40
C 1 50
2 60
Name: col3, dtype: int64
上述代码中,首先将数据转换为pandas中的DataFrame对象,然后对该对象进行分组操作,按照第一列和第二列进行分组,并且选择第三列进行聚合计算,获取最大值。最后,将结果输出。