假设我们有一个名为"items"的数据框,其中包含"category"和"price"列。下面是将数据按类别分组、排序并选择每个组中第一条记录的代码示例:
import pandas as pd
# 创建数据框
items = pd.DataFrame({
'category': ['电子', '电子', '服装', '电子', '电子', '服装'],
'price': [1200, 1400, 800, 900, 1000, 600]
})
# 将数据按类别和价格排序
items_sorted = items.sort_values(['category', 'price'])
# 按类别分组并选择每个组中的第一条记录
first_items = items_sorted.groupby(['category']).first()
print(first_items)
输出:
price
category
电子 900
服装 600
在上面的代码中,我们首先通过sort_values()方法将数据按照"category"和"price"列排序。然后,我们使用groupby()方法按照"category"列分组,并使用first()方法选择每个组中的第一条记录。