在Python中,可以使用pandas库来按列特定类型分组数据。下面是一个示例代码:
import pandas as pd
# 创建示例数据
data = {'Name': ['Tom', 'Nick', 'John', 'Tom', 'Nick', 'John'],
'Age': [20, 25, 30, 20, 25, 30],
'City': ['London', 'Paris', 'New York', 'London', 'Paris', 'New York'],
'Salary': [50000, 60000, 70000, 50000, 60000, 70000]}
df = pd.DataFrame(data)
# 按列特定类型分组
grouped = df.groupby('Age')
# 遍历分组并输出结果
for name, group in grouped:
print(name)
print(group)
在这个例子中,我们创建了一个包含姓名、年龄、城市和工资的示例数据框df。然后,我们使用groupby
函数按年龄分组数据。最后,我们使用循环遍历每个分组,并打印出结果。
输出结果如下:
20
Name Age City Salary
0 Tom 20 London 50000
3 Tom 20 London 50000
25
Name Age City Salary
1 Nick 25 Paris 60000
4 Nick 25 Paris 60000
30
Name Age City Salary
2 John 30 New York 70000
5 John 30 New York 70000
可以看到,数据按照年龄分成了三个组,并以不同的组名(年龄)进行了打印。每个组包含相应的数据行。
上一篇:按列索引引用