要按段落对pandas数据帧进行分组,可以使用groupby
函数。下面是一个包含代码示例的解决方法:
import pandas as pd
# 创建示例数据帧
data = {'段落': ['A', 'A', 'B', 'B', 'B', 'C'],
'数值': [1, 2, 3, 4, 5, 6]}
df = pd.DataFrame(data)
# 按段落进行分组
grouped = df.groupby('段落')
# 对分组后的数据帧进行操作(例如求和)
summed = grouped.sum()
print(summed)
上述代码首先创建了一个包含两列('段落'和'数值')的数据帧。然后,使用groupby
函数将数据帧按照'段落'列进行分组。最后,对分组后的数据帧进行操作,例如求和。输出结果如下:
数值
段落
A 3
B 12
C 6
这里的分组操作是根据'段落'列的值进行的,所以数据帧中具有相同'段落'值的行会被分为一组。根据需要,可以对每个分组应用不同的操作。