以下是一个示例,演示如何使用Python中的pandas库按人员工作结果进行提取:
import pandas as pd
# 创建一个示例数据集
data = {'姓名': ['张三', '李四', '王五', '张三', '李四', '王五'],
'工作结果': ['完成', '未完成', '完成', '完成', '未完成', '未完成'],
'工作时长': [5, 3, 4, 6, 2, 7]}
df = pd.DataFrame(data)
# 按姓名和工作结果分组,并计算工作时长的总和
result = df.groupby(['姓名', '工作结果'])['工作时长'].sum().reset_index()
print(result)
输出结果:
姓名 工作结果 工作时长
0 张三 完成 11
1 李四 未完成 5
2 王五 完成 4
3 王五 未完成 7
这个示例中,我们首先创建了一个包含姓名、工作结果和工作时长的数据集。然后,我们使用groupby()
函数按姓名和工作结果分组,并使用sum()
函数计算工作时长的总和。最后,我们使用reset_index()
函数将结果转换为一个新的数据框。
这个示例演示了如何按人员工作结果进行提取,并计算工作时长的总和。你可以根据自己的需求进行修改和扩展。
上一篇:按任意索引打印字符串字母