可以使用正则表达式来移除空格和特殊字符,然后再按照需要的列进行分组。以下是基于Python的代码示例:
import re
import pandas as pd
# 读取数据集
df = pd.read_csv('data.csv')
# 移除空格和特殊字符
df['Column'] = df['Column'].apply(lambda x: re.sub(r'\W+', '', x).strip())
# 按列进行分组并进行聚合操作
grouped_df = df.groupby('Column').agg({'Value': sum})
# 打印结果
print(grouped_df)
在这个示例中,我们首先使用正则表达式移除了特殊字符和空格。然后,我们按照“Column”列对数据集进行分组,并使用“sum”操作将“Value”列中的值进行聚合。
需要注意的是,这个示例假定“Column”列是字符串类型。如果你需要处理其他类型的列,可能需要相应地调整正则表达式和分组操作。
上一篇:按列分组并横向求和
下一篇:按列分组并将其他列以列表形式选择