以下是一个示例函数,用于清理字符串数据并重命名列:
import pandas as pd
def clean_and_rename_columns(data, column_mapping):
# 清理数据
cleaned_data = data.copy()
cleaned_data = cleaned_data.apply(lambda x: x.str.strip() if x.dtype == "object" else x)
# 重命名列
cleaned_data = cleaned_data.rename(columns=column_mapping)
return cleaned_data
# 示例数据
data = pd.DataFrame({
" Name ": [" John ", " Jane ", " Mike "],
"Age": [25, 30, 35],
" City ": [" New York ", " Los Angeles ", " Chicago "]
})
# 列重命名映射
column_mapping = {
" Name ": "Name",
" City ": "City"
}
# 使用函数清理和重命名列
cleaned_data = clean_and_rename_columns(data, column_mapping)
print(cleaned_data)
输出结果为:
Name Age City
0 John 25 New York
1 Jane 30 Los Angeles
2 Mike 35 Chicago
在这个示例中,我们使用clean_and_rename_columns
函数清理了字符串数据,并通过column_mapping
字典重命名了列。首先,我们使用str.strip()
方法去除了字符串数据中的前导和尾随空格。然后,我们使用rename()
方法通过column_mapping
字典重命名了列。最后,我们将清理和重命名后的数据返回。