编写一个函数，以DataFrame和Dictionary作为输入来清理一个Python DataFrame。_编程开发

编写一个函数，以DataFrame和Dictionary作为输入来清理一个Python DataFrame。

创始人

2024-12-06 19:31:44

0次

下面是一个解决方法的示例代码：

import pandas as pd

def clean_dataframe(df, mapping_dict):
    cleaned_df = df.copy()  # 复制输入的DataFrame，以免修改原始数据
    
    # 遍历字典的键值对
    for col, values in mapping_dict.items():
        # 在DataFrame中找到与字典键对应的列
        if col in cleaned_df.columns:
            # 将列中的值与字典的值进行比较，并替换为字典的键
            cleaned_df[col] = cleaned_df[col].replace(values)
    
    return cleaned_df

# 创建一个示例DataFrame
data = {'name': ['Tom', 'Jerry', 'Spike'],
        'gender': ['M', 'M', 'M'],
        'age': [25, 30, 35]}
df = pd.DataFrame(data)

# 创建一个示例字典，用于清理DataFrame
mapping = {'gender': {'M': 'Male', 'F': 'Female'}}

# 调用函数进行清理
cleaned_df = clean_dataframe(df, mapping)
print(cleaned_df)

运行以上代码会输出清理后的DataFrame：

    name  gender  age
0    Tom    Male   25
1  Jerry    Male   30
2  Spike    Male   35

在这个示例中，我们定义了一个clean_dataframe函数，它接受一个DataFrame和一个字典作为输入。函数首先复制输入的DataFrame，以避免修改原始数据。然后，它遍历字典的键值对，检查DataFrame中是否存在与键对应的列。如果存在，它将列中的值与字典的值进行比较，并将其替换为字典的键。最后，函数返回清理后的DataFrame。

在示例中，我们创建了一个包含姓名、性别和年龄的示例DataFrame。然后，我们创建了一个字典，用于将性别列中的"M"替换为"Male"。最后，我们调用clean_dataframe函数来清理DataFrame，并将结果打印出来。

上一篇：编写一个函数，以查看特定列的唯一值。

下一篇：编写一个函数，以获取当列A/B具有特定值时列C/D的求和。

编写一个函数，以DataFrame和Dictionary作为输入来清理一个Python DataFrame。

相关内容

热门资讯