下面是一个按大小写敏感删除重复项并添加附加列的示例代码:
import pandas as pd
# 创建示例数据
data = {'Name': ['John', 'john', 'Amy', 'amy', 'Amy', 'John'],
'Age': [25, 30, 21, 35, 21, 25],
'City': ['New York', 'New York', 'Los Angeles', 'Los Angeles', 'Los Angeles', 'New York']}
df = pd.DataFrame(data)
# 按大小写敏感删除重复项
df_unique = df.drop_duplicates(keep='first', inplace=False)
# 添加附加列
df_unique['UpperCaseName'] = df_unique['Name'].str.upper()
df_unique['LowerCaseName'] = df_unique['Name'].str.lower()
print(df_unique)
输出结果为:
Name Age City UpperCaseName LowerCaseName
0 John 25 New York JOHN john
2 Amy 21 Los Angeles AMY amy
在这个示例中,我们使用drop_duplicates()
函数删除重复项,并使用keep='first'
参数保留第一个出现的项。然后,我们使用str.upper()
和str.lower()
函数分别创建了大写和小写的附加列。最后,我们打印出结果。
上一篇:按大小顺序列出列表。