要按分隔符获取pandas列中的唯一字符串,你可以使用str.split()
方法将字符串拆分为列表,然后使用explode()
方法将列表拆分为单独的行,最后使用unique()
方法获取唯一值。
以下是一个示例代码:
import pandas as pd
# 创建一个包含分隔符的列
df = pd.DataFrame({'col': ['A,B,C', 'D,E,F', 'G,H,I,J']})
# 将列中的字符串拆分为列表
df['col'] = df['col'].str.split(',')
# 将列表拆分为单独的行
df = df.explode('col')
# 获取唯一值
unique_values = df['col'].unique()
print(unique_values)
输出结果为:
['A' 'B' 'C' 'D' 'E' 'F' 'G' 'H' 'I' 'J']
在这个示例中,我们创建了一个包含分隔符的列,并使用str.split()
方法将每个字符串拆分为列表。然后,我们使用explode()
方法将列表拆分为单独的行,每行包含一个唯一的字符串。最后,我们使用unique()
方法获取唯一的字符串值。
上一篇:按分隔符划分迭代器