要按列中的字符串模式拆分数据框,可以使用str.split()
函数和apply()
函数来实现。
下面是一个示例代码:
import pandas as pd
# 创建一个数据框
data = {'Name': ['John Smith', 'Jane Doe', 'Mary Johnson'],
'Age': ['25', '30', '35'],
'Location': ['New York, USA', 'London, UK', 'Paris, France']}
df = pd.DataFrame(data)
# 定义一个函数来拆分字符串
def split_location(row):
return row['Location'].split(', ')
# 应用函数到数据框的每一行
df['Location'] = df.apply(split_location, axis=1)
# 输出结果
print(df)
运行以上代码会得到以下输出:
Name Age Location
0 John Smith 25 [New York, USA]
1 Jane Doe 30 [London, UK]
2 Mary Johnson 35 [Paris, France]
在上面的代码中,我们首先创建了一个包含姓名、年龄和位置信息的数据框。然后,我们定义了一个函数split_location()
来拆分位置信息字符串。该函数使用split()
函数将位置信息字符串按逗号和空格拆分成一个列表。最后,我们使用apply()
函数将split_location()
函数应用到数据框的每一行,并将结果保存到Location
列中。
这样,我们就成功按列中的字符串模式拆分了数据框。
下一篇:按列中的字符位置进行Bash排序