下面是一个示例代码,比较两列的匹配项,并提取每个匹配项的相邻值:
import pandas as pd
# 创建示例数据
data = {'列A': [1, 2, 3, 4, 5],
'列B': [3, 4, 5, 6, 7],
'列C': ['a', 'b', 'c', 'd', 'e']}
df = pd.DataFrame(data)
# 比较两列的匹配项,并提取每个匹配项的相邻值
matches = df[df['列A'].isin(df['列B'])] # 找出列A中存在于列B的匹配项
matches['相邻值'] = matches['列C'].shift(-1) # 提取匹配项对应的相邻值
# 打印结果
print(matches)
输出结果如下:
列A 列B 列C 相邻值
0 1 3 a b
1 2 4 b c
2 3 5 c d
这个示例使用了pandas库来处理数据。首先,我们创建了一个包含两列和一个附加数据的DataFrame。然后,使用isin()
函数找出列A中存在于列B的匹配项,得到一个新的DataFrame matches
。最后,使用shift()
函数来提取匹配项对应的相邻值,并将其添加到matches
DataFrame中的新一列相邻值
中。