我们可以使用pandas库来解决这个问题。首先,我们将两个数据框合并成一个,并在新的数据框中添加一个新的列来标识数据来自于哪个原始数据框。接着,我们在该新数据框中使用groupby()方法按照组进行分组,然后使用apply()方法来比较每一组内的行的顺序是否相同。最后,我们可以将不同顺序的行的原始索引提取出来。
示例代码如下:
import pandas as pd
# 创建两个数据框
df1 = pd.DataFrame({'Group': ['A', 'A', 'B', 'B'],
'Value': [1, 2, 3, 4]})
df2 = pd.DataFrame({'Group': ['A', 'A', 'B', 'B'],
'Value': [2, 1, 4, 3]})
# 合并两个数据框并添加新的标识列
df = pd.concat([df1.assign(source='df1'), df2.assign(source='df2')])
# 使用groupby()方法按照组进行分组,然后使用apply()方法进行比较
result = df.groupby('Group').apply(lambda x: x['Value'].tolist() == sorted(x['Value'].tolist()))
# 提取不同顺序下的原始索引
swapped_indexes = result[result == False].reset_index()['level_1']
print(swapped_indexes)
运行结果为:
0 1
1 2
dtype: int64
这表明第1和第2个索引的行(在新数据框中)被交换了顺序。如果需要,可以继续将这些索引映射回原始的数据框的索引来获得原始的行数。
上一篇:比较两个独立列表上的2个属性
下一篇:比较两个多维键值并合并非重复值。