在Python中,可以使用pandas库来按多个变量进行合并或合并。下面是一个示例代码:
import pandas as pd
# 创建两个DataFrame对象
df1 = pd.DataFrame({'A': ['A0', 'A1', 'A2', 'A3'],
'B': ['B0', 'B1', 'B2', 'B3'],
'key': ['K0', 'K1', 'K2', 'K3']})
df2 = pd.DataFrame({'C': ['C0', 'C1', 'C2', 'C3'],
'D': ['D0', 'D1', 'D2', 'D3'],
'key': ['K0', 'K1', 'K2', 'K3']})
# 使用merge函数按key变量进行合并
merged_df = pd.merge(df1, df2, on='key')
print(merged_df)
输出结果为:
A B key C D
0 A0 B0 K0 C0 D0
1 A1 B1 K1 C1 D1
2 A2 B2 K2 C2 D2
3 A3 B3 K3 C3 D3
在上述示例中,我们创建了两个DataFrame对象df1和df2,并且它们都有一个名为'key'的变量。然后,我们使用merge函数按'key'变量进行合并,并将结果保存在merged_df中。最后,我们打印输出了合并后的DataFrame对象。
除了merge函数之外,还可以使用concat函数按多个变量进行合并。下面是一个示例代码:
import pandas as pd
# 创建两个DataFrame对象
df1 = pd.DataFrame({'A': ['A0', 'A1', 'A2', 'A3'],
'B': ['B0', 'B1', 'B2', 'B3'],
'key': ['K0', 'K1', 'K2', 'K3']})
df2 = pd.DataFrame({'C': ['C0', 'C1', 'C2', 'C3'],
'D': ['D0', 'D1', 'D2', 'D3'],
'key': ['K0', 'K1', 'K2', 'K3']})
# 使用concat函数按多个变量进行合并
merged_df = pd.concat([df1, df2], axis=1)
print(merged_df)
输出结果为:
A B key C D key
0 A0 B0 K0 C0 D0 K0
1 A1 B1 K1 C1 D1 K1
2 A2 B2 K2 C2 D2 K2
3 A3 B3 K3 C3 D3 K3
在上述示例中,我们使用concat函数按列(axis=1)合并了df1和df2,并将结果保存在merged_df中。最后,我们打印输出了合并后的DataFrame对象。
下一篇:按多个表达式分区