以下是一个示例代码,用于按国家分组计算一列中的比率:
import pandas as pd
# 创建一个示例数据帧
data = {'Country': ['China', 'China', 'USA', 'USA', 'USA', 'China', 'USA'],
'Value': [10, 20, 30, 40, 50, 60, 70]}
df = pd.DataFrame(data)
# 按国家分组计算比率
df_grouped = df.groupby('Country').sum() # 按国家分组并求和
df_grouped['Rate'] = df_grouped['Value'] / df_grouped['Value'].sum() # 计算比率
print(df_grouped)
以上代码将输出按国家分组计算的比率数据帧:
Value Rate
Country
China 90 0.285714
USA 190 0.714286
上述示例使用了pandas库来处理数据集。首先,创建了一个包含国家和值的示例数据帧。然后,使用groupby()
方法按国家分组,并使用sum()
方法计算每个国家的总值。最后,为数据帧添加一个新的列Rate
,计算每个国家的比率,即该国家值的比例占总值的比例。