要按年份统计pandas数据框中相似的字符串值的数量,可以使用pandas的groupby和str.contains方法。下面是一个示例代码:
import pandas as pd
# 创建示例数据框
data = {
'Year': [2010, 2010, 2010, 2011, 2011, 2012],
'Title': ['Apple', 'Banana', 'Orange', 'Apple', 'Grape', 'Apple']
}
df = pd.DataFrame(data)
# 使用groupby和str.contains方法按年份统计相似的字符串值的数量
result = df.groupby('Year')['Title'].apply(lambda x: x.str.contains('app', case=False).sum())
print(result)
输出结果为:
Year
2010 1
2011 1
2012 1
Name: Title, dtype: int64
在示例中,我们首先创建了一个包含“Year”和“Title”两列的数据框。然后,使用groupby方法按年份分组,并使用str.contains方法在“Title”列中查找包含“app”字符串的值。最后,使用sum方法计算符合条件的值的数量。
上一篇:按年份统计列的总和
下一篇:按年份显示总和和最后一个值的组