此问题指的是建议对polars表达式进行重构。Polars是一种用于数据操作和分析的快速和内存集合。使用Polars时,我们经常需要编写表达式来选择、操作或过滤数据。当表达式非常复杂或不够优化时,它们可能会变得难以理解和维护。
以下是改进polars表达式的一些建议:
示例:
df.select([col for col in df.columns if col.startswith('item')]).groupby('order_id').max()
cols = [col for col in df.columns if col.startswith('item')] df1 = df.select(cols) df2 = df1.groupby('order_id') df3 = df2.max()
示例:
df.filter((col('age') < 18) & (col('gender') == 'F')).select(['name', 'age'])
def filter_female_underage(df): return df.filter((col('age') < 18) & (col('gender') == 'F')).select(['name', 'age'])
df1 = filter_female_underage(df) df2 = filter_female_underage(df)
示例: