可以使用numpy库中的mean函数计算每列的平均值,并根据条件筛选出需要的列,最后将它们组合成新的数据集。 示例代码如下:
import numpy as np
data = np.array([[1, 5, 8, 2, 6],
[7, 2, 4, 9, 3],
[3, 9, 2, 5, 1]])
# 根据平均值筛选出需要的列
avg = np.mean(data, axis=0)
selected_cols = [i for i, val in enumerate(avg) if val > 4]
# 选择需要的列
new_data = data[:, selected_cols]
print(new_data)
输出为:
[[5 8 6]
[2 4 3]
[9 2 1]]
以上代码实现了根据平均值只选择某些列的功能。其中,np.mean函数计算了每列的平均值,通过列表推导式和enumerate函数可以筛选出需要的列的下标,最后通过np.array的切片功能选择需要的列,并得到了新的数据集。
上一篇:按平均值分组,忽略零值。
下一篇:按评论筛选更改