在BigQuery中,我们可以使用array_agg函数来将一列中的多个值组合成一个数组。例如:
SELECT department, array_agg(employee_name) as employees FROM employee_table GROUP BY department
这将返回每个部门及其员工的数组。但是,当我们需要在一个查询中使用多个array_agg函数时,会出现问题。例如,假设我们希望同时获取每个部门的员工和工资数组:
SELECT department, array_agg(employee_name) as employees, array_agg(salary) as salaries FROM employee_table GROUP BY department
上述查询会抛出一个错误,因为我们不能在同一查询中使用多个array_agg函数。解决方法是使用嵌套子查询来分开使用多个array_agg函数。以下是示例代码:
SELECT department, (SELECT array_agg(employee_name) FROM UNNEST(employee_details)) AS employees, (SELECT array_agg(salary) FROM UNNEST(employee_details)) AS salaries FROM ( SELECT department, ARRAY_AGG(STRUCT(employee_name, salary)) AS employee_details FROM employee_table GROUP BY department ) subquery
这里,我们将原始表格的每个行转换为结构,其中包含员工姓名和工资,然后用ARRAY_AGG组合每个部门的所有员工。最后,我们使用嵌套子查询来分别使用多个array_agg函数。
注意,嵌套子查询的性能可能会受到影响,因此在使用它之前,请确保你的数据集不会过于庞大。