在BigQuery中使用JavaScript定义用户定义函数时,可能会出现无法剪枝分区的问题。这意味着即使查询只需要访问命名表中的一个分区,也会扫描整个表。
解决方法是将分区列包含在函数签名中,并使用这些参数在JavaScript函数中提取和使用分区信息。
例如,在下面的查询中,使用了一个用户定义函数,该函数需要传入分区列(date_partition),以便可以仅扫描所需的分区而不是整个表:
CREATE TEMP FUNCTION count_records_on_date(date_partition DATE)
RETURNS INT64
LANGUAGE js AS """
var table = '`my-project.my-dataset.my_table`';
var start_date = date_partition;
var end_date = DateAdd('day', 1, date_partition);
var sql_query =
"SELECT COUNT(*) from " + table +
" WHERE date_column >= '" + start_date + "' AND date_column < '" + end_date + "'";
var result = BigQuery.query({ query: sql_query, useLegacySql: false });
return result.rows[0][0];
""";
SELECT date_partition, count_records_on_date(date_partition) as records_count
FROM my_table
WHERE date_partition BETWEEN '2020-01-01' AND '2020-01-07';