在BigQuery中,可以使用CASE WHEN语句来处理分类变量。下面是一个示例查询,'gender”列中的“M”和“F”值替换为“Male”和“Female”。
SELECT
name,
CASE
WHEN gender = 'M' THEN 'Male'
WHEN gender = 'F' THEN 'Female'
ELSE gender
END AS gender
FROM
my_table
在这个查询中,我们使用了CASE WHEN语句来检查每个“gender”值,并根据其值返回“Male”或“Female”。如果值不是“M”或“F”,则返回原始值。
可以使用类似的方法来处理其他分类变量。这个查询可以通过在SELECT语句中添加条件语句来扩展,如下面的示例所示:
SELECT
name,
CASE
WHEN gender = 'M' THEN 'Male'
WHEN gender = 'F' THEN 'Female'
ELSE gender
END AS gender,
CASE
WHEN age < 18 THEN 'Under 18'
WHEN age BETWEEN 18 AND 64 THEN '18-64'
WHEN age >= 65 THEN '65+'
ELSE NULL
END AS age_group
FROM
my_table
在这个查询中,我们添加了另一个CASE WHEN语句来计算“age_group”列,其中根据年龄将每个个体分组为三个不同的分组。注意,我们使用了BETWEEN关键字来指示年龄在18到64岁之间的条件。
通过使用CASE WHEN语句,可以轻松地处理分类变量,并在BigQuery中进行分析。