可以使用以下技巧优化 BigQuery ML 的模型创建时间:
在以下 SQL 示例中,我们用 LIMIT 语句限制数据集的大小:
CREATE MODEL mymodel
OPTIONS(
model_type='linear_reg'
) AS
SELECT * FROM mytable
LIMIT 10000
以下是一个使用 bq 命令行工具和 GNU Parallel 库的示例:
parallel --jobs 4 "bq query --nouse_legacy_sql 'CREATE MODEL mymodel_{1} OPTIONS(model_type=\"linear_reg\") AS SELECT * FROM mytable WHERE x = {1}'" ::: {1..4}
此示例创建了 4 个线性回归模型,分别使用了一个不同的 x 值。
learning_rate 参数,以控制学习速度。以下是一个使用 learning_rate 参数的示例:
CREATE MODEL mymodel
OPTIONS(
model_type='linear_reg',
learning_rate=0.1
) AS
SELECT * FROM mytable
例如,如果你的数据集中包含分类变量,则使用逻