可以使用以下技巧优化 BigQuery ML 的模型创建时间:
在以下 SQL 示例中,我们用 LIMIT
语句限制数据集的大小:
CREATE MODEL mymodel
OPTIONS(
model_type='linear_reg'
) AS
SELECT * FROM mytable
LIMIT 10000
以下是一个使用 bq
命令行工具和 GNU Parallel
库的示例:
parallel --jobs 4 "bq query --nouse_legacy_sql 'CREATE MODEL mymodel_{1} OPTIONS(model_type=\"linear_reg\") AS SELECT * FROM mytable WHERE x = {1}'" ::: {1..4}
此示例创建了 4 个线性回归模型,分别使用了一个不同的 x
值。
learning_rate
参数,以控制学习速度。以下是一个使用 learning_rate
参数的示例:
CREATE MODEL mymodel
OPTIONS(
model_type='linear_reg',
learning_rate=0.1
) AS
SELECT * FROM mytable
例如,如果你的数据集中包含分类变量,则使用逻