如果想在 BigQuery 中开始分析 Google Analytics 4 (GA4) 中的数据,我们需要将 GA4 事件转储到 BigQuery 中。 然而,在默认情况下,创建 Events 表格时可能会出现延迟。 这会导致我们在创建事件表格之前无法分析 GA4 数据。
为了解决这个问题,我们可以手动创建 Events 表格,而不是等待 BigQuery 自动创建它。 这样可以确保表格早些时候可用。 另外,我们可以使用 BigQuery Data Transfer Service 来自动导入 GA4 事件并在导入期间创建事件表格。
以下是手动创建 Events 表格的示例代码:
# Define your Google Analytics 4 export path
EXPORT_PATH=gs://[GA4_EXPORT_BUCKET]/event_export_20211010_20211017
# Create events table in BigQuery
bq mk \
--time_partitioning_field=event_timestamp \
--schema='device.client_info.*:RECORD,device.*:RECORD,geo.*:RECORD,traffic_source.*:RECORD,user.*:RECORD,event_params.*:RECORD' \
--time_partitioning_type=DAY \
[PROJECT_ID]:[DATASET_NAME].events
# Load data into events table
bq load \
--source_format=AVRO \
--time_partitioning_field=event_timestamp \
[PROJECT_ID]:[DATASET_NAME].events \
$EXPORT_PATH/*.avro
这个代码示例中,我们首先定义 GA4 数据的导出路径,然后使用 bq 命令手动创建事件表格,并将数据加载到表格中。
使用 Data Transfer Service 也可以自动创建事件表格并将 GA4 数据导入 BigQuery 中。 例如,可以使用以下代码创建 Data Transfer Service 配置,以从 GA4 导入数据并自动创建事件表格:
curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
https://bigquerydatatransfer.googleapis.com/v1/projects/[PROJECT_ID]/transferConfigs \
-d '{
"dataSourceId": "analytics",
"params": {
"metrics": "screenPageViews,screenViews,totalUsers,newUsers",
"dimensions": "devices.browser",
"samplingLevel": "LARGE",
"viewId": "[GA4_VIEW_ID]"
},
"destinationDatasetId": "[DAT