下面是一个示例代码,演示如何使用Python将BigQuery数据导出为JSON格式并保存到Google Cloud Storage(GCS)中:
from google.cloud import bigquery
from google.cloud import storage
# 设置BigQuery和GCS的项目和存储桶信息
bq_project_id = 'your-bq-project-id'
bq_dataset_id = 'your-bq-dataset-id'
bq_table_id = 'your-bq-table-id'
gcs_bucket_name = 'your-gcs-bucket-name'
# 创建BigQuery客户端和存储客户端
bq_client = bigquery.Client(project=bq_project_id)
gcs_client = storage.Client()
# 构建导出配置
destination_uri = f'gs://{gcs_bucket_name}/export.json'
job_config = bigquery.ExtractJobConfig()
job_config.destination_format = bigquery.DestinationFormat.JSON
# 提交导出作业
extract_job = bq_client.extract_table(
table=bq_client.dataset(bq_dataset_id).table(bq_table_id),
destination_uris=[destination_uri],
job_config=job_config,
)
# 等待作业完成
extract_job.result()
# 打印导出的GCS URI
print(f'Data exported to: {destination_uri}')
请注意,您需要安装并设置适当的Google Cloud SDK和Python客户端库,并使用正确的项目和存储桶信息替换示例代码中的占位符。