在BigQuery中,可以使用STRUCT
类型来插入嵌套记录。以下是一个示例代码,演示如何在BigQuery中插入嵌套记录:
from google.cloud import bigquery
# 初始化BigQuery客户端
client = bigquery.Client()
# 指定目标数据集和表
dataset_id = 'your_dataset_id'
table_id = 'your_table_id'
# 定义一个包含嵌套记录的数据
data = [
{
'name': 'John',
'age': 30,
'address': {
'street': '123 Main St',
'city': 'New York',
'state': 'NY'
}
},
{
'name': 'Jane',
'age': 25,
'address': {
'street': '456 Elm St',
'city': 'San Francisco',
'state': 'CA'
}
}
]
# 构造嵌套记录的模式
schema = [
bigquery.SchemaField('name', 'STRING', mode='REQUIRED'),
bigquery.SchemaField('age', 'INTEGER', mode='REQUIRED'),
bigquery.SchemaField('address', 'RECORD', mode='REQUIRED', fields=[
bigquery.SchemaField('street', 'STRING', mode='REQUIRED'),
bigquery.SchemaField('city', 'STRING', mode='REQUIRED'),
bigquery.SchemaField('state', 'STRING', mode='REQUIRED')
])
]
# 创建数据集(如果不存在)
dataset_ref = client.dataset(dataset_id)
dataset = bigquery.Dataset(dataset_ref)
dataset.location = 'US'
client.create_dataset(dataset)
# 创建表(如果不存在)
table_ref = dataset.table(table_id)
table = bigquery.Table(table_ref, schema=schema)
client.create_table(table)
# 插入数据
errors = client.insert_rows_json(table, data)
if not errors:
print('Data inserted successfully.')
else:
print(f'Encountered errors while inserting data: {errors}')
在上述代码中,首先初始化了一个BigQuery客户端。然后,定义了一个包含嵌套记录的数据列表。接下来,构造了嵌套记录的模式,并使用bigquery.Table
创建了一个表。最后,使用client.insert_rows_json
方法将数据插入到表中。
请注意,上述代码中的your_dataset_id
和your_table_id
需要替换为实际的数据集和表的标识符。另外,确保已正确设置好了BigQuery的认证凭据。