在BigQuery中,从JSON加载作业时,有时候会遇到布尔数据类型字段加载失败的问题。这可能是因为JSON中的布尔值被解析为了字符串,而不是正确的布尔值类型。
为了解决这个问题,可以使用BigQuery的内置函数来转换字符串为布尔值类型。
下面是一个使用Python进行加载的示例代码:
from google.cloud import bigquery
import json
# 创建BigQuery客户端
client = bigquery.Client()
# 定义JSON数据
json_data = """
[
{
"id": 1,
"name": "John",
"is_active": "true"
},
{
"id": 2,
"name": "Jane",
"is_active": "false"
}
]
"""
# 将JSON数据解析为Python对象
data = json.loads(json_data)
# 将布尔字符串转换为布尔类型
for item in data:
item["is_active"] = item["is_active"].lower() == "true"
# 创建数据表
table_id = "your-project.your_dataset.your_table"
table = bigquery.Table(table_id)
# 定义表架构
schema = [
bigquery.SchemaField("id", "INTEGER"),
bigquery.SchemaField("name", "STRING"),
bigquery.SchemaField("is_active", "BOOLEAN")
]
# 设置表架构
table.schema = schema
# 加载数据到表
job_config = bigquery.LoadJobConfig()
job_config.source_format = bigquery.SourceFormat.NEWLINE_DELIMITED_JSON
job_config.write_disposition = bigquery.WriteDisposition.WRITE_TRUNCATE
# 开始加载作业
job = client.load_table_from_json(data, table, job_config=job_config)
job.result()
# 打印加载作业的状态
print("Job finished: ", job.state)
在上面的示例代码中,我们首先将JSON数据解析为Python对象,然后使用循环将布尔字符串转换为布尔类型。接下来,我们创建了一个新的BigQuery表,并定义了表的架构。最后,我们使用client.load_table_from_json()
方法加载数据到表中,并等待作业完成。
请确保将your-project
、your_dataset
和your_table
替换为您自己的项目、数据集和表的名称。