要加载包含转义制表符的CSV/TSV文件到BigQuery中,可以使用以下代码示例:
google-cloud-bigquery
库:from google.cloud import bigquery
# 设置你的项目ID
project_id = "your-project-id"
# 设置你的数据集ID
dataset_id = "your-dataset-id"
# 设置你的表名
table_name = "your-table-name"
# 设置CSV/TSV文件路径
file_path = "path/to/file.csv"
# 创建BigQuery客户端
client = bigquery.Client(project=project_id)
# 定义表架构
schema = [
bigquery.SchemaField("column1", "STRING"),
bigquery.SchemaField("column2", "STRING"),
# ...
]
# 加载CSV/TSV文件到BigQuery表
job_config = bigquery.LoadJobConfig(
schema=schema,
skip_leading_rows=1,
field_delimiter="\t",
quote_character='"',
allow_quoted_newlines=True,
)
with open(file_path, "rb") as source_file:
job = client.load_table_from_file(
source_file, f"{project_id}.{dataset_id}.{table_name}", job_config=job_config
)
job.result() # 等待加载任务完成
bq
命令行工具:bq load --source_format=CSV --skip_leading_rows=1 --field_delimiter="\t" \
--quote='"' --allow_quoted_newlines \
project_id:dataset_id.table_name path/to/file.csv column1:STRING,column2:STRING,...
请将上述代码示例中的your-project-id
、your-dataset-id
、your-table-name
和path/to/file.csv
替换为你自己的项目、数据集、表和文件路径。同时,根据你的文件结构,更新schema
变量以匹配你的表架构。