使用 BigQuery 表格列表 API 获取数据集的所有表格,然后在该列表中根据更新时间来查找最新表格。
以下是 Python 代码示例:
from google.cloud import bigquery
# 设置凭据、项目 ID 和数据集名称
credentials = ... # 参考 Google Cloud 文档获得凭据
project_id = "your-project-id"
dataset_name = "your-dataset-name"
client = bigquery.Client(project=project_id, credentials=credentials)
# 获取数据集所有表格,并按照更新时间降序排序
dataset_ref = client.dataset(dataset_name)
tables = client.list_tables(dataset_ref)
tables = sorted(tables, key=lambda table: table.modified, reverse=True)
# 获取最新表格名称
if tables:
newest_table_name = tables[0].table_id
print(f"The newest table is {newest_table_name}.")
else:
print("The dataset has no tables.")
此代码从 Google Cloud 获得凭据、项目 ID 和数据集名称,然后使用 list_tables()
方法获取数据集的所有表格,再根据表格的更新时间来排序(使用了 Python 的 sorted()
函数和 lambda
表达式),最后找到更新时间最近的表格并输出其名称。如果数据集中没有表格,则输出相应信息。