下面是使用Python和BigQuery解决"BigQuery: GitHub代码库年度增长"问题的代码示例:
from google.cloud import bigquery
def query_github_growth():
# 初始化BigQuery客户端
client = bigquery.Client()
# 构建查询语句
query = """
SELECT
EXTRACT(YEAR FROM created_at) AS year,
COUNT(*) AS repository_count
FROM
`bigquery-public-data.samples.github_timeline`
WHERE
type = 'CreateEvent'
GROUP BY
year
ORDER BY
year
"""
# 执行查询
query_job = client.query(query)
# 获取查询结果
results = query_job.result()
# 输出结果
for row in results:
print(f"Year: {row.year}, Repository Count: {row.repository_count}")
# 调用函数进行查询
query_github_growth()
这个代码示例使用了Google Cloud的bigquery
库来连接和查询BigQuery。首先,我们初始化了一个BigQuery客户端,然后构建了一个查询语句,该语句从bigquery-public-data.samples.github_timeline
数据集中获取GitHub的创建事件(CreateEvent)的数量,并按年份进行分组和排序。最后,我们执行查询并遍历结果集来打印每个年份的代码库数量。
请注意,此示例假设您已经设置了适当的认证和访问权限来连接和查询BigQuery。如果您还没有设置,请参考Google Cloud的文档来了解如何进行配置。