在BigQuery里,schema(模式)用于定义表格的结构。在schema中,有两种类型的列可以用来存储复杂数据类型:数组和记录(也称为嵌套结构)。
数组通常用于存储一个变量数量的值列表,而记录(嵌套结构)可以用于表示多个值组成的结构。
在schema中,用' repeated ”来表示数组类型,用' record ”来表示嵌套结构类型。
以下是一个包含两个字段(' name ”和' age ”)的单独记录的示例,其中' name ”字段是一个字符串类型,而' age ”字段是一个整数类型。
{ "name": "John", "age": 30 }
现在我们来看一个示例,其中' phone_numbers ”字段是一个重复的记录类型,每个记录包含可变数量的电话号码(字符串类型)和一个类型为' category ”的固定数量的字段。
{ "name": "John", "age": 30, "phone_numbers": [ { "number": "123-456-7890", "category": "home" }, { "number": "555-555-5555", "category": "work" } ] }
当我们需要查询嵌套结构时,我们可以使用点号'.”来访问内部的字段。例如,下面的查询可以返回所有拥有' home ”电话号码的人的姓名和年龄:
SELECT name, age FROM my_table WHERE EXISTS ( SELECT 1 FROM UNNEST(phone_numbers) WHERE category = 'home' )
总的来说,在BigQuery中使用嵌套结构可以使你的数据更有组织结构,并可以使查询更加复杂和灵活。