使用Athena SQL语句创建分区表,指定分区键为位置和日期,以便在查询时可以快速访问需要的数据。
示例代码如下:
CREATE EXTERNAL TABLE my_table ( col1 INT, col2 STRING, col3 DOUBLE ) PARTITIONED BY ( location STRING, date STRING ) ROW FORMAT DELIMITED FIELDS TERMINATED BY ',' LOCATION 's3://my-bucket/data/'
在上面的例子中,我们创建了一个名为“my_table”的分区外部表,它有三列,名为“col1”,“col2”和“col3”。我们指定了两个分区键,分别是“location”和“date”,用于将数据按位置和日期分区存储。最后,我们指定了数据存储的位置,即“s3://my-bucket/data/”。
数据可以通过以下方式添加到表中:
ALTER TABLE my_table ADD PARTITION (location='USA', date='2020-01-01') LOCATION 's3://my-bucket/data/USA/2020-01-01/';
这将在表中添加一个名为“location=USA/date=2020-01-01”的分区,并将数据存储在“s3://my-bucket/data/USA/2020-01-01/”中。
查询可以按以下方式执行:
SELECT col1, col2 FROM my_table WHERE location='USA' AND date='2020-01-01'
这将返回与条件相匹配的列“col1”和“col2”的数据,其中分区键为“location=USA/date=2020-01-01”。这将根据指定的位置和日期只检索所需的分区,而不是遍历整个表,这将大大提高查询性能。