在Athena中,可以通过使用CREATE TABLE AS
语句来创建当前/最新分区。以下是一个示例代码:
-- 创建表结构并指定分区
CREATE TABLE my_table (
id INT,
name STRING,
date STRING
)
PARTITIONED BY (dt STRING);
-- 创建当前分区
CREATE TABLE my_table_latest
WITH (
format = 'Parquet',
external_location = 's3://bucket/path/my_table_latest/'
) AS
SELECT *
FROM my_table
WHERE dt = (SELECT MAX(dt) FROM my_table);
-- 创建最新分区
CREATE TABLE my_table_latest
WITH (
format = 'Parquet',
external_location = 's3://bucket/path/my_table_latest/',
partitioned_by = ARRAY['dt']
) AS
SELECT *
FROM my_table
WHERE dt = (SELECT MAX(dt) FROM my_table);
在上面的示例中,我们首先创建了一个my_table
表,并指定了一个分区列dt
。然后,我们使用CREATE TABLE AS
语句创建了一个新的表my_table_latest
,并将数据从my_table
复制到my_table_latest
。在创建表时,我们可以选择指定分区列和分区的存储路径。在第一个示例中,我们没有指定分区信息,因此数据将被保存在s3://bucket/path/my_table_latest/
路径下。在第二个示例中,我们使用partitioned_by
参数指定了分区列,数据将按照分区列的值进行存储,例如s3://bucket/path/my_table_latest/dt=2022-01-01/
。
请注意,上述示例假设您已经在Athena中设置了适当的访问权限,并且您的数据已经存在于指定的S3存储桶中。