首先,检查您是否正确配置了所需的数据连接和抓取数据源。确保您已正确指定表格的位置。
如果您已检查并确认配置设置正确,但仍然无法保存表格,请尝试在Glue页面上的“Jobs”选项卡中创建一个任务并手动运行它。这将提供更多信息,帮助您确定问题所在。
如果表格仍然未能正确保存,还可以尝试在AWS CLI中使用以下代码示例手动创建表格:
aws glue create-table --database-name 'my_database' --table-input '{
"Name": "my_table",
"TableType": "EXTERNAL_TABLE",
"Parameters": {
"classification": "parquet",
"typeOfData": "file"
},
"StorageDescriptor": {
"Location": "s3://my_bucket/my_table/",
"InputFormat": "org.apache.hadoop.hive.ql.io.parquet.MapredParquetInputFormat",
"OutputFormat": "org.apache.hadoop.hive.ql.io.parquet.MapredParquetOutputFormat",
"SerdeInfo": {
"SerializationLibrary": "org.apache.hadoop.hive.ql.io.parquet.serde.ParquetHiveSerDe",
"Parameters": {
"serialization.format": "1"
}
},
"Columns": [
{
"Name": "column1",
"Type": "string"
},
{
"Name": "column2",
"Type": "int"
}
]
}
}'
这段代码将使用AWS CLI在AWS Glue中手动创建一个新表格,并为其指定所需的参数和位置。在创建表格后,您可以在AWS Glue页面上的“Tables”选项卡中找到它,并相应地配置它。