在 AWS EMR 无服务器 Spark 应用程序中使用以下代码将属性定界符更改为逗号(,):
val delimiter = ","
sc.hadoopConfiguration.set("textinputformat.record.delimiter", delimiter)
sc.hadoopConfiguration.set("textoutputformat.record.delimiter", delimiter)
修改 textinputformat.record.delimiter
和 textoutputformat.record.delimiter
属性,可更改 Spark 应用程序的默认属性定界符。在上面的示例中,将属性定界符更改为逗号。
这将修改输入和输出中属性/字段之间的分隔符。如果您需要更改示例代码中使用的分隔符,请将其替换为所需的其他字符,例如制表符 (\t)。