在AWS Glue作业中使用pandas模块读取CSV文件,并使用replace()函数将无限值替换为某个值。以下是示例代码:
import pandas as pd
df = pd.read_csv('s3://your-s3-bucket/file.csv')
df = df.replace([np.inf, -np.inf], 9999) #将无限值替换为9999或任何其他您想要的值
df.to_csv('s3://your-s3-bucket/output-file.csv', index=False)
首先,我们使用pandas模块从S3中读取CSV文件。然后,使用replace()函数将所有无限值替换为9999,也可以使用任何其他合适的值。最后,将修改后的数据框保存到S3中的输出文件中。