下面是一个示例代码,展示如何使用Python和openpyxl库来实现按主题读取电子邮件,并将特定数据粘贴到Excel中:
import openpyxl
from openpyxl.utils import get_column_letter
from openpyxl.styles import Alignment
import os
import re
import email
from email.header import decode_header
# 定义函数,用于解码邮件主题
def decode_subject(subject):
decoded = decode_header(subject)[0]
if decoded[1] is not None:
return decoded[0].decode(decoded[1])
else:
return decoded[0]
# 创建一个Excel工作簿
wb = openpyxl.Workbook()
sheet = wb.active
# 设置表头
sheet['A1'] = '主题'
sheet['B1'] = '发件人'
sheet['C1'] = '日期'
# 指定电子邮件文件夹路径
email_folder = './emails'
# 遍历电子邮件文件夹中的每个文件
for filename in os.listdir(email_folder):
if filename.endswith('.eml'):
email_path = os.path.join(email_folder, filename)
with open(email_path, 'rb') as file:
# 解析邮件内容
msg = email.message_from_bytes(file.read())
# 获取主题
subject = decode_subject(msg['Subject'])
# 获取发件人
sender = msg['From']
# 获取日期
date = msg['Date']
# 在Excel中添加数据
sheet.append([subject, sender, date])
# 调整列宽和居中对齐
for column in sheet.columns:
max_length = 0
column = [cell for cell in column]
for cell in column:
try:
if len(str(cell.value)) > max_length:
max_length = len(cell.value)
except:
pass
adjusted_width = (max_length + 2)
sheet.column_dimensions[get_column_letter(column[0].column)].width = adjusted_width
for cell in column:
cell.alignment = Alignment(horizontal='center')
# 保存Excel文件
wb.save('emails.xlsx')
在上述代码中,我们首先导入了必要的库和模块,包括openpyxl、os、re、email和email.header。然后,我们定义了一个decode_subject
函数,用于解码邮件主题中可能存在的非ASCII字符。
接下来,我们创建了一个Excel工作簿,并设置了表头。然后,我们遍历电子邮件文件夹中的每个.eml文件,并使用email.message_from_bytes
函数解析邮件内容。我们从邮件中获取主题、发件人和日期,并将这些数据添加到Excel工作表中。
最后,我们调整列宽和居中对齐数据,并保存Excel文件为emails.xlsx
。
请注意,上述代码假设电子邮件文件夹中的每个文件都是.eml格式,并且保存在./emails
路径下。您可以根据实际情况修改这些路径和文件格式。
上一篇:按主题过滤kafka流
下一篇:按主题和日期范围选择新电子邮件