以下是一个Python脚本的示例,可以读取一个csv文件,并使用该输入从finviz.com上进行数据爬取,然后将数据导出到一个csv文件中。请确保安装了所需的库,如pandas、beautifulsoup和requests。
import pandas as pd
import requests
from bs4 import BeautifulSoup
# 从csv文件中读取输入数据
input_data = pd.read_csv('input.csv')
# 创建一个空的DataFrame来存储结果数据
output_data = pd.DataFrame(columns=['Symbol', 'Company', 'Sector', 'Industry'])
# 遍历输入数据
for index, row in input_data.iterrows():
symbol = row['Symbol']
url = f'https://finviz.com/quote.ashx?t={symbol}'
# 发送GET请求并解析HTML响应
response = requests.get(url)
soup = BeautifulSoup(response.text, 'html.parser')
# 从解析后的HTML中提取所需的数据
company = soup.find('table', {'class': 'fullview-title'}).findAll('tr')[1].findAll('td')[0].text
sector = soup.find('a', text='Sector').findNext('a').text
industry = soup.find('a', text='Industry').findNext('a').text
# 将提取的数据添加到结果DataFrame中
output_data = output_data.append({'Symbol': symbol, 'Company': company, 'Sector': sector, 'Industry': industry}, ignore_index=True)
# 将结果DataFrame保存为csv文件
output_data.to_csv('output.csv', index=False)
请将上述代码保存为一个Python脚本(例如script.py
),并确保在同一目录下有一个名为input.csv
的csv文件。然后运行脚本,它将从input.csv
读取输入数据,并将爬取的数据保存为output.csv
。请根据需要修改脚本中的csv文件名和列名。