在抓取网站数据时,如果网站宕机或无法访问,我们可以使用try-except语句来捕获异常,并处理错误信息。以下是一个示例代码,展示了如何避免在抓取网站宕机时收到错误信息:
import requests
url = "https://example.com" # 要抓取的网站URL
try:
response = requests.get(url)
response.raise_for_status() # 如果返回的响应状态码不是200,会抛出一个HTTPError异常
# 在这里继续处理正常情况下的代码逻辑
except requests.exceptions.RequestException as e:
# 处理异常情况下的代码逻辑
print("无法访问网站:", e)
在上面的代码中,我们使用了requests
库来发送GET请求并获取响应。通过response.raise_for_status()
方法,我们可以检查响应的状态码是否为200,如果不是200,则会抛出一个HTTPError
异常。在except
块中,我们可以自定义处理异常的代码逻辑,比如输出错误信息或进行其他操作。
请注意,这只是一个基本的示例,实际情况可能更复杂。您可能需要根据具体的需求进行适当的修改和扩展。
上一篇:避免在转换运算符中复制基类的子集
下一篇:避免在主程序中使用库。