DrissionPage 异常处理实战指南:构建稳健的网页自动化防线

news2026/5/22 3:27:37

在网页自动化领域,异常处理能力直接决定了系统的健壮性。作为融合Selenium与Requests特性的创新工具,DrissionPage提供了多层次的异常处理机制。本文将深入剖析其异常体系,结合真实场景案例,为您构建一套完善的自动化容错方案。

一、异常类型全景图谱

1.1 基础异常分类

异常类别典型场景继承关系
连接异常DNS解析失败/网络中断requests.ConnectionError
超时异常页面加载超时/API响应延迟requests.Timeout
元素异常元素未找到/不可交互NoSuchElementException
状态码异常4xx/5xx HTTP错误HTTPError
验证异常验证码拦截/反爬机制触发AuthenticationRequired

1.2 DrissionPage特有异常

from drissionpage.exceptions import (
    PageJumpError,        # 页面跳转异常
    DriverError,          # 浏览器驱动异常
    SessionExpired,       # 会话过期
    SmartModeError        # 智能模式切换失败
)

典型案例分析

try:
    page.get('https://example.com/admin')
except PageJumpError as e:
    if '302 Found' in str(e):
        print('检测到登录重定向,需处理认证')
except SessionExpired:
    print('会话令牌失效,需重新登录')

二、防御性编程实践

2.1 多层捕获策略

def safe_fetch(url):
    try:
        with ChromiumPage() as page:
            page.get(url, timeout=30)
            return page.ele('body').text
    except (ConnectionError, Timeout) as e:
        log_error(f'网络层异常: {str(e)}', retry=True)
        return handle_network_failure()
    except (NoSuchElementException, ElementNotInteractableException) as e:
        log_error(f'UI操作异常: {str(e)}', screenshot=True)
        return fallback_to_api(url)
    except Exception as e:
        log_critical(f'未知异常: {traceback.format_exc()}')
        raise SystemExit(1)

2.2 智能重试机制

from tenacity import (
    retry,
    stop_after_attempt,
    wait_exponential,
    retry_if_exception_type
)

@retry(
    stop=stop_after_attempt(3),
    wait=wait_exponential(multiplier=1, min=2, max=10),
    retry=retry_if_exception_type((
        ConnectionError,
        Timeout,
        PageJumpError
    ))
)
def robust_crawl(url):
    with ChromiumPage() as page:
        page.get(url, timeout=15)
        return page.html

重试策略优化

  • 指数退避:避免对目标服务器造成过大压力
  • 异常筛选:仅对可恢复异常进行重试
  • 状态标记:重试前设置retrying=True避免循环陷阱

2.3 上下文感知处理

class ContextAwareHandler:
    def __init__(self):
        self.retry_count = 0
        self.last_error = None

    def __call__(self, func):
        def wrapper(*args, **kwargs):
            try:
                return func(*args, **kwargs)
            except Exception as e:
                self.last_error = e
                if self.retry_count < 3:
                    self.retry_count += 1
                    if self._should_retry(e):
                        return self._handle_retry(func, args, kwargs)
                raise
        return wrapper

    def _should_retry(self, e):
        return isinstance(e, (ConnectionError, Timeout)) and not self._is_critical(e)

    def _handle_retry(self, func, args, kwargs):
        if self.retry_count == 1:
            switch_to_cdn()  # 切换CDN节点
        elif self.retry_count == 2:
            refresh_cookies()  # 刷新会话凭证
        return func(*args, **kwargs)

三、高级容错模式

3.1 混合模式容错

def hybrid_fetch(url):
    try:
        with SessionPage() as page:
            return page.get(url, timeout=5)
    except (HTTPError, Timeout):
        try:
            with ChromiumPage(headless=True) as page:
                return page.get(url, timeout=30)
        except Exception as e:
            raise HybridModeFailure(f'混合模式均失败: {str(e)}')

性能对比(1000次请求测试):

模式成功率平均耗时资源占用
纯Session82%1.2s★★☆
纯Chromium98%8.7s★★★★★
混合模式99.7%3.1s★★★☆

3.2 分布式异常处理

# Master节点异常协调
from drissionpage import DistributedErrorHandler

handler = DistributedErrorHandler(
    redis_host='coordinator.redis',
    failure_queue='global_failures',
    max_retries=3
)

@handler.register
def distributed_task(url):
    try:
        with ChromiumPool.get() as page:
            return page.get(url)
    except Exception as e:
        handler.report_failure(url, e)

# Worker节点异常消费
def failure_consumer():
    while True:
        task = handler.get_failure()
        if not task:
            time.sleep(5)
            continue
        try:
            retry_result = retry_strategy(task['url'])
            handler.acknowledge(task['id'])
        except Exception as e:
            handler.escalate(task['id'], e)  # 升级处理

故障处理流程

  1. 本地重试(最多3次)
  2. 队列转移(到备用集群)
  3. 人工介入(超过阈值时)
  4. 死信队列(最终归档)

四、监控与预警体系

4.1 实时异常看板

from prometheus_client import Counter, Gauge, start_http_server

REQUEST_COUNT = Counter('drission_requests_total', 'Total requests processed')
ERROR_RATE = Gauge('drission_error_rate', 'Current error rate')
LATENCY = Gauge('drission_latency_seconds', 'Request latency')

def track_metrics(func):
    def wrapper(*args, **kwargs):
        start = time.time()
        try:
            result = func(*args, **kwargs)
            REQUEST_COUNT.inc()
            LATENCY.set(time.time() - start)
            return result
        except Exception as e:
            ERROR_RATE.inc()
            raise
    return wrapper

监控指标

  • 错误率突增(>5%持续3分钟)
  • 平均延迟(P99>15s)
  • 连接池耗尽率(>80%)

4.2 智能预警系统

class AnomalyDetector:
    def __init__(self):
        self.baseline = {
            'error_rate': 0.02,
            'avg_latency': 2.5
        }
        self.threshold = {
            'error_spike': 3,
            'latency_spike': 4
        }

    def detect(self, metrics):
        alerts = []
        if metrics['error_rate'] > self.baseline['error_rate'] * self.threshold['error_spike']:
            alerts.append('ERROR_SPIKE')
        if metrics['avg_latency'] > self.baseline['avg_latency'] * self.threshold['latency_spike']:
            alerts.append('LATENCY_SPIKE')
        return alerts

预警响应流程

  1. 邮件通知(P0级异常)
  2. Slack机器人@值班人员
  3. 自动扩容(云服务商API调用)
  4. 特征样本采集(用于后续分析)

五、持续改进策略

  1. 异常指纹库:建立历史异常特征库,实现模式识别
  2. 自愈机制:自动修复Cookie过期、驱动版本冲突等问题
  3. 混沌工程:定期注入故障测试系统韧性
  4. AIops集成:使用异常检测模型预测潜在故障
# 异常自愈示例
class SelfHealingAgent:
    def __init__(self):
        self.recovery_actions = {
            'session_expired': self.refresh_session,
            'driver_crash': self.restart_driver,
            'certificate_error': self.bypass_ssl
        }

    def handle(self, exception):
        fingerprint = self.fingerprint_error(exception)
        if action := self.recovery_actions.get(fingerprint):
            action()
            return True
        return False

    def fingerprint_error(self, e):
        import hashlib
        return hashlib.sha256(str(e).encode()).hexdigest()[:8]

构建稳健的异常处理体系需要建立感知-响应-恢复的完整闭环。通过DrissionPage提供的异常处理工具箱,结合智能监控和自愈机制,可以让您的自动化系统具备自我保护能力,在复杂的网络环境中保持持久稳定运行。记住:最好的异常处理是预防异常的发生,而实现这一目标需要持续的数据积累和策略优化。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2400961.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

鸿蒙任务项设置案例实战

目录 案例效果 资源文件与初始化 string.json color.json CommonConstant 添加任务 首页组件 任务列表初始化 任务列表视图 任务编辑页 添加跳转 任务目标设置模型&#xff08;formatParams&#xff09; 编辑页面 详情页 任务编辑列表项 目标设置展示 引入目标…

TDengine 的 AI 应用实战——运维异常检测

作者&#xff1a; derekchen Demo数据集准备 我们使用公开的 NAB数据集 里亚马逊 AWS 东海岸数据中心一次 API 网关故障中&#xff0c;某个服务器上的 CPU 使用率数据。数据的频率为 5min&#xff0c;单位为占用率。由于 API 网关的故障&#xff0c;会导致服务器上的相关应用…

使用Plop.js高效生成模板文件

前情 开发是个创造型的职业&#xff0c;也是枯燥的职业&#xff0c;因为开发绝大多数都是每天在业务的代码中无法自拨&#xff0c;说到开发工作&#xff0c;就永远都逃不开新建文件的步骤&#xff0c;特别现在组件化开发胜行&#xff0c;每天都是在新建新建组件的道路上一去不…

Vue框架2(vue搭建方式2:利用脚手架,ElementUI)

一.引入vue第二种搭建方式 在以前的前端项目中,一个项目需要多个html文件实现页面之前的切换,如果页面中需要依赖js或者css文件,那么我们就需要在多个html文件中都需要导入vue.js文件,太过繁琐. 现在前端开发都采用单页面结果,一个项目中只有一个html文件 其他不同的内容都写…

mac 设置cursor (像PyCharm一样展示效果)

一、注册 Cursor - The AI Code Editor 二、配置Python环境 我之前使用pycharm创建的python项目&#xff0c;以及创建了虚拟环境&#xff0c;现在要使用cursor继续开发。 2.1 选择Python 虚拟环境 PyCharm 通常将虚拟环境存储在项目目录下的 venv 或 .venv 文件夹中&#xf…

SpringCloudAlibaba微服务架构

技术架构图 SpringCloudAlibaba微服务架构 说明&#xff1a; 1.1、采用SpringCloudAlibaba分布式微服务架构&#xff0c;使用Nginx做代理&#xff0c;服务治理使用Nacos组件&#xff0c;Gateway网关做权限验证、路由、过滤。 1.2、Redis做消息缓存&#xff0c;包括数据大屏、数…

Java高级 | 【实验三】Springboot 静态资源访问

隶属文章&#xff1a; Java高级 | &#xff08;二十二&#xff09;Java常用类库-CSDN博客 系列文章&#xff1a; Java高级 | 【实验一】Spring Boot安装及测试 最新-CSDN博客 Java高级 | 【实验二】Springboot 控制器类相关注解知识-CSDN博客 目录 一、Thymeleaf 1.1 是什么&…

「Java教案」Java程序的构成

课程目标 1&#xff0e;知识目标 能够按照Java标识符的命名规则&#xff0c;规范变量的命名。能够区分Java中的关键字与保留字。能够对注释进行分类&#xff0c;根据注释的用途合理的选择注释方式。 2&#xff0e;能力目标 能编写符合规范的标识符。能识别Java中的关键字和…

区块链可投会议CCF B--EDBT 2026 截止10.8 附录用率

Conference&#xff1a;EDBT: 29th International Conference on Extending Database Technology CCF level&#xff1a;CCF B Categories&#xff1a;数据库&#xff0f;数据挖掘&#xff0f;内容检索 Year&#xff1a;2026 Conference time&#xff1a;24th March - 27th…

经典ReLU回归!重大缺陷「死亡ReLU问题」已被解决

来源 &#xff5c; 机器之心 在深度学习领域中&#xff0c;对激活函数的探讨已成为一个独立的研究方向。例如 GELU、SELU 和 SiLU 等函数凭借其平滑梯度与卓越的收敛特性&#xff0c;已成为热门选择。 尽管这一趋势盛行&#xff0c;经典 ReLU 函数仍因其简洁性、固有稀疏性及…

在VSCode中开发一个uni-app项目

创建项目 使用命令行工具&#xff08;例如 vue-cli&#xff09;来创建一个新的 uni-app 项目。 创建以JavaScript开发的工程 npx degit dcloudio/uni-preset-vue#vite my-vue3-project //或者 npx degit dcloudio/uni-preset-vue#vite-alpha my-vue3-project创建以TypeScript…

Python - 爬虫;Scrapy框架之插件Extensions(四)

阅读本文前先参考 https://blog.csdn.net/MinggeQingchun/article/details/145904572 在 Scrapy 中&#xff0c;扩展&#xff08;Extensions&#xff09;是一种插件&#xff0c;允许你添加额外的功能到你的爬虫项目中。这些扩展可以在项目的不同阶段执行&#xff0c;比如启动…

Spark实战能力测评模拟题精析【模拟考】

1.println(Array(1,2,3,4,5).filter(_%20).toList() 输出结果是&#xff08;B&#xff09; A. 2 4 B. List(2,4) C. List(1,3,5) D. 1 3 5 2.println(Array("tom","team","pom") .filter(_.matches("")).toList) 输出结果为(List(tom,…

【OSG学习笔记】Day 15: 路径动画与相机漫游

本章来学习下漫游相机。 路径动画与相机漫游 本届内容比较简单&#xff0c;其实就是实现物体的运动和相机的运动 当然这两个要一起执行。 贝塞尔曲线 贝塞尔曲线&#xff08;Bzier curve&#xff09;是一种在计算机图形学、动画制作、工业设计等领域广泛应用的参数曲线&am…

PostgreSQL(PostGIS)触发器+坐标转换案例

需求&#xff0c;只录入一份坐标参考为4326的数据&#xff0c;但是发布的数据要求坐标必须是3857 对这种需求可以利用数据库触发器实现数据的同步 步骤&#xff1a; 1. 使用ArcGIS Pro创建一个名字为testfc_4326的图层&#xff0c;坐标参考为4326 2. 使用Pro再创建一个名字…

Constraints and Triggers

目录 Kinds of Constraints Single-Attribute Keys Multiattribute Key Foreign Keys Expressing Foreign Keys Enforcing Foreign-Key Constraints Actions Taken Attribute-Based Checks Timing of Checks Tuple-Based Checks Assertions Timing of Assertion Ch…

BERT:让AI真正“读懂”语言的革命

BERT&#xff1a;让AI真正“读懂”语言的革命 ——图解谷歌神作《BERT: Pre-training of Deep Bidirectional Transformers》 2018年&#xff0c;谷歌AI团队扔出一篇核弹级论文&#xff0c;引爆了整个NLP领域。这个叫BERT的模型在11项任务中屠榜&#xff0c;甚至超越人类表现…

冷雨泉教授团队:新型视觉驱动智能假肢手,拟人化抓握技术突破,助力截肢者重获生活自信

研究背景&#xff1a;日常生活中&#xff0c;健康人依靠手完成对物体的操作。对于手部截肢患者&#xff0c;手部的缺失导致他们难以有效地操作物体&#xff0c;进而影响正常的日常生活。拥有一个能够实现拟人地自然抓取多种日常物体的五指动力假手是手部截肢患者的夙愿&#xf…

pikachu靶场通关笔记14 XSS关卡10-XSS之js输出(五种方法渗透)

目录 一、源码分析 1、进入靶场 2、代码审计 二、渗透实战 1、根据提示输入tmac 2、XSS探测 3、注入Payload1 4、注入Payload2 5、注入Payload3 6、注入Payload4 7、注入Payload5 本系列为通过《pikachu靶场通关笔记》的XSS关卡(共10关&#xff09;渗透集合&#x…

李沐-动手学深度学习:RNN

1.RNN从零开始实现 import math import torch from torch import nn from torch.nn import functional as F from d2l import torch as d2l#8.3.4节 #batch_size&#xff1a;每个小批量中子序列样本的数目&#xff0c;num_steps&#xff1a;每个子序列中预定义的时间步数 #loa…