Selenium的driver.get_url 和 手动输入网址, 并点击的操作,有什么不同?

news2025/5/12 15:49:50

我在搞爬取的时候,发现有些网站直接用driver.get(url) 跳转到目标特定的网址的时候,会被强制跳转到其他的网址上,但是如果是自己手动,在网址栏那里输入网址,并点回车,却能完成跳转。

这是在使用 Selenium 进行自动化测试或爬虫时,driver.get(url)手动输入网址并回车/点击 在操作流程上有本质区别,主要体现在 浏览器行为、触发事件、性能及稳定性 等方面。

以下是详细对比:


1. driver.get(url) 的原理与特点

  • 直接导航
    Selenium 通过浏览器驱动(如ChromeDriver)直接向浏览器发送导航命令,跳过地址栏输入,类似代码层面的 window.location.href = url
  • 不触发页面加载事件
    部分浏览器可能不会完全模拟手动输入时的完整生命周期事件(如 beforeunload)。
  • 速度快
    无需模拟键盘输入和回车操作,直接加载目标页面。
  • 无地址栏历史记录(部分浏览器):
    某些情况下,浏览器地址栏的历史记录可能不会更新(取决于驱动实现)。

示例代码:

from selenium import webdriver
driver = webdriver.Chrome()
driver.get("https://www.example.com")  # 直接导航

2. 手动输入网址并回车/点击的特点

  • 完整模拟用户行为
    1. 聚焦地址栏 → 2. 输入字符 → 3. 回车或点击“前往”按钮。
  • 触发完整事件链
    包括 keydown/keyupchangesubmit 等事件,可能影响页面加载逻辑(尤其是依赖地址栏监听的网站)。
  • 性能较慢
    需要逐字符输入,受键盘延迟影响。
  • 历史记录可靠
    地址栏历史记录一定会更新。

3. 关键差异对比

对比项driver.get(url)手动输入网址+回车/点击
触发事件仅触发基本导航事件触发完整键盘/地址栏事件链
速度快(直接跳转)慢(需模拟输入和回车)
浏览器历史记录可能不更新(因驱动实现而异)一定更新
兼容性所有网站通用需定位地址栏元素(可能因浏览器而异)
适用场景常规爬虫/测试测试地址栏相关功能(如输入建议)

4. 解决方法

  • 4.1 优先使用 driver.get(url)

    如果是经常需要连接某个网站的话,就时不时清空页面吧。

    driver.get("about:blank")  # 先清空页面
    # 再手动输入网址(确保历史记录生成)
    
  • 4.2 手动输入场景
    如果 driver.get(url)搞不定,可能存在下面的原因:

    • 测试地址栏的输入提示、历史记录功能。
    • 某些网站通过JavaScript监听地址栏输入(罕见)。
    • 某些动态网站单页应用(SPA)依赖 hashchangepopstate 事件

这个时候可以采用JavaScript 执行导航 :

from selenium import webdriver
import time

# 初始化 WebDriver(以 Chrome 为例)
driver = webdriver.Chrome()

# 使用 JavaScript 执行导航
driver.execute_script("window.location.href = 'https://www.example.com';")

# 等待页面加载(根据需要可以添加显式等待)
time.sleep(5)

# 关闭浏览器
driver.quit()

PS:
由于浏览器的地址栏无法通过常规的 HTML 元素来定位,如标签名、CSS 选择器等来操作。

所以使用selenium的find_element ,是没有办法直接定位到网址栏,这种操作是不太可行的。

错误的演示例:

from selenium import webdriver
from selenium.webdriver.common.keys import Keys
import time

# 初始化 WebDriver(以 Chrome 为例)
driver = webdriver.Chrome()

# 找到地址栏(通常可以通过标签名或特定的 CSS 选择器定位)
address_bar = driver.find_element_by_tag_name("input") #在这里,chrome是无法对地址栏做定位的

# 清空地址栏(可选,确保地址栏为空)
address_bar.clear()

# 输入网址
address_bar.send_keys("https://www.example.com")

# 模拟按下回车键
address_bar.send_keys(Keys.RETURN)

# 等待页面加载(根据需要可以添加显式等待)
time.sleep(5)

# 关闭浏览器
driver.quit()

这是因为地址栏是浏览器的一部分,而不是网页内容的一部分。

因此,Selenium 无法直接与地址栏交互。

如果需要更多绕开检测的方法,可以参考这个文章:Selenium模拟人类行为,操作网页的方法(全)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2374046.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

无人甘蔗小车履带式底盘行走系统的研究

1.1 研究背景与意义 1.1.1 研究背景 甘蔗作为全球最重要的糖料作物之一,在农业经济领域占据着举足轻重的地位。我国是甘蔗的主要种植国家,尤其是广西、广东、云南等地,甘蔗种植面积广泛,是当地农业经济的重要支柱产业。甘蔗不仅…

通俗易懂版知识点:Keepalived + LVS + Web + NFS 高可用集群到底是干什么的?

实验开始前,先搞懂为什么要部署该集群? 这个方案的目标是让网站 永不宕机,即使某台服务器挂了,用户也感觉不到。它主要涉及 负载均衡(LVS) 高可用(Keepalived) 共享存储&#xff…

https,http1,http2,http3的一些知识

温故知新,突然有人问我项目中🤔有使用http3么,一下不知从何说起,就有了这篇文章的出现。 https加密传输,ssltls https 验证身份 提供加密,混合加密 : 对称加密 非对称加密 原理&#xff1a…

go 通过汇编学习atomic原子操作原理

文章目录 概要一、原理1.1、案例1.2、关键汇编 二、LOCK汇编指令2.1、 LOCK2.2、 原理2.2.1、 缓存行2.2.2、 缓存一致性之MESI协议2.2.3、lock原理 三、x86缓存发展四、x86 DMA发展参考 概要 在并发操作下,对一个简单的aa2的操作都会出错,这是因为这样…

WebRTC 源码原生端Demo入门-1

1、概述 我的代码是比较新的,基于webrtc源码仓库的main分支的,在windows下把源码仓库下载好了后,用visual stdio 2022打开进行编译调试src/examples/peerconnection_client测试项目,主要是跑通这个demo来入手和调试,纯看代码很难…

【MySQL】第二弹——MySQL表的增删改查(CRUD)

文章目录 🎓一. CRUD🎓二. 新增(Create)🎓三. 查询(Rertieve)📖1. 全列查询📖2. 指定列查询📖3. 查询带有表达式📖4. 起别名查询(as )📖 5. 去重查询(distinct)📖6. 排序…

基于zernike 拟合生成包裹训练数据-可自定义拟合的项数

可以看到拟合误差其实还是有很多的,但是这个主要是包裹噪声产生的,用到了github 上的zernike 库,直接pip install 一下安装就可以了 import numpy as np import matplotlib.pyplot as plt from matplotlib import cm from mpl_toolkits.mplot3d import Axes3D import matpl…

大模型赋能:2D 写实数字人开启实时交互新时代

在数字化浪潮席卷全球的当下,人工智能技术不断突破创新,其中大模型驱动的 2D 写实数字人正成为实时交互领域的一颗新星,引领着行业变革,为人们带来前所未有的交互体验。 一、2D 写实数字人概述 2D 写实数字人是通过计算机图形学…

5G-A来了!5G信号多个A带来哪些改变?

5G-A来了!5G信号多个A带来哪些改变? 随着科技不断进步,通信网络的迭代升级也在加速。自4G、5G的推出以来,我们见证了通信技术的飞跃式发展。最近,越来越多的用户发现自己手机屏幕右上角的5G标识已经变成了“5G-A”。那…

Chroma:一个开源的8.9B文生图模型

Chroma 模型讲解 一、模型概述 Chroma 是一个基于 FLUX.1-schnell 的 8.9B 参数模型。它采用了 Apache 2.0 许可证,完全开源,允许任何人使用、修改和在其基础上进行开发,不存在企业限制。该模型目前正在训练中,训练数据集从 20M…

[强化学习的数学原理—赵世钰老师]学习笔记01-基本概念

[强化学习的数学原理—赵世钰老师]学习笔记01-基本概念 1.1 网格世界的例子1.2 状态和动作1.3 状态转移1.4 策略1.5 奖励1.6 轨迹、回报、回合1.6.1 轨迹和回报1.6.2 回合 1.7 马尔可夫决策过程 本人为强化学习小白,为了在后续科研的过程中能够较好的结合强化学习来…

1、Kafka与消息队列核心原理详解

消息队列(Message Queue, MQ)作为现代分布式系统的基础组件,极大提升了系统的解耦、异步处理和削峰能力。本文以Kafka为例,系统梳理消息队列的核心原理、架构细节及实际应用。 Kafka 基础架构及术语关系图 术语简要说明 Produce…

免费公共DNS服务器推荐

当自动获取的DNS或本地运营商的DNS出现问题,可能导致软件无法连接服务器。此时,手动修改电脑的DNS设置或许能解决问题。许多用户觉得电脑上网速度慢、游戏卡顿,归咎于DNS问题。确实,我们可以自行设置一个DNS来改善网络体验。不少用…

【统计以空格隔开的字符串数量】2021-11-26

缘由一提标准的大一oj提木-编程语言-CSDN问答 void 统计以空格隔开的字符串数量() {//缘由https://ask.csdn.net/questions/7580109?spm1005.2025.3001.5141int n 0, x 0, g 0, k 1;string s "";cin >> n;getchar();while (n--){getline(cin, s);while …

OSCP备战-kioptrixvm3详细解法

探测IP arp-scan -l 得出目标IP:192.168.155.165 也可以使用 netdiscover -i eth0 -r 192.168.155.0/24 也可以使用 nmap -sN 192.168.155.0/24 --min-rate 1000 修改hosts文件 找到IP后,通过之前读取README.txt了解到,我们需要编辑host…

《从零构建大模型》PDF下载(中文版、英文版)

内容简介 本书是关于如何从零开始构建大模型的指南,由畅销书作家塞巴斯蒂安• 拉施卡撰写,通过清晰的文字、图表和实例,逐步指导读者创建自己的大模型。在本书中,读者将学习如何规划和编写大模型的各个组成部分、为大模型训练准备…

大数据应用开发和项目实战-电商双11美妆数据分析

数据初步了解 (head出现,意味着只出现前5行,如果只出现后面几行就是tail) info shape describe 数据清洗 重复值处理 这个重复值是否去掉要看实际情况,比如说:昨天卖了5瓶七喜,今天卖了5瓶七…

招行数字金融挑战赛数据分析赛带赛题二

赛题描述:根据提供的脱敏资讯新闻数据,选手需要对提供的训练集进行特征工程,构建资讯分类模型,对与测试集进行准确的新闻分类。 最终得分:0.8120。十二点关榜没看到排名,估算100? 训练集很小&am…

卡尔曼滤波算法(C语言)

此处感谢华南虎和互联网的众多大佬的无偿分享。 入门常识 先简单了解以下概念:叠加性,齐次性。 用大白话讲,叠加性:多个输入对输出有影响。齐次性:输入放大多少倍,输出也跟着放大多少倍 卡尔曼滤波符合这…

ENSP-OSPF综合实验

AR4中通过ospf获取的其他区域路由信息,并且通过路由汇总后简化路由信息 实现全网通,以及单向重发布,以及通过缺省双向访问, 通过stub简化过滤四类五类lsa,简化ospf路由信息 通过nssa简化ospf信息 区域汇总简化R4路由信…