Selenium 基本用法入门指南

Selenium 是一款强大的开源工具,用于自动化 Web 浏览器操作。它可以模拟人类在浏览器上的行为,完成诸如表单填写、页面交互、数据抓取和自动化测试等任务。本文将带你快速上手 Selenium,掌握它的基本用法。

什么是 Selenium?

Selenium 是一个支持多种编程语言的浏览器自动化工具。主要特点包括:

  • 跨浏览器支持:兼容 Chrome、Firefox、Safari、Edge 等主流浏览器。
  • 多语言绑定:支持 Python、Java、C# 等编程语言。
  • 强大的扩展性:可结合 WebDriver 执行复杂的操作。
  • 广泛应用:广泛用于测试自动化、数据抓取、持续集成等领域。

安装 Selenium

1. 安装 Selenium

在 Python 环境中,安装 Selenium 非常简单,只需执行以下命令:

pip install selenium
2. 下载 WebDriver

WebDriver 是 Selenium 和浏览器之间的桥梁,不同的浏览器需要对应的 WebDriver:

  • Chrome: ChromeDriver 下载
  • Firefox: GeckoDriver 下载

确保将下载的 WebDriver 添加到系统环境变量中,或在代码中指定路径。

基本用法

以下将以 Chrome 浏览器为例,展示 Selenium 的基本功能。

1. 打开浏览器并访问网页
from selenium import webdriver

# 初始化 WebDriver
driver = webdriver.Chrome()

# 打开网页
driver.get("https://www.example.com")

# 打印网页标题
print(driver.title)

# 关闭浏览器
driver.quit()
2. 定位元素

Selenium 提供多种方法来定位页面元素:

  • By.ID:通过元素的 id
  • By.NAME:通过元素的 name 属性。
  • By.XPATH:通过 XPath 表达式。
  • By.CSS_SELECTOR:通过 CSS 选择器。
from selenium.webdriver.common.by import By

# 定位元素
element = driver.find_element(By.ID, "username")
element.send_keys("my_username")  # 输入文本
3. 常见操作
输入文本
element = driver.find_element(By.ID, "password")
element.send_keys("my_password")

点击按钮

button = driver.find_element(By.ID, "login-button")
button.click()

获取元素文本

message = driver.find_element(By.ID, "welcome-message")
print(message.text)

清空文本框

element.clear()
4. 等待元素加载

在实际应用中,某些页面元素可能需要时间加载。可以通过以下方法等待元素:

  • 隐式等待:设置全局等待时间。
  • 显式等待:指定条件等待特定元素。

隐式等待

driver.implicitly_wait(10)  # 等待最多 10 秒

显式等待

from selenium.webdriver.common.by import By
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC

wait = WebDriverWait(driver, 10)
element = wait.until(EC.presence_of_element_located((By.ID, "dynamic-element")))
5. 切换窗口和框架
切换到新窗口
driver.switch_to.window(driver.window_handles[1])

切换到 iframe

driver.switch_to.frame("iframe-id")

返回主页面

driver.switch_to.default_content()
6. 执行 JavaScript

有些操作无法直接通过 Selenium 实现,可以通过执行 JavaScript 脚本:

driver.execute_script("window.scrollTo(0, document.body.scrollHeight);")  # 滚动到底部
7. 文件上传与下载
文件上传
upload_element = driver.find_element(By.ID, "file-upload")
upload_element.send_keys(r"C:\path\to\file.txt")
文件下载

在浏览器选项中设置默认下载目录:

from selenium.webdriver.chrome.options import Options

options = Options()
options.add_experimental_option("prefs", {
    "download.default_directory": r"C:\path\to\download",
})
driver = webdriver.Chrome(options=options)

示例:自动化登录

以下示例演示如何通过 Selenium 自动登录一个网站:

from selenium import webdriver
from selenium.webdriver.common.by import By

# 初始化 WebDriver
driver = webdriver.Chrome()

# 打开登录页面
driver.get("https://example.com/login")

# 输入用户名和密码
driver.find_element(By.ID, "username").send_keys("my_username")
driver.find_element(By.ID, "password").send_keys("my_password")

# 点击登录按钮
driver.find_element(By.ID, "login-button").click()

# 打印登录成功后的标题
print(driver.title)

# 关闭浏览器
driver.quit()

常见问题及解决方法

  1. 元素未找到

    • 原因:页面加载过慢。
    • 解决:使用显式等待或检查定位器的准确性。
  2. WebDriver 版本不匹配

    • 原因:浏览器版本与 WebDriver 不匹配。
    • 解决:更新浏览器或下载对应版本的 WebDriver。
  3. 页面交互失败

    • 原因:元素被遮挡或不可见。
    • 解决:尝试滚动页面或使用 JavaScript 执行操作。

总结

Selenium 提供了强大的功能来操作 Web 浏览器,是自动化测试和爬虫开发的利器。本篇文章涵盖了 Selenium 的基础用法,包括浏览器控制、元素定位、页面交互等功能。如果你是初学者,可以从简单的项目入手,比如自动登录、批量数据抓取等。在实际开发中,结合显式等待、多线程和异常处理,可以进一步提升脚本的可靠性和效率。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/919404.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

PHP屏蔽海外IP的访问页面(源代码实例)

PHP屏蔽海外IP的访问页面&#xff08;源代码实例&#xff09;&#xff0c;页面禁用境外IP地址访问 <?php/*** 屏蔽海外ip访问* 使用ip2long函数得到ip转为整数的值&#xff0c;判断值是否在任一一个区间中* 以下是所有国内ip段* 调用方法&#xff1a;IschinaIp($ALLIPS)* …

现代分布式系统新法宝:基于单元的架构

- 前言 - 数十年来&#xff0c;IT 业界一直在努力掌握分布式系统。然而&#xff0c;随着系统日益复杂&#xff0c;给开发数字产品的组织带来巨大挑战。可以说&#xff0c;分布式系统最棘手的方面之一是面对故障时的可靠性&#xff0c;特别是现代分布式系统使用大量物理与虚拟资…

2.8 群辉 黑群晖 意味断电 抱歉,您所指定的页面不存在。

实验室组装的黑群晖施工时不小心被意味断电&#xff0c;然后出现了如下图&#xff1a; 对于7.1.1的系统来说&#xff0c;这个是由于libsynopkg.so.1和libsynoshare.so.7这两个文件出问题所致。 因此&#xff0c;解决方法也比较简单就是把好的文件恢复到/lib文件夹下即可。 这…

【视频讲解】Python深度神经网络DNNs-K-Means(K-均值)聚类方法在MNIST等数据可视化对比分析...

全文链接&#xff1a;https://tecdat.cn/?p38289 分析师&#xff1a;Cucu Sun 近年来&#xff0c;由于诸如自动编码器等深度神经网络&#xff08;DNN&#xff09;的高表示能力&#xff0c;深度聚类方法发展迅速。其核心思想是表示学习和聚类可以相互促进&#xff1a;好的表示会…

K8S资源限制之ResourceQuota

ResourceQuota介绍 在K8S中&#xff0c;大部分资源都可以指定到一个名称空间下&#xff0c;因此可以对一个名称空间的计算资源&#xff0c;存储资源&#xff0c;资源数量等维度做资源限制。 如限制pod数量、svc数量&#xff0c;控制器数量&#xff0c;限制PVC请求的存储量 注…

【Android原生问题分析】夸克、抖音划动无响应问题【Android14】

1 问题描述 偶现问题&#xff0c;用户打开夸克、抖音后&#xff0c;在界面上划动无响应&#xff0c;但是没有ANR。回到Launcher后再次打开夸克/抖音&#xff0c;发现App的界面发生了变化&#xff0c;但是仍然是划不动的。 2 log初分析 复现问题附近的log为&#xff1a; 用户…

[JavaWeb]微头条项目

完整笔记和项目代码&#xff1a; https://pan.baidu.com/s/1PZBO0mfpwDPic4Ezsk8orA?pwdwwp5 提取码: wwp5 JavaWeb-微头条项目开发 1 项目简介 1.1 业务介绍 微头条新闻发布和浏览平台,主要包含业务如下 用户功能 注册功能登录功能 头条新闻 新闻的分页浏览通过标题关键字搜…

AJAX学习(24.11.1-24.11.14)(包含HTTP协议)

AJAX学习&#xff08;24.11.1-11.14) 来源&#xff1a; 传智 | 高校学习平台-首页 传智播课&#xff1a;黑马程序员 1.服务器和客户端 1.服务器&#xff1a;存放和对外提供资源的电脑。 2.客户端&#xff08;用户&#xff09;&#xff1a;获取和消费资源的电脑。&#xff0…

9.《滑动窗口篇》---①长度最小的子数组(中等)

滑动窗口推导过程 我们不能说一上来就知道这个题目用滑动窗口&#xff0c;然后就使用滑动窗口的方法来做这个题目。 首先我们想到的应该是暴力解法。 接着再优化为滑动窗口 由于数字都是 ≥ 0 的数。因此累加的数越多。和越大。 因此right往后遍历的时候。当发现sum > targe…

《Python网络安全项目实战》项目5 编写网站扫描程序

《Python网络安全项目实战》项目5 编写网站扫描程序 项目目标&#xff1a;任务5.1 暴力破解网站目录和文件位置任务描述任务分析任务实施相关知识任务评价 任务5.2 制作网页JPG爬虫任务分析任务实施相关知识任务评价任务拓展 WEB网站安全渗透测试过程中需要进行目录扫描和网站爬…

React(二)

文章目录 项目地址七、数据流7.1 子组件传递数据给父组件7.1.1 方式一:給父设置回调函数,传递给子7.1.2 方式二:直接将父的setState传递给子7.2 给props传递jsx7.2.1 方式一:直接传递组件给子类7.2.2 方式二:传递函数给子组件7.3 props类型验证7.4 props的多层传递7.5 cla…

Python学习29天

二分查找 # 定义函数冒泡排序法从大到小排列 def bbble_sort(list):# i控制排序次数for i in range(len(list) - 1):# j控制每次排序比较次数for j in range(len(list) - 1 - i):if list[j] < list[j 1]:list[j], list[j 1] list[j 1], list[j] # 定义二分查找函数 def…

【工控】线扫相机小结 第三篇

海康软件更新 目前使用的是 MVS_STD_4.3.2_240705.exe &#xff0c;最新的已经到4.4了。 一个大的变动 在上一篇中我们提到一个问题&#xff1a; 需要注意的是&#xff0c;我们必须先设置 TriggerSelector 是 “FrameBurstStart” 还是 “LineStart” 再设置TriggerMode 是 …

K8S资源限制之LimitRange

LimitRange介绍 LimitRange也是一种资源&#xff0c;在名称空间内有效&#xff1b;限制同一个名称空间下pod容器的申请资源的最大值&#xff0c;最小值pod的resources中requests和limits必须在这个范围内&#xff0c;否则pod无法创建。当然pod也可以不使用resources进行创建ty…

Maven maven项目构建的生命周期 Maven安装配置 IDEA 配置 Maven

一&#xff0c;Maven的概述 Maven的作用&#xff1a;专门用于管理和构建Java项目的工具&#xff0c;它的主要功能有&#xff1a; 提供了一套标准化的项目结构提供了一套标准化的构建流程&#xff08;编译&#xff0c;测试&#xff0c;打包&#xff0c;发布……&#xff09;提…

Rust “xxx“.to_string()和Rust String::from(“xxx“)区别(将字符串字面量(str类型)转换为String类型)

文章目录 Rust "xxx".to_string()和Rust String::from("xxx")区别1. .to_string()&#xff08;能够将任何可以显示的类型&#xff08;如数字、结构体等&#xff09;转为字符串&#xff09;2. String::from()区别总结&#xff1a;性能&#xff1a;示例对比&…

Windows仿macOS?看这一篇就够了

如果你有任何关于Windows仿macOS的问题&#xff0c;可加入942644281 &#xff08;QQ群&#xff09; Date9.20更新&#xff1a;增加功能按键左移部分Date9.16更新&#xff1a;增加了大多数资源的网盘链接Date9.15更新&#xff1a;增加StartAllBack&#xff0c;资源管理器调整部…

Django数据迁移出错,解决raise NodeNotFoundError问题

错误出现在&#xff1a; raise NodeNotFoundError(self.error_message, self.key, originself.origin) django.db.migrations.exceptions.NodeNotFoundError: Migration myApp.0003_alter_jobinfo_practise dependencies reference nonexistent parent node (myApp, 0002_renam…

PaddleNLP的环境配置:

PaddleNLP的环境配置&#xff1a; conda create -n paddle—test python3.9conda activate paddle—testpython -m pip install paddlepaddle-gpu2.6.1.post112 -f https://www.paddlepaddle.org.cn/whl/windows/mkl/avx/stable.html(paddle—test) (venv) PS D:\work\论文写…

【MySQL实战45讲笔记】基础篇——redo log 和 binlog

系列文章 基础篇——MySQL 的基础架构 目录 系列文章1. 重要的日志模块&#xff1a;redo log 和 binlog1.1 redo log1.2 binlog1.3 执行器和 InnoDB 引擎内部如何执行更新语句 1. 重要的日志模块&#xff1a;redo log 和 binlog 前面系统的了解了一个查询语句的执行流程&…