什么是selenium
比较官方的解释
Selenium是一个自动化测试工具,用于在Web应用程序中模拟用户操作。它提供了一组API,可以通过编程方式控制浏览器,并模拟用户的交互行为,例如点击、输入文本和导航等。Selenium支持多种编程语言,包括Java、C#、Python、Ruby、JavaScript等,并可以在多个浏览器和操作系统上运行测试。Selenium的目标是帮助测试人员自动化测试过程,提高测试效率和测试质量。
个人的简单理解
- 浏览器驱动可以操作浏览器,不用selenium也能实现代码控制浏览器的效果,就是需要自己查询浏览器启动提供的功能,
- selenium可以看成是浏览器驱动的工具类,在项目中引入seleniu,就能通过selenium方便的操作浏览器
用途
- 自动化测试
- 爬虫,这里主要做爬虫使用
各种爬虫的比较
-
直接通过http工具调用接口
例如HttpClient、OkHttp、RestTemplate等,此种方法需要注意数据的完整性,页面上一个操作可能会涉及到多个接口的调用,如果调用不全可能会造成一些异常数据,另外如果请求中有一些自定义的加密请求头,就需要扒前端源码,找到加密算法,前端源码往往是经过编译后的,可读性比较差,想到加密算法比较费劲
Java环境搭建
下载对应的浏览器和驱动
浏览器版本和浏览器驱动版本要保持一致(一般前三位一致即可),浏览器和对应的驱动见附件
引入依赖
<dependency>
<groupId>org.seleniumhq.selenium</groupId>
<artifactId>selenium-java</artifactId>
<version>3.141.59</version>
</dependency>
此种方法不是最佳实践,最佳实践是连接已经打开的浏览器,退出时仅仅退出浏览器驱动,不退出已经打开的浏览器,见最佳实践部分
public class HelloSelenium {
@SneakyThrows
public static void main(String[] args) {
// 设置 ChromeDriver 的路径
System.setProperty("webdriver.chrome.driver", "C:\\118.0.5993.70\\chromedriver-win64\\chromedriver.exe");
// 配置 ChromeOptions
ChromeOptions options = new ChromeOptions();
// 指定特定版本的 Chrome 浏览器路径 浏览器版本和浏览器驱动版本要保持一致(一般前三位一致即可)
options.setBinary("C:\\118.0.5993.70\\chrome-win64\\chrome.exe");
// 可选:无头模式,不打开浏览器窗口 如果做爬虫不打开浏览器某些网站过不去,可能会遇到Enable JavaScript and cookies to continue
// options.addArguments("--headless");
// 解决一些系统的图形化渲染问题
options.addArguments("--disable-gpu");
// 在某些系统上需要添加此参数
options.addArguments("--no-sandbox");
// 解决资源共享内存的问题
options.addArguments("--disable-dev-shm-usage");
// 创建 ChromeDriver 实例
WebDriver driver = new ChromeDriver(options);
// 为浏览器驱动driver创建一个等待器,循环等待,直到条件达成或者超时,如果条件未达成超时就会跑出异常
WebDriverWait wait = new WebDriverWait(driver, 10);
try {
// 访问指定的 URL
driver.get("http://localhost:8080");
// 直接使用driver.findElement可能元素还没有加载出来读取不到,wait.until会一直检测,直到找到元素或者超时
// WebElement nameInput = driver.findElement(By.xpath("/html/body/div[1]/form/div[1]/div/div/input"));
WebElement nameInput = wait.until(ExpectedConditions.presenceOfElementLocated(By.xpath("/html/body/div[1]/form/div[1]/div/div/input")));
nameInput.sendKeys("张无忌");
List<WebElement> buttons = driver.findElements(By.tagName("button"));
WebElement queryButton = buttons.stream().filter(item -> "查询".equals(item.getText())).findFirst().get();
queryButton.click();
} catch (Exception e) {
e.printStackTrace();
} finally {
// 方便观察浏览器,避免马上退出
Thread.sleep(10 * 1000);
// 退出浏览器驱动程序,关闭所有关联的窗口。(如果不退出浏览器驱动器不会结束,多次运行会启动多个浏览器驱动,占用系统资源)
driver.quit();
}
}
options全部参数可参考https://peter.sh/experiments/chromium-command-line-switches/
常用方法
// 请求一个页面,不支持前进和后退切换
driver.get(url);
// 和get类似,支持前进和后退切换
driver.navigate().to(url);
// 退到上一个页面 ,前提必须前进了一个页面才能回退
driver.navigate().back();
// 指前进到下一个页面 ,前提是必须后退后才能前进
driver.navigate().forward();
// 刷新当前页面
driver.navigate().refresh();
// 通用搜索,第一个 , By里包含常用的各种搜索
WebElement findElement(By by);
// 通用搜索,多个,By里包含常用的各种搜索
List<WebElement> findElements(By by);
// 关闭当前窗口,如果它是当前打开的最后一个窗口,则退出浏览器。
driver.close();
// 退出此驱动程序,关闭每个相关窗口。
driver.quit();
WebElement常用方法
元素定位
根据id属性匹配
public static By id(String id) {
return new ById(id);
}
根据a标签内容匹配
public static By linkText(String linkText) {
return new ByLinkText(linkText);
}
根据a标签内容模糊匹配
public static By partialLinkText(String partialLinkText) {
return new ByPartialLinkText(partialLinkText);
}
根据name属性匹配
public static By name(String name) {
return new ByName(name);
}
根据标签名字匹配
public static By tagName(String tagName) {
return new ByTagName(tagName);
}
根据路径匹配
路径可直接在浏览器中拷贝
public static By xpath(String xpathExpression) {
return new ByXPath(xpathExpression);
}
根据类名匹配
public static By className(String className) {
return new ByClassName(className);
}
根据css选择器匹配
public static By cssSelector(String cssSelector) {
return new ByCssSelector(cssSelector);
}
元素操作
- click():点击该元素。
- submit():将表单提交到该元素所在的表单。
- sendKeys(CharSequence… keysToSend):将指定的字符序列发送到该元素。例如向输入框输入文本。
- clear():清除该元素的内容。
- getTagName():获取该元素的标签名称。
- getAttribute(String name):获取该元素指定属性的值。
- getText():获取该元素的文本内容。
- isEnabled():判断该元素是否可用。
- isSelected():判断该元素是否被选中。
- isDisplayed():判断该元素是否可见。
- getLocation():获取该元素在页面中的位置。以
Point
对象表示,包含x
和y
坐标。 - getSize():获取该元素的大小,以
Dimension
对象表示,包含width
和height
。 - getCssValue(String propertyName):获取该元素指定CSS属性的值。
等待机制
显式等待
- 使用
WebDriverWait
和ExpectedConditions
来等待特定条件(如元素可点击、元素存在等)。
// 配置 ChromeOptions
ChromeOptions options = new ChromeOptions();
// 指定特定版本的 Chrome 浏览器路径 浏览器版本和浏览器驱动版本要保持一致(一般前三位一致即可)
options.setBinary("C:\\118.0.5993.70\\chrome-win64\\chrome.exe");
WebDriver driver = new ChromeDriver(options);
// 创建一个显示等待器,超时时间10S
WebDriverWait wait = new WebDriverWait(driver, 10)
// 循环寻找一个h3元素,10s内找到返回该元素,10s找不到抛出异常
WebElement h3 = wait.until(ExpectedConditions.presenceOfElementLocated(By.tagName("h3")));
隐式等待
隐式等待在Java中通过WebDriver
的manage().timeouts().implicitlyWait
方法实现。以下是一个示例代码:
import org.openqa.selenium.By;
import org.openqa.selenium.WebDriver;
import org.openqa.selenium.WebElement;
import org.openqa.selenium.chrome.ChromeDriver;
import java.util.concurrent.TimeUnit;
public class ImplicitWaitExample {
public static void main(String[] args) {
// 设置ChromeDriver的路径
System.setProperty("webdriver.chrome.driver", "path/to/chromedriver");
// 初始化WebDriver
WebDriver driver = new ChromeDriver();
// 设置隐式等待时间为10秒
driver.manage().timeouts().implicitlyWait(10, TimeUnit.SECONDS);
// 打开一个网页
driver.get("http://example.com");
try {
// 查找元素 如果10s内找到则返回元素,如果10秒没有找到则抛出异常
WebElement element = driver.findElement(By.id("myElement"));
// 操作元素
element.click();
} catch (Exception e) {
e.printStackTrace();
} finally {
// 关闭浏览器
driver.quit();
}
}
}
在这个示例中,implicitlyWait
方法设置了一个最长等待时间为10秒,在查找元素时,如果元素未立即出现,WebDriver会等待这个时间内不断尝试查找元素。
显示等待与隐式等待的区别
- 显示等待是指在代码中明确指定等待条件和等待时间,直到条件成立或等待时间到期,程序才会继续执行下一步操作。显示等待可以根据不同的条件进行等待,例如元素的可见性、可点击性、文本内容、属性值等。显示等待可以通过ExpectedConditions类来实现。
2 隐式等待是指在代码中设置一个全局等待时间,在此时间内如果元素没有立即出现,程序将等待指定的时间,等待元素出现。隐式等待适用于整个测试用例,而不是针对某个特定的元素。隐式等待可以通过WebDriver.Timeouts.implicitlyWait()方法来设置。。
最佳实践
打开与关闭浏览器驱动
开启浏览器debug端口
连接到已经打开的浏览器,需要浏览器开启debug端口,简单的开启方法
-
为chrome.exe创建一个快捷方式
-
chrome.exe创建>>右键>>属性>>目标后面添加
--remote-debugging-port=9222
(注意chrome.exe与新加内容之间有个空格,端口可以自由定义) -
直接打开浏览器即可
-
检查浏览器是否开启了debug端口,访问http://localhost:9222/json,返回一下内容说明浏览器成功开启了debug端口,9222是自定义端口
[ {
"description": "",
"devtoolsFrontendUrl": "/devtools/inspector.html?ws=localhost:9222/devtools/page/B3C592C54EB3552A0F5D76706A6EF844",
"id": "B3C592C54EB3552A0F5D76706A6EF844",
"title": "emp",
"type": "page",
"url": "http://localhost:8080/",
"webSocketDebuggerUrl": "ws://localhost:9222/devtools/page/B3C592C54EB3552A0F5D76706A6EF844"
} ]
创建浏览器驱动并连接到已经打开的浏览器
public void openChrome() {
// 设置 ChromeDriver 的路径
System.setProperty("webdriver.chrome.driver", "C:\\118.0.5993.70\\chromedriver-win64\\chromedriver.exe");
// 配置 ChromeOptions
ChromeOptions options = new ChromeOptions();
options.setExperimentalOption("debuggerAddress", "localhost:9222");
// 创建 ChromeDriver 实例
driver = new ChromeDriver(options);
}
退出浏览器驱动ChromeDriver
public void closeChrome() {
// 退出浏览器驱动程序
driver.quit();
}
不要让ChromeDriver打开浏览器,让ChromeDriver链接到已经打开的浏览器,好处如下
- 退出浏览器驱动时不退出浏览器,如果用浏览器驱动打开浏览器,调用driver.quit()方法退出浏览器驱动时会关闭浏览器(有时候我们想看到最好操作的结果,不希望退出浏览器)
- ChromeDriver打开的浏览器中不一定有身份信息,可能需要登录.自己可以提前打开好浏览器,并且登录相关网站
元素定位
- 如果页面元素相对比较固定,可以直接用xpath定位,简单直接,xpath可以直接从浏览器赋值
复制出来的xpath直接粘贴到代码里即可
/html/body/div[2]/div[1]/div/div[1]/div/div/div[1]/div/form/div[2]/div/div[1]/div[1]/textarea
如果前端页面频繁更新,页面元素位置经常变动,就不太适合这种方式了
- 如果页面元素经常变动,但是提示语或者某些属性比较固定,可以拿到所有这个类型的元素,再根据固定的属性过滤
List<WebElement> textareaList = driver.findElements(By.tagName("textarea"));
for (WebElement textarea : textareaList) {
String placeholder = textarea.getAttribute("placeholder");
if (placeholder.contains("内容概要+适用人群+使用场景及目标+其他说明")) {
// 拿到了资源描述文本框
}
}
selenium实战
基于selenium的crud
- 启动项目
- crud详见代码com.study.selenium.EmpCRUDTest
- 效果见演示视频