Browser-Use WebUI项目启动指南

摘要

此前发布《Browser - Use WebUI 使用体验》博文后,鉴于部分朋友运行时出现问题,重新运行并整理相关内容。本文详细记录 Web UI 项目启动全过程,涵盖 Python 3.11+、Chrome 浏览器及 API Keys 等环境要求,Python 环境检查、依赖安装等环境配置步骤,.env 文件中环境变量的设置方法。同时,针对启动中如 lxml.html.clean 依赖缺失、连接被拒等问题给出解决方案,介绍启动命令、访问方式、故障排查建议,以及日志级别设置与支持的 LLM 模型等,还提供官方文档供参考 。

引言

之前写了一篇《Browser-Use WebUI 使用体验》的博文,有些朋友可能在运行过程中出现了一些问题,所以今天,我重新运行了一次,并对其中可能出现的问题,简单整理了一下:

Web UI 项目启动指南

本文档记录了启动 Web UI 项目的完整过程,包括环境配置、遇到的问题及其解决方案。

1. 环境要求

  • Python 3.11 或更高版本
  • Chrome 浏览器(用于浏览器自动化)
  • 相关 API Keys(支持多个 LLM 提供商)

2. 环境配置

2.1 Python 环境检查

python --version
# 输出: Python 3.11.5

2.2 安装项目依赖

pip install -r requirements.txt

依赖包括:

  • browser-use==0.1.18
  • langchain-google-genai==2.0.8
  • pyperclip==1.9.0
  • gradio==5.9.1
  • langchain-ollama==0.2.2
  • langchain-openai==0.2.14

3. 环境变量配置

在项目根目录创建 .env 文件,配置以下环境变量:

# LLM API 配置
OPENAI_ENDPOINT=https://api.openai.com/v1
OPENAI_API_KEY=  # 可选

ANTHROPIC_API_KEY=  # 可选

GOOGLE_API_KEY= 替换为你的key # 已配置

AZURE_OPENAI_ENDPOINT=  # 可选
AZURE_OPENAI_API_KEY=  # 可选

DEEPSEEK_ENDPOINT=https://api.deepseek.com
DEEPSEEK_API_KEY=t替换为你的key # 已配置

# Chrome 配置
CHROME_PATH="C:\Users\[你的用户名]\AppData\Local\Google\Chrome\Application\chrome.exe"
CHROME_USER_DATA="C:\Users\[你的用户名]\AppData\Local\Google\Chrome\User Data"
CHROME_DEBUGGING_PORT=9222
CHROME_DEBUGGING_HOST=localhost
CHROME_PERSISTENT_SESSION=false  # 设置为 true 可以在 AI 任务之间保持浏览器打开

# 显示设置
RESOLUTION=1920x1080x24
RESOLUTION_WIDTH=1920
RESOLUTION_HEIGHT=1080

# VNC 设置
VNC_PASSWORD=youvncpassword

4. 启动过程中遇到的问题及解决方案

4.1 依赖问题:lxml.html.clean

问题描述
启动时遇到 ImportError:

ImportError: lxml.html.clean module is now a separate project lxml_html_clean.
Install lxml[html_clean] or lxml_html_clean directly.

解决方案
安装缺失的依赖:

pip install "lxml[html_clean]"
pip install lxml_html_clean

4.2 连接被拒绝问题

问题描述
使用默认的 127.0.0.1 地址时,无法访问 Web UI(ERR_CONNECTION_REFUSED)。

解决方案

  1. 检查服务是否正常运行:
netstat -ano | findstr :7788
  1. 使用 0.0.0.0 替代 127.0.0.1:
python webui.py --ip 0.0.0.0 --port 7788

5. 启动命令

完整的启动命令如下:

python webui.py --ip 0.0.0.0 --port 7788

6. 访问方式

服务启动后,可以通过以下方式访问:

  1. http://localhost:7788
  2. http://127.0.0.1:7788
  3. http://[本机IP]:7788

7. 故障排查建议

如果无法访问 Web UI,请检查:

  1. 确保服务正在运行
  2. 检查防火墙设置,确保端口 7788 未被阻止
  3. 如果使用代理,尝试关闭代理后访问
  4. 尝试在浏览器无痕模式下访问
  5. 查看服务日志,寻找可能的错误信息

8. 日志级别设置

.env 文件中,可以通过设置 BROWSER_USE_LOGGING_LEVEL 来调整日志级别:

  • result:仅显示结果
  • debug:显示详细调试信息
  • info:显示一般信息(默认)

9. 支持的 LLM 模型

当前配置支持以下 LLM 模型:

  1. Google Gemini(已配置)
  2. DeepSeek(已配置)
  3. OpenAI(需要配置 API key)
  4. Anthropic(需要配置 API key)
  5. Azure OpenAI(需要配置 endpoint 和 API key)

其他问题,可以参考官方文档

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/957264.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

消息队列篇--原理篇--Pulsar(Namespace,BookKeeper,类似Kafka甚至更好的消息队列)

Apache Pulusar是一个分布式、多租户、高性能的发布/订阅(Pub/Sub)消息系统,最初由Yahoo开发并开源。它结合了Kafka和传统消息队列的优点,提供高吞吐量、低延迟、强一致性和可扩展的消息传递能力,适用于大规模分布式系…

音频入门(二):音频数据增强

本文介绍了一些常见的音频数据增强方法,并给出了代码实现。 目录 一、简介 二、代码 1. 安装必要的库 2. 代码 3. 各函数的介绍 4. 使用方法 参考: 一、简介 音频数据增强是机器学习和深度学习领域中用于改善模型性能和泛化能力的技术。 使用数据…

Oracle审计

审计是监控选定的用户数据库操作的过程 审计的目的: 调查可疑的数据库活动: 审计可以帮助检测和跟踪潜在的 security breaches、未授权的访问尝试或其他异常行为。通过分析审计日志,可以确定可疑活动的来源、时间、频率和影响。 收集特定数…

Appium(四)

一、app页面元素定位 1、通过id定位元素: resrouce-id2、通过ClassName定位:classname3、通过AccessibilityId定位:content-desc4、通过AndroidUiAutomator定位5、通过xpath定位xpath、id、class、accessibility id、android uiautomatorUI AutomatorUI自…

AUTOSAR OS模块详解(三) Alarm

AUTOSAR OS模块详解(三) Alarm 本文主要介绍AUTOSAR OS的Alarm,并对基于英飞凌Aurix TC3XX系列芯片的Vector Microsar代码和配置进行部分讲解。 文章目录 AUTOSAR OS模块详解(三) Alarm1 简介2 功能介绍2.1 触发原理2.2 工作类型2.3 Alarm启动方式2.4 Alarm配置2.5…

【0x04】HCI_Connection_Request事件详解

目录 一、事件概述 二、事件格式及参数 2.1. HCI_Connection_Request 事件格式 2.2. BD_ADDR 2.3. Class_Of_Device 2.4. Link_Type 三、主机响应 3.1. ACL链接类型 3.2. SCO或eSCO链接类型 四、应用场景 4.1. 设备配对场景 4.2. 蓝牙文件传输场景 4.3. 蓝牙物联网…

洛谷题目:P2742 [USACO5.1] 圈奶牛Fencing the Cows /【模板】二维凸包 题解 (本题较难)

题目传送门:P2742 [USACO5.1] 圈奶牛Fencing the Cows /【模板】二维凸包 - 洛谷 | 计算机科学教育新生态 (luogu.com.cn) 另:由于一些文章的疏忽,导致一些错别字,代码错误,公式错误导致大家的理解和误导,…

Qt中的按钮组:QPushButton、QToolButton、QRadioButton和QCheckBox使用方法(详细图文教程)

💪 图像算法工程师,专业从事且热爱图像处理,图像处理专栏更新如下👇: 📝《图像去噪》 📝《超分辨率重建》 📝《语义分割》 📝《风格迁移》 📝《目标检测》 &a…

2025-1-21 SUCTF 2025 crypto signin

今年充满期待,上线一看两道题,一道看名字应该是跟环相关的,估计做不出来,还有一道签到题,没做出来,遗憾下线 文章目录 signin signin from Crypto.Util.number import * from secret import flagbit_lengt…

C语言之图像文件的属性

🌟 嗨,我是LucianaiB! 🌍 总有人间一两风,填我十万八千梦。 🚀 路漫漫其修远兮,吾将上下而求索。 图像文件属性提取系统设计与实现 目录 设计题目设计内容系统分析总体设计详细设计程序实现…

【Linux】华为服务器使用U盘安装统信操作系统

目录 一、准备工作 1.1 下载UOS官方系统 1.2制作启动U盘 1.3 服务器智能管理系统iBMC 二、iBMC设置U盘启动 一、准备工作 1.1 下载UOS官方系统 服务器CPU的架构是x86-64还是aarch64),地址:统信UOS生态社区 - 打造操作系统创…

macOS如何进入 Application Support 目录(cd: string not in pwd: Application)

错误信息 cd: string not in pwd: Application 表示在当前目录下找不到名为 Application Support 的目录。可能的原因如下: 拼写错误或路径错误:确保你输入的目录名称正确。目录名称是区分大小写的,因此请确保使用正确的大小写。正确的目录名…

python麻辣香锅菜品推荐

1.推荐算法概述 推荐算法出现得很早,最早的推荐系统是卡耐基梅隆大学推出的Web Watcher浏览器导航系统,可以根据当的搜索目标和用户信息,突出显示对用户有用的超链接。斯坦福大学则推出了个性化推荐系统LIRA.AT&T实验室于1997年提出基于协作过滤的个性化推荐系统…

利用大型语言模型在量化投资中实现自动化策略

“Automate Strategy Finding with LLM in Quant investment” 论文地址:https://arxiv.org/pdf/2409.06289 摘要 这个新提出的量化股票投资框架,利用大型语言模型(LLMs)与多智能体系统相结合的方法,通过LLMs从包括数…

JAVA:Spring Boot 实现责任链模式处理订单流程的技术指南

1、简述 在复杂的业务系统中,订单流程往往需要一系列的操作,比如验证订单、检查库存、处理支付、更新订单状态等。责任链模式(Chain of Responsibility)可以帮助我们将这些处理步骤分开,并且以链式方式处理每一个操作…

(开源)基于Django+Yolov8+Tensorflow的智能鸟类识别平台

1 项目简介(开源地址在文章结尾) 系统旨在为了帮助鸟类爱好者、学者、动物保护协会等群体更好的了解和保护鸟类动物。用户群体可以通过平台采集野外鸟类的保护动物照片和视频,甄别分类、实况分析鸟类保护动物,与全世界各地的用户&…

算法专题(三):二分查找

本篇还是像之前一样,以举例子的形式向大家讲解!每道题的题目均是传送门!点击跳转对应题! 目录 一、二分查找 1.1 题目 1.2 思路 1.3 代码实现 总结(模版) 朴素版: 二、在排序数组中查找…

C# OpenCvSharp 部署文档矫正,包括文档扭曲/模糊/阴影等情况

目录 说明 效果 模型 项目 代码 下载 参考 C# OpenCvSharp 部署文档矫正,包括文档扭曲/模糊/阴影等情况 说明 地址:https://github.com/RapidAI/RapidUnDistort 修正文档扭曲/模糊/阴影等情况,使用onnx模型简单轻量部署&#xff0c…

Excel 技巧15 - 在Excel中抠图头像,换背景色(★★)

本文讲了如何在Excel中抠图头像,换背景色。 1,如何在Excel中抠图头像,换背景色 大家都知道在PS中可以很容易抠图头像,换背景色,其实Excel中也可以抠简单的图,换背景色。 ※所用头像图片为百度搜索&#x…

吴恩达深度学习——神经网络介绍

文章内容来自BV11H4y1F7uH,仅为个人学习所用。 文章目录 什么是神经网络引入神经网络神经元激活函数ReLU隐藏单元 用神经网络进行监督学习监督学习与无监督学习举例 什么是神经网络 引入 已经有六个房子的数据集,横轴为房子大小,纵轴为房子…