1、部署:
参考官网链接:https://github.com/browser-use/browser-use
这里有两点需要注意:
- 需要注意的就是python版本要求大于等于3.11。
- 部署过程中,还需要额外的两个依赖:
pip install mem0ai
pip install faiss-cpu
2、使用
这里分两种使用场景
2.1 非服务器(win、mac之类的)
示例代码test.py,这里我用的是deepseek的api:
from langchain_openai import ChatOpenAI
from browser_use import Agent
import asyncio
import os
extend_system_message = """
记住最重要的规则:
1、执行搜索任务时,优先打开 https://www.bing.com/?mkt=zh-CN 进行搜索。
2、最后的输出结果,要用中文回答用户的问题。
"""
# 明确设置虚拟的OPENAI_API_KEY环境变量,绕过框架检查
os.environ['OPENAI_API_KEY'] = 'fake-key'
# 设置实际使用的DeepSeek API Key
os.environ['DEEPSEEK_API_KEY'] = 'sk-***'
async def main():
llm = ChatOpenAI(
base_url='https://api.deepseek.com/v1',
model='deepseek-chat',
api_key=os.environ['DEEPSEEK_API_KEY']
)
agent = Agent(
task="近期发布的《提振消费专项行动方案》,有哪些值得关注的内容?",
llm=llm,
use_vision=False,
message_context=extend_system_message
)
await agent.run()
asyncio.run(main())
如果要运行上面的代码,不能直接使用
python test.py
就会报错:
ERROR [browser] ❌ Failed to create new browser session: BrowserType.launch: Target page, context or browser has been closed
正确的:
xvfb-run python test.py
xvfb-run 是一个虚拟的X server环境,可模拟图形界面运行。
2.2 服务器(没有显示器的)
参考官网示例即可
3、技术分析:
参考链接:
1、https://zhuanlan.zhihu.com/p/1885651451088462924
2、https://zhuanlan.zhihu.com/p/28582961592