star 34-6k!通過 DeepSeek 實現 AI 自動化操作瀏覽器!
如今是 AI 的時代,如果能夠通過大模型自動操作瀏覽器,無論是網頁抓取、自動化測試還是數據收集都能大大提高效率。
因爲你無須編寫和維護複雜的 xpath、正則、css 選擇器腳本。今天,喵將介紹一個非常有趣的工具——browser-use[1],並結合 DeepSeek
模型,展示通過 AI Agent 自動化操作瀏覽器。
開始使用
1. 安裝依賴
首先,你需要確保有一個基礎的 Python 環境,Python 版本要大於 3.11。
pip install browser-use
playwright install
2. 編寫測試腳本
browser-use
官方推薦使用 GPT-4 模型,但爲了降低成本,我們可以使用 DeepSeek
。官方的有點卡,我這裏使用的是硅基流動的deepseek-ai/DeepSeek-V2.5
接下來,我們可以編寫一個簡單的 Python 腳本來測試 browser-use
的功能。以下是一個示例腳本,用於獲取財聯社電報的前十條新聞資訊:
from langchain_openai import ChatOpenAI
from browser_use import Agent
import asyncio
if __name__ == '__main__':
llm = ChatOpenAI(model="deepseek-ai/DeepSeek-V2.5", api_key="api-key", base_url="https://api.siliconflow.cn")
asyncdefmain():
agent = Agent(
task="打開財聯社https://www.cls.cn/telegraph,獲取前十條資訊",
llm=llm,
use_vision=False,
)
result = await agent.run()
print(result)
asyncio.run(main())
3. 運行腳本並查看結果
運行上述腳本後,browser-use
會自動打開瀏覽器,訪問指定的財聯社地址,並獲取前十條資訊。結果將打印在控制檯中。
下面是 browser-use 獲取到的數據,並且自動轉爲了 json 格式,對於抓取數據可謂是相當友好了。
注意: 本文中的示例代碼和配置僅供參考,實際使用時請根據你的需求進行調整。
引用鏈接
[1]
browser-use: https://github.com/browser-use/browser-use
本文由 Readfog 進行 AMP 轉碼,版權歸原作者所有。
來源:https://mp.weixin.qq.com/s/MAsOWJ_BxSZ2xz_PTzSayA