star 34-6k!通過 DeepSeek 實現 AI 自動化操作瀏覽器!

如今是 AI 的時代,如果能夠通過大模型自動操作瀏覽器,無論是網頁抓取、自動化測試還是數據收集都能大大提高效率。

因爲你無須編寫和維護複雜的 xpath、正則、css 選擇器腳本。今天,喵將介紹一個非常有趣的工具——browser-use[1],並結合 DeepSeek 模型,展示通過 AI Agent 自動化操作瀏覽器。

開始使用

1. 安裝依賴

首先,你需要確保有一個基礎的 Python 環境,Python 版本要大於 3.11。

pip install browser-use
playwright install

2. 編寫測試腳本

browser-use 官方推薦使用 GPT-4 模型,但爲了降低成本,我們可以使用 DeepSeek 。官方的有點卡,我這裏使用的是硅基流動的deepseek-ai/DeepSeek-V2.5

接下來,我們可以編寫一個簡單的 Python 腳本來測試 browser-use 的功能。以下是一個示例腳本,用於獲取財聯社電報的前十條新聞資訊:

from langchain_openai import ChatOpenAI
from browser_use import Agent
import asyncio

if __name__ == '__main__':
    llm = ChatOpenAI(model="deepseek-ai/DeepSeek-V2.5", api_key="api-key", base_url="https://api.siliconflow.cn")
    asyncdefmain():
        agent = Agent(
            task="打開財聯社https://www.cls.cn/telegraph,獲取前十條資訊",
            llm=llm,
            use_vision=False,
        )
        result = await agent.run()
        print(result)

    asyncio.run(main())

3. 運行腳本並查看結果

運行上述腳本後,browser-use 會自動打開瀏覽器,訪問指定的財聯社地址,並獲取前十條資訊。結果將打印在控制檯中。

下面是 browser-use 獲取到的數據,並且自動轉爲了 json 格式,對於抓取數據可謂是相當友好了。

注意: 本文中的示例代碼和配置僅供參考,實際使用時請根據你的需求進行調整。

引用鏈接

[1] browser-use: https://github.com/browser-use/browser-use



本文由 Readfog 進行 AMP 轉碼,版權歸原作者所有。
來源https://mp.weixin.qq.com/s/MAsOWJ_BxSZ2xz_PTzSayA