Nanobrowser:又一款基於 AI 的網頁自動化工具

Nanobrowser 是一款開源的 AI 網頁自動化工具,以 Chrome 擴展形式運行在瀏覽器中。它提供了類似 OpenAI Operator 的功能,但完全免費,並支持靈活的 LLM 選項和多代理系統。本文將深入介紹 Nanobrowser 的核心特性、安裝配置方法以及實際應用場景。

核心優勢 

Nanobrowser 相比其他 AI 網頁自動化工具具有以下顯著優勢:

  1. 完全免費:無需支付訂閱費用,只需使用自己的 API 密鑰,按實際使用量付費

  2. 注重隱私:所有操作在本地瀏覽器中運行,憑據不會共享給任何雲服務

  3. 靈活的 LLM 選項:可連接到首選的 LLM 提供商,爲不同代理選擇不同模型

  4. 完全開源:瀏覽器自動化過程完全透明,無黑盒或隱藏流程

目前支持 OpenAI、Anthropic 和 Gemini,未來將集成更多 LLM(經過魔改,我添加了對 Deepseek 的支持)。

主要功能 

安裝配置指南 

方法一:直接安裝

  1. 下載
  1. 安裝
  1. 配置代理模型

方法二:從源代碼構建

  1. 前提條件
  1. 克隆倉庫

    git clone https://github.com/nanobrowser/nanobrowser.git
    cd nanobrowser
  2. 安裝依賴

    pnpm install
  3. 構建擴展

    pnpm build
  4. 加載擴展

  1. 開發模式(可選):

    pnpm dev

模型選擇建議 

Nanobrowser 允許爲每個代理配置不同的 LLM 模型,以平衡性能和成本:

更好的性能配置

實際應用示例 

以下是一些可以通過簡單指令完成的強大任務:

  1. 新聞摘要

    "前往 TechCrunch 並提取過去 24 小時內的前 10 條頭條新聞"

  2. GitHub 研究

    "查找 GitHub 上星標最多的熱門 Python 倉庫,分析前 5 個倉庫,提取它們的名稱、描述、星標數、主要功能和最近更新時間。然後生成一個簡短的比較報告。"

  3. 購物研究

    "在亞馬遜上查找防水設計的便攜式藍牙音箱,價格低於 50 美元,電池續航至少 10 小時"

  4. 在搜索框搜索 MCP 相關的技術文章:(會自動在搜索框進行關鍵字搜索)

優化使用技巧 

Nanobrowser 代表了 AI 網頁自動化工具的一個重要發展方向,它通過開源、免費和靈活的方式,使更多用戶能夠利用 AI 代理進行網頁自動化。無論是個人用戶還是開發者,都可以通過 Nanobrowser 實現高效的網頁任務自動化,同時保持對數據和流程的完全控制。

對於希望探索 AI 網頁自動化但不想支付高昂訂閱費用的用戶來說,Nanobrowser 提供了一個極具吸引力的選擇。

本文由 Readfog 進行 AMP 轉碼,版權歸原作者所有。
來源https://mp.weixin.qq.com/s/1EfV7rx8LdmX8F-OhdbIUA