Nanobrowser:又一款基於 AI 的網頁自動化工具
Nanobrowser 是一款開源的 AI 網頁自動化工具,以 Chrome 擴展形式運行在瀏覽器中。它提供了類似 OpenAI Operator 的功能,但完全免費,並支持靈活的 LLM 選項和多代理系統。本文將深入介紹 Nanobrowser 的核心特性、安裝配置方法以及實際應用場景。
核心優勢
Nanobrowser 相比其他 AI 網頁自動化工具具有以下顯著優勢:
-
完全免費:無需支付訂閱費用,只需使用自己的 API 密鑰,按實際使用量付費
-
注重隱私:所有操作在本地瀏覽器中運行,憑據不會共享給任何雲服務
-
靈活的 LLM 選項:可連接到首選的 LLM 提供商,爲不同代理選擇不同模型
-
完全開源:瀏覽器自動化過程完全透明,無黑盒或隱藏流程
目前支持 OpenAI、Anthropic 和 Gemini,未來將集成更多 LLM(經過魔改,我添加了對 Deepseek 的支持)。
主要功能
-
多代理系統:專業 AI 代理協作完成複雜的網頁工作流
-
交互式側邊欄:直觀的聊天界面,實時狀態更新
-
任務自動化:跨網站無縫自動化重複性網頁任務
-
後續問題:可以詢問已完成任務的上下文相關問題
-
對話歷史:輕鬆訪問和管理 AI 代理交互歷史
-
多 LLM 支持:連接首選 LLM 提供商,爲不同代理分配不同模型
安裝配置指南
方法一:直接安裝
- 下載:
- 從 GitHub 官方發佈頁面下載最新的
nanobrowser.zip
文件
- 安裝:
-
解壓
nanobrowser.zip
-
在 Chrome 中打開
chrome://extensions/
-
啓用
開發者模式
(右上角) -
點擊
加載已解壓的擴展程序
(左上角) -
選擇解壓後的
nanobrowser
文件夾
- 配置代理模型:
-
點擊工具欄中的 Nanobrowser 圖標打開側邊欄
-
點擊
設置
圖標(右上角) -
添加 LLM API 密鑰
-
選擇用於不同代理的模型(Navigator、Planner、Validator)
方法二:從源代碼構建
- 前提條件:
-
Node.js(v22.12.0 或更高版本)
-
pnpm(v9.15.1 或更高版本)
-
克隆倉庫:
git clone https://github.com/nanobrowser/nanobrowser.git cd nanobrowser
-
安裝依賴:
pnpm install
-
構建擴展:
pnpm build
-
加載擴展:
-
構建好的擴展位於
dist
目錄中 -
按照快速入門部分的安裝步驟將擴展加載到瀏覽器中
-
開發模式(可選):
pnpm dev
模型選擇建議
Nanobrowser 允許爲每個代理配置不同的 LLM 模型,以平衡性能和成本:
更好的性能配置
-
Planner & Validator:Claude 3.7 Sonnet
-
更好的推理和規劃能力
-
更可靠的任務驗證
-
Navigator:Claude 3.5 Haiku
-
高效的網頁導航任務
-
性能和成本的良好平衡
實際應用示例
以下是一些可以通過簡單指令完成的強大任務:
-
新聞摘要:
"前往 TechCrunch 並提取過去 24 小時內的前 10 條頭條新聞"
-
GitHub 研究:
"查找 GitHub 上星標最多的熱門 Python 倉庫,分析前 5 個倉庫,提取它們的名稱、描述、星標數、主要功能和最近更新時間。然後生成一個簡短的比較報告。"
-
購物研究:
"在亞馬遜上查找防水設計的便攜式藍牙音箱,價格低於 50 美元,電池續航至少 10 小時"
-
在搜索框搜索 MCP 相關的技術文章:(會自動在搜索框進行關鍵字搜索)
優化使用技巧
-
明確指令:提供具體、清晰的指令以獲得最佳結果
-
分解複雜任務:將複雜任務分解爲多個簡單步驟
-
利用上下文:後續問題可以基於之前的任務結果
-
監控執行:觀察代理的執行過程,必要時提供額外指導
Nanobrowser 代表了 AI 網頁自動化工具的一個重要發展方向,它通過開源、免費和靈活的方式,使更多用戶能夠利用 AI 代理進行網頁自動化。無論是個人用戶還是開發者,都可以通過 Nanobrowser 實現高效的網頁任務自動化,同時保持對數據和流程的完全控制。
對於希望探索 AI 網頁自動化但不想支付高昂訂閱費用的用戶來說,Nanobrowser 提供了一個極具吸引力的選擇。
本文由 Readfog 進行 AMP 轉碼,版權歸原作者所有。
來源:https://mp.weixin.qq.com/s/1EfV7rx8LdmX8F-OhdbIUA