從零到一打造商用 AI Agent（智能體）

Hi，大家好，我叫秋水，當前專注於 AI 智能體和 AI 工作流自動化

經常有朋友問我，如何打造一個商用 AI Agent（智能體）？

是選擇 Coze？Dify？還是 LangGraph ？
過程中有哪些注意事項？
我的數據應該存儲在哪裏？
爲什麼某些網頁用這個工具無法抓取到內容？
······

因此，在 2025 年初，我結合這兩年的 AI Agent 的開發經驗，啓動了一個合集《從零到一打造 AI Agent》。

內容包含了 AI Agent 的理論、實操和案例，我將一步步展示如何打造一個商用 AI Agent 的完整過程。

如果你是非技術人員，這對你來說非常有幫助；如果你是技術人員，這個視頻將幫助你少走一些彎路，快速上手！

全文 3900 字，可以先收藏。

關注我，及時收到後續內容。

這篇內容將從整體上介紹打造 AI Agent 的七個步驟，分別是需求梳理、軟件選型、提示工程、數據庫、構建 UI 界面、測試評估和部署發佈。

梳理需求

梳理工作流

第一步，我們需要做的工作就是梳理需求。

首先，我們需要明確，做這個 AI Agent 是爲了幫我們解決什麼問題？

如果你是一位自媒體從業者，可能會希望做一個 AI Agent 來幫你處理一些重複性的工作，如找對標、找熱點、做分析、寫初稿等，這樣你可以把精力集中在內容創作上；
如果你是一位貿易公司的老闆，可能會希望做一個 AI Agent 來幫你彙集來自不同平臺的訂單，並在各個平臺之間進行產品詢價和價格比較。

記住，你需要重點梳理的是那些重複性的、機械化的、不需要太多思考的工作，越詳細越好。

當然，你也可以藉助 AI 工具，與它交流，形成初稿後，再進行補充。

你是一位工作流梳理專家，請幫我梳理 <自媒體編輯> 這個角色在日常工作中需要重複乾的工作，並標記處哪些可以由 AI 來協助，哪些主要我來去做，先以表格的形式（工作內容 / AI 協助 / 人工來做）輸出，我當認爲表格的內容完整後，我回復“繼續”，你再以 mermaid 流程圖的形式輸出，每個流程節點需要註明是否可由 AI 協助完成，流程圖爲橫向。

用到哪些工具

梳理完需求後，我們需要根據梳理的工作流，羅列出需要用到的工具。

例如，採集數據需要網頁抓取工具；發佈文章，需要對接微信公衆平臺。

因此，工具的選型也非常重要。藉助不同的工具，可以讓 AI Agent 在不同的系統之間自動化地執行任務，從而減少人工操作。

AI Agent 選型

第二步，我們需要根據場景選擇 AI Agent 開發平臺，選擇合適的大模型，並選用不同的工具來執行不同系統的操作。

選擇哪個 AI Agent 平臺

先說說 AI Agent 開發平臺，Dify、Coze、FastGPT 等這麼多無代碼 Agent 開發平臺，我們該選擇哪個比較合適呢？

Coze 只能使用雲端，不能在本地部署。
Dify 是完全開源的，沒有限制，但在知識問答方面的能力較弱。
FastGPT 的使用有一定限制，但在知識回答方面的能力相對較強。

更高級的開發平臺，如 LangGraph、CrewAI 等，可以讓 AI 自我規劃並執行任務，但是需要編寫代碼。

是否選擇這些平臺，取決於我們的具體需求，當然也可以混合使用。

這就要求我們深入瞭解每個開發平臺的特點，它擅長什麼、不擅長什麼，存在哪些明顯的缺陷。只有掌握了這些信息，才能根據我們的場景做出合適的選型。

選擇哪個 LLM

再說說大模型的選擇，現在有海外的 OpenAI、Claude、Gemini，也有國內的 Kimi、通義千問和近期爆火的 DeepSeek，還有一些開源模型如 LLaMA、Grok，也有像 Mistral 這樣的小模型。

那麼，基於你的 AI Agent 場景，在這麼多模型中，最合適的應該選擇哪個？

如果你沒有隱私數據，最好的選擇是 OpenAI 和 Claude，因爲它們是頭部大模型。如果你僅僅是做翻譯、總結文章等任務，選擇國內的大模型效果也差不多，當前 DeepSeek 的性價比很高。

選擇哪個模型，需要根據你的具體使用場景，當然也可以考慮混合使用。這個時候，建議你深入瞭解不同模型的能力。

• 小模型和大模型有什麼區別？
• 哪個模型的推理能力最強？
• 8K、32K 等同一個模型的不同大小有什麼區別？
• 如果本地部署，什麼樣的配置能運行什麼樣的模型？這些模型的能力如何？
• 如果使用雲端大模型，模型的計費單價是多少？
• 是否可以混合使用不同的模型？
• 企業隱私數據能否使用雲端大模型？

這些問題，我會在後續的內容中會逐一講解。

選擇哪些工具

最後，就是工具選擇。工具是一種能力，它可以是生成一張圖片，也可以是到互聯網上去搜索，甚至可以是與一個系統進行對接。

AI Agent 開發平臺的能力僅僅是利用大模型的能力，因此，如果需要與外部系統進行交互，就需要用到工具。工具大致可以分爲有 API 接口的和無 API 接口的兩類。

有 API 接口的工具，對接起來就非常簡單。在 Coze、Dify 等平臺上，已經集成了許多工具，可以直接配置和使用。

而對於無 API 接口的工具，就需要通過 RPA（機器人流程自動化）來處理。簡單來說，RPA 是一種可以通過控制瀏覽器來執行一系列操作的自動化工具。

提示工程

第三步，提示工程是 AI Agent 的核心，好的提示詞能夠大大提升大模型輸出的準確性。

一個好的提示詞能幫助 AI Agent 準確地理解任務，提高大模型的輸出質量。
一個好的提示詞可以減少 token 的消耗，降低成本。
一個好的提示詞可以幫助 AI Agent 理解上下文，確保對話的連貫性。

因此，我們需要掌握如何編寫有效的提示詞。

• 什麼是 CRISPE 框架？
• 什麼是 BROKE 框架？
• 什麼是 ICIO 框架？
• 什麼是 CoT（思維鏈）？

我們還需要了解與大模型交互的規則，例如：

• 一篇長文分多次輸出比一次性輸出的質量更高。
• 使用不同的符號將不同信息分隔開，可以增強大模型的理解。
• 給出示例能幫助大模型快速理解你的要求。
• 對於複雜任務，將其拆解爲若干步驟，引導大模型分步執行，效果更佳。
• 明確輸出內容的限定，如字數、格式、風格、語言難度等。

ICIO 框架：

• Intruction（任務）：明確指出希望 AI 執行的具體任務，如 “翻譯一段文本” 或“撰寫一篇關於 AI 倫理的博客文章”。
• Context（背景）：提供任務的背景信息，幫助 AI 理解任務的上下文，例如，“這段文本是用於公司內部會議的開場白”。
• Input Data（輸入數據）：指定 AI 需要處理的具體數據，如 “請翻譯以下句子：‘人工智能正在改變世界’”。
• Output Indicator（輸出格式）：設定期望的輸出格式和風格，例如，“請以正式的商務英語風格翻譯”。

BROKE 框架：

• Background（背景）：例如，“你正在爲一家初創科技公司撰寫一篇關於其最新產品的新聞稿。”
• Role（角色）：指定 AI 作爲 “新聞稿撰寫者”，以便它能夠以專業的角度回答問題。
• Objectives（目標 / 任務）：給出任務描述，如 “撰寫一篇吸引人的新聞稿，突出產品的獨特賣點。”
• Key Result（關鍵結果）：設定回答的關鍵結果，例如，“使用正式和專業的語言，包含產品的主要功能和市場定位。”
• Evolve（改進）：在 AI 給出回答後，提供三種改進方法，如 “調整語言風格以吸引目標受衆”，“增加產品使用案例”，或 “優化結構以提高閱讀流暢性”。

CRISPE 框架：

1. Capacity and Role（角色）：明確 AI 在交互中應扮演的角色，如教育者、翻譯者或顧問。
1. Insight（背景）：提供角色扮演的背景信息，幫助 AI 理解其在特定情境下的作用。
1. Statement（任務）：直接說明 AI 需要執行的任務，確保其理解並執行用戶的請求。
1. Personality（格式）：設定 AI 回覆的風格和格式，使其更符合用戶的期望和場景需求。
1. Experiment（實驗）：如果需要，可以要求 AI 提供多個示例，以供用戶選擇最佳回覆。

CoT 框架：

Chain-of-Thought，一種引導大模型像人類一樣，按照順序一步步思考問題解決方案的方法。

主要包括 Few-Shot CoT 和 Zero-Shot CoT 兩種應用方式。

Few-Shot CoT（少量示例）

描述思考步驟，先理解客戶需求，再考慮 <目標>，最後給出推薦並解釋原因。

同時提供示例，這些示例展示 AI 如何依思維鏈思考給出答案。

Zero-Shot CoT（沒有示例）

簡單地增加一句提示詞即可：

讓我們一步步的思考（Let’s think step by step）

數據庫選型

第四步，AI Agent 運行過程中產生的聊天記錄、採集數據等內容存放到哪裏？這個時候就需要數據庫了。

對於非技術人員，我建議使用飛書的多維表格，因其可視化程度高、易於操作、對接簡單。

不足之處是，當數據量變大時，讀取速度會變慢，且無法處理複雜的業務邏輯。

而對於技術人員，可以使用 MySQL、NoSQL 等常用的數據庫。

構建 UI 界面

第五步，構建屬於你自己的 UI 界面。在 Coze 上，你可以 DIY 自己的界面，而在 Dify 上則有現成的界面，只是不能修改。

這兩個平臺也都可以發佈成服務 API，也就是說，你可以不使用它們提供的界面，而是獨立開發一個界面，與其對接。

如果你要開發自己的界面，可以藉助 Cursor 這樣的 AI 編程平臺，來定製開發一個。

還有一個原因需要你自己開發一個界面，那就是在 Coze 和 Dify 上，你可以定義多個 AI Agent，你可以用自己定義的界面來調用，這樣可以讓你在使用時，始終在一個界面上操作。

測試評估

第六步，測試評估。測試是確保你的 AI Agent 不會出現錯誤，例如程序報錯、大模型無法處理用戶請求等問題。

評估則是確保 AI Agent 輸出的回覆是正確的。在評估的過程中，我們需要不斷優化 AI Agent，確保它能夠輸出正確的回答，並減少 token 的消耗。

我們可以使用 LangSmith 來監控項目的運行。

LangSmith 幫助你更好地使用大模型：

• 調試和測試：它可以幫助你找出程序中的問題，並提供解決方案，確保 AI Agent 能夠正確地回答問題或完成任務。
• 評估：通過創建各種測試案例，來測試 AI Agent 的表現，比如它回答問題的準確性和可靠性。
• 監控：它可以實時觀察 AI Agent 的工作狀態，比如處理請求的速度、花費的成本等。
• 日誌記錄：它可以記錄 AI Agent 在工作過程中所有的詳細信息，包括接收到的問題、給出的回答以及使用的參數等，方便你進行分析和改進。

部署發佈

第七步，部署發佈。不同的 AI Agent 開發平臺有不同的部署方式。Coze 可以直接發佈到豆包、小程序等平臺上，而 Dify 則可以直接發佈爲 Web 應用，或者嵌入到你的系統當中。

如果你是獨立開發的 AI Agent，那麼你可以購買服務器進行獨立部署。

結尾

這就是我將在合集《從零到一打造 AI Agent》裏介紹的一系列內容，非常開心與你一起深入研究這些內容，幫助你打造屬於你自己的完美 AI Agent。

本文由 Readfog 進行 AMP 轉碼，版權歸原作者所有。
來源：https://mp.weixin.qq.com/s/r6VMtiqdFCcqJUMf-wUebw