從零到一打造商用 AI Agent(智能體)

Hi,大家好,我叫秋水,當前專注於 AI 智能體和 AI 工作流自動化

經常有朋友問我,如何打造一個商用 AI Agent(智能體)?

因此,在 2025 年初,我結合這兩年的 AI Agent 的開發經驗,啓動了一個合集《從零到一打造 AI Agent》。

內容包含了 AI Agent 的理論、實操和案例,我將一步步展示如何打造一個商用 AI Agent 的完整過程。

如果你是非技術人員,這對你來說非常有幫助;如果你是技術人員,這個視頻將幫助你少走一些彎路,快速上手!

全文 3900 字,可以先收藏。

關注我,及時收到後續內容。

這篇內容將從整體上介紹打造 AI Agent 的七個步驟,分別是需求梳理、軟件選型、提示工程、數據庫、構建 UI 界面、測試評估和部署發佈。

梳理需求

梳理工作流

第一步,我們需要做的工作就是梳理需求。

首先,我們需要明確,做這個 AI Agent 是爲了幫我們解決什麼問題?

記住,你需要重點梳理的是那些重複性的、機械化的、不需要太多思考的工作,越詳細越好。

當然,你也可以藉助 AI 工具,與它交流,形成初稿後,再進行補充。

你是一位工作流梳理專家,請幫我梳理 <自媒體編輯> 這個角色在日常工作中需要重複乾的工作,並標記處哪些可以由 AI 來協助,哪些主要我來去做,先以表格的形式(工作內容 / AI 協助 / 人工來做)輸出,我當認爲表格的內容完整後,我回復“繼續”,你再以 mermaid 流程圖的形式輸出,每個流程節點需要註明是否可由 AI 協助完成,流程圖爲橫向。

用到哪些工具

梳理完需求後,我們需要根據梳理的工作流,羅列出需要用到的工具。

例如,採集數據需要網頁抓取工具;發佈文章,需要對接微信公衆平臺。

因此,工具的選型也非常重要。藉助不同的工具,可以讓 AI Agent 在不同的系統之間自動化地執行任務,從而減少人工操作。

AI Agent 選型

第二步,我們需要根據場景選擇 AI Agent 開發平臺,選擇合適的大模型,並選用不同的工具來執行不同系統的操作。

選擇哪個 AI Agent 平臺

先說說 AI Agent 開發平臺,Dify、Coze、FastGPT 等這麼多無代碼 Agent 開發平臺,我們該選擇哪個比較合適呢?

更高級的開發平臺,如 LangGraph、CrewAI 等,可以讓 AI 自我規劃並執行任務,但是需要編寫代碼。

是否選擇這些平臺,取決於我們的具體需求,當然也可以混合使用。

這就要求我們深入瞭解每個開發平臺的特點,它擅長什麼、不擅長什麼,存在哪些明顯的缺陷。只有掌握了這些信息,才能根據我們的場景做出合適的選型。

選擇哪個 LLM

再說說大模型的選擇,現在有海外的 OpenAI、Claude、Gemini,也有國內的 Kimi、通義千問和近期爆火的 DeepSeek,還有一些開源模型如 LLaMA、Grok,也有像 Mistral 這樣的小模型。

那麼,基於你的 AI Agent 場景,在這麼多模型中,最合適的應該選擇哪個?

如果你沒有隱私數據,最好的選擇是 OpenAI 和 Claude,因爲它們是頭部大模型。如果你僅僅是做翻譯、總結文章等任務,選擇國內的大模型效果也差不多,當前 DeepSeek 的性價比很高。

選擇哪個模型,需要根據你的具體使用場景,當然也可以考慮混合使用。這個時候,建議你深入瞭解不同模型的能力。

這些問題,我會在後續的內容中會逐一講解。

選擇哪些工具

最後,就是工具選擇。工具是一種能力,它可以是生成一張圖片,也可以是到互聯網上去搜索,甚至可以是與一個系統進行對接。

AI Agent 開發平臺的能力僅僅是利用大模型的能力,因此,如果需要與外部系統進行交互,就需要用到工具。工具大致可以分爲有 API 接口的和無 API 接口的兩類。

有 API 接口的工具,對接起來就非常簡單。在 Coze、Dify 等平臺上,已經集成了許多工具,可以直接配置和使用。

而對於無 API 接口的工具,就需要通過 RPA(機器人流程自動化)來處理。簡單來說,RPA 是一種可以通過控制瀏覽器來執行一系列操作的自動化工具。

提示工程

第三步,提示工程是 AI Agent 的核心,好的提示詞能夠大大提升大模型輸出的準確性。

因此,我們需要掌握如何編寫有效的提示詞。

我們還需要了解與大模型交互的規則,例如:

ICIO 框架:

BROKE 框架:

CRISPE 框架:

    1. Capacity and Role(角色):明確 AI 在交互中應扮演的角色,如教育者、翻譯者或顧問。
    1. Insight(背景):提供角色扮演的背景信息,幫助 AI 理解其在特定情境下的作用。
    1. Statement(任務):直接說明 AI 需要執行的任務,確保其理解並執行用戶的請求。
    1. Personality(格式):設定 AI 回覆的風格和格式,使其更符合用戶的期望和場景需求。
    1. Experiment(實驗):如果需要,可以要求 AI 提供多個示例,以供用戶選擇最佳回覆。

CoT 框架:

Chain-of-Thought,一種引導大模型像人類一樣,按照順序一步步思考問題解決方案的方法。

主要包括 Few-Shot CoT 和 Zero-Shot CoT 兩種應用方式。

Few-Shot CoT(少量示例)

描述思考步驟,先理解客戶需求,再考慮 <目標>,最後給出推薦並解釋原因。

同時提供示例,這些示例展示 AI 如何依思維鏈思考給出答案。

Zero-Shot CoT(沒有示例)

簡單地增加一句提示詞即可:

讓我們一步步的思考(Let’s think step by step)

數據庫選型

第四步,AI Agent 運行過程中產生的聊天記錄、採集數據等內容存放到哪裏?這個時候就需要數據庫了。

對於非技術人員,我建議使用飛書的多維表格,因其可視化程度高、易於操作、對接簡單。

不足之處是,當數據量變大時,讀取速度會變慢,且無法處理複雜的業務邏輯。

而對於技術人員,可以使用 MySQL、NoSQL 等常用的數據庫。

構建 UI 界面

第五步,構建屬於你自己的 UI 界面。在 Coze 上,你可以 DIY 自己的界面,而在 Dify 上則有現成的界面,只是不能修改。

這兩個平臺也都可以發佈成服務 API,也就是說,你可以不使用它們提供的界面,而是獨立開發一個界面,與其對接。

如果你要開發自己的界面,可以藉助 Cursor 這樣的 AI 編程平臺,來定製開發一個。

還有一個原因需要你自己開發一個界面,那就是在 Coze 和 Dify 上,你可以定義多個 AI Agent,你可以用自己定義的界面來調用,這樣可以讓你在使用時,始終在一個界面上操作。

測試評估

第六步,測試評估。測試是確保你的 AI Agent 不會出現錯誤,例如程序報錯、大模型無法處理用戶請求等問題。

評估則是確保 AI Agent 輸出的回覆是正確的。在評估的過程中,我們需要不斷優化 AI Agent,確保它能夠輸出正確的回答,並減少 token 的消耗。

我們可以使用 LangSmith 來監控項目的運行。

LangSmith 幫助你更好地使用大模型:

部署發佈

第七步,部署發佈。不同的 AI Agent 開發平臺有不同的部署方式。Coze 可以直接發佈到豆包、小程序等平臺上,而 Dify 則可以直接發佈爲 Web 應用,或者嵌入到你的系統當中。

如果你是獨立開發的 AI Agent,那麼你可以購買服務器進行獨立部署。

結尾

這就是我將在合集《從零到一打造 AI Agent》裏介紹的一系列內容,非常開心與你一起深入研究這些內容,幫助你打造屬於你自己的完美 AI Agent。

本文由 Readfog 進行 AMP 轉碼,版權歸原作者所有。
來源https://mp.weixin.qq.com/s/r6VMtiqdFCcqJUMf-wUebw