AI Agent:基於大模型的自主智能體
AI Agent:探索 AGI 的真實形態
什麼是 AI Agent
AI Agent(人工智能代理)是一種能夠感知環境、進行決策和執行動作的智能實體。不同於傳統 的人工智能,AI Agent 具備通過獨立思考、調用工具去逐步完成給定目標的能力。比如,告訴 AI Agent 幫忙下單一份外賣,它就可以直接調用 APP 選擇外賣,再調用支付程序下單支付,無需人 類去指定每一步的操作。Agent 的概念由 Minsky 在其 1986 年出版的《思維的社會》一書中提出, Minsky 認爲社會中的某些個體經過協商之後可求得問題的解,這些個體就是 Agent。他還認爲 Agent 應具有社會交互性和智能性。Agent 的概念由此被引入人工智能和計算機領域,並迅速成爲 研究熱點。但苦於數據和算力限制,想要實現真正智能的 AI Agents 缺乏必要的現實條件。
Hyperwrite 研發的 AI Agent 個人助理插件實現自動預訂航班機票
大語言模型和 AI Agent 的區別在於 AI Agent 可以獨立思考並做出行動,和 RPA 的區別在於它能夠處理未知環境信息。ChatGPT 誕生後,AI 從真正意義上具備了和人類進行多輪對話的能力,並且能針對相應問題給出具體回答與建議。隨後各個領域的 “Copilot” 推出,如 Microsoft 365 Copilot、GitHub Copilot、Adobe Firefly 等,讓 AI 成爲了辦公、代碼、設計等場景的“智能副駕駛”。AI Agent 和大模型的區別在於,大模型與人類之間的交互是基於 prompt 實現的,用戶 prompt 是否清晰明確會影響大模型回答的效果,例如 ChatGPT 和這些 Copilot 都需要明確任務才能得到有用的回答。而 AI Agent 的工作僅需給定一個目標,它就能夠針對目標獨立思考並做出行動,它會根據給定任務詳細拆解出每一步的計劃步驟,依靠來自外界的反饋和自主思考,自己給自己創建 prompt,來實現目標。如果說 Copilot 是“副駕駛”,那麼 Agent 則可以算得上一個初級的“主駕駛”。和傳統的 RPA 相比,RPA 只能在給定的情況條件下,根據程序內預設好的流程來進行工作的處理,在出現大量未知信息、難以預測的環境中時,RPA 是無法進行工作的,AI Agent 則可以通過和環境進行交互,感知信息並做出對應的思考和行動。
AI Agent 的工作流程
Agent 的最終發展目標:通用人工智能 AGI
AI Agent 並不是一個新興的概念,早在多年前就已在人工智能領域有了研究。例如 2014 年由 DeepMind 推出的引發全球熱議的圍棋機器人 AlphaGo,也可以看做是 AI Agent 的一種。與之類似的還有 2017 年 OpenAI 推出的用於玩《Dota2》的 OpenAI Five,2019 年 DeepMind 公佈用於玩《星際爭霸 2》的 AlphaStar 等,這些 AI 都能根據對實時接收到的信息的分析來安排和規劃下一步的操作,均滿足 AI Agent 的基本定義。當時的業界潮流是通過強化學習的方法來對 AI Agent 進行訓練,主要應用場景是在遊戲這類具有對抗性、有明顯輸贏雙方的場景中。但如果想要在真實世界中實現通用性,基於當時的技術水平還難以實現。
AlphaGo 戰勝柯潔
OpenAI Five 戰勝《Dota 2》世界冠軍
大語言模型的浪潮推動了 AI Agent 相關研究快速發展。AI Agent 需要做到能夠像人類一樣進行交互,大語言模型強大的能力爲 AI Agent 的突破帶來了契機。大模型龐大的訓練數據集中包含了大量人類行爲數據,爲模擬類人的交互打下了堅實基礎;另一方面,隨着模型規模不斷增大,大模型湧現出了上下文學習能力、推理能力、思維鏈等類似人類思考方式的多種能力。將大模型作爲 AI Agent 的核心大腦,就可以實現以往難以實現的將複雜問題拆解成可實現的子任務、類人的自然語言交互等能力。大模型的快速發展大幅推動了 AI Agent 的發展。
大語言模型浪潮
通往 AGI 的道路仍需探索,AI Agent 是當前的主要路線。在大模型浪潮席捲全球之時,很多人認爲大模型距離真正的通用人工智能 AGI 已經非常接近,很多廠商都投入了基礎大模型的研究。但經過了一段時間後,大家對大模型真實的能力邊界有了清晰的認知,發現大模型仍存在大量的問題如幻覺、上下文容量限制等,導致其無法直接通向 AGI,於是 AI Agent 成爲了新的研究方向。通過讓大模型藉助一個或多個 Agent 的能力,構建成爲具備自主思考決策和執行能力的智能體,來繼續實現通往 AGI 的道路。OpenAI 聯合創始人 Andrej Karpathy 在一次開發者活動中講到, OpenAI 內部對 AI Agents 非常感興趣,AI Agent 將是未來 AI 的前沿方向。扎克伯格也在 Meta 的一季度財報電話會上提到,Meta 將會把 AI Agents 介紹給數十億用戶。
研究 AI Agent 的最終目標是通向 AGI
AI Agent 可以類比爲自動駕駛的 L4 階段,距離真正實現仍有差距。根據甲子光年報告,AI 與人 類的協作程度可以和自動駕駛等級進行類比。像 ChatGPT 這類對話機器人可以類比 L2 級別自動 駕駛,人類可以向 AI 尋求意見,但 AI 不直接參與工作;Copilot 這類副駕駛工具可以類比爲 L3 級 別的自動駕駛,人類和 AI 共同協作完成工作,AI 根據 prompt 生成初稿,人類僅需進行修改調整;而 Agent 則進一步升級爲 L4,人類給定一個目標,Agent 可以自己完成任務規劃、工具調用等。但就如同 L4 級別的自動駕駛還未真正實現一樣,AI Agents 容易想象和演示,卻難以實現,AI Agents 的真正應用還在不確定的未來。
AI Agent 拆解:大模型、規劃、記憶與工具
一個基於大模型的 AI Agent 系統可以拆分爲大模型、規劃、記憶與工具使用四個組件部分。6 月, OpenAI 的應用研究主管 Lilian Weng 撰寫了一篇博客,認爲 AI Agent 可能會成爲新時代的開端。她提出了 Agent = LLM + 規劃技能 + 記憶 + 工具使用的基礎架構,其中 LLM 扮演了 Agent 的 “大 腦”,在這個系統中提供推理、規劃等能力。
由 LLM 驅動的自主智能體系統的架構
大模型 + 規劃:Agent 的 “大腦”,通過思維鏈能力實現任務分解
LLM 具備邏輯推理能力,Agent 可以將 LLM 的邏輯推理能力激發出來。當模型規模足夠大的時候,LLM 本身是具備推理能力的。在簡單推理問題上,LLM 已經達到了很好的能力;但在複雜推理問題上,LLM 有時還是會出現錯誤。事實上,很多時候用戶無法通過 LLM 獲得理想的回答,原因在於 prompt 不夠合適,無法激發 LLM 本身的推理能力,通過追加輔助推理的 prompt,可以大幅提升 LLM 的推理效果。在《Large language models are zero-shot reasoners》這篇論文的測試中,在向 LLM 提問的時候追加 “Let’s think step by step” 後,在數學推理測試集 GSM8K 上的推理準確率從 10.4% 提升到了 40.7%。而 Agent 作爲智能體代理,能夠根據給定的目標自己創建合適的 prompt,可以更好地激發大模型的推理能力。
通過調整 prompt 可以提升大模型推理效果
對於需要更多步驟的複雜任務,Agent 能夠調用 LLM 通過思維鏈能力實現任務分解與規劃。在 AI Agent 的架構中,任務分解規劃的過程是基於大模型的能力來實現的。大模型具備思維鏈(Chain of Thoughts, CoT)能力,通過提示模型 “逐步思考”,利用更多的計算時間來將困難任務分解爲更小,更簡單的步驟,降低每個子任務的規模。
AI Agent 的反思框架
通過反思與自省框架,Agents 可以不斷提升任務規劃能力。AI Agent 可以對過去的行爲進行自我批評和反思,從錯誤中學習,併爲未來的步驟進行完善,從而提高最終結果的質量。自省框架使 Agents 能夠修正以往的決策、糾正之前的失誤,從而不斷優化其性能。在實際任務執行中,嘗試和錯誤是常態,反思和自省兩個框架在這個過程中起到了核心作用。
記憶:用有限的上下文長度實現更多的記憶
對 AI 智能體系統的輸入會成爲系統的記憶,與人類的記憶模式可實現一一映射。記憶可以定義爲用於獲取、存儲、保留以及隨後檢索信息的過程。人腦中有多種記憶類型,如感覺記憶、短期記憶和長期記憶。而對於 AI Agent 系統而言,用戶在與其交互過程中產生的內容都可以認爲是 Agent 的記憶,和人類記憶的模式能夠產生對應關係。感覺記憶就是作爲學習嵌入表示的原始輸入,包括文本、圖像或其他模態;短期記憶就是上下文,受到有限的上下文窗口長度的限制;長期記憶則可以認爲是 Agent 在工作時需要查詢的外部向量數據庫,可通過快速檢索進行訪問。目前 Agent 主要是利用外部的長期記憶,來完成很多的複雜任務,比如閱讀 PDF、聯網搜索實時新聞等。任務與結果會儲存在記憶模塊中,當信息被調用時,儲存在記憶中的信息會回到與用戶的對話中,由此創造出更加緊密的上下文環境。
人類記憶的分類
人類記憶與 AI Agent 記憶的映射
向量數據庫通過將數據轉化爲向量存儲,解決大模型海量知識的存儲、檢索、匹配問題。向量是 AI 理解世界的通用數據形式,大模型需要大量的數據進行訓練,以獲取豐富的語義和上下文信息,導致了數據量的指數級增長。向量數據庫利用人工智能中的 Embedding 方法,將圖像、音視頻等 非結構化數據抽象、轉換爲多維向量,由此可以結構化地在向量數據庫中進行管理,從而實現快 速、高效的數據存儲和檢索過程,賦予了 Agent“長期記憶”。同時,將高維空間中的多模態數 據映射到低維空間的向量,也能大幅降低存儲和計算的成本,向量數據庫的存儲成本比存到神經 網絡的成本要低 2 到 4 個數量級。
Embedding 技術和向量相似度計算是向量數據庫的核心。Embedding 技術是一種將圖像、音視頻等非結構化數據轉化爲計算機能夠識別的語言的方法,例如常見的地圖就是對於現實地理的 Embedding,現實的地理地形的信息其實遠遠超過三維,但是地圖通過顏色和等高線等來最大化表現現實的地理信息。在通過 Embedding 技術將非結構化數據例如文本數據轉化爲向量後,就可以通過數學方法來計算兩個向量之間的相似度,即可實現對文本的比較。向量數據庫強大的檢索功能就是基於向量相似度計算而達成的,通過相似性檢索特性,針對相似的問題找出近似匹配的結果,是一種模糊匹配的檢索,沒有標準的準確答案,進而更高效地支撐更廣泛的應用場景。
非結構化數據的向量化表徵
不同文本在向量空間中的相似度計算
工具:懂得使用工具纔會更像人類
AI Agent 與大模型的一大區別在於能夠使用外部工具拓展模型能力。懂得使用工具是人類最顯著 和最獨特的地方,同樣地,我們也可以爲大模型配備外部工具來讓模型完成原本無法完成的工作。ChatGPT 的一大缺點在於,其訓練數據只截止到了 2021 年底,對於更新一些的知識內容它無法 直接做出回答。雖然後續 OpenAI 爲 ChatGPT 更新了插件功能,能夠調用瀏覽器插件來訪問最新 的信息,但是需要用戶來針對問題指定是否需要使用插件,無法做到完全自然的回答。AI Agent 則具備了自主調用工具的能力,在獲取到每一步子任務的工作後,Agent 都會判斷是否需要通過 調用外部工具來完成該子任務,並在完成後獲取該外部工具返回的信息提供給 LLM,進行下一步 子任務的工作。OpenAI 也在 6 月爲 GPT-4 和 GPT-3.5 更新了函數調用的功能,開發者現在可以 向這兩個大模型描述函數,並讓模型智能地選擇輸出包含調用這些函數的參數的 JSON 對象。這 是一種更可靠地將 GPT 的功能與外部工具和 API 相連的新方法,允許開發者更可靠地從模型中獲 得結構化的數據,爲 AI 開發者提供了方便。
GPT 模型函數調用功能示例
AI Agent 研究與應用進展
AI Agent 發展迅速,出現多款 “出圈” 級研究成果。2023 年 3 月起,AI Agent 領域迎來了第一次“出圈”,西部世界小鎮、BabyAGI、AutoGPT 等多款重大 Agent 研究項目均在短短兩週內陸續上線,引發了大家對 AI Agent 領域的關注。
AI Agents 領域動態
AutoGPT:推動 AI Agent 研究熱潮
AutoGPT 將 AI Agent 概念帶 “出圈”。2023 年 3 月,開發人員 Significant Ggravitas 在 GitHub 上發佈了開源項目 AutoGPT,它以 GPT-4 爲驅動基礎,允許 AI 自主行動,完全無需用戶提示每個操作。給 AutoGPT 提出目標,它就能夠自主去分解任務、執行操作、完成任務。作爲 GPT-4 完全自主運行的最早示例之一,AutoGPT 迅速走紅於 AI 界,並帶動了整個 AI Agent 領域的研究與發展,它也成爲了 GitHub 排行榜 4 月增長趨勢第一名。截至 2023 年 8 月 15 日,AutoGPT 在 GitHub 上已經得到了超過 14.7 萬顆 star。
開源項目點燃開發者熱情,基於 AutoGPT 的案例應用層出不窮。基於 GPT-4 的強大能力和 AutoGPT 帶來的 Agent 熱潮,開發者們很快便基於 AutoGPT 實現了很多有趣的應用案例,例如自動實現代碼 debug、自主根據財經網站信息進行投資掙錢、自主完成複雜網站建設、進行科技產品研究並生成報告等。還有開發者爲 AutoGPT 開發了網頁版本 AgentGPT,僅需給定大模型的 API 即可實現網頁端的 AI Agent。
基於 AutoGPT 完成網站建設
AutoGPT 仍存在成本高、響應慢、出現死循環 bug 等缺點。Auto-GPT 採用的是 GPT-3.5 和 GPT-4 的 API,而 GPT-4 的單個 token 價格爲 GPT-3.5 的 15 倍。假設每次任務需要 20 個 step(理想狀況下),每個 step 會花費 4K tokens 的 GPT-4 使用量,prompt 和回覆的平均每一千 tokens 花費是 0.05 美元(因爲實際使用中回覆使用的 token 遠遠多於 prompt),假設匯率爲 1 美元 = 7 人民幣,那麼花費就是 2040.05*7=28 元人民幣。而這僅是理想狀況下,正常使用中經常出現需要拆分出幾十上百個 step 的任務,這時單個任務的處理成本就會難以接受。而且 GPT-4 的響應速度遠遠慢於 GPT-3.5,導致 step 一多的時候任務處理會變得很慢。並且 AutoGPT 在遇到 GPT-4 無法解決的 step 問題時,就會陷入死循環中,不斷重複沒有意義的 prompt 和輸出,造成大量的資源浪費和損失。
遊戲領域應用:西部世界小鎮與我的世界
斯坦福西部世界小鎮首次創造了多個智能體生活的虛擬環境。2023 年 4 月,斯坦福大學的研究者們發表了名爲《Generative Agents: Interactive Simulacra of Human Behavior》的論文,展示了一個由生成代理(Generative Agents)組成的虛擬西部小鎮。這是一個交互式的沙盒環境,在小鎮上,生活着 25 個可以模擬人類行爲的生成式 AI Agent。它們會在公園裏散步,在咖啡館喝咖啡,和同事分享當天的新聞。甚至一個智能體想舉辦情人節排隊,這些智能體在接下來的兩天裏,會自動傳播派對邀請的消息,結識新朋友,互相約對方一起去派對,還會彼此協調時間,在正確 的時間一起出現在派對上。這種 Agent 具有類似人的特質、獨立決策和長期記憶等功能,它們更接近於 “原生 AI Agent”。在這種合作模式下,Agent 不僅僅是爲人類服務的工具,它們也能夠 在數字世界中與其他 Agent 建立社交關係。
斯坦福學者打造的西部世界小鎮
記憶流是西部世界小鎮中 AI Agents 的架構核心。小鎮中的 Agents 包含三大重要的基本要素:記憶、反思和規劃,相比第二章提到的幾個核心組件略有調整。這三大基本要素都基於一個核心:記憶流(Memory Stream),記憶流存儲了 Agent 的所有經歷記錄,是一個包含了多個觀察的列 表,每個觀察都包含了事件描述、創建時間以及最近一次訪問的時間戳,觀察可以是 Agent 自己 的行爲或從其他人那裏感知到的行爲。爲了檢索最重要的記憶以傳遞給語言模型,研究者確定了 檢索過程中需要考慮的三個因素:最近性、重要性和相關性。通過確定每條記憶基於這三個因素 的分數,最後加總起來得到權重最高的記憶,作爲 prompt 的一部分傳遞給大模型,以此來決定 Agent 的下一步動作。反思和規劃都是基於記憶流中的觀察來進行更新與創建的。
ModelScopeGPT:國內首個大模型調用工具
阿里雲推出國內首個大模型調用工具 ModelScopeGPT(魔搭 GPT),是一個能實現大小模型協同的 Agent 系統。在 2023 年 7 月的世界人工智能大會上,阿里雲推出了面向開發者們的大模型調用工具魔搭 GPT。魔搭 GPT 的理念類似於浙大和微軟團隊推出的 HuggingGPT,通過魔搭 GPT,開發者可以一鍵發送指令去調用魔搭社區中的其他 AI 模型,從而實現大大小小的模型共同協作,進而完成複雜的任務。這也是國內首款大模型調用工具 Agent。
ModelScopeGPT 是阿里雲 MaaS 範式在模型使用層的重要映射,旨在建立大模型生態。阿里雲表示,構建 ModelScopeGPT 的數據集和訓練方案將會對外開放,供開發者自行調用,開發者可以根據需要對不同的大模型和小模型進行組合,幫助開發者多、快、好、省地使用大模型。目前在 AI 開發者圈,魔搭社區已成中國大模型第一門戶。所有模型生產者都可以上傳自己的模型,驗證模型的技術能力和商業化模式,並與其他社區模型進行協作,共同探索模型應用場景。ModelScopeGPT 則實現了將模型生產力進行自由組合,繼續強化阿里雲在大模型生態建設中的領先地位。
AgentBench:LLM 的 Agent 能力評估標準
清華大學聯合團隊提出世界首個大模型 AI Agent 能力的評估標準。儘管當前 AI 智能體研究異常火熱,但 AI 行業缺乏一個系統化和標準化的基準來評估 LLM 作爲 Agent 的智能水平。2023 年 8 月,清華大學、俄亥俄州立大學、加州大學伯克利分校的研究團隊便提出了首個系統性的基準測試——AgentBench,用來評估 LLM 作爲 Agent 在各種真實世界挑戰和 8 個不同環境中的能力表現(如推理和決策能力)。這 8 個環境分別是:操作系統、數據庫、知識圖譜、卡牌對戰遊戲、家務事、橫向思維謎題、網絡購物、網頁瀏覽。基於這 8 個環境,研究團隊設計了不同的真實世界挑戰,涵蓋了代碼場景和生活場景,比如用 SQL 語言從一些表格裏提取需要的數、玩卡牌遊戲取得勝利、從網頁預訂機票等。
GPT-4 性能遙遙領先,開源模型能力顯著弱於閉源模型。研究者選擇了 25 種主流的大模型 API 來進行 Agent 能力評估,涵蓋了閉源模型(如 OpenAI 的 GPT-4、GPT-3.5 等)和開源模型(LLaMA 2 和 Baichuan 等)。根據測試結果來看,GPT-4 基本上在所有環境中都佔據領先地位,是名副其實的當前大模型能力邊界。閉源模型 Anthropic 的 Claude 以及 OpenAI 的 GPT-3.5 水平相差不大,而常見的一些開源模型 Vicuna、Dolly 等由於尺寸和閉源模型相差了至少一個數量級,性能評估顯著較弱。我們認爲,雖然 LLM 能夠在自然語言交流等 NLP 上達到基本的類人水平,但在關注行動有效性、上下文長度記憶、多輪對話一致性和代碼生成執行等 Agent 重要能力上的表現仍舊相對落後,基於 LLM 的 AI Agent 的發展空間仍具潛力。
“Agent+” 有望成爲未來 AI 領域產品主流
AI Agent 有望多個領域實現落地應用
AI Agent 是釋放 LLM 潛能的關鍵,Agent 和人的合作將越來越多。當前像 GPT-4 這樣的大模型具備很強的能力,但是其性能的發揮卻主要依賴於用戶寫的 prompt 是否足夠合適。AI Agent 則將用戶從 prompt 工程中解放出來,僅需提供任務目標,以大模型作爲核心的 AI Agent 就能夠爲大模型提供行動能力,去完成目標。得益於 LLM 能力邊界的不斷髮展,AI Agent 展現出了豐富的功能性,雖然目前 Agent 還只能完成一些比較簡單的任務,但我們認爲,隨着 Agent 研究的不斷髮展,Agent 和人類的合作將越來越多,人類的合作網絡也將升級爲一個人類與 AI Agent 的自動化合作體系,人類社會的生產結構將會出現變革。
AI Agent 有望多個領域實現落地應用,有的已經出現好用的 demo 產品。AI Agent 已經在各個領域得到了初步的應用和發展,未來將有望成爲 AI 應用層的基本架構,包括 to C、to B 產品等。比如在遊戲領域,Agent 將推動遊戲裏面的每個 NPC 都具有自己的思考能力與行動路線,更加擬人化,整個遊戲的沉浸感體驗會大大增強;在軟件開發領域,Agent 可以根據目標自動完成代碼生成、試運行、bug 檢查、release 上線等過程。把 Agent 系統作爲 AI 應用產品的核心,能夠實現比僅採用大模型產品輔助人類工作更高的工作效率,人類的生產力會進一步釋放。
距離真正的 AGI 還有很長的發展之路,“Agent+” 有望成爲未來產品的主流。雖然目前有許多類別的 Agent,但大多很粗淺,遠遠談不上 AGI。即使是最簡單的 Agent 應用,語音助手或智能外呼系統,其複雜性以及如何引入環境 Feedback 等問題,都未得到有效解決。目前行業內形成的共識是,Agent 調用外部工具的方式是輸出代碼——由 LLM 輸出可執行的代碼,然後將其轉換成一種機器指令,再去調用外部的工具來執行或生成答案。OpenAI 近期推出的 Function Call 能力也證明了這一點。這也是爲什麼 GPT-4 在 Agents 系統裏很受歡迎的原因,GPT-4 強大的代碼
能力在當下仍舊找不到可替代的大模型。我們認爲,AI Agent 的研究是人類不斷探索接近 AGI 的過程,隨着 Agent 變得越來越 “可用” 和“好用”,“Agent+”的產品將會越來越多,成爲未來產品的主流發展方向。
2B + 垂類 Agent 認知正在形成,有望率先落地
2B 和垂直領域仍是 AI Agents 容易率先落地的方向。由於 Agent 對環境反饋的依賴性較強,具備顯著特點的企業環境是更加適合 Agent 建立起對某一個垂直領域認知的場景。傳統的企業與 AI 結合應用更多的是在流程任務自動化,通過定義規則來提升一線員工的工作效率。而 Agent 則能夠更進一步地提升一線員工的工作質量,通過將企業在私域業務上的知識與經驗傳授給 Agent,讓 Agent 能夠成爲該領域一個虛擬的 “專家” 智能體,去指導和幫助經驗較爲匱乏的一線員工,在讓一線員工的工作質量大幅提升的同時,也能讓一線員工快速成長起來。並且從時間上來看,一個經驗豐富的高級員工是需要很長時間的培養的,而通過訓練得到的垂類 Agent 是很容易實現低成本規模化複製的。理想狀態下,企業能夠實現給每一位一線員工都配備一位甚至多位垂類 Agent 來輔助工作,員工的單位生產力將會有大幅提升。大模型時代的到來加速了 AI 技術的平民化,我們認爲,隨着科技水平的不斷髮展,未來 5-10 年間 AI 智能的成本將會快速降低,企業爲每一位員工搭配 Agent 的願景將有望實現。
用戶對 Agent 的認知正在形成,初創企業正在卡位。當前關於 AI Agent 的研究主要還是以學術界和開發者爲主,商業化產品極少,Agent 的未來產品形態如何仍未有定論。但是用戶對於 Agent 的關注度正在提升,Agent 對於效率提升的認知正在形成,可能未來幾年間就會湧現出大量以 Agent 作爲核心的產品應用到各行各業。目前,已經有一些初創公司開始以企業的智能體平臺作爲主要的產品研發方向,打造基於 LLM 的企業級 Agent 平臺。垂直領域專家通過 Agent 平臺定義工作流程,完成工作方法論的構建,設計 Agent 對話模式以便於更清晰地表達業務;一線員工用自然語言提出需求,調度 Agent 完成任務,能夠極大地提升工作流程自動化的靈活性,降低成本,是對傳統工作方式的顛覆式創新。長遠來看,我們認爲這類 Agent 平臺有可能成爲 2B 領域人機交互的入口級平臺。
本文由 Readfog 進行 AMP 轉碼,版權歸原作者所有。
來源:https://mp.weixin.qq.com/s/28DbYV4SUdgwdIEnZC8u5A?poc_token=HNTPh2ajWGaJhma1MipJGA3gkuRIOPB61Odp2uaa