單 Agent 的核心步驟:
一、任務(wù)規(guī)劃 1. 輸入:query + tools 2. 模型:deepseek-r1 / claude-3.7-think / gpt-4o 3. 提示詞:理解用戶輸入,挑選合適工具,返回需要調(diào)用的工具+對(duì)應(yīng)參數(shù),輸出 DSL 4. 響應(yīng): [ { type: text: content: how-to-do} { type: tools, content:[ { name: tool1, arguments: {} }, { name: tool2, arguments: {} } ] } ]
二、Agent 執(zhí)行 1. 并行分發(fā)執(zhí)行任務(wù)到 tool1, tool2 對(duì)應(yīng)的 sub- agent 2. sub-agent 執(zhí)行 function,返回?cái)?shù)據(jù)給調(diào)度者
三、結(jié)果驗(yàn)證 1. 拿query + tools 執(zhí)行結(jié)果,驗(yàn)證當(dāng)前上下文信息是否足夠回答問題 2. 信息充足,直接回答 3. 信息不足,返回下一步應(yīng)該執(zhí)行的 tools 列表 4. 提示詞工程:上下文信息,tools 功能描述, tools 執(zhí)行結(jié)果、判斷依據(jù)、退出條件
sub-agent 的實(shí)現(xiàn)邏輯:
1. 簡(jiǎn)單版:調(diào)用 function,返回結(jié)果 2. 完整版:規(guī)劃 -> 執(zhí)行(sub sub agent ) -> 驗(yàn)證
原子功能 agent:
1. 聯(lián)網(wǎng)搜 2. 執(zhí)行命令 / 創(chuàng)建文件 / 寫入內(nèi)容 3. 生成代碼 4. browser use
由內(nèi)向外的套娃實(shí)現(xiàn):
1. 在聯(lián)網(wǎng)搜 agent 上面包一層,實(shí)現(xiàn) query rewrite,reranking 等功能,做成一個(gè) ai search agent 2. 在生成代碼 agent 上面包一層,規(guī)劃項(xiàng)目路徑,生成項(xiàng)目文件,做成一個(gè) ai coding agent
由外向內(nèi)的調(diào)度邏輯:
1. 外層 agent:規(guī)劃 -> 調(diào)度 -> 驗(yàn)證 2. 內(nèi)層 agent:執(zhí)行 -> 重試 -> 返回結(jié)果
重點(diǎn):
1. 依賴模型的理解能力,能否精準(zhǔn)識(shí)別并分發(fā)任務(wù)到指定 agent 2. 業(yè)務(wù)抽象能力,越上層的 agent,業(yè)務(wù)功能越復(fù)雜,相當(dāng)于一個(gè)垂直賽道的產(chǎn)品 3. 原子抽象能力,把業(yè)務(wù)無關(guān)的功能,抽成原子 agent,比如搜索,讀寫文件,瀏覽器操作(browser use)
幾種產(chǎn)品形態(tài):
1. 純?cè)贫送ㄓ?agent,以Manus 為代表,自定義很多原子 agent,上層業(yè)務(wù) agent 占大頭,執(zhí)行任務(wù)慢,token 消耗高 2. 純本地通用 agent,還未有代表產(chǎn)品,以海量的 mcp server 作為原子 agent,制作少量的上層業(yè)務(wù) agent,理論上執(zhí)行任務(wù)更高效,成本問題也更好解決 3. 云端垂類 agent,以 same 為代表,只需要在少量原子 agent 基礎(chǔ)上實(shí)現(xiàn)一個(gè)上層業(yè)務(wù) agent 即可,實(shí)現(xiàn)更簡(jiǎn)單,效果更收斂
我個(gè)人看好以海量 MCP Server 為原子 agent 的超級(jí) Agent 產(chǎn)品。MCP so 最近也在做 Server Hosting 方面的事情。
關(guān)于用套娃模式實(shí)現(xiàn)超級(jí)智能體的一些思考
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
chenxiaoyun
半自動(dòng)人工智障點(diǎn)贊?rùn)C(jī)
瀏覽 2864
贊 2
相關(guān)推薦





暫無評(píng)論,快來評(píng)論吧!