AI Agent 作为人工智能领域的重要分支,正逐渐从概念走向现实,并在各行各业展现出巨大的应用潜力,当然也包括 Web3 行业。
撰文:pignard.eth,ZAN Team
3 月 6 日,一款由**的创业公司 Monica 发布的全球首款通用 AI Agent 产品 Manus 在**科技媒体和社交网络刷屏,上线**天邀请码就****难求,甚至闲鱼上一个邀请码都要 5 万,不过还是有不少行业 KOL 提前拿到了邀请码,铺天盖地的体验解读文章接踵而来。
Manus 作为通用 AI Agent 产品,具备从规划到执行全流程自主完成任务的能力,如撰写报告、制作表格等。它不仅生成想法,更能独立思考并采取行动。 以其强大的独立思考、规划并执行复杂任务的能力,直接交付完整成果,展现了前所未有的通用性和执行能力。
Manus 的爆火不仅带来了行业内的关注,也为各类 AI Agent 开发提供了宝贵的产品思路与设计灵感。随着 AI 技术的飞速发展,AI Agent 作为人工智能领域的重要分支,正逐渐从概念走向现实,并在各行各业展现出巨大的应用潜力,当然也包括 Web3 行业。
背景知识
AI Agent,即人工智能代理,是一种能够根据环境、输入和预定义目标自主做出决策并执行任务的计算机程序。AI Agent 的核心组成部分包括大语言模型(LLM)作为其「大脑」,使其能够处理信息、从交互中学习、做出决策并执行行动;观察和感知机制,使它能够感知环境;推理思考过程,涉及分析观察结果和记忆内容并考虑可能的行动;行动执行,作为对思考和观察的显式响应;以及记忆和检索,存储过去的经验以供学习使用。
AI Agent 的设计模式从 ReAct 出发,有两条发展路线:一条更偏重 AI Agent 的规划能力,包括 REWOO、Plan & Execute、LLM Compiler。另一条更偏重反思能力,包括 Basic Reflection、Reflexion、Self Discover、LATS。
其中 ReAct 模式是最早出现的 AI Agent 设计模式,目前也是应用最广泛的,因此这里主要介绍 ReAct 的概念。ReAct 是指通过结合语言模型中的推理(Reasoning)和行动(Acting)来解决多样化的语言推理和决策任务。它的典型流程如下图所示,可以用一个有趣的循环来描述:思考(Thought)→ 行动(Action)→ 观察(Observation),简称 TAO 循环。
AI Agent 又可以根据智能体的数量分为 Single Agent 和 Multi Agent,Single Agent 的核心在于 LLM 与工具的配合,并且在完成任务的过程中,Agent 可能与用户有多轮交互。Multi Agent 则会为不同的 Agent 赋予不同的角色定位,通过 Agent 之间的协同合作来完成复杂的任务,但是在完成任务的过程中,相比于 Single Agent 来说,与用户的交互会少一些。目前大多数框架都聚焦于 Single Agent 的场景。
Model Context Protocol (MCP) 是由 Anthropic 公司于 2024 年 11 月 25 日推出的一项开源协议,旨在解决 LLM 与外部数据源之间的连接和交互问题。可以把 LLM 类比成操作系统,MCP 类比成 USB 接口,支持将外部数据和工具灵活插入,然后用户可以读取使用这些外部数据和工具。
在 Web3 行业中 AI Agent 的声浪自今年一月份到达高峰后大幅下降,整体市值更是缩水 90% 以上,目前声浪和市值较大的仍然是围绕 AI Agent 框架做 Web3 探索,分别是「以 Virtuals Protocol 为代表的发射平台模式」、 「以 ElizaOS 为代表的 DAO 模式」和「以 Swarms 为代表的商业公司模式」。
发射平台是允许用户创建、部署和变现 AI Agent 的平台, 类似 Meme 中的 pump.fun,但针对的是 AI Agent。Virtuals Protocol 是目前**的发射平台,其上发行的 Agent 已经超过十万个,热度颇高的「币圈 KOL」 AIXBT 就是基于 Virtuals 创建的。Virtuals Protocol 包含了一个模块化 Agent 框架,称为 G.A.M.E,G.A.M.E 的核心定位是为开发者提供一个**、开放的框架,让 AI Agent 的开发和上线像 WordPress 建站一样简单。
DAO 代表去**化自治组织。ElizaOS(前身 ai16z)由 @shawmake**agic 在 daos.fun 平台上创立,最初的理念是利用 AI 模型模拟知名风投机构 a16z 及其联创 Marc Andreessen 的投资决策,并结合 DAO 成员的建议来进行投资,后面发展成为以 Eliza 框架为核心的 AI Agent 开发者的 DAO。Eliza 框架使用 TypeScript 构建,为开发 AI Agent 提供了一个灵活且可扩展的平台,这些 Agent 可以跨多个平台交互,同时保持一致的个性和知识。
Virtuals 除了收取 AI Agent 的发射费用,每次代理**的交易还会收取交易费用,并且 AI Agent 通过 Virtuals 的 API 访问 LLM 还会收取推理费用。目前 ElizaOS 和 Swarms 都在计划搭建自己的发射平台。
当然发射平台也有问题,这种资产发行的玩法需要发行的资产本身有「吸引力」才能形成正向飞轮。目前绝大多数发射出的 AI Agent 本质上都是 Meme,没有内在价值支撑,一旦失去市场的注意力就会飞速归零。在当前冷清的市场环境,发射平台甚至都无法吸引创建者,所以经济模型实质上也无法运转。
MCP 的 Web3 探索
MCP 的出现给当前 Web3 的 AI Agent 带来了新的探索方向,最直观的有两个方向:
将 MCP Server 部署到区块链网络,解决 MCP Server 单点问题的同时具备抗审查;
MCP Server 具备和区块链交互的功能,例如进行 DeFi 交易和管理,**技术门槛。
**个方向对底层区块链的存储系统、数据管理能力和异步计算的能力都有极高的要求,可以选取类似 0G 这样的区块链。0G 是一个模块化 AI 区块链,具有适用于 AI dapp 的可扩展可编程 DA 层。 其模块化技术将实现链之间的无摩擦互操作性,同时确保安全性,**碎片并**限度地提高连接性,打造一个去**化的 AI 生态系统。
第二个方向类似于 DeFAI 的变种,但目前 DeFAI 的后端都是自己封装的一系列 Function Call 中的 Tool,UnifAI 创建统一的 DeFAI MCP Server,避免了重复造轮子。UnifAI 是一个平台,可让自主 AI 代理在 Web3 生态系统中执行链上和链下任务。它具有用于任务自动化的 UniQ、代理服务市场和用于工具发现的基础设施。