Agents

《AI Agents vs. Agentic AI: A Conceptual Taxonomy, Applications and Challenges》这篇综述论文旨在严格区分人工智能代理（AI Agents）与智能体人工智能（Agentic AI），通过提供结构化的概念分类、应用图谱和挑战分析，阐明两者在设计理念和功能上的差异。研究的核心目标是为开发稳健、可扩展且可解释的人工智能驱动系统提供明确的路线图。 AI Agent的基础理解 AI Agent被定义为在特定数字环境中为实现目标导向的任务执行而设计的自主软件实体。它们能够感知结构化或非结构化输入，基于上下文信息进行推理，并启动行动以实现特定目标，通常作为人类用户或子系统的代理。 AI Agent的核心特征包括：自主性（部署后以最少的人工干预独立行动的能力）；任务特定性（为狭窄范围的任务进行优化，如调度、查询或过滤）；以及反应性与适应性（响应环境变化并利用反馈循环和基本学习启发式方法的能力）。大型语言模型（LLM）和大型图像模型（LIM）作为核心推理和感知引擎，极大地加速了AI Agent的基础性进展。生成式AI被定位为智能体智能的前身，它能生成新内容但缺乏自主性和目标追求；而AI Agent则通过集成外部工具、提示工程和增强的推理机制来推进这些能力。语言模型作为AI Agent发展的引擎将LLM集成为核心推理引擎是推动从反应式生成模型向自主、目标导向的AI Agent转变的关键驱动力。这些最初为自然语言处理任务训练的模型，日益被嵌入到需要自适应规划、实时决策和环境感知行为的框架中。为了克服仅生成式系统的局限性（如幻觉、静态知识），研究人员提出了工具增强的LLM代理，这些系统将外部工具、API和计算平台集成到代理的推理流程中，从而实现实时信息访问、代码执行和与动态数据环境的交互。例如，ReAct框架通过结合推理（思维链提示）和行动（工具使用），使LLM在内部认知和外部环境交互之间交替进行，展现了这种增强功能。从AI Agent基础看Agentic AI的出现 (The Emergence of Agentic AI from AI Agent Foundations) 尽管AI Agent在通过工具增强推理自动化狭窄任务方面取得了显著进展，但其在复杂、多步骤或协作场景中的可扩展性限制催生了更高级的范式：Agentic AI 。 Agentic AI通过允许多个智能实体通过结构化通信、共享内存和动态角色分配来协同追求目标，从而扩展了传统代理的能力。其核心概念飞跃在于从执行孤立任务的单个代理转变为由多个专业代理协作以实现复杂、高级目标的协调系统。这种转变的关键驱动因素包括目标分解、多步骤规划、跨智能体通信以及反思性推理和记忆系统。一个形象的例子是智能家居系统：一个AI Agent可能是一个单独控制温度的智能恒温器，而一个Agentic AI系统则是一个由天气预报、日程安排、能源优化等多个专业代理协同工作的完整生态系统，共同实现舒适、安全和节能的总体目标。论文通过多个表格详细对比了生成式AI、AI Agent以及Agentic AI在核心功能、架构组成、操作机制、范围与复杂性、交互与自主性等多个维度的关键差异。架构演进：从AI Agent到Agentic AI系统 Agentic AI显著扩展了AI Agent的基础架构（感知、推理、行动），通过集成专业化代理、高级推理与规划、持久性内存和编排等高级组件来实现更复杂、分布式和适应性的行为。基础AI Agent通常包含感知模块（处理输入信号）、知识表示与推理模块（应用逻辑）、行动选择与执行模块（转化决策为行动）以及基本的学习与适应机制。Agentic AI系统则在此基础上增强，例如采用专业代理的集合（每个代理负责特定功能，如MetaGPT中的角色扮演），嵌入递归推理能力（如ReAct, CoT）以进行动态规划和适应，整合持久性内存架构（如情景记忆、语义记忆、向量记忆）以跨任务周期或会话保持知识，并引入编排层或元代理来协调子代理的生命周期、管理依赖关系和解决冲突（如ChatDev中的虚拟CEO元代理）。 ...

OpenAI发布了第一批Agent构建模块，旨在帮助开发者和企业构建实用且可靠的 AI 智能体。过去一年，OpenAI推出了一系列新的模型功能，例如高级推理、多模态交互以及最新的安全技术，这些都为OpenAI的模型奠定了基础，使其能够处理构建 AI 智能体所需的复杂、多步骤任务。然而，客户反馈表明，将这些功能转化为可用于生产环境的 AI 智能体极具挑战性，通常需要大量的提示词迭代和自定义编排逻辑，且缺乏足够的可见性或内置支持。为了解决这些难题，OpenAI推出了一套全新的 API 和工具，专门用于简化 AI 智能体应用的开发：全新的 Responses API ，它结合了 Chat Completions API 的简洁性和 Assistants API 的工具使用能力，旨在帮助开发者构建 AI 智能体内置工具，包括网页搜索、文件搜索和计算机使用全新的 Agents SDK ，用于编排单 AI 智能体和多 AI 智能体工作流程集成的可观测性工具，用于追踪和检查 AI 智能体工作流程的执行情况这些新工具简化了核心 AI 智能体逻辑、编排和交互，从而显著降低了开发者构建 AI 智能体的入门门槛。在接下来的几周和几个月里，OpenAI计划发布更多工具和功能，以进一步简化和加速在OpenAI平台上构建 AI 智能体应用。隆重推出 Responses API Responses API 是OpenAI用于构建 AI 智能体的全新 API 原语，它利用 OpenAI 的内置工具，兼具 Chat Completions 的简洁性和 Assistants API 的工具使用能力。随着模型能力的不断发展，OpenAI相信 Responses API 将为开发者构建 AI 智能体应用提供更灵活的基础。通过单个 Responses API 调用，开发者将能够使用多种工具和模型交互来解决日益复杂的任务。 ...

Agents

AI Agent 与 Agentic AI：概念、应用与挑战的深度剖析

OpenAI发布一批Agent工具