当AI领域竞争激烈,新模型不断涌现时,Agent的登场虽功能场景不算惊艳,但其发布意义却远超功能本身,引发广泛关注的同时,也给老对手带来了巨大冲击。
独特技术路径
Agent具有革命性的独特技术路径,它能主动从工具箱选代理技能,用自身计算机完成任务,用户可实时观察其在虚拟环境的工作过程。这和Manus“外部缝合”调用多个底层模型不同,Agent把能力内化于模型本身,让人看到端到端通用Agent的雏形。
系统卡片信息
据Agent系统卡片显示,它是新的代理模型,和o3同属一系列,采用端到端训练方法。而从定价看,GPT的Plus套餐每月20美金能使用Agent,Manus基础计划每月19美金,差距不大,这让Manus感受到巨大压力。
核心统一系统
Agent核心是统一代理系统,整合并扩展了早期研究项目 “”和 “Deep ”的能力。这使其能在单一对话流中,无缝从推理思考切换到执行具体动作,展现出强大的连贯性和实用性。
智能工具箱配备
为完成复杂工作流,Agent配备四种工具,能依任务需求自动选最合适的工具。通过强化学习方法针对复杂任务训练,学会在工具间流畅切换协同工作,执行关键操作前还会明确请求用户许可。
实际评测表现
在极难的数学基准上,借助终端运行代码后准确率提升至27.4%。内部评测中,代理在约半数案例里与人类持平或更佳。从其做的PPT来看,在做PPT和上网冲浪能力上,相比基础模型有明显提升。
实际使用情况
实际使用简单,在对话中切到「代理模式」描述目标即可,还能设任务周期性执行。不过模型可能接触敏感数据或遭攻击,部分高风险任务启用「监督模式」,另外它最大创新是集成虚拟机环境,可让用户实时观察操作。而刚上线的Kimi K2采用开源架构,价格仅为4的1/6左右。
你认为Agent未来能否在激烈的AI市场竞争中脱颖而出?欢迎点赞、分享本文并留言参与讨论。
发表评论