在科技日新月异的今天,AI Agent正逐渐从理论走向实践,被视为引领人类文明进入新纪元的“火种”。2024年,这一概念热度空前,不仅因为大模型赛道竞争激烈且趋于饱和,更因为AI Agent被视为大模型落地应用的最优解,能够突破LLMs在具体场景中的局限性。
那么,当前AI Agent的采用现状如何?哪些领域正率先迈出步伐?为了解答这些问题,我们深入分析了LangChain与Langbase发布的两份关于AI Agent的权威报告,试图揭示其在开发与采用过程中的关键信息。
首先,从采用主体来看,LangChain的调查显示,超过半数的受访者已经在生产环境中部署了AI Agent,且超过七成计划在未来引入。中型企业在采用上最为积极,而非科技公司与科技公司的采用率几乎持平。Langbase的数据则显示,虽然目前AI(非AI Agent)的实验用途仍大于生产用途,但生产用途正在稳步增长。
在AI Agent的基座大模型方面,OpenAI凭借76%的采用率占据主导地位,谷歌则以59%的采用率迅速崛起,成为其强劲对手。Anthropic、meta的Llama、Mistral和Cohere等也展现出一定的竞争力。各大模型在不同领域的应用也各有千秋,如OpenAI在技术和营销领域领先,谷歌在健康和翻译领域表现出色。
在选择AI Agent基座大模型时,准确性被受访者视为最重要的因素,其次是安全性和可定制性,成本影响相对较小。这一结果与企业采用AI Agent时的顾虑基本一致。
在具体应用场景上,LangChain的调查显示,研究与总结、个人生产力工具和客户服务是AI Agent的主要应用领域。这些场景体现了AI Agent在提炼关键信息、提升个人效率和快速处理客户咨询方面的强大能力。而Langbase的数据则显示,软件开发是AI大模型应用最广泛的领域,其次是文本摘要、市场营销等。
然而,在生产中采用AI Agent也面临诸多挑战。性能质量是首要关注点,远超成本和安全等因素。AI Agent依赖LLM“黑盒”控制工作流程,带来不可预测性,增加了出错风险。知识不足和时间有限也是团队面临的主要问题。Langbase的调查还显示,复杂的扩展和部署过程、数据隐私和安全合规性、缺乏监控工具和高昂的基础设施成本也阻碍了AI Agent的落地应用。
在AI Agent的开发过程中,定制化难度高、缺乏用于质量保证的评估方法和可重复使用的基础设施不足是关键挑战。开发者对版本控制、强大的SDK、库生态系统和本地开发环境等功能表示出强烈需求。同时,多代理RAG能力、评估工具和多代理流水线也是实现复杂任务的关键技术。
展望未来,企业在采用AI Agent时既充满期待也面临挑战。期待AI Agent能够处理多步骤任务、自动化重复性任务、优化任务分配与协作,并具备类人推理能力。然而,AI Agent的黑盒机制仍是一大难题,工程师难以向团队和利益相关者解释其功能和行为。开源AI Agent的兴起和更强大模型的期待也为企业带来了新的机遇和挑战。