在科技界的瞩目下,OpenAI近日悄然推出了一款名为ChatGPT agent的新产品,瞬间在业界掀起了波澜。与广大用户的兴奋相比,各Agent竞品公司似乎更为激动,纷纷摩拳擦掌,准备与这位新入局者一较高下。
其中,Manus公司尤为积极,连续发布多条推文,与ChatGPT agent展开“正面交锋”。在推文中,Manus不仅晒出了自家Agent产品与ChatGPT agent的对比图,还暗示自己才是更早、更快、更好用的选择。这些推文迅速吸引了大量关注,成为业界热议的话题。
与此同时,Genspark公司也加入了这场“较量”。其创始人发布推文,展示了Genspark与ChatGPT agent的结果对比,并轻描淡写地表示,自己在同样的提示词下“一次搞定”。他还补充说:“我们不想制造什么drama,只是为整个Agent生态感到兴奋。当然,也为我们自己的丝滑体验小小自豪一下。”
这场“热闹”的较量,让人不禁感叹,这哪像是一家巨头发布新品,简直就是扔进了Agent市场的一颗“竞品炸弹”。那么,OpenAI发布的这个ChatGPT agent到底怎么样呢?能让同类产品连夜上线进入“battle”模式?
目前,ChatGPT agent已经向全部的Pro用户推出。由于需求高于预期,Plus和Team用户将于周一开始获得访问权限。为了探究这款产品的真实实力,我们搜集了一些网友的实测案例,并找来了Kimi、Manus、Minimax等几个典型的对手进行实测对比。
博主@rowancheung提前获得了ChatGPT agent的访问权限,并尝试让它生成一份完整的退休计划PPT。他输入的提示词是为年收入50万美元、希望30岁退休并拥有500万美元的人创建一个FIRE模型,包括极端储蓄率、税收优化、高效复利的投资策略等。令人惊讶的是,ChatGPT agent只用了20分钟左右的时间就完成了任务,生成了完整的PPT。
然而,当网友们看到这份PPT时,却有些失望。虽然流程顺畅,但成品显得过于简陋,只是单纯的黑白配色,缺乏美观和吸引力。
另一位用户则分享了通过ChatGPT agent准备购物清单的经历。他要求ChatGPT agent为两个人的烤肉晚餐准备一个特易购购物清单,并包括一道甜点。ChatGPT agent成功完成了任务,包括浏览网站、添加商品到购物车等步骤。但用户在评论区提到,如果是自己去做这件事情,可能会更快。
除了这些生成PPT、表格或制定计划清单的任务外,网友们还尝试了更多复杂的任务。但结果显示,ChatGPT agent在处理需要更高准确度的任务时,输出的内容经不起太多推敲。尽管如此,它仍然可以被视为一个“进化版”的ChatGPT。
为了更全面地评估ChatGPT agent的实力,我们让它与Kimi、Minimax、Manus等先前推出的产品进行了对比测试。在“加拿大退休计划”这个任务中,Manus的速度最快,十分钟不到就完成了任务,并且生成的PPT在美观度上明显优于ChatGPT agent。
Minimax则提供了更为详尽的报告,不仅包括了可下载的PPT文档,还有纯文字的PDF报告和在线浏览链接。在内容详尽度和数据可视化效果上,Minimax都做得比ChatGPT agent和Manus要好。
经过这次实测对比,我们发现ChatGPT agent虽然具备了一定的执行任务能力,但在美观度、内容详尽度和数据可视化等方面仍有提升空间。与此同时,这次ChatGPT agent的出现也传递了一个信号:AI的形态正在从“回答问题”向“执行任务”转变,大模型AI公司的野心也开始扩展到“谁来承载未来人机交互的主入口”。