近日,一款拥有超过2亿日活跃用户的国民级AI应用——豆包,正式上线专业版,并同步发布了其最新的2.1系列大模型。此次更新引入了全新的“办公任务模式”,标志着豆包正式迈入Agent驱动的新时代。
在专业版中,用户可以体验到豆包2.1 Pro模型的强大能力,而免费用户则可以使用豆包2.1 Turbo模型。这一模式的核心在于,它能够自主完成一个完整的工作目标,包括拆解任务步骤、调用本地电脑、浏览器以及飞书办公套件等工具,最终产出可直接交付使用的工作成品,如行业报告、数据分析表、PPT,甚至带后端数据库的网站。
一个引人注目的Demo展示了豆包2.1 Pro在芯片设计RTL测试中的表现。该模型连续运行近18小时,完成了6个核心模块、1303行RTL代码的编写,并经历了9轮迭代,成功跑通了仿真、测试、综合检查等完整工程流程。这一成果展示了豆包在真实工程场景中的生产级Coding交付能力,而过去完成类似任务需要3到5名工程师数周的时间。
办公任务模式的推出,不仅为专业用户提供了强大的工具,也兼顾了免费用户的需求。免费用户的功能和额度保持不变,但底层模型升级为豆包2.1 Turbo,能力显著提升。办公任务模式还在一定额度内向所有用户免费开放,让更多人能够体验到Agent带来的便利。
为了验证办公任务模式的实际效果,进行了三个不同难度的场景测试。在第一个场景中,豆包被要求设计一个可复用的本地软件,用于检测重复照片中质量最好的,并将其余照片放入回收站。豆包不仅成功完成了任务,还根据用户反馈添加了一个极简UI,使得即使不会运行Python代码的人也能轻松操作。
第二个场景则聚焦于财报数据分析。豆包被要求整理近半年全球AI芯片行业的财报核心数据,对比英伟达和AMD两家公司的营收增速、毛利率变化,并生成对比分析表格和行业趋势总结。豆包交付了高质量的表格和投资摘要文档,覆盖了一个初级分析师大概半天的工作量。
第三个场景展示了豆包创建自定义Skill并调用其进行分析的能力。用户要求豆包创建一个可以生成数据可视化面板的技能,并用该技能分析当天世界杯的所有比赛数据。豆包不仅成功创建了Skill,还抓取了实时数据,生成了一个包含多种图表类型的交互式数据面板。
除了上述场景外,办公任务模式还具备本地电脑操作、定时任务执行以及网站和应用生成等多项能力。用户可以授权豆包协助整理本地文件、归类文档、跨应用搬运信息,也可以设定豆包在固定时间自动执行重复性工作,如每周生成AI行业动态周报。该模式还支持创建带后端数据库的生产级网站,为个人或团队快速搭建信息系统提供了便利。
豆包2.1 Pro模型的强大能力得益于其底层的模型升级。在面向真实Coding场景的众测开发者评估中,豆包2.1 Pro对比Claude Opus 4.6获得了59.1%的胜率。在ALE基准评测中,该模型也处于第一梯队。豆包2.1 Pro在GDPval基准和Terminal Bench 2.1测试中也取得了优异成绩,证明了其在真实工作任务中的完成质量和经济价值。
在价格方面,豆包专业版提供了三档订阅服务,以满足不同用户的需求。同时,豆包还即将推出面向在校大学生的专属优惠和针对视障人群的特殊优惠方案。这些举措进一步降低了用户使用专业级工作流的门槛,推动了AI技术的普惠化。
随着豆包办公任务模式的推出,一个拥有2亿日活跃用户的国民级应用开始认真替用户“干活”。这不仅改变了用户的工作方式,也为AI技术的发展注入了新的动力。海量用户在Agent模式下处理真实工作任务所积累的数据将持续反哺模型的迭代升级,形成一个良性循环的飞轮效应。
