当前位置:首页 > 科创板分析 > 正文

发布豆包深度思考模型,火山引擎要争夺Agent市场

界面新闻记者 | 肖芳

界面新闻编辑 | 文姝琪

DeepSeek走红数月之后,字节跳动终于对外发布自研的深度思考模型。

4月17日,豆包1.5・深度思考模型由火山引擎对外发布,面向企业市场提供服务。技术报告显示,豆包深度思考模型采用MoE架构,总参数为200B,激活参数为20B。相比之下,同样采用MoE架构的DeepSeek-V3模型总参数为671B,激活参数为37B。

豆包1.5・深度思考模型的参数实现更小,但从评测结果来看,其能力不逊于顶尖模型的效果。其中,豆包1.5・深度思考模型在专业领域的推理任务中表现出色,数学推理AIME 2024测试得分追平OpenAI o3-mini-high,编程竞赛和科学推理测试成绩也接近o1,在编程竞赛Codeforces pass@8得分接近 OpenAI o1,在科学推理GPQA 得分接近o3-mini。

同时,基于高效算法和高性能推理系统,豆包模型API服务在保障高并发的同时,延迟低至20毫秒。

豆包深度思考模型还上线了多模态版,具备视觉推理能力,能像人类一样对看到的事物进行联想和思考,拓展了智能推理的应用边界。比如,这款模型可以看懂复杂的企业项目管理流程图表,快速定位到关键信息,并能够严格按照流程图,回答客户的问题。在分析航拍图时,能结合地貌特征判断区域开发可行性。

从现场演示来看,上传一份可口可乐财报,豆包深度思考模型能够提取财报中不同区域的营收、增长等关键数据指标,并能够结合这些数据分析不同区域数据表现差异的原因;上传一份西餐厅菜单图片,并给出点餐需求和预算指令,豆包深度思考模型能够推理不同菜品是否符合需求,从而按照开胃菜、主菜、配菜、甜点搭配推荐菜品。

去年5月,字节跳动首次对外发布豆包系列模型。一年以来,豆包系列模型的数量在不断增加,模型的能力也在持续提升。豆包多款主力模型的发布都晚于同行,但还是有其市场认可度。

据火山引擎披露,截至2025年3月底,豆包大模型日均tokens调用量已达到12.7万亿,较去年5月发布时增长上百倍。火山引擎总裁谭待在接受界面新闻等媒体采访时透露,从长期来看,豆包大模型日均tokens调用量百倍甚至更高的增长是有可能的。但未来两三年内,最关键的取决于模型是否有重大突破。

去年,豆包大模型首次对外发布,火山引擎把豆包大模型的定价降低了一个数量级。其中,豆包通用模型pro-32k版,模型推理输入价格不足市面上同规格模型的定价的1%;豆包通用模型pro-128k版,模型推理输入价格比行业价格低95.8%。在谭待看来,基础信息处理能力的提升以及成本的下降让豆包大模型从去年到今年获得了快速增长,今年模型在深度思考能力上的突破又带来新的增长。

火山引擎也在遵循相同的逻辑思考大模型未来的增长点。谭待认为,视觉推理能力以及Agent相关技术能否获得重大突破,是未来几年大模型增长的关键节点。

此次发布豆包深度思考模型,火山引擎正是在押宝这两个新的机会。因为现实世界中的很多应用场景是靠视觉驱动的,豆包深度思考模型具备了视觉推理能力,便可以在更多场景助力企业进行落地应用。

火山引擎更大的野心在于争夺Agent市场的机会。2025年被业界视为“Agent智能体元年”。谭待认为,在多模态深度思考模型的基础上,Agent需要良好的架构和工具,去操作数字世界和物理世界。同时,模型的推理成本和延迟要持续降低,才能推动应用普惠。

为此,火山引擎宣布推出OS Agent解决方案,并演示了由Agent操作浏览器,搜索商品页,实现iPhone比价的任务,甚至由Agent在远程计算机上用剪映进行视频编辑、配乐。

据发布会现场的介绍,OS Agent解决方案包含豆包UI-TARS模型,以及veFaaS函数服务、云服务器、云手机等产品,实现对代码、浏览器、电脑、手机以及其他Agent的操作。其中,豆包UI-TARS模型将屏幕视觉理解、逻辑推理、界面元素定位和操作整合在一起,突破传统自动化工具依赖预设规则的局限性,为Agent的智能交互提供了更接近人类操作的模型基础。

好的模型和工具能够加速Agent的落地,但Agent也会带来更大量的模型推理消耗。面对大规模推理需求,火山引擎还有AI云原生ServingKit推理套件,让模型部署更快、推理成本更低,GPU消耗相比传统方案降低80%。

谭待在接受媒体采访时表示,聊天和信息处理只是AI应用的一小部分,AI要真正为各行各业带来变革,Agent是必经之路。对于垂直类Agent,火山引擎会基于自身优势领域进行探索;对于通用型Agent,火山引擎更重要的是搭建好基础框架、提供好用的工具。

IDC发布的《中国公有云大模型服务市场格局分析,1Q25》显示,火山引擎以46.4%的市场份额位居第一。

豆包大模型去年率先降价对火山引擎的增长提供了积极助力,火山引擎也希望通过Agent应用增长的机会获得更大的市场份额。谭待表示,每一次大的模型突破都肯定能激发一次大的变化,他对未来2年内豆包大模型的调用量能否再翻100倍保持谨慎乐观。

有话要说...