6月11日,字节跳动旗下火山引擎举办Force原动力大会,发布豆包大模型1.6、视频生成模型Seedance 1.0 pro等新模型,并升级了Agent开发平台等AI云原生服务。
过去两年多,AI从生成式智能,正加速迈向“能自主执行”的Agent 智能。顺着这一大势,全球研发方向出现明显收敛:视频生成正成为生成式 AI 的新高地,高品质文生视频模型不断涌现;AI 编程被视为生产力“第二曲线”。
字节跳动旗下火山引擎最新发布的系列产品正对准这两条主线:Seedance1.0负责视频生成,可一键产出 1080P 多镜头短片;豆包 1.6及TRAE 则把 AI写代码嵌进工程流程,字节跳动内部已有80%以上工程师使用。火山引擎正在为即将到来的Agentic AI时代打下技术与场景的双重基础。
据火山引擎披露,豆包大模型日均tokens使用量超过16.4万亿,较去年5月首次发布时增长137倍。另据IDC报告,豆包大模型在中国公有云大模型市场份额排名第一,占比达46.4%。高强度的实际使用,反映出模型的成熟稳定和用户的认可,也反哺模型效果持续优化。
字节跳动CEO梁汝波以视频形式致辞表示:“字节跳动致力成为优秀的创新科技公司,会坚定长期投入,追求智能突破,服务产业应用。通过火山引擎,持续把新模型、新技术开放给企业客户。”这一表态阐释了公司从上而下的战略定力,让科技创新创造更长远的价值。
目前,豆包大模型已涵盖多模态、视频、图像、语音、音乐等模型品类,全方位推进智能提升和应用落地。在行业应用上,豆包大模型服务着全球TOP10手机厂商中的9家、8成主流汽车品牌、70%的系统重要性银行及超5成985高校。
火山引擎总裁谭待告诉参会的各媒体们:“我们的营收里,与大模型相关的业务增长最快,毛利也是最好的之一。”
豆包1.6与Seedance:Agent时代的模型底座
作为字节跳动自研的大模型,豆包大模型在短短一年内快速迭代,最新发布的豆包1.6系列已全面迈入全球第一梯队。在复杂推理、数学竞赛、多轮对话、指令遵循等权威评测中,豆包1.6-thinking(深度思考版本)表现跻身全球前列。
据谭待介绍,豆包1.6支持多模态理解和图形界面操作能力,能够理解图像等非文本信息,并模拟人类操作电脑界面完成任务。
例如,在现场演示中,豆包1.6可以自动操作浏览器预订酒店、读取购物小票并整理为Excel表格等,实现从“认知”到“行动”的飞跃。这意味着豆包不仅能对话答疑,还具备了初步的工具使用和执行能力,行动力显著增强为构建自主Agent提供了强大模型支撑。
豆包视频生成模型Seedance 1.0 pro是火山引擎同期发布的另一大亮点。该模型支持文字与图片输入,可生成多镜头无缝切换的1080P高品质视频,画面自然流畅,主体运动稳定。
在国际权威评测榜单Artificial Analysis上,Seedance在文本生成视频和图生成视频两项任务上均排名全球第一,这标志字节跳动在视频生成领域已跻身全球前沿。至此,豆包大模型家族覆盖了通用多模态、视频、图像、语音、音乐等模型品类,全面推进智能能力提升与应用落地。
在AI Agent快速发展的当下,规模化落地面临多重挑战。根据行业观察,企业级Agent的实际应用成本压力尤为突出——单个Agent每日token消耗成本可达20美元,高成本成为企业投入Agent开发和应用的一个阻碍。
值得一提的是,高性价比成为豆包1.6的一大竞争优势。谭待强调,要推动Agent大规模应用,模型每次执行消耗大量Token,使用成本必须降下来。
豆包1.6首创按“输入长度”区间定价,深度思考、多模态能力与基础语言模型统一价格。在企业使用量最大的0-32K输入区间,豆包1.6的输入价格为0.8元/百万tokens、输出8元/百万tokens,综合成本只有豆包1.5深度思考模型或DeepSeek R1的三分之一。Seedance 1.0 pro模型每千 tokens仅0.015元,每生成一条5秒的1080P视频只需3.67元,为行业最低。
谭待表示, 除了整体Tokens规模的迅猛增长,新的应用场景正在不断被解锁。以今年 5 月份火山引擎的 Tokens消耗构成为例,较去年 12 月的数据有明显跃升:深度推理模型的推出,带动了 AI工具的Tokens 消耗在5 个月内增长了 4.4 倍。
其中,AI 搜索的调用量增长了 10 倍,AI 编程的增长幅度也达到 8.4 倍。同时,智能巡检、视频检索等新兴场景也快速突破了日均百亿 Tokens级别的调用量,显示出多模态深度推理在各行各业的加速落地。这意味着在行业里,大模型的应用也在不断深化。
在消费电子行业,企业将大模型应用在语音助手,创作工具,效率提升等诸多场景,全球Top10手机厂商有9家和火山引擎深度合作;
在汽车行业,大模型覆盖了从智能座舱,到智能营销,到自动驾驶标注等全流程场景。在刚过去的上海车展,豆包大模型是被最多提及的名词,助力八成主流汽车AI升级;
在金融行业,火山引擎为客户提供智能展业、投顾、投研等大模型应用方案,已服务华泰证券、国信证券等数十家券商和基金公司,招商银行、浦发、民生等70%的系统重要性银行;
在教育行业,火山引擎面向教学服务、科研辅助、师生服务和管理辅助等场景,提供大模型解决方案,已与北京大学、浙江大学、南开大学等超五成985高校达成合作,持续推动高等教育智能化转型。
高性价比背后的成本逻辑:技术成熟胜于价格战
当火山引擎把豆包1.6的价格大幅下调时,业界一度猜测这是否预示着一场云服务商之间的价格战。毕竟,在云计算乃至AI服务领域,行业龙头通过降价抢占市场的案例并不鲜见。去年豆包 1.0 发布时,把价格下调了99%,引发了广泛的讨论。
实际上,去年以来技术、软件和硬件都在持续进步,此次火山引擎的价格下调更像是凭借技术进步实现成本优化的自然结果,而竞争的手段。Agent复杂度更高,深度思考和多模态能力是必需,但这意味着更高的推理成本。为此,火山引擎在模型和商业模式上做了三点优化:
首先,豆包大模型1.6降价建立在统一定价的新模式之上。以往,大模型的高级功能(如长上下文、深度思考、多模态)往往按功能分级定价,企业使用成本居高不下。
火山引擎创新性地取消了这些“附加费”,直接做统一定价,免去区别带来的复杂和成本负担。也就是说,客户不再为高阶AI能力额外买单,人人都用得起“全功能版”的大模型服务。
这种策略背后是一系列技术攻关:通过模型架构改进和推理优化,字节跳动团队成功将模型推理所需的算力代价降低到可接受范围,使其能以标准配置开放。当技术瓶颈被突破,服务成本下降,价格下调就水到渠成。
其次,豆包模型降价得以实施还有赖于规模效应摊薄成本。前文提及,豆包模型日调用量已逾16万亿Token,在金融、汽车、互联网等各行业大规模实战。海量的使用为模型迭代提供了宝贵经验,也让字节跳动能够优化算力部署和调度,实现单次调用的边际成本递减。
谭待也指出,每个Agent任务耗费的Token非常可观,只有成本降下来,Agent应用才能铺开。显然,字节跳动选择在豆包1.6阶段推出区间定价模式,正是因为模型和基础设施已经达到足够成熟的经济规模,降低价格不仅不会亏损,反而能激发更大量的使用,从而形成良性循环。
反观传统的“价格战”,往往是以亏损换市场份额,不具备可持续性。而火山引擎此举是在确保自身技术和运营足以支撑低价高质服务的前提下进行的。豆包1.6发布会上宣布降价,伴随的是模型性能的大幅提升以及产品形态的丰富完善(如多模态、Agent支持等)。
这传递出一个清晰信号:高性价比是技术成熟度的体现,而非简单的价格竞争手段。对于企业客户而言,这样的降价是健康的、可持续的,因为他们享受到的是更高效且更实惠的AI能力;对于行业而言,这有助于加速AI的普及和落地,而不会因为低价而牺牲服务质量或压垮供应商。
豆包模型落地案例:联想、飞书、瑞幸、百胜中国、顺丰的实践
大模型只有与行业场景深度结合,才能真正释放价值。字节跳动旗下火山引擎,已在企业办公、零售消费、餐饮、终端设备等多个领域积累了标杆案例,展现了模型能力的产业落地与跨行业渗透力。
联想集团执行副总裁兼中国区总裁刘军表示:“这是联想与火山引擎发挥各自领域技术优势的一次全新尝试,对混合式AI安全架构的搭建具有里程碑意义。我们希望与火山引擎继续深入合作,将安全方案拓展到更多AI终端、AI 基础设施和AI解决方案与服务,为中国消费者和中国企业打造安全可信的AI新未来,助力中国AI产业在全球实现弯道超车。”
在办公领域,飞书率先上新知识问答功能,受到了众多企业的欢迎。知识问答基于豆包大模型构建,融合外部与企业专属知识,并严格遵循知识权限,精准回答业务问题。目前,飞书知识问答已在安克创新、地平线等企业落地。
在零售消费场景中,瑞幸咖啡携手火山引擎推出AI智能点单助手“Lucky”。用户只需动动嘴,比如说出“老样子,再来一单”,AI智能体就会基于用户历史订单精准推荐并快速下单。AI点单在高峰期也能保障流畅体验,离不开豆包大模型准确的意图识别与语义理解能力,以及火山引擎的算力支持和性能优化。瑞幸计划继续升级这一智能体,探索更多AI服务可能,成为新消费领域“科技赋能”的样板。
在物流领域,顺丰基于豆包大模型和HiAgent智能体开发平台,能够帮助业务同学将通用知识和顺丰的专业知识进行融合,并通过零代码、低代码的方式打造每个人专属的AI办公助理。
在餐饮行业方面,百胜中国(肯德基、必胜客母公司)携手火山引擎,打造了专有云平台“百胜云”。借助火山引擎的弹性容器云,百胜中国在业务高低峰灵活调度IT资源,实现降本增效。更重要的是,百胜将豆包大模型引入智能客服、员工培训等场景:AI客服可自动回应顾客咨询,AI培训助手能基于专属知识库回答员工问题,显著提升服务效率,降低人力成本。
在智能终端领域,联想集团与火山引擎深度合作,将豆包大模型集成到AI桌面助手“如意”中,实现从简单系统工具到智能对话助手的飞跃。升级后的如意,具备AI搜索、AI写作、AI聊天三大功能:既可个性化搜索和智能问答,也能快速生成营销文案、专业报告,极大提升创作和交互体验。
这些多维度的合作案例充分展现了火山引擎豆包大模型的产业落地力:从知识工作场景的智能化,消费者服务的个性化,到行业后台的运营升级以及智能终端的体验革新,AI不再是概念,而是推动产业高效转型的关键引擎。
字节跳动通过火山引擎,正在用大模型和AI云服务打破传统边界,让AI真正服务产业创新、助力企业实现更具竞争力的智能化升级。
字节跳动全力投入科技创新
在此次豆包大模型发布中,火山引擎总裁谭待和字节跳动技术副总裁洪定坤发表了演讲,展现出对技术长期演进的理性判断与愿景。
谭待提出,AI时代技术范式与底层架构都在重塑,企业需要拥抱Agent智能体的全新形态:“PC时代的主体是Web,移动时代是App,AI时代则是Agent。”这意味着火山引擎未来将围绕Agent形态,持续演进豆包模型和AI云原生平台,支持企业将智能体融入日常业务流程,实现规模化应用。
洪定坤则更专注于开发者视角,认为大模型有潜力成为软件生产的调度核心,帮助企业调用不同Agent和工具,重塑开发模式,大幅降低门槛,提升效率。他透露,豆包1.6在编程能力上有显著进步,已接入AI编程助手TRAE进行内侧,并将很快对外开放,意味着AI写代码等能力将加速普惠到更广泛的开发群体。
无论是梁汝波倡导的长期投入,还是谭待、洪定坤的技术解读,都指向字节跳动正在努力成为更优秀的创新科技公司。
行业人士分析,唯有掌握大模型等关键技术,持续投入并服务产业,字节才能在AI时代延续增长动能。
市场反馈也初步印证了这一战略的可行性:豆包模型推出一年,迅速占据中国公有云大模型近半市场份额;在飞书、瑞幸、百胜中国、联想等企业场景中,已经见证了大模型与企业智能化的深度融合。
火山引擎的实践还表明,字节跳动的AI布局不仅仅是商业化,更是一种与全社会共享技术红利的尝试。
在技术层面,豆包大模型以高性能、低成本、强适配和安全可信为基础,满足了各行业对AI的多样化、个性化需求;在理念层面,管理层坚持以技术创新降低成本、强调安全合规,展现出兼顾商业成功与社会责任的平衡取向。
可以说,字节跳动进入AI产业化赛道,并非偶然,而是长期在算法、数据、算力领域积累的自然延伸。或许在不久的将来,在Agentic AI加速到来的未来几年,火山引擎将成为字节跳动连接产业的关键纽带,一个又一个行业智能化升级的故事会在其平台上演。
届时,当人们提起字节跳动,也许不再仅仅想到抖音的流量奇迹,而会更多谈论起这家公司的技术创新、生态构建和产业贡献。
在全球范围内,Agentic AI 已被视为智能化浪潮的下一个“拐点”,也是产业数字化转型的新引擎。
随着字节跳动等企业不断夯实大模型基础设施、提升多模态理解与工具调用的深度,AI 智能体正在从实验室走向企业前台,成为可落地的生产力工具。对产业而言,这意味着生产力工具不再只是“人手延伸”,而将成为企业智能化的核心驱动器;
对字节跳动而言,这是一条更宽阔、也更具想象力的增长曲线。未来,Agentic AI 的真正价值将不仅体现在效率提升,更在于深度改造企业流程和重塑行业格局——这场变革的脚步,已经悄然开始。
周悦/文