在2025年6月11日的 FORCE 原动力大会上,火山引擎发布了豆包大模型1.6、豆包·视频生成模型 Seedance 1.0 pro、豆包·语音播客模型,同时豆包·实时语音模型在火山引擎全面上线。豆包大模型家族已成为覆盖全模态、全尺寸、高性价比的领先模型。截至2025年5月底,豆包大模型日均 tokens 调用量达16.4万亿,较去年5月发布时增长137倍。
字节跳动 CEO 梁汝波表示,火山引擎对字节跳动成为卓越科技公司、保持技术竞争力至关重要。未来,字节将持续长期投入,追求智能创新,赋能产业应用。

在价格方面,豆包大模型1.6采用统一区间定价模式,首创按“输入长度”分段收费。在企业常用输入区间0-32K内,定价为输入0.8元/百万 tokens、输出8元/百万 tokens,综合成本较豆包1.5·深度思考模型和DeepSeek R1降低63%。Seedance 1.0 pro模型每千tokens仅0.015元,生成一条5秒1080P视频约3.67元,行业最优。
目前,能自主思考、规划、执行任务的Agent正逐步应用于企业场景,这要求模型具备强推理、多模态和低成本特性,同时需升级AI云原生全栈服务。大会上,字节跳动技术副总裁洪定坤与火山引擎总裁谭待发布了12款面向Agent开发和应用的工具产品。
为支持Agent开发,升级了AI IDE“TRAE”,推出火山引擎MCP服务、Prompt优化工具“PromptPilot”、开源veRL强化学习框架及AI知识管理产品;在大数据服务上,发布多模态数据湖和AI数字专家“Data Agent”;在AI基础设施上,针对Agent开发、模型训练和推理,推出AgentKit、TrainingKit、Servingkit;安全方面,发布AICC私密计算和大模型应用防火墙,保障Agent运行安全。
谭待表示,AI时代,开发范式、大数据、计算和安全发生深刻变革,构建的“AI云原生”技术栈是企业开发优质Agent、实现创新的关键。

豆包大模型1.6正式发布
更强模型、更高性价比
全新发布的豆包大模型1.6系列包含三款模型,为企业提供多样化选择。
- doubao-seed-1.6:全能综合模型,国内首款支持256K上下文的思考模型,具备深度思考、多模态理解、图形界面操作等能力。支持开启、关闭或自适应思考三种模式,自适应模式可根据提示词难度自动调整思考状态,优化效果并显著降低tokens消耗。
- doubao-seed-1.6-thinking:专注深度思考的强化版,在代码、数学、逻辑推理等能力上进一步提升,支持256K上下文。
- doubao-seed-1.6-flash:极速版,支持深度思考、多模态理解和256K上下文,延迟低至10ms(TOPT),视觉理解能力媲美行业顶尖模型。
豆包大模型1.6在推理、多模态理解和GUI操作能力上表现卓越,在多项权威测评中位列国际第一梯队。

推理能力
豆包大模型1.6在推理速度、准确度与稳定性上显著提升,可支撑更复杂的业务场景落地。
例如,有媒体针对今年的高考全国新一卷数学单科做了测评,豆包的成绩是144分,全国第一。而在高考前,在针对海淀区模拟全卷的测评中,相比去年的模型,豆包大模型1.6理科成绩显著提升了154分,文科提升了90分。

豆包大模型1.6具有边想边搜、DeepResearch 深度研究能力,能独立思考、规划、使用搜索等各种研究工具。例如豆包 APP 和 PC 端正在小流量测试的 DeepResearch 功能,可以把过去需要多名专业人士花费数天写成的调研报告,缩短到5-30分钟内完成,还能自动提炼信息,总结成网页,方便查阅。
为方便企业使用“边想边搜”和 DeepResearch 功能,火山引擎打造了大模型应用实验室,并开源了手机助手、实时视频理解、DeepSearch 等应用,帮助企业快速搭建 AI 应用原型,灵活编排自己的专属智能体。用户可在火山引擎官网大模型应用实验室、GitHub 方舟开源站点下载使用。
多模态理解
多模态理解的核心是“让模型像人一样理解世界”。豆包大模型1.6全系列均原生支持多模态思考能力,让模型可以理解和处理真实世界的问题。该能力支持了豆包 APP 最新的实时视频通话功能,在企业端可广泛应用于电商商品审核、自动驾驶标注、安全巡检等场景。
GUI操作能力
豆包大模型1.6凭借领先的视觉深度思考能力、精准的视觉定位能力,能够让智能体与浏览器及其他软件进行交互和操作,高效执行各类任务。
更高性价比
豆包大模型1.6采用统一定价模式,无论是否开启深度思考模式,无论是文本还是视觉,tokens 价格均一致,按照输入上下文长度区间定价。
在绝大部分企业使用的输入区间0-32K 范围内,价格是输入0.8元/百万 tokens,输出8元/百万 tokens。
在输入区间32K-128K 的范围内,价格是输入1.2元/百万 tokens,输出16元/百万 tokens。
在输入区间128K-256K 的范围内,价格是输入2.4元/百万 tokens,输出24元/百万 tokens。

从综合成本看,大多数请求输入在32K以内,输入输出比例为3:1,豆包大模型1.6的综合成本(2.6元)较豆包1.5·深度思考模型及DeepSeek R1(7元)降低63%,仅需原三分之一价格即可使用更强大、原生多模态的新模型。
火山引擎还新增特惠区,对于输入32K、输出200 tokens以内的请求,豆包大模型1.6定价进一步降至输入0.8元/百万 tokens、输出2元/百万 tokens。这意味着大部分非思考模型需求也能以更低成本享受新模型的优越性能。
豆包·视频生成模型
Seedance 1.0 pro正式发布
全新发布的豆包·视频生成模型 Seedance 1.0 pro 具备三大特性:无缝多镜头叙事、多动作及随心运镜、稳定运动与真实美感,在电商、影视、游戏等行业应用前景广阔。
根据第三方权威榜单 Artificial Analysis 最新结果,Seedance 1.0 pro 在文生视频、图生视频两个维度都超越了业界诸多主流模型,登顶全球竞技场第一。

Seedance 1.0 Pro 的定价为每千 tokens 0.015 元,生成一条 5 秒 1080P 视频约需 3.67 元。以 1 万元预算,通过 Seedance 1.0 Pro 可制作约 2,700 条 5 秒 1080P 视频,而通过 Seedance 1.0 Lite 可制作约 9,700 条视频。

两款豆包语音大模型上新
语音正在成为 AI 应用和 Agent 的核心交互方式,小米汽车、OPPO、美图、儿歌多多等企业已使用豆包语音大模型提升产品创新体验。
今天,豆包·实时语音模型全量上线火山方舟,对企业客户开放使用。该模型支持自然语言高级指令控制,具备唱歌表演、声线模仿、方言演绎等多种能力,语气、用语、思考方式等拟人感大幅提升,能随时打断与主动搭话。
此外,火山引擎还发布了豆包·语音播客模型。只需输入一句话、网页链接、长文本或文档,语音播客模型即可快速搜索学习,生成播客脚本后创作出来;模型可秒级生成双人对话式播客作品,效果自然,具有互相附和、插话、犹豫等播客节奏;自带的深度搜索功能可生成跟进热点话题的播客内容。