本报记者 袁传玺
6月11日,北京字节跳动科技有限公司(以下简称“字节跳动”)旗下火山引擎发布豆包大模型1.6、视频生成模型Seedance 1.0 pro等新模型,并升级了Agent(智能体)开发平台等AI云原生服务。
字节跳动CEO梁汝波表示:“字节跳动致力于成为优秀的创新科技公司,会坚定长期投入,追求智能突破,服务产业应用。通过火山引擎,持续把新模型、新技术开放给企业客户。”
综合成本进一步下降
据火山引擎总裁谭待介绍,豆包1.6系列模型支持多模态理解和图形界面操作,能够理解和处理真实世界问题,同时图形界面操作能力让豆包1.6进一步具备“行动力”。
此外,豆包视频生成模型Seedance 1.0 pro也同时发布。据了解,该模型支持文字与图片输入,可生成多镜头无缝切换的1080P高品质视频,主体运动稳定性与画面自然度较高。
截至目前,豆包大模型已涵盖多模态、视频、图像、语音、音乐等模型品类,全方位推进智能提升和应用落地。数据显示,豆包大模型日均tokens使用量超过16.4万亿,较去年5月份首次发布时增长137倍。另据国际数据公司IDC报告,豆包大模型在中国公有云大模型市场份额占比高达46.4%。
值得关注的是,通过技术和商业的双重创新,豆包1.6首创按“输入长度”区间定价,深度思考、多模态能力与基础语言模型统一价格。在企业使用量最大的0-32K输入区间,豆包1.6的输入价格为0.8元/百万tokens、输出为8元/百万tokens,综合成本只有豆包1.5深度思考模型的三分之一。Seedance 1.0 pro模型每千tokens仅0.015元,每生成一条5秒的1080P视频只需3.67元,为行业最低。
“豆包系列大模型价格下调对行业与开发者而言意义重大。低价策略可以加速技术普及,降低企业AI转型门槛,促进生态繁荣。”广州艾媒数聚信息咨询股份有限公司CEO张毅向《证券日报》记者表示,对开发者而言,成本降低显著提升试错空间,尤其利好初创团队与中小企业,助力其以更低成本验证创意、加速产品迭代,同时倒逼行业聚焦技术创新与服务优化。
谭待表示,深度思考、多模态和工具调用等模型能力提升,是构建Agent的关键要素。同时,由于Agent每次执行任务都会消耗大量tokens,模型使用成本也要降下来,才能推动Agent的规模化应用。
加速Agent大规模应用
在技术层面,大模型本身也在飞速进化,从感知AI,到生成式AI,再到Agentic AI。谭待表示,公司希望大模型不再仅仅完成信息的识别、处理和生成,而是能够自主推理、规划行动并执行任务,从而成为构建复杂业务闭环的智能体。
为了更好地支持Agent开发与应用,除进一步降低企业和开发者的使用成本之外,火山引擎AI云原生全栈服务进一步升级,发布了火山引擎MCP服务、PromptPilot智能提示工具、AI知识管理系统、veRL强化学习框架等产品,并推出多模态数据湖、AICC私密计算、大模型应用防火墙,以及一系列AI Infra套件。
字节跳动技术副总裁洪定坤表示,随着模型能力的持续进步,AI有机会成为调度者,通过调用不同的Agent和工具,让软件开发“all in one”,更大幅度地降低开发门槛,提升开发效率。
洪定坤表示,目前豆包1.6模型在编程能力上进步很大,已经接入字节跳动的AI编程产品TRAE内测。在字节跳动内部,超过80%的工程师在使用TRAE辅助开发。TRAE的整体月活用户已经超过100万。
事实上,在AI时代,调用中心已经从程序员转移到大模型。谭待在接受《证券日报》记者采访时表示,大模型和Agent开发平台是AI时代的关键要素,模型要做好强推理、多模态、低成本才能支撑好Agent的大规模应用。同时,需要提供强化学习、Prompt优化、MCPHub、知识库、运行沙盒等开发平台,才能基于模型开发好Agent。
谭待认为,AI时代会推动开发范式与技术架构全面升级。AI时代的代表则是Agent,Agent能够自主感知、规划和反思,完成复杂任务,从被动工具转变为主动执行者。豆包大模型和AI云原生将持续迭代,助力企业构建和大规模应用Agent。
(编辑 上官梦露)