详细介绍
豆包音频生成模型1.0(Doubao-Seed-Audio 1.0)是字节跳动发布的AI音频生成模型。核心能力:1)多模态参考生成——输入文本图片音频任一模态作为参考素材端到端生成目标音频;2)多角色音色一致性——在长程生成中保持多角色音色统一;3)影视级成品直出——一次生成中同步编排角色对白情绪语气方言口音背景音乐环境氛围音拟音特效。与Seedance 2.5串联实现视频+音频一键出片。
工具信息
| 官网 | www.volcengine.com |
| 分类 | AI音乐 |
| 费用 | 付费产品 |
| 评分 | ★ 8.0 / 5.0 |
| 浏览 | 3 次 |