DS

豆包音频1.0

字节跳动音频生成模型,支持多模态参考生成、多角色音色一致性保持、一次直出影视级成品音效

AI音乐 热门 ★ 8.0/5
访问官网 →

详细介绍

豆包音频生成模型1.0(Doubao-Seed-Audio 1.0)是字节跳动发布的AI音频生成模型。核心能力:1)多模态参考生成——输入文本图片音频任一模态作为参考素材端到端生成目标音频;2)多角色音色一致性——在长程生成中保持多角色音色统一;3)影视级成品直出——一次生成中同步编排角色对白情绪语气方言口音背景音乐环境氛围音拟音特效。与Seedance 2.5串联实现视频+音频一键出片。

工具信息

官网 www.volcengine.com
分类 AI音乐
费用 付费产品
评分 ★ 8.0 / 5.0
浏览 3 次

同类工具

S
Suno
★ 4.6
E
ElevenLabs
★ 4.5
H
Higgs Audio v3
★ 4.5
M
Magenta RealTime 2
★ 4.5
U
Udio
★ 4.3
A
AIVA
★ 4.2