语音能力概览
豆包的语音能力在中文场景中处于断崖式领先地位。| 能力 | 说明 |
|---|---|
| 实时语音对话 | 端到端语音模型,延迟极低,可随时打断 |
| 声音克隆 | 5 秒录音即可 1:1 复制声音 |
| 同声传译 | 延迟 2-3 秒,支持 13 种语言 |
| 语音播客 | 秒级生成双人对话播客 |
| 情感表达 | 多种情绪语调,接近真人表达 |
使用方式
在豆包 App 中
- 打开豆包 App
- 点击底部的麦克风按钮
- 开始自然对话
- 可以随时打断 AI 的回答
语音特色功能
- 声线选择:可选择不同的 AI 声线风格
- 方言支持:支持多种中文方言
- 唱歌:AI 可以演唱歌曲
- 角色扮演:用特定声线进行角色扮演对话
适用场景
| 场景 | 使用建议 |
|---|---|
| 外语练习 | 开启语音对话,练习口语和听力 |
| 开车/运动时 | 解放双手,语音提问和获取信息 |
| 会议同传 | 使用同声传译功能辅助跨语言会议 |
| 内容创作 | 用语音播客功能快速生成音频内容 |
| 情感陪伴 | 自然的语音对话,缓解孤独感 |