Skip to main content

语音能力概览

豆包的语音能力在中文场景中处于断崖式领先地位。
能力说明
实时语音对话端到端语音模型,延迟极低,可随时打断
声音克隆5 秒录音即可 1:1 复制声音
同声传译延迟 2-3 秒,支持 13 种语言
语音播客秒级生成双人对话播客
情感表达多种情绪语调,接近真人表达

使用方式

在豆包 App 中

  1. 打开豆包 App
  2. 点击底部的麦克风按钮
  3. 开始自然对话
  4. 可以随时打断 AI 的回答

语音特色功能

  • 声线选择:可选择不同的 AI 声线风格
  • 方言支持:支持多种中文方言
  • 唱歌:AI 可以演唱歌曲
  • 角色扮演:用特定声线进行角色扮演对话

适用场景

场景使用建议
外语练习开启语音对话,练习口语和听力
开车/运动时解放双手,语音提问和获取信息
会议同传使用同声传译功能辅助跨语言会议
内容创作用语音播客功能快速生成音频内容
情感陪伴自然的语音对话,缓解孤独感