Skip to content

AI 有声内容制作

从文稿到成品音频,覆盖播客、有声书、课程配音、多角色对话

1稿件撰写
2语音合成
3多角色配音
4BGM 配乐

AI 有声内容制作流程

步骤推荐工具预估成本
稿件撰写 (1000字)Claude / GPT-4o~$0.01
语音合成 (5分钟)ElevenLabs / Fish Audio~$0.30-$1.50
多角色配音MiniMax / OpenAI TTS~$0.20-$0.50
BGM 生成Suno / Udio~$0.10
合计~$0.61-$2.11

Step 1: 稿件撰写

内容类型对照

类型字数参考角色数风格
知识播客1500字/10分钟1-2人专业、有深度
故事播客2000字/10分钟2-4人生动、有画面感
有声书3000字/20分钟1人+角色沉浸、文学性
课程讲解1200字/10分钟1人清晰、有逻辑

Step 2: 单人语音合成

TTS 工具全面对比

工具MCP 命令中文效果英文效果延迟价格
ElevenLabsclaude mcp add elevenlabs npx -y elevenlabs-mcp★★★★★★★★★75ms$0.30/分钟
Fish Audioclaude mcp add fish-audio npx -y mcp-fish-audio-server★★★★★★★★★300ms开源免费
MiniMax TTSclaude mcp add minimax-tts npx -y @minimax-ai/mcp★★★★★★★★150ms¥0.1/千字符
OpenAI TTSclaude mcp add openai-tts npx -y tts-mcp★★★★★★★500ms$0.015/千字符
CosyVoiceclaude mcp add cosyvoice npx -y cosyvoice-mcp★★★★★★★★200ms开源免费
Edge TTS无需安装★★★★★★100ms完全免费

零成本方案: Edge TTS 完全免费,支持 322 种语音,适合批量生成或预算有限的场景


Step 3: 多角色配音

多角色配音实现方案

方案工具组合优点缺点
方案一ElevenLabs 多声线声音最自然成本较高
方案二MiniMax TTS 多角色中文效果好,API 简单英文一般
方案三OpenAI TTS 换 voice6 种预设声线声线有限
方案四Fish Audio 声音克隆开源免费需要本地部署

Step 4: BGM 配乐


完整 Claude Code 流程

bash
# 安装语音工具
claude mcp add elevenlabs npx -y elevenlabs-mcp
claude mcp add minimax-tts npx -y @minimax-ai/mcp

# 设置 API Key
export ELEVENLABS_API_KEY=your_key
export MINIMAX_API_KEY=your_key

# 一键生成
claude "帮我制作一期10分钟的知识播客,主题是 [你的主题],
       请先写脚本,然后为主持人和嘉宾分别配音"

更多工具信息:语音工具 · 对比总览 · MCP 集成

AI 多媒体工具调研资料