Agent 功能
MiniMax 提供 6 大多媒体 AI 工具(语音、图像、视频、音乐),结合五层 Token 效率优化架构,实现成本降低 75% 的同时保持高质量输出。
MiniMax 多媒体 AI 能力
通过 n8n 工作流引擎整合 MiniMax 的 6 大云端 AI 工具,为您的 Agent 系统赋予「看、听、说、创」的全方位多媒体能力。

文本转语音
text_to_audio多语言、多情绪的高质量语音合成。支持调节语速、音调和情绪,可选择多种预设声线。
会议纪要语音简报、市场异动语音预警、每日财经晨报
声音克隆
voice_clone上传一段音频样本,即可克隆出高度相似的个人声音,用于后续的 TTS 合成。
个性化语音邮件、品牌声音统一、自动化客户沟通
声音设计
voice_design根据文字描述(如「年轻女性,温柔且专业」)生成全新的声音,无需音频样本。
为不同场景定制专属声音、创建虚拟助手人格
文本生成图片
text_to_image根据文字描述生成高质量图片,支持多种风格和尺寸。
会议简报封面图、内容营销配图、数据可视化图表美化
视频生成
generate_video支持文本生成视频(T2V)和图片生成视频(I2V),内置最新 Hailuo-02 模型。
会议视频简报、策略回测报告动画、市场异动可视化短片
AI 作曲
music_generation根据歌词和风格描述生成原创音乐,支持多种曲风和情绪。
培训视频背景音乐、演示文稿配乐、品牌音频标识
五层 Token 效率最大化架构
从 Prompt 工程到硬件加速,每一层都在减少不必要的 Token 消耗。 五层叠加可实现综合 70-85% 的 Token 成本节约。
CLAUDE.md 精简
减少 40% 基础上下文保持 < 500 行,仅包含必要的项目上下文。将专业指令(如 NautilusTrader 策略模板、回测配置)迁移到 Skills 中按需加载。
自定义 Compact 指令
每次压缩节省 60% Token在 CLAUDE.md 中配置 compact instructions,告诉 Claude 压缩时保留什么:回测指标、策略参数、错误日志。丢弃冗长的中间输出。
具体化 Prompt
减少 50% 探索性读取避免「优化这个策略」,改为「将 auth.ts 中 EMA 交叉策略的止损从 2% 调整为 1.5%,并在 on_bar 中添加 ATR 过滤器」。
Token 消耗 对比分析
五层优化架构的实际效果:相同任务,Token 消耗降低 75%,月度成本从 $180 降至 $45。