Appearance
Mureka 技术报告
全球首发!Mureka O1系统开启AI音乐工业革命,全新O1系统重塑音乐创作范式
作为AI音乐生成技术的领导者,Mureka今天正式发布革命性的O1音乐生成系统。O1系统以多语言音乐创作、场景化背景音乐(BGM)生成和先进AI音乐编辑为核心功能,全面重塑音乐创作范式。
- O1系统重塑音乐创作范式
- 多语言覆盖:支持美欧亚主流10种语言的歌词与音乐生成,涵盖多种风格与流派,满足全球用户需求。
- 场景化BGM生产:需输入场景描述性Prompt,即可生成与特定场景完美契合的完整背景音乐。
- 音轨分离下载:提供音乐生成的独立的人声、伴奏等多轨输出,方便用户后续混音与二次创作。
- 音色克隆:行业领先的AI音色克隆,精准模拟歌手音色,一键生成个性化专属作品。
- 歌曲翻译:用户可上传参考曲目,以不同语言重新填词,一键生成精准保留原曲旋律的跨语言改编版本。
- 领先的技术优势
Mureka O1首次在音乐生成领域应用先进的Chain-of-Thought(CoT)技术,通过逐步反馈与优化机制,显著提升了歌词旋律契合度、演唱准确性和艺术表现力,同时保持了低延时音乐生成。
- 低延迟音乐创作:通过AI基础设施深度优化,Mureka O1实现了行业领先的低延迟音乐生成,提供即时、高质量的用户体验。以下实测采用相同prompt进行输入:
- 各项指标领先:
- 主观评测:
- 在最新的音乐评测中,Mureka O1 展现出卓越的音乐品质,在最终的总整体听感评测超过了Suno V4。其中乐器演奏法多样性和配器设计方面明显超越 Suno V4,Mureka O1 在音质、人声质感及BGM质感 上实现了显著提升。这一进展标志着Mureka在音乐生成领域的持续突破,为用户带来更丰富、更高品质的音乐体验。
客观评测:
Mureka O1在与Suno V4等主流系统的客观评测中表现卓越。评测选用了100条英文prompt,在使用同样的prompt分别生产了100条英文歌曲进行横向对比。为保障评测的客观性,评测使用了近期发布的开源预训练模型进行测算。具体标准与结果如下:
客观指标 评测模型 评测内容 发音唱对率 WhisperX
歌词发音准确性 乐段准确率
All-In-One Music Structure Analyzer 乐段精准还原程度 文本相关度 CLAP
CLaMP 3
音乐与prompt相关度 制作质量 Meta Audiobox Aesthetics 内容享受度,内容可用价值,制作复杂度,制作质量
通过上述流行的开源模型对生成音乐进行分析测试,Mureka O1在发音清晰程度,生成歌曲的唱词准确率、乐段的精准度、与输入文本的相关性和制作质量上在行业中领先。
- API开放与合作
Mureka为企业和开发者提供两种灵活的音乐音频生成API服务:
标准音乐生成API:Prompt与歌词创作支持多风格音乐及纯音乐生成,适用于内容创作、游戏配乐、短视频等多场景应用。
精调私有曲库API:输入至多200首歌,上传私有曲库定制专属风格,模型精调技术深度解析每一首旋律风格偏好,无需音乐知识也可轻松定制品牌音乐、个人专辑等专属内容。
Mureka也同步开发前沿语音合成API: Mureka TTS 在与 11labs、openai、微软的横向评测表现出色,在全场景效果与一线厂商保持了优异的竞争力
AI 语音播客 API:输入双人对谈的播客文本台词,直接生成完整连续的长音频、双人对谈播客
精品说话人 API:提供多个预置精品说话人音色,可用于自然聊天、客服、有声书朗读等多场景的应用
音色克隆 API:只需上传 10 秒语音,无需训练模型,实时生成与上传音色一致的语音
在聊天对话类文本数据上来看,整体听感为4.34分,在月11labs, openai,和微软的对比中保持领先;各维度均表现优异。
- O1思维链技术研究分享
Mureka团队发布了音乐生成领域的创新研究成果——MusiCoT。MusiCoT利用了思维链Chain-of-Thought (CoT)方法,不同于传统自回归模型逐步生成音频,MusiCoT首次在细粒度音频token预测前预生成整体音乐结构,大幅提升生成音乐的结构连贯性与乐器编排精准度。MusiCoT基于CLAP模型,无需人工标注即具备高扩展性,并显著提高了生成音乐的可解释性和质量。MusiCoT为高保真AI音乐生成开辟全新路径,推动音乐AI创作迈入结构化时代。
立即访问Mureka官网,体验全新O1系统,并加入我们的discord社区,与全球AI音乐创作者共同探索音乐创作的无限可能!