Skip to content

Mureka 技术报告

全球首发!Mureka O1系统开启AI音乐工业革命,全新O1系统重塑音乐创作范式

作为AI音乐生成技术的领导者,Mureka今天正式发布革命性的O1音乐生成系统。O1系统以多语言音乐创作、场景化背景音乐(BGM)生成和先进AI音乐编辑为核心功能,全面重塑音乐创作范式。

  1. O1系统重塑音乐创作范式
  • 多语言覆盖:支持美欧亚主流10种语言的歌词与音乐生成,涵盖多种风格与流派,满足全球用户需求。
  • 场景化BGM生产:需输入场景描述性Prompt,即可生成与特定场景完美契合的完整背景音乐。
  • 音轨分离下载:提供音乐生成的独立的人声、伴奏等多轨输出,方便用户后续混音与二次创作。
  • 音色克隆:行业领先的AI音色克隆,精准模拟歌手音色,一键生成个性化专属作品。
  • 歌曲翻译:用户可上传参考曲目,以不同语言重新填词,一键生成精准保留原曲旋律的跨语言改编版本。
  1. 领先的技术优势

Mureka O1首次在音乐生成领域应用先进的Chain-of-Thought(CoT)技术,通过逐步反馈与优化机制,显著提升了歌词旋律契合度、演唱准确性和艺术表现力,同时保持了低延时音乐生成。

  • 低延迟音乐创作:通过AI基础设施深度优化,Mureka O1实现了行业领先的低延迟音乐生成,提供即时、高质量的用户体验。以下实测采用相同prompt进行输入:

O1 Performance Benchmarks

  • 各项指标领先
  • 主观评测:
  • 在最新的音乐评测中,Mureka O1 展现出卓越的音乐品质,在最终的总整体听感评测超过了Suno V4。其中乐器演奏法多样性和配器设计方面明显超越 Suno V4,Mureka O1 在音质、人声质感及BGM质感 上实现了显著提升。这一进展标志着Mureka在音乐生成领域的持续突破,为用户带来更丰富、更高品质的音乐体验。

O1 Subjective Evaluation Results

  • 客观评测:

  • Mureka O1在与Suno V4等主流系统的客观评测中表现卓越。评测选用了100条英文prompt,在使用同样的prompt分别生产了100条英文歌曲进行横向对比。为保障评测的客观性,评测使用了近期发布的开源预训练模型进行测算。具体标准与结果如下:

    客观指标评测模型评测内容
    发音唱对率

    WhisperX

    歌词发音准确性

    乐段准确率

    All-In-One Music Structure Analyzer乐段精准还原程度
    文本相关度

    CLAP

    CLaMP 3

    音乐与prompt相关度
    制作质量Meta Audiobox Aesthetics内容享受度,内容可用价值,制作复杂度,制作质量

O1 Objective Evaluation Results

O1 Objective Evaluation Results

通过上述流行的开源模型对生成音乐进行分析测试,Mureka O1在发音清晰程度,生成歌曲的唱词准确率、乐段的精准度、与输入文本的相关性和制作质量上在行业中领先。

  1. API开放与合作

Mureka为企业和开发者提供两种灵活的音乐音频生成API服务:

  • 标准音乐生成API:Prompt与歌词创作支持多风格音乐及纯音乐生成,适用于内容创作、游戏配乐、短视频等多场景应用。

  • 精调私有曲库API:输入至多200首歌,上传私有曲库定制专属风格,模型精调技术深度解析每一首旋律风格偏好,无需音乐知识也可轻松定制品牌音乐、个人专辑等专属内容。

    Mureka也同步开发前沿语音合成API: Mureka TTS 在与 11labs、openai、微软的横向评测表现出色,在全场景效果与一线厂商保持了优异的竞争力

O1 TTS Benchmarks

  • AI 语音播客 API:输入双人对谈的播客文本台词,直接生成完整连续的长音频、双人对谈播客

  • 精品说话人 API:提供多个预置精品说话人音色,可用于自然聊天、客服、有声书朗读等多场景的应用

  • 音色克隆 API:只需上传 10 秒语音,无需训练模型,实时生成与上传音色一致的语音

    聊天对话类文本数据上来看,整体听感为4.34分,在月11labs, openai,和微软的对比中保持领先;各维度均表现优异。

  1. O1思维链技术研究分享

Mureka团队发布了音乐生成领域的创新研究成果——MusiCoT。MusiCoT利用了思维链Chain-of-Thought (CoT)方法,不同于传统自回归模型逐步生成音频,MusiCoT首次在细粒度音频token预测前预生成整体音乐结构,大幅提升生成音乐的结构连贯性与乐器编排精准度。MusiCoT基于CLAP模型,无需人工标注即具备高扩展性,并显著提高了生成音乐的可解释性和质量。MusiCoT为高保真AI音乐生成开辟全新路径,推动音乐AI创作迈入结构化时代。

MusiCoT Architecture

立即访问Mureka官网,体验全新O1系统,并加入我们的discord社区,与全球AI音乐创作者共同探索音乐创作的无限可能!