Meta 开源 AI 语言模型 MusicGen，可将文本和旋律转化为完整乐曲

Meta 开源 AI 语言模型 MusicGen，可将文本和旋律转化为完整乐曲

人工智能 2023-06-14 19:19:01 1年以前

IT酷哥 6 月 12 日消息，Meta 近日在 Github 上开源了其 AI 语言模型 MusicGen，该模型基于谷歌 2017 年推出的 Transformer 模型。如同模型名称所示，MusicGen 主要用于音乐生成，它可以将文本和已有的旋律转化为完整乐曲。

研发团队表示：“我们使用了 20000 小时的授权音乐来对训练该模型，并采用 Meta 的 EnCodec 编码器将音频数据分解为更小的单元进行并行处理，进而让 MusicGen 的运算效率和生成速度都比同类型 AI 模型更为出色。”

除此之外，MusicGen 还支持文本与旋律的组合输入，例如你可以提出生成“一首轻快的曲目”并同时要求“将它与贝多芬的《欢乐颂》结合起来”。

研发团队还对 MusicGen 的实际表现进行了测试。结果显示，与谷歌的 MusicLM 以及 Riffusion、Mousai、Noise2Music 等其他音乐模型相比，MusicGen 在测试音乐与文本提示的匹配度以及作曲的可信度等指标上表现更好，总体而言略高于谷歌 MusicLM 的水平。

Meta 已允许该模型的商业使用，并在 Huggingface 上发布了一个供演示用的网页应用。

IT酷哥附上模型地址：点此前往

演示应用地址：点此前往

模型点此音乐贝多芬演示

相关阅读

Line 推出付费 AI 自拍功能，可定制你的风格

一个月来至少三起，台积电频频投资硅谷 AI 芯片创企

亚马逊云服务部门高管称正考虑使用 AMD 的新款 AI 芯片，还未最终决定

消息称谷歌警告员工不要向生成式 AI“泄密”，也不要直接用其写代码

你的工作未来由人工智能决定，报告称明年 43% 的企业部署 AI 面试

AI 公司 Databricks 推出人工智能模型共享机制，可令开发者与公司实现“双赢”

全球首个 AI 广播频道公司完成 1900 万美元融资，开发无障碍及游戏 NPC 技术

美图秀秀发布七款 AI 工具：修图一样修视频、打造电影级上镜脸

英伟达赚翻了，甲骨文今年将斥资数十亿美元买 GPU 发力 AI 云服务

英伟达联手 Snowflake：卖出更多芯片，帮助企业客户建立自己的 AI 模型

李开复创业大模型公司“零一万物”官网上线：致力于打造全新的 AI 2.0 平台

“世界上最像人的机器人”Ameca 接入 Stable Diffusion 和 GPT-3，现场完成作画

AI 作画工具 Midjourney 推出“pan”功能，可上下左右平移扩展图片外场景

日本计划在学校内限度使用 ChatGPT 等生成式 AI

国内 AI 初创公司第四范式获得证监会赴港 IPO 批准，有望近期进行上市聆讯

热度过去用户兴趣降低：数据显示 ChatGPT 流量在 6 月首次出现下降

下一代“世界最快”超级计算机 El Capitan 开始安装 AMD Instinct MI300 人工智能 GPU

科大讯飞：讯飞医疗基于星火大模型升级医疗诊后康复管理平台，出院患者满意度 98% 以上

腾讯多媒体实验室发布自研 AI 作曲框架 XMusic，不通音律也能帮你“自动作曲”

中国移动发布“九天”人工智能大模型，面向政务和客服