Meta 开源 AI 语言模型 MusicGen,可将文本和旋律转化为完整乐曲

Meta 开源 AI 语言模型 MusicGen,可将文本和旋律转化为完整乐曲

人工智能 2023-06-14 19:19:01 1年以前

IT酷哥 6 月 12 日消息,Meta 近日在 Github 上开源了其 AI 语言模型 MusicGen,该模型基于谷歌 2017 年推出的 Transformer 模型。如同模型名称所示,MusicGen 主要用于音乐生成,它可以将文本和已有的旋律转化为完整乐曲。

研发团队表示:“我们使用了 20000 小时的授权音乐来对训练该模型,并采用 Meta 的 EnCodec 编码器将音频数据分解为更小的单元进行并行处理,进而让 MusicGen 的运算效率和生成速度都比同类型 AI 模型更为出色。”

除此之外,MusicGen 还支持文本与旋律的组合输入,例如你可以提出生成“一首轻快的曲目”并同时要求“将它与贝多芬的《欢乐颂》结合起来”。

研发团队还对 MusicGen 的实际表现进行了测试。结果显示,与谷歌的 MusicLM 以及 Riffusion、Mousai、Noise2Music 等其他音乐模型相比,MusicGen 在测试音乐与文本提示的匹配度以及作曲的可信度等指标上表现更好,总体而言略高于谷歌 MusicLM 的水平。

Meta 已允许该模型的商业使用,并在 Huggingface 上发布了一个供演示用的网页应用。

IT酷哥附上模型地址:点此前往

演示应用地址:点此前往

文章版权声明:除非注明,否则均为网络转载文章,转载或复制请以超链接形式并注明出处。

相关阅读

  • OpenAI 网站访问量飙升至 10 亿次,上榜全球访问量最高网站 Top20
  • 消息称三星正开发“类 ChatGPT”AI 大语言模型供内部使用,投入全部 GPU 资源
  • 赛博礼拜?德国一教堂首次尝试用 ChatGPT 布道,300 多人排队一小时参与
  • 谷歌将生成式 AI 应用于在线购物,真人模特可实现高精度虚拟换衣
  • 赛博手冢治虫:GPT-4 将参与漫画《怪医黑杰克》续作创作过程
  • Stack Overflow 发布 2023 年度报告:JavaScript 位列榜首,83% 的人用过 ChatGPT
  • 美国最大报业集团 Gannett 引入生成式人工智能,保留人类编辑的最终决定权
  • Meta 发布 Voicebox AI 模型:可生成音频回复信息,用于 NPC 对话等
  • 腾讯宣布打造行业大模型精选商店,提供一站式服务
  • Snap 研发出新技术 SnapFusion,未来智能手机秒出 AI 生成图像
  • 腾讯首次披露行业大模型进展:不追求参数高,希望成本预算可控
  • DeepMind 联合创始人提出新的图灵测试:让 AI 将 10 万美元变成 100 万美元
  • 特斯拉创建 Tesla AI 推特账户,称下月开始生产 Dojo 超级计算机
  • 复旦大学与阿里巴巴达成全面战略合作,共享 AI 大模型底层能力
  • 金融巨头瑞穗银行押注生成式 AI,开放 Azure OpenAI 给 4.5 万名员工使用
  • 16 名匿名人士起诉 ChatGPT 侵犯隐私,向微软和 OpenAI 索赔 30 亿美元
  • 微软在 Bing 和 Edge 浏览器中拓展网购服务,帮用户选购心仪产品
  • 微软英伟达参投,OpenAI 竞争对手 Inflection AI 获 13 亿美元融资
  • “世界上最像人的机器人”Ameca 接入 Stable Diffusion 和 GPT-3,现场完成作画
  • 研究发现 AI 筛选的私募基金回报率高于大部分机构投资者
  • 最新资讯

    热门资讯