Meta 开源 AI 语言模型 MusicGen,可将文本和旋律转化为完整乐曲

Meta 开源 AI 语言模型 MusicGen,可将文本和旋律转化为完整乐曲

人工智能 2023-06-14 19:19:01 1年以前

IT酷哥 6 月 12 日消息,Meta 近日在 Github 上开源了其 AI 语言模型 MusicGen,该模型基于谷歌 2017 年推出的 Transformer 模型。如同模型名称所示,MusicGen 主要用于音乐生成,它可以将文本和已有的旋律转化为完整乐曲。

研发团队表示:“我们使用了 20000 小时的授权音乐来对训练该模型,并采用 Meta 的 EnCodec 编码器将音频数据分解为更小的单元进行并行处理,进而让 MusicGen 的运算效率和生成速度都比同类型 AI 模型更为出色。”

除此之外,MusicGen 还支持文本与旋律的组合输入,例如你可以提出生成“一首轻快的曲目”并同时要求“将它与贝多芬的《欢乐颂》结合起来”。

研发团队还对 MusicGen 的实际表现进行了测试。结果显示,与谷歌的 MusicLM 以及 Riffusion、Mousai、Noise2Music 等其他音乐模型相比,MusicGen 在测试音乐与文本提示的匹配度以及作曲的可信度等指标上表现更好,总体而言略高于谷歌 MusicLM 的水平。

Meta 已允许该模型的商业使用,并在 Huggingface 上发布了一个供演示用的网页应用。

IT酷哥附上模型地址:点此前往

演示应用地址:点此前往

文章版权声明:除非注明,否则均为网络转载文章,转载或复制请以超链接形式并注明出处。

相关阅读

  • 《自然》杂志拒绝刊登人工智能生成的图片和视频
  • 一个月来至少三起,台积电频频投资硅谷 AI 芯片创企
  • 麦肯锡:到 2045 年左右,将有 50% 工作被 AI 接管
  • 王小川创立的百川智能发布中英文大模型:采用开源模式,可免费商用
  • 日本音乐作家团体联合会发表声明,要求政府立即组织 AI 监管讨论并邀请创作者参与
  • 当一个网站的内容被 AI 完全接管
  • 微软为 AI 初学者推出免费网课:为期 12 周,共 24 节课
  • 消息称东盟正起草 AI 监管法案:新加坡牵头,最快今年底完成
  • 马斯克称没人会真暂停开发 AI ,呼吁只是为提醒大家注意
  • 谷歌警告员工使用聊天机器人时要小心,包括自家的 Bard
  • Snap 研发出新技术 SnapFusion,未来智能手机秒出 AI 生成图像
  • 丰田推出生成式 AI 工具:输入文字指令可自动设计汽车外形,并符合工程学需求
  • 中国联通发布鸿湖图文 AI 大模型 1.0,可实现以文生图、视频剪辑
  • 香港电台推出 AI 天气主播 Aida,表情、动作均由电脑合成
  • 美国银行分析师:聊天机器人中 ChatGPT 占据最大优势,过半用户会为其付费服务买单
  • 特斯拉人形机器人将于 7 月亮相上海 2023 世界人工智能大会
  • 微软必应聊天周报:改善体育相关话题、向 Skype 开放图片生成工具
  • 英国初创公司用 AI 提升垃圾回收效率,每年追踪量达 320 亿件
  • 中国电信公布 TeleChat 大模型,宣称将建立“百亿级 AI 服务商”
  • 正版文心一言上架 App Store,百度此前起诉苹果“盗版 App 泛滥”
  • 最新资讯

    热门资讯