Yandex 发布最大音乐推荐开源数据集 Yambda

Yandex 发布最大音乐推荐开源数据集 Yambda

人工智能 2025-06-01 11:03:08 2天前

IT酷哥 5 月 30 日消息,俄罗斯搜索引擎巨头 Yandex 昨日发布了世界上最大的音乐推荐系统开源数据集 Yambda,包含 47.9 亿条匿名用户的交互数据,旨在帮助开发者创建智能音乐服务。

Yandex 在十个月内收集了近 2800 万 Yandex Music 月度用户的数据,具体为用户与 939 万首歌曲的 47.9 亿次交互,数据集包括听众对歌曲好恶的关键反馈,所有交互都带有时间戳以提高准确度。

Yambda 在 Hugging Face 提供三种大小的数据集供自由下载:Yambda-5B(来自 100 万名用户的行为)、Yambda-500M(10 万用户)和 Yambda-50M(1 万用户)。其中规模最大的5B 数据集至少需要 85 GB 存储空间。

数据集包含音乐听众的偏好信息,以 Apache Parquet 格式存储,可用作研究用途或开发类似 Spotify 等流媒体服务提供的 AI 音乐推荐功能。

据IT酷哥了解,Spotify 和 Tidal 等流媒体服务通常不会发布其音乐推荐算法的代码或模型,因为推荐听众喜爱歌曲的能力被视为其成功的商业秘密。

文章版权声明:除非注明,否则均为网络转载文章,转载或复制请以超链接形式并注明出处。

相关阅读

  • 国际货币基金组织警告:AI 可能会对就业市场造成“重大破坏”
  • 生成式 AI 热潮让云计算收入猛增,甲骨文股价创历史新高
  • 联合国秘书长称支持建立全球人工智能监管机构
  • Meta 首席 AI 科学家杨立昆:AI 智力连狗都不如,不应将其视作威胁
  • 必应聊天周报:iOS 端引入小组件、为语音聊天扩展语言支持
  • 普通人也能成为音频剪辑师,Meta 推出 AI 模型 Voicebox
  • 美国最大报业集团 Gannett 引入生成式人工智能,保留人类编辑的最终决定权
  • 长城汽车申请 SPACEGPT 等商标,有望成为首批在车机终端引入 AI 智能助理的吃螃蟹者
  • 普林斯顿大学推出 Infinigen AI 模型,可生成真实自然环境 3D 场景
  • 谷歌警告员工使用聊天机器人时要小心,包括自家的 Bard
  • 全球 AI 人才需求激增,部分岗位年薪逼近 40 万美元
  • 印象笔记开放旗下“印象 AI”,可一键生成思维导图、写文章等
  • Meta 发布 Voicebox AI 模型:可生成音频回复信息,用于 NPC 对话等
  • 快手旗下视频剪辑类产品“快影”内测多款 AIGC 创作功能,可一键生成文案等
  • 阿里、腾讯、字节、美团内部算法名单公开,网信办发布深度合成服务备案信息
  • DeepMind 联合创始人提出新的图灵测试:让 AI 将 10 万美元变成 100 万美元
  • Dropbox 网盘推出 AI 搜索工具 Dropbox Dash:聚合多办公平台,可视化管理工作任务
  • 开源模型 PrivateGPT 上线,可本地搭建、避免信息外泄
  • Unity 推出面向开发者的 AI 软件市场 AI Hub,股价飙涨 15%
  • 警用 AI 助手到来,美亚柏科发布国内首个公共安全大模型“天擎”
  • 最新资讯

    热门资讯