AI 公司 MosaicML 推出 300 亿参数模型 MPT-30B,号称训练成本仅为竞品零头

AI 公司 MosaicML 推出 300 亿参数模型 MPT-30B,号称训练成本仅为竞品零头

人工智能 2023-06-27 14:01:02 1年以前

IT酷哥 6 月 25 日消息,AI 创业公司 MosaicML 近日发布了其语言模型 MPT-30B,该模型具有 300 亿参数,训练成本“仅有其他同类竞品模型的零头”,有望促进行业逐步降低此类模型训练成本,扩大 AI 模型在更广泛领域的运用。

▲ 图源 MosaicML

MosaicML 公司的首席执行官兼联合创始人 Naveen Rao 表示,MPT-30B 的训练成本为 70 万美元(约 502.44 万元人民币),远低于 GPT-3 等同类产品所需的数千万美元训练成本。此外,由于 MPT-30B 的成本较低,体积较小,它也可以更快速地被训练,并且更适合部署在本地硬件上。

据悉,MosaicML 使用了 Alibi 和 FlashAttention 技术来优化模型,可以实现更长的文本长度和对 GPU 计算的更高利用率。MosaicML 也是少数几个能够使用 Nvidia H100 GPU 的实验室,相比以往成果,当下每块 GPU 的吞吐量增加了 2.4 倍以上,可带来更快的完成时间。

除了让 AI 技术更容易获得之外,MosaicML 还专注于提高数据质量并提高模型性能。他们目前正在开发一款工具,可以帮助用户在预训练过程中分层加入特定领域的数据,以确保训练中开业实现多样化和高质量的数据组合。

MosaicML 公司表示,将模型扩展到 300 亿参数只是第一步,接下来他们将以降低成本为前提,推出体积更大、质量更高的模型。

IT酷哥注意到,目前开发者可以从 Hugging Face 下载并使用开源的 MPT-30B 基础模型,开发者还可以在本地硬件上使用自己的数据,对模型进行微调。

文章版权声明:除非注明,否则均为网络转载文章,转载或复制请以超链接形式并注明出处。

相关阅读

  • 可按用户语气自动回复消息,在线会议软件 Zoom 推出基于生成式 AI 的新功能
  • 笔神作文称学而思 AI 大模型盗窃其数据,后者回应称调用均与合同要求相符
  • 赛博手冢治虫:GPT-4 将参与漫画《怪医黑杰克》续作创作过程
  • 当一个网站的内容被 AI 完全接管
  • 格莱美修订规则:只有“人类创作者”才有资格获奖
  • 必应聊天周报:iOS 端引入小组件、为语音聊天扩展语言支持
  • 普通人也能成为音频剪辑师,Meta 推出 AI 模型 Voicebox
  • 你的工作未来由人工智能决定,报告称明年 43% 的企业部署 AI 面试
  • 腾讯首次披露行业大模型进展:不追求参数高,希望成本预算可控
  • 蚂蚁集团证实正研发语言和多模态大模型,定名“贞仪”
  • YouTube 测试 Aloud 人工智能配音功能,可将视频转述为不同语言
  • 宏碁、惠普、华硕等品牌发力 AI 笔记本市场,明年将带动新一波换机潮
  • 美国商务部宣布成立 AI 公共工作组,应对生成式人工智能潜在风险
  • 复旦大学与阿里巴巴达成全面战略合作,共享 AI 大模型底层能力
  • 外媒提议更新开源许可证:摆脱 80 年代束缚,应对当下人工智能时代
  • Unity 推出面向开发者的 AI 软件市场 AI Hub,股价飙涨 15%
  • 谷歌 DeepMind 自曝正开发新型 AI 模型 Gemini,号称“比 GPT-4 强”
  • 英科智能推出 AI 设计的罕见病特效药,已在中美同时启动人体临床试验
  • 英伟达联手 Snowflake:卖出更多芯片,帮助企业客户建立自己的 AI 模型
  • 2023 全球 AI 指数排名公布:美中稳居前二,亚洲国家表现亮眼
  • 最新资讯

    热门资讯