英伟达:CPU 已落伍,用 GPU 训练大语言模型成本可降低 96%

英伟达:CPU 已落伍,用 GPU 训练大语言模型成本可降低 96%

人工智能 2023-06-01 08:00:02 1年以前

IT酷哥 5 月 29 日消息,根据英伟达在 2023 年台北电脑展会上的演讲,该公司宣称其 GPU 可以大幅降低训练大型语言模型(LLM)的成本和耗能。

英伟达首席执行官黄仁勋在演讲中,向 CPU 行业发起了挑战,他认为生成式人工智能和加速计算是未来计算的方向。他宣布传统的摩尔定律已经过时,未来的性能提升将主要来自生成式人工智能和基于加速计算的方法。

英伟达在展会上展示了一份 LLM 的总体拥有成本(Total Cost of Ownership,TCO)分析:首先,他们计算了训练一个 LLM 所需的 960 个 CPU 组成的服务器集群的完整成本(包括网络、机箱、互连等所有设备),发现这需要花费约 1000 万美元(IT酷哥备注:当前约 7070 万元人民币),并消耗 11 千兆瓦时的电力。

相比之下,如果保持成本不变,购买一个价值 1000 万美元的 GPU 集群,可以在同样的成本和更少的电力消耗(3.2 千兆瓦时)下训练 44 个 LLM。如果转而保持电力消耗不变,那么可以通过 GPU 集群实现 150 倍的加速,以 11 千兆瓦时的电力消耗训练 150 个 LLM,但这需要花费 3400 万美元,此外这个集群的占地面积比 CPU 集群小得多。最后,如果只想训练一个 LLM,那么只需要一个价值 40 万美元、消耗 0.13 千兆瓦时电力的 GPU 服务器就可以了。

英伟达所要表达的意思是,相比 CPU 服务器,客户可以以 4% 的成本和 1.2% 的电力消耗来训练一个 LLM,这是一个巨大的成本节省。

文章版权声明:除非注明,否则均为网络转载文章,转载或复制请以超链接形式并注明出处。

相关阅读

  • 全球最大资产管理公司 CEO:人工智能可能是一种抑制通货膨胀的技术
  • 行业首家,长虹电视 AI 大模型“长虹超脑”开启公测
  • 软银 CEO 孙正义称每天都会使用 ChatGPT,是生成式 AI 服务的“忠实用户”
  • 长虹电视 AI 大模型“长虹超脑”发布:三大核心能力,可连续自然对话
  • 丰田推出生成式 AI 工具:输入文字指令可自动设计汽车外形,并符合工程学需求
  • 英特尔研究院发布全新 AI 扩散模型,可根据文本提示生成 360 度全景图
  • AI 作画工具 Midjourney 迎来 5.2 版本更新,可生成相机“变焦效果”
  • 外媒提议更新开源许可证:摆脱 80 年代束缚,应对当下人工智能时代
  • Unity 推出面向开发者的 AI 软件市场 AI Hub,股价飙涨 15%
  • 2023 全球 AI 指数排名公布:美中稳居前二,亚洲国家表现亮眼
  • 特斯拉人形机器人将于 7 月亮相上海 2023 世界人工智能大会
  • 内置 AI 助手 Copilot 上线:微软 Win11 Dev 预览版 Build 23493 发布,设置、音量大改
  • 版权问题难解,OpenAI 被控非法使用图书数据训练 AI 系统
  • 微软在 Bing 和 Edge 浏览器中拓展网购服务,帮用户选购心仪产品
  • 刚合作就解约,Unity 剔除一家销售盗用资源的 AI 合作伙伴
  • 微软必应聊天周报:改善体育相关话题、向 Skype 开放图片生成工具
  • “世界上最像人的机器人”Ameca 接入 Stable Diffusion 和 GPT-3,现场完成作画
  • 联合国安理会将首次召开 AI 监管会议,讨论 AI 对全球和平与安全的潜在威胁
  • 格莱美 CEO 解释 AI 新规:愿意接纳新技术,包含 AI 要素作品也可获提名
  • 热度过去用户兴趣降低:数据显示 ChatGPT 流量在 6 月首次出现下降
  • 最新资讯

    热门资讯