新加坡国立大学发布 AI 算数模型 GOAT,能力居于 GPT-4 之上

新加坡国立大学发布 AI 算数模型 GOAT,能力居于 GPT-4 之上

人工智能 2023-06-08 13:28:02 1年以前

IT酷哥 6 月 7 日消息,当下 GPT-4 模型最大的短板主要是算术能力,由于模型的逻辑推理能力尚待提升,因此即使是许多人认为相对简单的计算问题,GPT-4 却无法得出正确的结果。

近日,新加坡国立大学研究者推出了 Goat 模型,称该模型“专门用于算术问题”。研究人员表示“在对 LLaMA 模型进行微调后,Goat 在算数上实现了比 GPT-4 更高的准确度与更出色的性能”。

▲图源 Arxiv

研究人员提出了一种新办法,将任务根据算数的可学习型进行分类,然后利用基本算术原理将不可学习的任务分解为一系列可以学习的任务(IT酷哥注:把复杂的计算过程分点拆解成简单的步骤)后导入 AI 模型。

这种新方法可以令模型学习答题模式,并将过程泛化为看不见的数据,而非仅仅依靠纯粹的“权重记忆计算”,因此能够有效地提高算数性能,可以在零样本学习中以“近乎完美的精度”为大数加法和减法生成答案。

▲图源 Arxiv

研究人员在具备 24 GB 显存的 GPU 上进行训练,并将最终得到的模型使用 BIG-bench 算数子任务进行测试,准确率结果较为出众,领先于业内的 Bloom、GPT-NeoX、OPT 等模型。其中零样本的 Goat-7B 的准确率甚至一度超过了少样本学习后的 PaLM-540 模型,在大数计算方面远超 GPT-4。

IT酷哥的小伙伴们可以在这里找到论文的链接。

文章版权声明:除非注明,否则均为网络转载文章,转载或复制请以超链接形式并注明出处。

相关阅读

  • 商汤科技:元萝卜 AI 下棋机器人新品发布会 6 月 14 日举行
  • 谷歌推出 SAIF 框架,倡导安全环境下探索和发展人工智能
  • 原小米 9 号员工李明打造全球首款 AI 安卓桌面机器人:官方支持 Root,号称“可玩性无限”
  • 微软推出 LLaVA-Med AI 模型,可对医学病理案例进行分析
  • 谷歌推出多项功能:识别皮肤病、模拟试穿衣服
  • 中科院自研新一代 AI 大模型“紫东太初 2.0”问世,支持视频、3D 等模态数据
  • 格莱美修订规则:只有“人类创作者”才有资格获奖
  • 日本神户开始验证市政 AI 化效果:自动规划巡逻路线,减少犯罪发生
  • 理想汽车负责人:我们在 ChatGPT 问世之前就已启动 AI 大语言模型训练
  • 你的工作未来由人工智能决定,报告称明年 43% 的企业部署 AI 面试
  • Stability AI 推出文字生成图片模型 SDXL 0.9,硬件要求下探至消费级 GPU 水平
  • 美国商务部宣布成立 AI 公共工作组,应对生成式人工智能潜在风险
  • 中国联通发布鸿湖图文 AI 大模型 1.0,可实现以文生图、视频剪辑
  • Unity 推出面向开发者的 AI 软件市场 AI Hub,股价飙涨 15%
  • 英科智能推出 AI 设计的罕见病特效药,已在中美同时启动人体临床试验
  • 金融巨头瑞穗银行押注生成式 AI,开放 Azure OpenAI 给 4.5 万名员工使用
  • 微软推出 ZeRO++ 技术,可显著减少 AI 大模型训练时间和成本
  • 警用 AI 助手到来,美亚柏科发布国内首个公共安全大模型“天擎”
  • 微软推出生成式 AI 培训项目,免费提供在线课程和证书
  • 成功率 99%,科学家研发语音 deepfake 软件:只需 5 分钟录音即可欺骗语音认证系统
  • 最新资讯

    热门资讯