新加坡国立大学发布 AI 算数模型 GOAT,能力居于 GPT-4 之上

新加坡国立大学发布 AI 算数模型 GOAT,能力居于 GPT-4 之上

人工智能 2023-06-08 13:28:02 1年以前

IT酷哥 6 月 7 日消息,当下 GPT-4 模型最大的短板主要是算术能力,由于模型的逻辑推理能力尚待提升,因此即使是许多人认为相对简单的计算问题,GPT-4 却无法得出正确的结果。

近日,新加坡国立大学研究者推出了 Goat 模型,称该模型“专门用于算术问题”。研究人员表示“在对 LLaMA 模型进行微调后,Goat 在算数上实现了比 GPT-4 更高的准确度与更出色的性能”。

▲图源 Arxiv

研究人员提出了一种新办法,将任务根据算数的可学习型进行分类,然后利用基本算术原理将不可学习的任务分解为一系列可以学习的任务(IT酷哥注:把复杂的计算过程分点拆解成简单的步骤)后导入 AI 模型。

这种新方法可以令模型学习答题模式,并将过程泛化为看不见的数据,而非仅仅依靠纯粹的“权重记忆计算”,因此能够有效地提高算数性能,可以在零样本学习中以“近乎完美的精度”为大数加法和减法生成答案。

▲图源 Arxiv

研究人员在具备 24 GB 显存的 GPU 上进行训练,并将最终得到的模型使用 BIG-bench 算数子任务进行测试,准确率结果较为出众,领先于业内的 Bloom、GPT-NeoX、OPT 等模型。其中零样本的 Goat-7B 的准确率甚至一度超过了少样本学习后的 PaLM-540 模型,在大数计算方面远超 GPT-4。

IT酷哥的小伙伴们可以在这里找到论文的链接。

文章版权声明:除非注明,否则均为网络转载文章,转载或复制请以超链接形式并注明出处。

相关阅读

  • 知乎发布最新大模型应用“搜索聚合”,即日开启内测
  • OpenAI CTO 揭晓 ChatGPT 内幕,原本只是一个研究示范项目
  • 印象笔记开放旗下“印象 AI”,可一键生成思维导图、写文章等
  • 阿里、腾讯、字节、美团内部算法名单公开,网信办发布深度合成服务备案信息
  • 语音生成 AI 初创公司 ElevenLabs 发布合成语音检测工具,号称准确率超过 99%
  • AI 公司 Databricks 推出人工智能模型共享机制,可令开发者与公司实现“双赢”
  • YouTube 测试 Aloud 人工智能配音功能,可将视频转述为不同语言
  • 美国商务部宣布成立 AI 公共工作组,应对生成式人工智能潜在风险
  • 复旦大学与阿里巴巴达成全面战略合作,共享 AI 大模型底层能力
  • 16 名匿名人士起诉 ChatGPT 侵犯隐私,向微软和 OpenAI 索赔 30 亿美元
  • 微软在 Bing 和 Edge 浏览器中拓展网购服务,帮用户选购心仪产品
  • 金山办公宣布与英伟达团队合作,加速 WPS AI 服务
  • 学而思网校推出《人工智能第一课》,号称首个基于自研大模型的 AIGC 课程
  • 方舟启航,火山引擎这波在“大气层”
  • 奔驰正在车辆生产中测试 ChatGPT,进行质量管理和流程优化等活动
  • Mozilla 的 AI Help 工具终遭官方停用:生成的技术信息真假参半
  • 科大讯飞:讯飞医疗基于星火大模型升级医疗诊后康复管理平台,出院患者满意度 98% 以上
  • 阿里云宣布推出通义万相 AI 绘画大模型
  • 中国工程院院士高文:没有大算力做大模型就是天方夜谭
  • 图表显示必应聊天今年 3 月月活用户数量逼近 15 亿
  • 最新资讯

    热门资讯