新加坡国立大学发布 AI 算数模型 GOAT，能力居于 GPT-4 之上

新加坡国立大学发布 AI 算数模型 GOAT，能力居于 GPT-4 之上

人工智能 2023-06-08 13:28:02 1年以前

IT酷哥 6 月 7 日消息，当下 GPT-4 模型最大的短板主要是算术能力，由于模型的逻辑推理能力尚待提升，因此即使是许多人认为相对简单的计算问题，GPT-4 却无法得出正确的结果。

近日，新加坡国立大学研究者推出了 Goat 模型，称该模型“专门用于算术问题”。研究人员表示“在对 LLaMA 模型进行微调后，Goat 在算数上实现了比 GPT-4 更高的准确度与更出色的性能”。

▲图源 Arxiv

研究人员提出了一种新办法，将任务根据算数的可学习型进行分类，然后利用基本算术原理将不可学习的任务分解为一系列可以学习的任务（IT酷哥注：把复杂的计算过程分点拆解成简单的步骤）后导入 AI 模型。

这种新方法可以令模型学习答题模式，并将过程泛化为看不见的数据，而非仅仅依靠纯粹的“权重记忆计算”，因此能够有效地提高算数性能，可以在零样本学习中以“近乎完美的精度”为大数加法和减法生成答案。

▲图源 Arxiv

研究人员在具备 24 GB 显存的 GPU 上进行训练，并将最终得到的模型使用 BIG-bench 算数子任务进行测试，准确率结果较为出众，领先于业内的 Bloom、GPT-NeoX、OPT 等模型。其中零样本的 Goat-7B 的准确率甚至一度超过了少样本学习后的 PaLM-540 模型，在大数计算方面远超 GPT-4。

IT酷哥的小伙伴们可以在这里找到论文的链接。

模型算术研究人员样本大数

相关阅读

知乎发布最新大模型应用“搜索聚合”，即日开启内测

Yseop 公司推出面向科学家的生成式 AI 助理 Yseop Copilot

韩国宣布 2025 年起将 AI 引入中小学课程，三年内实现全覆盖

亚马逊云服务部门高管称正考虑使用 AMD 的新款 AI 芯片，还未最终决定

赛博礼拜？德国一教堂首次尝试用 ChatGPT 布道，300 多人排队一小时参与

腾讯自主研发机器狗 Max 升级，可模仿真狗“奔跑跳跃”完成避障动作

套娃不可取：研究人员证实用 AI 生成的结果训练 AI 将导致模型退化乃至崩溃

讯飞星火 App 上线苹果 iOS 平台：搭载 V1.5 认知大模型，须获取内测资格后使用

行业首家，长虹电视 AI 大模型“长虹超脑”开启公测

必应聊天周报：iOS 端引入小组件、为语音聊天扩展语言支持

对公司缺乏信心，Meta 去年流失三分之一 AI 研究人员

LG 发布首个生成式 AI 商业化服务 Captioning AI：10 秒内为图片提供 5 句描述和 10 个关键词

宏碁、惠普、华硕等品牌发力 AI 笔记本市场，明年将带动新一波换机潮

美国商务部宣布成立 AI 公共工作组，应对生成式人工智能潜在风险

香港电台推出 AI 天气主播 Aida，表情、动作均由电脑合成

微软推出 ZeRO++ 技术，可显著减少 AI 大模型训练时间和成本

警用 AI 助手到来，美亚柏科发布国内首个公共安全大模型“天擎”

16 名匿名人士起诉 ChatGPT 侵犯隐私，向微软和 OpenAI 索赔 30 亿美元

国内 AI 初创公司第四范式获得证监会赴港 IPO 批准，有望近期进行上市聆讯

亚马逊 Kindle 自助出版功能被滥用，AI 生成的书籍泛滥