DeepMind 推出 LATM 框架,可令 GPT-4 自己生成软件工具处理任务

DeepMind 推出 LATM 框架,可令 GPT-4 自己生成软件工具处理任务

IT资讯 2023-06-10 10:57:02 1年以前

IT酷哥 5 月 31 日消息,DeepMind、普林斯顿大学和斯坦福大学的研究人员近日提出了一项名为 LATM(LLMs As Tool Makers)的创新框架,该框架可以将像 GPT-4 这样的大型语言模型转变为工具制造者(IT酷哥注:即让模型自己生成软件工具来处理新任务)。

▲ 图源 Arxiv

LATM 的创新之处在于它为语言模型引入了工具制造和使用的概念,使得模型能够自主创建适用于不同任务的工具。这一框架不仅能够提高模型的灵活性和适应性,还能够为生成式 AI 提供更加高效和经济的解决方案。该框架主要包含以下两个关键部分:

工具制造:作为工具制造者,LLM 专门为特定任务设计软件工具,这些工具以 Python 函数的形式实现。

工具使用:另一个 LLM 作为工具使用者,可以调用这些软件工具来处理新的请求。

这种设计可以让 LATM 能够将任务分配给最适合的 LLM,将需要具备高强度算力才能实现的工具制造过程可以分配给功能强大、资源密集型的模型,例如 GPT-4;而将相对简单的使用工具过程分配给轻量级、经济高效的模型,例如 GPT-3.5 Turbo。这种方法不仅增强了 LLM 解决问题的能力,而且可以显著降低处理一系列任务的平均计算成本,以最大程度提升框架效率。

▲ 图源 Arxiv

实验结果验证了 LATM 在复杂推理任务上的有效性。研究人员发现,LATM 能够达到与资源密集型模型相当的性能,并具有更高的成本效益。这一大型语言模型方法仿照了人类创造和使用工具的进化过程,可促进大型语言模型生成工具的发展。

研究人员认为,LATM 将为自然语言处理领域带来重大的突破,并在实际应用中发挥重要作用,这一创新可高效提升生成式 AI 的效率,以加速促进自然语言处理和人工智能领域的发展。

IT酷哥的小伙伴们可以在这里找到论文信息。

文章版权声明:除非注明,否则均为网络转载文章,转载或复制请以超链接形式并注明出处。

相关阅读

  • 中国网吧,奇迹爆发
  • 联想 618 服务再升级,以旧换新至高补贴 2000 元!
  • 消息称联发科天玑 9300 处理器采用 4+4 全大核架构:性能阻击 A17,功耗降低 50%
  • 七彩虹开启 618 年中大促:新品显卡试玩,3+1 延保无限次服务
  • 打造小折叠终极形态 moto razr 40 Ultra 开启全面外屏时代
  • 英伟达 CEO 黄仁勋:H100 由台积电独家代工,不考虑新增第二家晶圆代工
  • 技嘉京东 618 年中钜惠,爆款 B550M 小雕主板仅需 669 元
  • 投票:苹果 Vision Pro 增强现实头显售价 3499 美元,贵?
  • 小课屏 C2 灵动版上市,行业首发 7 条人因智慧护眼调光,为孩子定制护眼屏幕光
  • 电影《封神第一部》定档 7 月 20 日上映:《寻龙诀》导演乌尔善新作,李雪健、黄渤主演
  • 苹果公布 2023 App 设计大奖获胜者:多邻国等 12 款应用、游戏上榜
  • 连续两年!PingCAP 入选 Gartner 云数据库“客户之声”,获评“卓越表现者”最高分
  • 微软警告 MOVEit Transfer 文件共享系统存在零日漏洞,黑客可任意修改数据库 SQL 语句
  • 可城市可越野!仰望 U8 以云辇-P 拓展体验边界
  • 华为云 ECS / HECS:中小企业简单上云快一步
  • 苹果 iOS 17 可自动屏蔽不请自来的裸照,并发出“敏感内容警告”
  • 瑞昱再度回应同联发科的专利纠纷,称所获赔偿将捐作公益
  • YashanDB 携共享集群技术首次亮相中国国际信息通信展
  • 广东电信网络出现故障:手机断网没信号,无法连网和拨打电话
  • 喝好水也要真功夫,小熊电器即热饮水机夯实产品实力
  • 最新资讯

    热门资讯