Meta 发布 Megabyte AI 模型抗衡 Transformer:解决后者已知问题、速度提升 4 成

Meta 发布 Megabyte AI 模型抗衡 Transformer:解决后者已知问题、速度提升 4 成

IT资讯 2023-06-09 15:06:02 1年以前

IT酷哥 5 月 30 日消息,近日 Meta 团队开发了一款名为 Megabyte 的 AI 模型以抗衡 Transformer,据称 Megabyte 解决了 Transformer 模型所面临的问题,并且在速度上提升了 40%。

▲图源 Arxiv

目前 Transformer 在自然语言处理等领域非常流行,但由于其序列数据的处理方式是逐步进行的,无法并行化处理,因此训练速度较慢; 难以处理长序列,因为其在反向传播过程中,梯度很容易消失或爆炸;此外,由于需要在每一步保留历史信息,内存消耗较大。

而 Megabyte 模型将输入和输出序列划分为 patch,而不是单个的 token。这种架构使得对大多数任务而言字节级别的预测相对容易,例如根据前几个字符预测完成的单词等。这意味着在大型网络中可以精简字符以提升效率,并且内部预测可以使用更小的模型进行。Megabyte 模型的这种方法解决了当今 AI 模型所面临的训练速度、可靠性及硬件占用比挑战。

▲图源 Arxiv

此外,在计算效率方面,相比于等大的 Transformer 和 Linear Transformer,Megabyte 模型在固定模型大小和序列长度范围内使用更少的 token。因此相对于 Transformer,Megabyte 模型可以在相同的计算成本下训练内容更丰富、体积更大、性能更好的模型。

目前 Meta 团队放出了 Megabyte 模型的论文,IT酷哥小伙伴可以前往查阅。

文章版权声明:除非注明,否则均为网络转载文章,转载或复制请以超链接形式并注明出处。

相关阅读

  • 贝锐向日葵网页控网页:高效、灵活的远程技术支持新利器
  • OPPO Reno10 系列搭载旗舰级配置,持久流畅引领行业
  • 微信视频号直播推游戏功能正式上线:主播与玩家“一起玩”,实现流量变现
  • 冰箱行业修复明显,容声开辟全新增长赛道
  • 京东 618 预售数据:人均购买预售商品数量同比增长超 30%
  • 收购动视暴雪在英国遇阻,微软列出上诉理由
  • 荣耀 Magic5 系列手机推送更新,新增荣耀影像相框
  • 科技融合交通,浪潮云海携手凤凰磁浮让千年古镇焕发新机
  • 英特尔黑科技加持,腾讯应用宝登陆电脑:安卓应用完美移植 PC 更有神器辅助
  • 行业流畅领跑,OPPO ColorOS 斩获鲁大师久用流畅大满贯
  • 《瞬息全宇宙》幕后技术公司 Runway 获谷歌投资,加速 AI 在影视创作中的应用
  • 天猫 618 包裹半日送达签收超 300 城,多城超七成预售包裹已签收
  • 减产无效,报告称企业级 SSD 一季度销售额几乎腰斩
  • 广汽传祺 5 月全系销量突破 3 万辆,传祺 M8 车型同比增长 100%
  • 统信 UOS 服务器版新增永久免费授权:可从 CentOS 迁移,但无后续支持
  • 消息称台积电拟明年 1 月起逆势上调先进制程报价,幅度达 3%~6%
  • 华为:不会有“盘古 Chat”此类命名,也不“对标”业界产品
  • 消息称美国科技产业今年前五个月裁员超 13 万人,创下 2001 年以来新纪录
  • 比亚迪王传福:汽车行业已进入淘汰赛阶段,有核心技术才能活下来
  • 苹果、Epic 一致要求美国法院重新考虑其反垄断裁决
  • 最新资讯

    热门资讯