AI 钞能力:阿联酋打造的 Falcon-40B 语言模型 OpenLLM 排名第一、持续霸榜

AI 钞能力:阿联酋打造的 Falcon-40B 语言模型 OpenLLM 排名第一、持续霸榜

人工智能 2023-06-14 18:38:01 1年以前

IT酷哥 6 月 13 日消息,众所周知,阿联酋在科技及教育产业方面投入的预算一直不菲,近日,阿联酋科技创新研究所(TII)打造出了 400 亿参数的语言模型 Falcon-40B,在 Hugging Face 的 OpenLLM 排行榜上排名第一,并持续霸榜,赢过此前 LLaMA、StableLM 和 RedPajama 等竞争者。

▲ 图源阿联酋科技创新研究所(TII)

据称,Falcon-40B 使用了 384 颗 GPU 来进行 2 个月的训练、利用将近 5 亿个 Token 训练而成。为提高训练过程的质量,团队还自己组建了一套工作流程来筛选出“最高质量的的资料”供给 AI 模型训练。经多个基准测试,表现比 LLaMA、Vicuna 和 Alpaca 更加出色。

此外,团队还采用了“多重查询注意力”(Multiqery attention)机制,来提高模型的效率。“多重查询注意力”机制即模型可以对每个 Token 进行多个查询,来更好表示同一序列中,不同 token 之间的关系,以在加速模型运算效率的同时,降低模型的复杂性,进而提高模型整体的可维护性。

阿联酋科技创新研究所首席执行官 Ray O. Johnson 博士表示:“2023 年将是人工智能之年。Falcon 模型对我们来说具有里程碑意义,但这仅仅是个开始”。

IT酷哥注意到,Falcon 模型已经在 huggingface 上开源,目前开源的版本有 Falcon-7B-Instruct 和 Falcon-40B-Instruct 等,IT酷哥的小伙伴们可以在这里访问。

文章版权声明:除非注明,否则均为网络转载文章,转载或复制请以超链接形式并注明出处。

相关阅读

  • 不止“文心一言”,消息称百度将推出全新 AI 对话软件“万话”
  • 谷歌 CEO 皮查伊最新专访实录:十个 AI 问题,事关人类生存发展
  • 原小米 9 号员工李明打造全球首款 AI 安卓桌面机器人:官方支持 Root,号称“可玩性无限”
  • 打不过就加入:首家承认 ChatGPT 影响收入的公司 Chegg 选择拥抱 AI ,裁减 4% 员工
  • 谷歌将生成式 AI 应用于在线购物,真人模特可实现高精度虚拟换衣
  • (更新)消息称谷歌将与联发科合作打造 AI 服务器芯片,后者回应“错误报道”
  • 快手旗下视频剪辑类产品“快影”内测多款 AIGC 创作功能,可一键生成文案等
  • 阿里、腾讯、字节、美团内部算法名单公开,网信办发布深度合成服务备案信息
  • 软银 CEO 孙正义宣布策略调整:AI 革命正在爆发,公司将“转守为攻”
  • AI 入局世界网球温布顿锦标赛,可分析赢球概率及生成球评
  • 亚马逊投入 1 亿美元成立 AI 创新中心,助力 AWS 业务发展
  • Stability AI 推出文字生成图片模型 SDXL 0.9,硬件要求下探至消费级 GPU 水平
  • 微软用 AI 缩短癌症放疗时间:扫描速度提高 2.5 倍,准确率达 90%
  • 外媒提议更新开源许可证:摆脱 80 年代束缚,应对当下人工智能时代
  • 人工智能深度调查:用过 AI 工具的人并没想象的那么多
  • 美国银行分析师:聊天机器人中 ChatGPT 占据最大优势,过半用户会为其付费服务买单
  • 金融巨头瑞穗银行押注生成式 AI,开放 Azure OpenAI 给 4.5 万名员工使用
  • 近 12 年由 AI 造成的事故暴涨 15 倍,Facebook、特斯拉、OpenAI 位居总量前三
  • “商汤如影 SenseAvatar” 数字人视频生成平台上线,支持定制形象、声音克隆、创作视频等功能
  • 正版文心一言上架 App Store,百度此前起诉苹果“盗版 App 泛滥”
  • 最新资讯

    热门资讯