AI 钞能力:阿联酋打造的 Falcon-40B 语言模型 OpenLLM 排名第一、持续霸榜

AI 钞能力:阿联酋打造的 Falcon-40B 语言模型 OpenLLM 排名第一、持续霸榜

人工智能 2023-06-14 18:38:01 1年以前

IT酷哥 6 月 13 日消息,众所周知,阿联酋在科技及教育产业方面投入的预算一直不菲,近日,阿联酋科技创新研究所(TII)打造出了 400 亿参数的语言模型 Falcon-40B,在 Hugging Face 的 OpenLLM 排行榜上排名第一,并持续霸榜,赢过此前 LLaMA、StableLM 和 RedPajama 等竞争者。

▲ 图源阿联酋科技创新研究所(TII)

据称,Falcon-40B 使用了 384 颗 GPU 来进行 2 个月的训练、利用将近 5 亿个 Token 训练而成。为提高训练过程的质量,团队还自己组建了一套工作流程来筛选出“最高质量的的资料”供给 AI 模型训练。经多个基准测试,表现比 LLaMA、Vicuna 和 Alpaca 更加出色。

此外,团队还采用了“多重查询注意力”(Multiqery attention)机制,来提高模型的效率。“多重查询注意力”机制即模型可以对每个 Token 进行多个查询,来更好表示同一序列中,不同 token 之间的关系,以在加速模型运算效率的同时,降低模型的复杂性,进而提高模型整体的可维护性。

阿联酋科技创新研究所首席执行官 Ray O. Johnson 博士表示:“2023 年将是人工智能之年。Falcon 模型对我们来说具有里程碑意义,但这仅仅是个开始”。

IT酷哥注意到,Falcon 模型已经在 huggingface 上开源,目前开源的版本有 Falcon-7B-Instruct 和 Falcon-40B-Instruct 等,IT酷哥的小伙伴们可以在这里访问。

文章版权声明:除非注明,否则均为网络转载文章,转载或复制请以超链接形式并注明出处。

相关阅读

  • OpenAI CEO 阿尔特曼访问韩国,将会见 100 家初创公司领袖
  • 报告称英伟达人工智能软件可被轻易破解,存在泄露用户隐私的风险
  • 北京智源发布悟道 3.0 大模型系列
  • 谷歌 CEO 皮查伊最新专访实录:十个 AI 问题,事关人类生存发展
  • AI 钞能力:阿联酋打造的 Falcon-40B 语言模型 OpenLLM 排名第一、持续霸榜
  • 麦肯锡:到 2045 年左右,将有 50% 工作被 AI 接管
  • 百度与中国石化签署战略合作框架协议,将在 AI 等领域深化合作
  • 普通人也能成为音频剪辑师,Meta 推出 AI 模型 Voicebox
  • (更新)消息称谷歌将与联发科合作打造 AI 服务器芯片,后者回应“错误报道”
  • Meta 发布 Voicebox AI 模型:可生成音频回复信息,用于 NPC 对话等
  • 成功率 99%,科学家研发语音 deepfake 软件:只需 5 分钟录音即可欺骗语音认证系统
  • 调查发现 20% 的男性使用 ChatGPT 等 AI 工具“美化”约会资料,提高交流技巧
  • 版权问题难解,OpenAI 被控非法使用图书数据训练 AI 系统
  • 刚合作就解约,Unity 剔除一家销售盗用资源的 AI 合作伙伴
  • 中国团队推出世界首颗 AI 全自动设计 CPU“启蒙 1 号”:无人工干预,性能堪比 486
  • 微软必应聊天周报:改善体育相关话题、向 Skype 开放图片生成工具
  • AI 作画工具 Midjourney 推出“pan”功能,可上下左右平移扩展图片外场景
  • 匈牙利公司推出世界首款 AI 研发饮料,口味、包装均由 AI 完成
  • 热度过去用户兴趣降低:数据显示 ChatGPT 流量在 6 月首次出现下降
  • 华为宣布联合 26 家企业启动昇腾 AI 大模型联合创新,已建成业界首个万卡 AI 集群
  • 最新资讯

    热门资讯