AI 钞能力:阿联酋打造的 Falcon-40B 语言模型 OpenLLM 排名第一、持续霸榜

AI 钞能力:阿联酋打造的 Falcon-40B 语言模型 OpenLLM 排名第一、持续霸榜

人工智能 2023-06-14 18:38:01 1年以前

IT酷哥 6 月 13 日消息,众所周知,阿联酋在科技及教育产业方面投入的预算一直不菲,近日,阿联酋科技创新研究所(TII)打造出了 400 亿参数的语言模型 Falcon-40B,在 Hugging Face 的 OpenLLM 排行榜上排名第一,并持续霸榜,赢过此前 LLaMA、StableLM 和 RedPajama 等竞争者。

▲ 图源阿联酋科技创新研究所(TII)

据称,Falcon-40B 使用了 384 颗 GPU 来进行 2 个月的训练、利用将近 5 亿个 Token 训练而成。为提高训练过程的质量,团队还自己组建了一套工作流程来筛选出“最高质量的的资料”供给 AI 模型训练。经多个基准测试,表现比 LLaMA、Vicuna 和 Alpaca 更加出色。

此外,团队还采用了“多重查询注意力”(Multiqery attention)机制,来提高模型的效率。“多重查询注意力”机制即模型可以对每个 Token 进行多个查询,来更好表示同一序列中,不同 token 之间的关系,以在加速模型运算效率的同时,降低模型的复杂性,进而提高模型整体的可维护性。

阿联酋科技创新研究所首席执行官 Ray O. Johnson 博士表示:“2023 年将是人工智能之年。Falcon 模型对我们来说具有里程碑意义,但这仅仅是个开始”。

IT酷哥注意到,Falcon 模型已经在 huggingface 上开源,目前开源的版本有 Falcon-7B-Instruct 和 Falcon-40B-Instruct 等,IT酷哥的小伙伴们可以在这里访问。

文章版权声明:除非注明,否则均为网络转载文章,转载或复制请以超链接形式并注明出处。

相关阅读

  • 欧盟要求大型科技公司标记 AI 生成内容,分析称实际执行存在技术障碍
  • 《瞬息全宇宙》幕后特效公司 Runway 推出 AI 模型 Gen-2,可根据提示词生成逼真视频
  • 消息称 ChatGPT 本可更强,GPU 短缺成最大阻碍
  • 商汤科技:元萝卜 AI 下棋机器人新品发布会 6 月 14 日举行
  • 打不过就加入:首家承认 ChatGPT 影响收入的公司 Chegg 选择拥抱 AI ,裁减 4% 员工
  • (更新)消息称谷歌将与联发科合作打造 AI 服务器芯片,后者回应“错误报道”
  • 网友“欺骗”ChatGPT 生成 Win10、Win11 密钥,马斯克调侃:真适合做睡前读物
  • 阿里、腾讯、字节、美团内部算法名单公开,网信办发布深度合成服务备案信息
  • 科学家利用 AI 识别热门歌曲,准确率高达 97%
  • 特斯拉创建 Tesla AI 推特账户,称下月开始生产 Dojo 超级计算机
  • 宏碁、惠普、华硕等品牌发力 AI 笔记本市场,明年将带动新一波换机潮
  • 微软用 AI 缩短癌症放疗时间:扫描速度提高 2.5 倍,准确率达 90%
  • 英科智能推出 AI 设计的罕见病特效药,已在中美同时启动人体临床试验
  • 日媒关注中国推进鸟类识别 AI 普及,除监测保护外还可预防传染性疾病
  • 版权问题难解,OpenAI 被控非法使用图书数据训练 AI 系统
  • 韩媒称三星先进封装技术落后于台积电,导致难以取得 AI 芯片订单
  • 研究发现 AI 筛选的私募基金回报率高于大部分机构投资者
  • 研究表明 GPT-4 模型具备自我纠错能力,有望推动 AI 代码进一步商业化
  • 《自然》杂志正刊发表华为云旗下盘古气象大模型研究成果,天气预报更精准
  • 精准度可提高 20%:英国九家银行签约使用基于 AI 的“消费者欺诈风险系统”应对诈骗
  • 最新资讯

    热门资讯