效果可达 OpenAI 同等模型 96%,国产开源 AI 语言模型 TigerBot 发布

效果可达 OpenAI 同等模型 96%,国产开源 AI 语言模型 TigerBot 发布

人工智能 2023-06-09 09:02:02 1年以前

IT 之家 6 月 8 日消息,国产多模态大语言模型 TigerBot 近日正式发布,包含 70 亿参数和 1800 亿参数两个版本,目前已经在 GitHub 开源。

▲ 图源 TigerBot 的 GitHub 页面

据悉,TigerBot 带来的创新主要在于:

提出指令完成监督微调的创新算法提升模型可学习性

运用 ensemble 和 probabilistic modeling 的方法实现可控事实性和创造性

在并行训练上突破 deep-speed 等主流框架中的内存和通信问题

此外,该模型还针对中文语言更不规则的分布,从 tokenizer 到训练算法上做了更适合的优化。

研究人员陈烨在虎博科技官网表示:“该模型在只使用少量参数的情况下,就能快速理解人类提出了哪类问题。根据 OpenAI InstructGPT 论文在公开 NLP 数据集上的自动评测,TigerBot-7B 已达到 OpenAI 同样大小模型的综合表现的 96%。”

▲ 图源 TigerBot 的 GitHub 页面

据称,其中 TigerBot-7B-base 的表现“优于 OpenAI 同等可比模型” ,开源代码包括基本训练和推理代码,双卡推理 180B 模型的量化和推理代码。数据包括 100G 预训练数据,监督微调 1G 或 100 万条数据。

IT酷哥小伙伴们可以在这里找到 GitHub 的开源项目。

文章版权声明:除非注明,否则均为网络转载文章,转载或复制请以超链接形式并注明出处。

相关阅读

  • 报告称英伟达人工智能软件可被轻易破解,存在泄露用户隐私的风险
  • 北京智源发布悟道 3.0 大模型系列
  • 联合国秘书长称支持建立全球人工智能监管机构
  • 美国心理学会:经常接触 AI 的员工更容易孤独,增加疾病风险
  • GitHub 报告称 92% 的美国程序员正在使用 AI 工具
  • 赛博手冢治虫:GPT-4 将参与漫画《怪医黑杰克》续作创作过程
  • 【IT之家评测室】讯飞星火认知大模型 V1.5 体验:真变成随身智能助理了
  • 长虹电视 AI 大模型“长虹超脑”发布:三大核心能力,可连续自然对话
  • 亚马逊投入 1 亿美元成立 AI 创新中心,助力 AWS 业务发展
  • 英科智能推出 AI 设计的罕见病特效药,已在中美同时启动人体临床试验
  • 为防止泄密,美国国会明确要求职员仅可使用付费版 ChatGPT
  • 微软推出生成式 AI 培训项目,免费提供在线课程和证书
  • 微软在 Bing 和 Edge 浏览器中拓展网购服务,帮用户选购心仪产品
  • “商汤如影 SenseAvatar” 数字人视频生成平台上线,支持定制形象、声音克隆、创作视频等功能
  • 韩媒称三星先进封装技术落后于台积电,导致难以取得 AI 芯片订单
  • 金山办公宣布与英伟达团队合作,加速 WPS AI 服务
  • MetaGPT AI 模型开源:可模拟软件公司开发过程,生成高质量代码
  • 奔驰正在车辆生产中测试 ChatGPT,进行质量管理和流程优化等活动
  • 小冰 CEO 李笛:马斯克呼吁停止研发 AI 大模型,可能是想给自己争取更多时间
  • 阿里云宣布推出通义万相 AI 绘画大模型
  • 最新资讯

    热门资讯