效果可达 OpenAI 同等模型 96%,国产开源 AI 语言模型 TigerBot 发布

效果可达 OpenAI 同等模型 96%,国产开源 AI 语言模型 TigerBot 发布

人工智能 2023-06-09 09:02:02 1年以前

IT 之家 6 月 8 日消息,国产多模态大语言模型 TigerBot 近日正式发布,包含 70 亿参数和 1800 亿参数两个版本,目前已经在 GitHub 开源。

▲ 图源 TigerBot 的 GitHub 页面

据悉,TigerBot 带来的创新主要在于:

提出指令完成监督微调的创新算法提升模型可学习性

运用 ensemble 和 probabilistic modeling 的方法实现可控事实性和创造性

在并行训练上突破 deep-speed 等主流框架中的内存和通信问题

此外,该模型还针对中文语言更不规则的分布,从 tokenizer 到训练算法上做了更适合的优化。

研究人员陈烨在虎博科技官网表示:“该模型在只使用少量参数的情况下,就能快速理解人类提出了哪类问题。根据 OpenAI InstructGPT 论文在公开 NLP 数据集上的自动评测,TigerBot-7B 已达到 OpenAI 同样大小模型的综合表现的 96%。”

▲ 图源 TigerBot 的 GitHub 页面

据称,其中 TigerBot-7B-base 的表现“优于 OpenAI 同等可比模型” ,开源代码包括基本训练和推理代码,双卡推理 180B 模型的量化和推理代码。数据包括 100G 预训练数据,监督微调 1G 或 100 万条数据。

IT酷哥小伙伴们可以在这里找到 GitHub 的开源项目。

文章版权声明:除非注明,否则均为网络转载文章,转载或复制请以超链接形式并注明出处。

相关阅读

  • 英国投资 1 亿英镑,成立 AI 工作组和 OpenAI 等共建基础模型
  • 消息称谷歌警告员工不要向生成式 AI“泄密”,也不要直接用其写代码
  • 对公司缺乏信心,Meta 去年流失三分之一 AI 研究人员
  • Meta 发布 Voicebox AI 模型:可生成音频回复信息,用于 NPC 对话等
  • 语音生成 AI 初创公司 ElevenLabs 发布合成语音检测工具,号称准确率超过 99%
  • DeepMind 联合创始人提出新的图灵测试:让 AI 将 10 万美元变成 100 万美元
  • AI 入局世界网球温布顿锦标赛,可分析赢球概率及生成球评
  • Opera 向桌面和安卓用户开放浏览器 AI“Aria”
  • 日本起草针对学校的生成式 AI 使用指南,禁止学生用 ChatGPT 写作文
  • AI 图像编辑技术 DragGAN 开源,拖动鼠标即可将狮子 P 转头
  • 外媒提议更新开源许可证:摆脱 80 年代束缚,应对当下人工智能时代
  • 微软推出生成式 AI 培训项目,免费提供在线课程和证书
  • 韩媒称三星先进封装技术落后于台积电,导致难以取得 AI 芯片订单
  • 首款搭载 ChatGPT 的自行车问世,让你骑行不再孤单
  • ChatGPT 的 Bing 浏览功能让用户免费阅读付费内容,OpenAI 暂停测试
  • 配 2.2 万片英伟达 H100 GPU,Inflection AI 正开发超级计算机
  • 联合国安理会将首次召开 AI 监管会议,讨论 AI 对全球和平与安全的潜在威胁
  • 精准度可提高 20%:英国九家银行签约使用基于 AI 的“消费者欺诈风险系统”应对诈骗
  • 下一代“世界最快”超级计算机 El Capitan 开始安装 AMD Instinct MI300 人工智能 GPU
  • 小冰 CEO 李笛:马斯克呼吁停止研发 AI 大模型,可能是想给自己争取更多时间
  • 最新资讯

    热门资讯