王小川旗下百川智能发布 Baichuan-13B AI 大模型,号称“130 亿参数开源可商用”

王小川旗下百川智能发布 Baichuan-13B AI 大模型,号称“130 亿参数开源可商用”

人工智能 2023-07-13 16:12:02 1年以前

IT酷哥 7 月 11 日消息,王小川旗下百川智能今日发布 Baichuan-13B 大模型,号称“130 亿参数开源可商用”。

▲ 图源 Baichuang-13B GitHub 页面

据官方介绍,Baichuan-13B 是由百川智能继 Baichuan-7B 之后开发的包含 130 亿参数的开源可商用的大规模语言模型,在中英文 Benchmark 上均取得同尺寸模型中最好的效果。本次发布包含有预训练 (Baichuan-13B-Base) 和对齐 (Baichuan-13B-Chat) 两个版本。

▲ 图源 Baichuang-13B GitHub 页面

官方宣称,Baichuan-13B 有如下几个特点:

更大尺寸、更多数据:Baichuan-13B 在 Baichuan-7B 的基础上进一步扩大参数量到 130 亿,并且在高质量的语料上训练了 1.4 万亿 tokens,超过 LLaMA-13B40%,是当前开源 13B 尺寸下训练数据量最多的模型。支持中英双语,使用 ALiBi 位置编码,上下文窗口长度为 4096。

同时开源预训练和对齐模型:预训练模型是适用开发者的『 基座 』,而广大普通用户对有对话功能的对齐模型具有更强的需求。因此项目中同时具有对齐模型(Baichuan-13B-Chat),具有很强的对话能力,开箱即用,几行代码即可简单地部署。

更高效的推理:为了支持更广大用户的使用,项目中同时开源了 int8 和 int4 的量化版本,相对非量化版本在几乎没有效果损失的情况下大大降低了部署的机器资源门槛,可以部署在如英伟达 RTX3090 这样的消费级显卡上。

开源免费可商用:Baichuan-13B 不仅对学术研究完全开放,开发者也仅需邮件申请并获得官方商用许可后,即可以免费商用。

目前该模型已经在 HuggingFace、GitHub、Model Scope 公布,感兴趣的 IT酷哥小伙伴们可以前往了解。

文章版权声明:除非注明,否则均为网络转载文章,转载或复制请以超链接形式并注明出处。

相关阅读

  • 北京智源发布悟道 3.0 大模型系列
  • 新华三发布私域大模型“百业灵犀”LinSeer,针对政企客户
  • 360 智脑大模型应用发布会直播(视频)
  • 日本音乐作家团体联合会发表声明,要求政府立即组织 AI 监管讨论并邀请创作者参与
  • 消息称东盟正起草 AI 监管法案:新加坡牵头,最快今年底完成
  • 印象笔记开放旗下“印象 AI”,可一键生成思维导图、写文章等
  • Meta 和 OpenAI 公司 CEO 公开支持欧盟推行 AI 监管方案
  • Stability AI 推出文字生成图片模型 SDXL 0.9,硬件要求下探至消费级 GPU 水平
  • 科大讯飞星火 AI 大模型出海东南亚,将在新加坡实施“1+4”战略
  • 外媒提议更新开源许可证:摆脱 80 年代束缚,应对当下人工智能时代
  • 2023 全球 AI 指数排名公布:美中稳居前二,亚洲国家表现亮眼
  • 刚合作就解约,Unity 剔除一家销售盗用资源的 AI 合作伙伴
  • 多家欧洲企业签署公开信,批评欧盟 AI 法案草案限制产业发展
  • 方舟启航,火山引擎这波在“大气层”
  • “世界上最像人的机器人”Ameca 接入 Stable Diffusion 和 GPT-3,现场完成作画
  • 研究发现 AI 筛选的私募基金回报率高于大部分机构投资者
  • 丁磊:当前网易的首要任务是用最快的速度探索 AI 大模型的创新应用
  • 格莱美 CEO 解释 AI 新规:愿意接纳新技术,包含 AI 要素作品也可获提名
  • ChatGPT 又陷版权风波:两位恐怖小说作家起诉 OpenAI 盗用自己作品用于训练
  • 精准度可提高 20%:英国九家银行签约使用基于 AI 的“消费者欺诈风险系统”应对诈骗
  • 最新资讯

    热门资讯