加入收藏 | 设为首页 | 会员中心 | 我要投稿 晋中站长网 (https://www.0354zz.com/)- 科技、容器安全、数据加密、云日志、云数据迁移!
当前位置: 首页 > 站长资讯 > 动态 > 正文

百川智能发布Baichuan2开源大模型,号称全方位领先 LLaMA 2

发布时间:2023-09-07 10:00:17 所属栏目:动态 来源:转载
导读:   百川智能今日举行主题为“百川汇海,开源合作双赢”的大模型分享会,正式开源微调后的Baichuan2-7B、Baichuan2-13B、Baichuan2-13B-Chat 与其 4bit 量化版,并且均为免费可商
  百川智能今日举行主题为“百川汇海,开源合作双赢”的大模型分享会,正式开源微调后的Baichuan2-7B、Baichuan2-13B、Baichuan2-13B-Chat 与其 4bit 量化版,并且均为免费可商用。
 
  百川智能此次还开源了模型训练的 Check Point,并宣布将发布 Baichuan 2 技术报告,据百川智能官方介绍,Baichuan2-7B-Base 和 Baichuan2-13B-Base,均基于 2.6 万亿高质量多语言数据进行训练,两个模型在数学、代码、安全、逻辑推理、语义理解等能力有显著提升。
 
  其中Baichuan2-13B-Base 相比上一代 13B 模型,数学能力提升 49%,代码能力提升 46%,安全能力提升 37%,逻辑推理能力提升 25%,语义理解能力提升 15%。
 
  在 MMLU、CMMLU、GSM8K 等基准测试中, 百川智能的公共云两个平台的模型都比 市面上的LLaMA 2 的分数要高一些,且在“在线人工智能算法的中文语言通用”部分优势较大。
 
  Baichuan2-7B 和 Baichuan2-13B 不仅对学术研究完全开放,开发者也仅需邮件申请获得官方商用许可后,即可以免费商用。腾讯云、阿里云、火山方舟、华为、联发科等企业均参加了本次发布会并与百川智能达成了合作。我们希望通过这次合作,让更多的人享受到人工智能带来的便利。

(编辑:晋中站长网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章