百川智能今日举办了一场名为“百川汇海,开源共赢”的大模型发布会,正式发布了微调后的Baichuan2-7B、Baichuan2-13B、Baichuan2-13B-Chat以及其4bit量化版本,并宣布所有模型均为免费可商用。此外,百川智能还开源了模型训练的Check Point,并计划发布Baichuan 2技术报告,详细介绍Baichuan 2的训练细节。Baichuan 2-7B-Base和Baichuan 2-13B-Base是基于2.6万亿高质量多语言数据进行训练的,两个模型在数学、代码、安全、逻辑推理、语义理解等能力方面都有显著提升。 Baichuan2-13B-Base相比上一代13B模型,在数学能力上提升了49%,代码能力提升了46%,安全能力提升了37%,逻辑推理能力提升了25%,语义理解能力提升了15%。在MMLU、CMMLU、GSM8K等基准测试中,百川智能的两个模型都比LLaMA 2的分数要高一些,且在“中文通用”部分优势较大。 Baichuan2-7B和Baichuan2-13B不仅对学术研究完全开放,开发者只需邮件申请获得官方商用许可后,即可免费商用。腾讯云、阿里云、火山方舟、华为、联发科等企业都参加了本次发布会并与百川智能达成了合作。