8月29日,SuperCLUE发布了中文大模型的8月榜单。此次榜单由五个部分组成:总排行榜、OPEN多轮开放问题排行榜、OPT三大能力客观题排行榜、十大基础能力排行榜和开源排行榜。 据了解,本次评测选取了目前国内外最具代表性的16个通用大语言模型,并且采用包含3337道测试题的全新评测数据集。在8月榜单中,Baichuan-13B凭借STF迭代优化,第二版效果非常出众,一举拿下国内大模型评测榜首。 此外,各榜单还显示,Baichuan-13B在知识问答和生成创作领域表现优异。在开源榜单中,Baichuan-13B也大幅超越Llama2。