快手自主研发的大语言模型KwaiYii开始内测,13B版本快意表现优秀,平均分超过61分
2023-08-22 08:58:45 来源:天空软件网 我要评论()
用手机看
近日,快手自主研发的大语言模型“快意”(KwaiYii)已经开始内测,并为业务团队提供了标准API和定制化项目合作方案。在最新的CMMLU中文向排名中,快意的13B版本KwaiYii-13B在five-shot和zero-shot下的排名均为第一,特别在人文学科、中国特定主题等方面表现优秀,平均分超过61分。 根据官方介绍,快意大模型(KwaiYii)是由快手AI团队从零到一独立自主研发的一系列大规模语言模型(Large Language Model,LLM),当前包含了多种参数规模的模型,并覆盖了预训练模型(KwaiYii-Base)、对话模型(KwaiYii-Chat)。 KwaiYii-13B-Base预训练模型具备优异的通用技术底座能力,在绝大部分权威的中/英文Benchmark上取得了同等模型尺寸下的State-Of-The-Art效果。例如,KwaiYii-13B-Base预训练模型在MMLU、CMMLU、C-Eval、HumanEval等Benchmark上目前处于同等模型规模的领先水平。 KwaiYii-13B-Chat对话模型具备出色的语言理解和生成能力,支持内容创作、信息咨询、数学逻辑、代码编写、多轮对话等广泛任务,人工评估结果表明KwaiYii-13B-Chat超过主流的开源模型,并在内容创作、信息咨询和数学解题上接近ChatGPT(3.5)同等水平。 据了解,快手AI团队将持续迭代“快意”大模型,一方面将继续优化模型性能并研发多模态能力,另一方面也在推进更多C端与B端业务场景下的落地。
看过本文的人还看过
- 老玩家集结! 《魔兽世界》怀旧服“巫妖王之怒”上线时间确定
- 海洋中的海龟会把头缩进龟壳吗 神奇海洋4月29日答案
- 再扩充!亚信峰会铺装“超车道”推动规模效应加快释放出来
- 近百年风雨沧桑 刻画文明行为主脉——留念仰韶文化遗址发觉暨当代中国考据学问世100周年纪念
- 南方人不敢吃的哪些东北菜,到了哈尔滨,一定要吃哪些东北菜?
- 张庭夫妇企业被查,该如何精确辨别网络传销?
- 吴亦凡最后的剩余价值!利用吴亦凡事件出圈的哪吒汽车,太不厚道,哪吒汽车营销“出圈”,没有底线的企业还能走多远
- 自然麝香和人工麝香有何不同,洗发水中含有麝香,经常使用是否会造成不孕
- 游戏工作室怎么去找项目,游戏工作室到底是怎么赚钱的?
- 打码赚钱哪个网站好,我想做手游录播解说视频,哪个视频网站或者是游戏视频网站最赚钱