【JIUYOU新闻】9月25日,阿里云开源通义千问140亿参数模子Qwen-14B和其对于话模子Qwen-14B-Chat,免费可商用。Qwen-14B于多个权势巨子评测中逾越划一范围模子,部门指标甚至靠近Llama2-70B。阿里云此前开源了70亿参数模子Qwen-7B等,一个多月下载量破100万,成为开源社区的口碑之作。
Qwen-14B是一款撑持多种语言的高机能开源模子,比拟同类模子利用了更多的高质量数据,总体练习数据跨越3万亿Token,使患上模子具有更强盛的推理、认知、计划及影象能力。Qwen-14B最年夜撑持8k的上下文窗口长度。
Qwen-14B于十二个权势巨子测评中全方位逾越同范围SOTA年夜模子
Qwen-14B-Chat是于基座模子上颠末邃密SFT获得的对于话模子。借助基座模子强盛机能,Qwen-14B-Chat天生内容的正确度年夜幅晋升,也更切合人类偏好,内容创作上的想象力及富厚度也有显著扩大。
Qwen拥有精彩的东西挪用能力,能闪开发者更快地构建基在Qwen的Agent(智能体)。开发者可用简朴指令教会Qwen利用繁杂东西,好比利用CodeInterpreter东西履行Python代码以举行繁杂的数学计较、数据阐发、图表绘制等;还有能开发具备多文档问答、长文写作等能力的“高级数字助理”。
百亿之内参数级别年夜语言模子是今朝开发者举行运用开发及迭代的主流选择,Qwen-14B进一步提高了小尺寸模子的机能上限,从浩繁同尺寸模子中冲出重围,于MMLU、C-Eval、GSM8K、MATH、GaoKao-Bench等12个权势巨子测评中取患上最优成就,逾越所有测评中的SOTA(State-Of-The-Art)年夜模子,也周全逾越Llama-2-13B,比起Llama2的34B、70B模子也其实不减色。与此同时,Qwen-7B也全新进级,焦点指标最高晋升22.5%。
Qwen-14B机能逾越同尺寸模子
用户可从魔搭社区直接下载模子,也可经由过程阿里云灵积平台拜候及挪用Qwen-14B及Qwen-14B-Chat。阿里云为用户提供包括模子练习、推理、部署、精调等于内的全方位办事。
8月,阿里云开源通义千问70亿参数基座模子Qwen-7B,前后冲上HuggingFace、Github的trending榜单。短短一个多月,累计下载量冲破100万。开源社区呈现了50多个基在Qwen的模子,社区多个知名的东西及框架都集成为了Qwen。

通义千问是落地最深、运用最广的中国年夜模子,海内已经有多个月活过亿的运用接入通义千问,年夜量中小企业、科研机谈判小我私家开发者都于基在通义千问开发专属年夜模子或者运用产物,如阿里系的淘宝、钉钉、将来精灵,以和外部的科研机构、创业企业。
浙江年夜学结合高档教诲出书社基在Qwen-7B开发了智海-三乐教诲垂直年夜模子,已经于天下12所高校运用,可提供智能问答、试题天生、进修导航、讲授评估等能力,模子已经于阿里云灵积平台对于外提供办事,一行代码便可挪用;浙江有鹿呆板人科技有限公司于路面清洁呆板人中集成为了Qwen-7B,使呆板人能以天然语言与用户举行及时交互,理解用户提出的需求,将用户的高层指令举行阐发及拆解,做高层的逻辑阐发及使命计划,完成清洁使命。
阿里云CTO周靖人暗示,阿里云将连续拥抱开源开放,鞭策中国年夜模子生态设置装备摆设。阿里云深信开源开放的气力,率先开源自研年夜模子,但愿让年夜模子技能更快触达中小企业及小我私家开发者。
阿里云还有牵头设置装备摆设了中国最年夜的AI模子开源社区魔搭ModelScope,连合全行业的气力,配合鞭策年夜模子技能普惠及运用落地。已往两个月内,魔搭社区的模子下载量从4500万飙升到8500万,增幅靠近100%。
版权所有,未经许可不患上转载
-jiuyou.com