阿里云通义千问720亿参数模型开源
洪恒飞 科技日报记者 江耘 12月1日,阿里阿里云举办通义千问发布会,云通义千开源通义千问720亿参数模型Qwen-72B、问亿18亿参数模型Qwen-1.8B和音频大模型Qwen-Audio。参数其中,模型基于Qwen-72B,开源大中型企业可开发商业应用,阿里高校、云通义千科研院所可开展人工智能驱动的问亿科研工作。 今年8月以来,参数阿里云开源了Qwen-7B、模型Qwen-14B和视觉理解模型Qwen-VL。开源这几款参数模型先后冲上HuggingFace、阿里Github大模型榜单,云通义千得到中小企业和个人开发者的问亿青睐,累计下载量超过150万,催生出150多款新模型、新应用。 发布会上介绍,通义千问目前共开源18亿、70亿、140亿、720亿参数的4款大语言模型,以及视觉理解、音频理解两款多模态大模型,实现“全尺寸、全模态”开源。其中,研发团队优化了Qwen-72B的指令遵循、工具使用等技能,使之能更好地被下游应用集成。比如,Qwen-72B搭载了强大的系统指令能力,用户只用一句提示词就可定制AI助手,要求大模型扮演某个角色或者执行特定的回复任务。 发布会现场。阿里云供图 会上介绍,Qwen-72B可以处理最多32k的长文本输入,在长文本理解测试集LEval上取得了超越ChatGPT-3.5-16k的效果。Qwen-72B基于3T tokens高质量数据训练,在10个权威基准测评中夺得开源模型最优成绩,在部分测评中超越闭源的GPT-3.5和GPT-4。 具体而言,英语任务上,Qwen-72B在MMLU基准测试取得开源模型最高分;中文任务上,Qwen-72B霸榜C-Eval、CMMLU、GaokaoBench等基准,得分超越GPT-4;数学推理方面,Qwen-72B在GSM8K、MATH测评中断层式领先其他开源模型;代码理解方面,Qwen-72B在HumanEval、MBPP等测评中的表现大幅提升,代码能力有了质的飞跃。 当天发布的Qwen-Audio则能够感知和理解人声、自然声、动物声、音乐声等各类语音信号。用户可以输入一段音频,要求模型给出对音频的理解,甚至基于音频进行文学创作、逻辑推理、故事续写等等。音频理解能够赋予大模型接近人类的听觉能力。 此外,继今年8月开源视觉理解大模型Qwen-VL后,本次发布会宣布了Qwen-VL的重大更新——大幅提升通用OCR、视觉推理、中文文本理解基础能力,还能处理各种分辨率和规格的图像,甚至能“看图做题”。 阿里云CTO周靖人表示,开源生态对促进中国大模型的技术进步与应用落地至关重要,通义千问将持续投入开源,希望成为“AI时代最开放的大模型”,与伙伴们共同促进大模型生态建设。
- 最近发表
- 随机阅读
-
- “央博龙年新春云庙会”数字门票助你游四方
- 刷新四项世界纪录 我国首例大型站改钢结构整体跨线顶推完成
- 寒潮南下降温影响波及江南 全国大部晴天为主宜出行
- 新疆正式建成 乌昌750千伏变电双环网
- 大年初一,给科技日报读者拜年!
- 荣耀赵明:荣耀独立三年又回到舞台中心 第100万台折叠屏手机下线
- 下雪啦!北京石景山、海淀、门头沟局地降雪
- 海关智慧属地查检助力湖北农产品“出海”提速
- 中国完成南极冰盖“环”国际合作计划航空调查
- 严爱国:让高铁跨海过桥不减速
- 新一股较强冷空气明天“发货” 东北雨雪天气再发展
- 荣耀赵明:市场上借壳炒作太多 IPO计划由股东和董事会决定
- 科普一下|“水果顶流”砂糖橘怎么吃才健康?
- 西南大样带:森林生态研究的天然“数据库”
- 肺炎支原体与流感叠加感染期间,二者怎样区别?
- 严爱国:让高铁跨海过桥不减速
- 新春走基层 身边暖镜头丨安置点里过新年
- 年轻人的楷模!一个宿舍,100%成为院士
- 13只帝企鹅宝宝入学!2023级企鹅幼“鹅”园开园迎新
- “绿色引擎”撬动“蓝色动能”——2023中国海洋经济博览会观察
- 搜索
-