阿里云通义千问720亿参数模型开源
洪恒飞 科技日报记者 江耘 12月1日,阿里阿里云举办通义千问发布会,云通义千开源通义千问720亿参数模型Qwen-72B、问亿18亿参数模型Qwen-1.8B和音频大模型Qwen-Audio。参数其中,模型基于Qwen-72B,开源大中型企业可开发商业应用,阿里高校、云通义千科研院所可开展人工智能驱动的问亿科研工作。 今年8月以来,参数阿里云开源了Qwen-7B、模型Qwen-14B和视觉理解模型Qwen-VL。开源这几款参数模型先后冲上HuggingFace、阿里Github大模型榜单,云通义千得到中小企业和个人开发者的问亿青睐,累计下载量超过150万,催生出150多款新模型、新应用。 发布会上介绍,通义千问目前共开源18亿、70亿、140亿、720亿参数的4款大语言模型,以及视觉理解、音频理解两款多模态大模型,实现“全尺寸、全模态”开源。其中,研发团队优化了Qwen-72B的指令遵循、工具使用等技能,使之能更好地被下游应用集成。比如,Qwen-72B搭载了强大的系统指令能力,用户只用一句提示词就可定制AI助手,要求大模型扮演某个角色或者执行特定的回复任务。 发布会现场。阿里云供图 会上介绍,Qwen-72B可以处理最多32k的长文本输入,在长文本理解测试集LEval上取得了超越ChatGPT-3.5-16k的效果。Qwen-72B基于3T tokens高质量数据训练,在10个权威基准测评中夺得开源模型最优成绩,在部分测评中超越闭源的GPT-3.5和GPT-4。 具体而言,英语任务上,Qwen-72B在MMLU基准测试取得开源模型最高分;中文任务上,Qwen-72B霸榜C-Eval、CMMLU、GaokaoBench等基准,得分超越GPT-4;数学推理方面,Qwen-72B在GSM8K、MATH测评中断层式领先其他开源模型;代码理解方面,Qwen-72B在HumanEval、MBPP等测评中的表现大幅提升,代码能力有了质的飞跃。 当天发布的Qwen-Audio则能够感知和理解人声、自然声、动物声、音乐声等各类语音信号。用户可以输入一段音频,要求模型给出对音频的理解,甚至基于音频进行文学创作、逻辑推理、故事续写等等。音频理解能够赋予大模型接近人类的听觉能力。 此外,继今年8月开源视觉理解大模型Qwen-VL后,本次发布会宣布了Qwen-VL的重大更新——大幅提升通用OCR、视觉推理、中文文本理解基础能力,还能处理各种分辨率和规格的图像,甚至能“看图做题”。 阿里云CTO周靖人表示,开源生态对促进中国大模型的技术进步与应用落地至关重要,通义千问将持续投入开源,希望成为“AI时代最开放的大模型”,与伙伴们共同促进大模型生态建设。
-
上一篇
-
下一篇
- 最近发表
- 随机阅读
-
- 中国人民银行:2023年末我国科技型中小企业获贷率升至46.8%
- 青海省科技人才队伍培育建设培训班开班
- 云南大部将强降温 滇东北将有小雪或雨夹雪
- 科学家建立火星大气模型 为采样返回任务提供科研支持
- 科普一下|“水果顶流”砂糖橘怎么吃才健康?
- 贾乃亮双11总销售额超13.6亿元,工作室此前持股公司曾因偷漏税被罚
- 概念验证装置“闻”海水识分子
- 天津海关用科技筑牢国门安全屏障
- 胖东来未按标准试吃员工已不再开除,关联公司2022年333人参保
- 天津海关用科技筑牢国门安全屏障
- 迅雷发布Q3财报:总营收8420万美元,毛利润3750万美元同比增6.6%
- 芯片上实现光学诱导超导性
- 成都金堂:多形式游玩 感受历史底蕴
- 乌鲁木齐开展“2023环保科普进校园”活动
- 北极变暖加快或致气温8年内上升2℃
- 西藏色季拉山发现雪豹、白颊猕猴等多种珍稀野生动物
- 北京市医学科技创新院士、北京学者“领航”系列讲座第二期举办
- 地球上电离层探测到伽马射线暴
- 2023国际可再生能源供热技术大会在河北雄安新区召开
- 10月份国民经济持续恢复向好 经济运行总体平稳
- 搜索
-