全球第三、国内第一，讯飞星火认知大模型获权威评测认可世界今日报

2023-05-10 17:13:16 来源：时代周报

5月9日，中文通用大模型综合性评测基准 SuperCLUE 正式发布，GPT-4位列全球第一，国产大模型中讯飞科技研发的星火认知大模型则位列总榜第三、国内第一，表现极为惹眼。

该基准测试主要关注三大问题，包括中文大模型在不同任务上的表现、相较国际代表性模型中文大模型的表现达到的程度，以及中文大模型相较人类的表现。该模型可通过多个层面，考验市面上主流的中文 GPT 大模型的能力，涵盖基础能力、专业能力、中文特性能力。

【资料图】

具体而言，基础能力包括了常见的有代表性的模型能力，如语义理解、对话、逻辑推理、角色模拟、代码、生成与创作等10项能力；专业能力:包括了中学、大学与专业考试，涵盖了从数学、物理、地理到社会科学等50多项能力；中文特性能力针对有中文特点的任务，包括中文成语、诗歌、文学、字形等10项多种能力。

该机构利用SuperCLUE测试基准，对市面上主流的支持中文的通用大模型进行了评测与排名。从排名中可看出，GPT-4 一骑绝尘，已经非常接近人类的能力；国产大模型中讯飞科技研发的星火认知大模型则位列总榜第三、国内第一。

以下为该机构公布的各个子项目的具体得分。排行榜将定期更新，并于CLUEbenchmarks 官方网站进行公示。

三个关键升级节点

自去年11月30日ChatGPT发布以来，认知大模型技术阶跃持续进化，人工智能在全球引起了广泛关注，掀起了全新的热潮。在多个领域，认知智能都表现出了非常强大的能力。对于人工智能来说，认知大模型成为通用人工智能的“曙光”，它出现的历史意义不亚于PC或者互联网的诞生。

科大讯飞董事长刘庆峰表示，从ChatGPT关注的48个主要任务方向和讯飞开放平台上400多万开发者团队的需求分析，通用人工智能应当具备七大维度能力，包括文本生成、语言理解，知识问答、逻辑推理、数学能力、代码能力、多模态能力等。

基于对通用人工智能的深刻理解与长期以来在相关领域的深厚沉淀，科大讯飞于5月6日正式发布讯飞星火认知大模型，现场实测大模型七大核心能力，并发布了面向教育、办公、汽车、数字员工四大行业应用成果。

从实测结果来看，讯飞星火认知大模型当前已在文本生成、知识问答、数学能力上效果惊艳。

编故事是文本生成的重要能力之一，星火大模型在这方面的表现堪称精彩。“孙悟空和奥特曼也偷偷潜入了会场，他们都争着想做讯飞星火认知大模型的代言人，还为此吵了一架，请根据上述信息创作一个故事。”星火大模型随即脑洞大开，一段生动的故事就娓娓道来。此外，该模型还能写邮件、做方案、写新闻通稿、生成英文宣传，修改英语语法错误等，展现了作为AI助手的多才多艺。

在语言理解上，星火大模型的变现也很出彩。科大讯飞研究院院长刘聪现场问道，“俗话说男子汉大丈夫宁死不屈，但是俗话又说男子汉大丈夫要能屈能伸，请问这两句话怎么理解？如果一个小伙子跟女朋友吵架了，他应该宁死不屈还是能屈能伸呢？”大模型均很好地理解了特定的句子与场景含义，并随着问题的变化灵活调整自己的答案。精彩的回答也让现场观众报以热烈掌声。刘庆峰表示，星火大模型目前的语言理解能力相比ChatGPT还略有差距，但已超越国内同类产品。

在数学能力方面，讯飞星火大模型展现出了“学霸”的气质。除了常规计算、几何、情景应用等，刘聪现场也抛出了复杂的计算题：“花坛里有三种花，一共88朵，其中月季花的数量是菊花的4倍，牡丹花的数量是菊花的5倍少2朵，那么请问花坛里一共有多少朵牡丹花？”星火大模型很快给出了准确的答案，并给出了解题步骤。刘庆峰表示，数理能力一定程度代表了一个大模型的聪明程度，星火认知大模型已经国内显著领先，且相比ChatGPT也具有一定优势T。

此外，刘聪还展示了大模型面向泛领域的开放式知识问答能力。结果显示，该模型具备很好的通识知识，能够对生活常识、科学知识、工作技巧，以及医学知识等应对自如。

刘庆峰还公布了年内大模型技术持续升级的三个关键节点：6月9日，将突破开放式问答、多轮对话能力明显提升、数学能力再升级；8月15日，代码能力升级以及多模态交互能力提升，希望能帮助到更多的合作伙伴及开发者团队；10月24日，将实现通用模型对标ChatGPT，中文超越ChatGPT的当前版本，英文能做到相当水平，并在教育、医疗等领域做到业界领先。

落地四大行业应用

讯飞星火认知大模型技术正逐渐为更多行业赋能。据悉，科大讯飞已发布了大模型在教育、办公、汽车、数字员工等多个方向的行业应用成果。

在教育领域，科大讯飞推出了“大模型+AI学习机”，让AI像老师一样批改作文，像口语老师一样实景对话。在作文批改上，搭载认知大模型的科大讯飞AI学习机T20系列可实现中英文作文类人批改。相较传统学习机只能针对字词标点纠错、识别句式修辞错误这些基础批改，讯飞AI学习机实现了围绕写作要求、分析全篇结构和文采的深度高阶批改。

在办公领域，科大讯飞推出了“大模型+智能办公本”，根据手写要点自动生成会议纪要，助力办公效能进一步提升。面对口语稿阅读困难、纪要整理耗费精力、已有素材难成稿、长篇文章难抓要点等痛点，搭载大模型技术的讯飞智能办公本升级了会议纪要、语篇规整两大功能。在会议纪要方面，办公本将语音实时转写与墨水屏纸感书写相结合，并可对会议记录内容形成一份精简的会议纪要；在语篇规整方面，办公本可去除语音转写文稿中的口语化词汇、过滤冗余词汇，对文本进行润色等，轻松将一篇语音转写文稿规整成书面化内容，阅读效率提升50%。

在汽车领域，科大讯飞已为数千个车型提供业界领先的智能语音交互服务，提供多轮、多人、多区域、多模态的语音交互，累计服务用户超过4610万，在国内汽车智能语音应用市场保持占有率第一。本次认知大模型技术也将让车载人机交互再上一个新台阶，实现更自由、更拟人化的沟通，让汽车驾驶更智能、更安全、更有乐趣。

在数字员工领域，科大讯飞首创新一代基于大模型的生成式RPA，让数字员工更智能，帮助企业员工完成大量重复性工作。以公司招聘事项为例，操作者输入指令后，系统即可自动按照事先设计的RPA脚本，操作计算机中的相应软件，实现业务流程的自动化操作并输出结果，还能进行数据分析，大幅减轻一线工作人员的压力。

除了上述领域外，讯飞星火认知大模型还将赋能包括医疗、城市、政法、工业等在内的更多行业，满足更多专业领域的需求，向更广阔的产业领域延伸。

责任编辑：

免责声明：以上内容为本网站转自其它媒体，相关信息仅为传递更多信息之目的，不代表本网观点，亦不代表本网站赞同其观点或证实其内容的真实性。如稿件版权单位或个人不想在本网发布，可与本网联系，本网视情况可立即将其撤除。

为您推荐

全球第三、国内第一，讯飞星火认知大模型获权威评测认可世界今日报
基于对通用人工智能的深刻理解与长期以来在相关领域的深厚沉淀，科大讯飞于5月6日正式发布讯飞星火认知大模
环球速讯：nef怎么转换成jpg格式_nef是什么格式
1、【◆】【你好】【◆】文件后缀名为* NEF文件属于单反数码相机拍摄的原始影像文件，这种文件统称为RAW
郑爽的电视剧有哪些你都看过哪些
1、截至2019年，郑爽演过的电视剧有《一起来看流星雨》、《古剑奇谭》、《抓住彩虹的男人》、《寂寞空
《请别相信她》预售章若楠吴昱翰“假戏真爱” 视讯
由杨沅翰执导，章若楠、吴昱翰、吴彦姝、杜晓宇、王成思、王尧、卜冠今主演，马丽、常远、魏翔友情出演，将
5月10日券商力推的十大金股（名单）
券商评级是指证券公司的分析师，通过分析上市公司的财务潜力、财务指标、公司运营治理能力，然后进行实地考
净水器前十名的牌子_净水器前十名-快资讯
1、据世贸组织专家介绍，全球最好的净水器是冰尊净水器，排名第一。2、冰尊的历史最长，有229多年了，德国
英国查尔斯三世加冕仪式完整指南！！！
5月6日星期六查尔斯国王加冕礼，时长04:00视频：CNN对于几代英国人来说，查尔斯三世国王的加冕典礼将是他们
播报：近期危化品事故时有发生，如何整治？应急管理部答封面新闻
封面新闻记者代睿5月10日，应急管理部举行新闻发布会，介绍全国重大事故隐患专项排查整治2023行动有关情况
2023台州路桥消费券可用商家名单天天热推荐
台州路桥消费券可使用商家名单和具体面额消费券面额1、市级消费券具体面额：面值5元、10元、20元、30元使用
揭开灰尘的隐藏作用滋养海洋和调节气候变化-世界速递
俄勒冈州立大学的一位科学家正在领导一项新的研究，旨在揭开尘埃在维持全球海洋生态系统和控制大气二氧化碳
当前速递！20年涨价20次，片仔癀高增长神话破灭
时隔三年，被称为“中药茅”的漳州片仔癀药业股份有限公司（下称“片仔癀”，600436 SH）再次迎来涨价。5月
盘中行情｜锂电池股走强天齐锂业涨超2% 内银股集体下跌中国银行跌超2% 环球简讯
恒生指数跌超0 4%。锂电池股大幅走强，天齐锂业涨超2%；内银股集体走低，中国银行跌超2%；互联网医疗板块延
上海“大零号湾”，何以打造世界级科创湾区？
人民网上海5月9日电从上海地铁5号线剑川路站出来，往东方向走上几分钟，一片颇具现代感的厂房映入眼帘，这
当前视讯！虚拟账号交易乱象调查：租售支付账号风险大
虚拟账号交易乱象调查：租售支付账号风险大
3斤麻辣小龙虾救回来的男孩，回杭州参观消防队了！谈到未来，他说了四个字全球快消息
“周颖小姐姐前两天发消息说邀请我过来参观消防队，我就立马来了，蛮想来的。”“特别感谢小姐姐，真的把我
李盈莹现在的处境跟北京周期王一梅一样-新动态
说到中国女排的主攻，曾经让很多国家羡慕不已，特别是里约奥运会周期到时候，朱婷、惠若琪、张常宁、刘晏含
仰望U8申报信息发布预售109.8万元
仰望U8在4月上海车展中已经开启预售，预售价格为109 8万元，目前该车已经正式申报。动力方面，新车配备易四
当前关注：车企价格战打不出“销冠王”
5月9日，乘联会发布4月全国乘用车市场分析，点出特斯拉涨价是“很好的信号”。此前，特斯拉在四天内两次涨
热资讯！“沪惠保”第三年 8小时投保者破百万
“沪惠保2023发布上线！”昨天中午，市民林先生收到了一条短信。“我们一家连续两年都买了，有政府背书，很
T1全新战袍亮相MSI！即将迎来首战！对阵LEC赛区的MAD
这必须从最近T1牛逼的商务说起，毕竟他们最近是换了全新的赞助商，而且是奔驰爸爸，而在这样的国际大赛出征
北京市西城区广外医院暂停发热门诊至12月31日
北京市西城区广外医院暂停发热门诊至12月31日
环球最新：电池内卷愈演愈烈，面对围剿特斯拉该如何是好
在前不久举行的上海车展上，宁德时代发布了全新的“凝聚态电池”，据说该电池的单体能量密度可以达到惊人的
5月9日基金净值：富国城镇发展股票最新净值2.241，跌1.15%
5月9日，富国城镇发展股票最新单位净值为2 241元，累计净值为2 741元，较前一交易日下跌1 15%。历史数据显
贵州桥梁建设获得多个国际性大奖
多彩贵州网讯（本网记者杨婧徐昆）5月9日，记者从贵州省政府新闻办举行的新闻发布会上获悉，贵州桥梁建设获
CIGA Design玺佳联合GQ打造U系列冰川蓝星球手表，传递环保理念
CIGADesign冰川蓝高档星球手表智趣不凡艺术高知CIGADesign玺佳联合GQ于五四青年节打造的，打造U系列蓝色星
美股三大指数集体低开诺瓦瓦克斯医药涨逾20%
美股三大指数集体低开，道指跌0 19%，纳指跌0 50%，标普500指数跌0 37%。诺瓦瓦克斯医药涨逾20%，公司将在
领英将关闭中国求职应用，宣布新一轮裁员；中公教育否认推出“88.8万高端定制课”；“ChatGPT之父”推出世界币App丨大公司动态
第一财经每日精选最热门大公司动态，点击「听新闻」，一键收听。
为什么点赞未发送(点赞末发送)
品牌型号：iPhone14pro系统：iOS16 1软件版本:微信8 0 34点赞未发送的原因可能
漯河源汇市场监管沙澧所，助国家食安示范城创建举办培训观摩世界即时看
为进一步推进漯河市国家食品安全示范城市创建工作，5月9日，漯河市市场监管局源汇分局沙澧产业集聚区所（以
鬼吹灯之天星术在哪里可以看_鬼吹灯之天星术什么时候上映
1、2021年上映。2、2018年9月20日，《鬼吹灯之天星术》在北京举行筹备发布，会上宣布三位主演阵容。3、2019
因未按规定开展互联网保险经纪业务等上海妙保保险经纪公司被罚12万
5月9日，上海银保监局行政处罚信息公开表显示，2023年4月26日，上海妙保保险经纪股份有限公司被责令改正，
今日精选：西藏民警爱心接力，受伤“夜猫子”终获救
中新网西藏阿里5月9日电(拉瑞宁邓鸿)“警察同志，我们在途经玛旁雍措的路上捡到一只受伤的猫头鹰。”5月6日
天天新资讯：央企新总部建设快速推进
“五一”期间，雄安新区中国华能总部项目工地上，四台塔吊高高矗立，1 3万余平方米的基坑内，近百根钢结构
环球百事通！原耽经典语录励志句子_原耽经典语录励志
1、他是我的心脏。2、——迟爱(蓝淋)　　2、世人只以为伤筋动骨便是极尽惨烈的酷刑了，其实不然，所谓酷刑
2022年城镇非私营单位就业人员年平均工资114029元
2022年全国城镇非私营单位就业人员年平均工资为114029元，比上年增加7192元，名义增长[1]6 7%。扣除价格因
首席执行官表示亚马逊的Alexa即将变得更加强大
在公司第一季度财报会议上，亚马逊首席执行官安迪贾西宣布该公司正在开发一种“更大、更通用和更强大”的大
瑞银(UBS.US)：在完成收购后瑞信(CS.US)CEO将加入董事会
智通财经APP获悉，瑞银(UBS US)周二宣布，一旦完成对瑞士信贷(CS US)的紧急收购，瑞信首席执行官Ulrich
初中语文人教版文言文+解析_初中语文人教版文言文_世界时讯
1、你一定是分不清“惟”与“唯”吧，我帮你简单说一下之所以会让你生出“唯”“惟”等不同字体写法的困惑
2023年度“沪惠保”5月9日开始参保！每日信息
2023年度“沪惠保”投保窗口于5月9日正式开启，保费维持129元人不变，保额最高310万元。2023年度“沪惠保
砜聚合物及其应用
1、《砜聚合物及其应用》是2015年4月出版的图书。2、作者是李生柱、吴存雷。
时讯：优化营商环境新看点｜“说了就算、定了就办”两年无虚言
原标题：在呼和浩特“项目能落地、办事不求人、投资很舒心”（引题）“说了就算、定了就办”两年无虚言（主
7月6日肖智就跟随天津泰达队进行了首次训练
7月5日报到，7月6日就跟随天津泰达队进行了首次训练，肖智的职业态度值得称道。更让人欣喜的是，肖智在这堂
徐子珊回归素人后好潇洒，穿抹胸勒出赘肉，胖了一圈反而更好看了|环球今亮点
在造型当中除了有元素增加了服装的设计感之外，整体的流畅性很强，表达出了简洁利落感，风格更偏向于简约，
今年前4个月民营企业进出口比重提升至52.9%
据海关统计，今年前4个月，我国有进出口实绩的民营企业41 5万家，同比增加8 9%，民营企业继续保持我国外贸
“最美书店”：一家把书店做成书店的书店-环球速读
记者施晨露“为什么要开钟书阁？”钟书阁创始人金浩说，“就是想让读者重新回到书店”。近日，记者从市区徐
永州陆港“向南向海向外”通道搭建成型
8日，永州湘粤非铁海联运班列常态化开通和产业招商集中签约活动举行，19个项目集中签约，总投资120亿元。活
短讯！蔓越莓饼干的做法烤箱版蔓越莓饼干的做法
今天来聊聊关于蔓越莓饼干的做法烤箱版，蔓越莓饼干的做法的文章，现在就为大家来简单介绍下蔓越莓饼干的做
快播：这4种油千万别吃错，否则血脂高了，血管可能就要堵了
日常饮食能掌握方法，选择合适食物，对健康有促进作用，不过，烹饪中要用到的各种食用油得擦亮眼睛去挑选，
热点！广发期货：需求预期依然较弱，钢材延续偏弱走势
【现货和基差】唐山钢坯涨40至3480元每吨。华东螺纹+50至3800元每吨。热轧-90至3970元每吨。【利润】原料和
西吉县开好“路边会”助民富口袋
“我把近期党的一些新理论和新政策简单给大家讲一讲。”5月4日，西吉县马建乡大坪村驻村第一书记韩紫阳利用
太突然！又一家新能源车企申请破产，年销售曾突破120亿、连续三年蝉联销冠，经销商联名举报：是诈骗公司
太突然！又一家新能源车企申请破产，年销售曾突破120亿、连续三年蝉联销冠，经销商联名举报：是诈骗公司,破
当前热点-眼下有细纹怎么办（4种方法可以去除）
眼下有细纹怎么办，，4种方法可以去除很多人还不知道，现在让我们一起来看看吧！解答：1、增加水分2、眼部
职场办公选这款打印机怎么样？实测给你看|热点
对于企业的采购人员来说，选购到合适的办公设备可以说非常有必要，这直接影响到日常的办公效率。那么对于日
【Alphabet将在I/O大会上发布AI更新展示创意写作和写代码能力】谷歌母公司Alphabet计划宣布一系列生成式人工智能更新，包括推出通用大型语言模型(LLM)。根据媒体看到的有关谷歌I/O的内部文件，该公司将推出其最新、最先进的大型语言模型——PaLM 2。PaLM 2包含100多种语言，并一直在内部代号“统一语言模型”下运行。它还进行了广泛的编码和数学测试以及创意写作。微速讯
【Alphabet将在I O大会上发布AI更新展示创意写作和写代码能力】谷歌母公司Alphabet计划宣布一系列生成式人
英语48个音标图片英语48个音标
今天来聊聊关于英语48个音标图片，英语48个音标的文章，现在就为大家来简单介绍下英语48个音标图片，英语48
当前视讯！平销返利增值税处理_平销返利
今天小编肥嘟来为大家解答以上的问题。平销返利增值税处理，平销返利相信很多小伙伴还不知道,现在让我们一

全球第三、国内第一，讯飞星火认知大模型获权威评测认可 世界今日报

为您推荐

相关推荐

阅读排行

全球第三、国内第一，讯飞星火认知大模型获权威评测认可世界今日报