工联院大模型测评:360智脑位列国产第一梯队表现超ChatGPT 世界焦点
2023-07-05 11:48:53 金融界


(相关资料图)

近日,中国工业互联网研究院(以下简称“工联院”)针对人工智能大模型在中文工业领域的知识问答能力进行系统性评测。结果显示,360集团(601360.SH,下称“360”)自研大模型“360智脑”在多项指标超过GPT3.5,综合表现位于国产大模型前列。

工联院此次评测选取了工业领域典型的八大行业,集合五大院士,八大IEEE Fellow共13位顶级专家构成了专家委员会。每个行业抽取客观题和主观题,主观题主要考察基础能力、语句能力、概括能力和逻辑能力四大维度,最终八大行业共计超过1100道题,对大模型就行全方位评测。评测对象涵盖GPT4、GPT3.5、360智脑、文心一言等国内外具有代表性的头部大模型。

从评测结果可以看出,GPT4表现最佳,国内大模型表现亮眼,360智脑在多个行业均处于前列,其中装备制造业和纺织行业更是超过GPT-3.5,表现优异。

虽然国内大模型在本次评测表现较好,以360智脑为代表的国产大模型甚至在部分行业赶超GPT3.5,但工联院评测报告也指出,国内外通用大模型在工业知识问答领域探索仍处于初级阶段,也缺乏行业针对性训练。

其实,360近期已经推出一个企业级的AI大模型解决方案,基于360智脑的能力,综合行业和企业的专业知识库,打造“行业化、企业化、垂直化、小型化、专有化”企业级大模型,目前已在智慧城市、智慧企服场景下落地应用实践,且双双入选“北京市通用人工智能大模型行业应用十大典型场景案例”。

这不是360智脑第一次在第三方评测中表现出优异成绩,早在不久前中文通用大模型基准(SuperCLUE)评测中,360智脑数次上榜,且多项能力蝉联国产大模型第一。

本文源自:金融界资讯

热门推荐

文章排行

  1. 2023-07-05工联院大模型测评:360智脑位列国产第一梯队表现超ChatGPT 世界焦点
  2. 2023-07-05环球快消息!前女友、前女朋友是什么意思 周公解梦原版原文
  3. 2023-07-05“盗窃”而来的 3000 亿单词?ChatGPT 摊上事了,遭索赔 30 亿美元!
  4. 2023-07-05冰淇淋2代(lg冰淇淋二代)
  5. 2023-07-05别不信,主线即将浮出水面!
  6. 2023-07-05暴雨,大风!你那里变天了吗?出门游玩别忘关注天气情况
  7. 2023-07-05良品铺子(603719):7月4日北向资金增持17.75万股
  8. 2023-07-05世界速读:追求幸福,财运上升,收获惊喜,创意爆发的4大星座
  9. 2023-07-05碟中谍5图片_碟中谍5漫画_当前热点
  10. 2023-07-05方晓红_关于方晓红简介 天天观焦点
  11. 2023-07-05今日热讯:美的电压力锅故障大全维修视频_美的电压力锅故障大全
  12. 2023-07-04速读:思明区教育局首次为班主任颁发“三角梅章” 致敬他们的奉献和坚守
  13. 2023-07-04百度网盘打不开了是什么原因_百度网盘打不开怎么回事 热门
  14. 2023-07-04【天鹅战报42】21-22赛季 足总杯1/4决赛富勒姆VS斯旺西_看点
  15. 2023-07-04环球热消息:仇的拼音 关于仇的拼音的介绍
  16. 2023-07-04【财经下午茶】乘联会:预估6月新能源乘用车厂商批发销量同比增30%;A股汽车产业链股爆发
  17. 2023-07-04天天观察:沈阳SSCA漫展门票价格2023
  18. 2023-07-04荣盛石化:荣盛新材料(台州)有限公司高端化工新材料项目目前正在积极推进中_天天消息
  19. 2023-07-04成都性价比高的婚庆公司_成都最好的婚庆公司 天天观察
  20. 2023-07-04台式电脑键盘功能图解_台式电脑键盘