设为首页|收藏本站|
开启左侧

[科技] AI光年|商汤日日新大模型升级,官宣赶超 GPT-4 Turbo

[复制链接]
40611 2
迟到 发表于 2024-4-23 20:41:44 | 只看该作者 打印 上一主题 下一主题
 
作者|薛芳
编辑|康晓
出品|深网·腾讯小满工作室
2024年4月23日,上海商汤科技SenseTime举办技术交流日活动,发布行业首个“云、端、边”全栈大模型产品矩阵,以满足不同规模场景的应用需求,并且升级“日日新SenseNova 5.0”大模型体系,其综合能力全面对标GPT-4 Turbo,加速生成式AI向产业落地。
人工智能发展的最基本法则——尺度定律(Scaling Law)的准则下,商汤持续寻求最有数据配比并建立数据质量评价体系,推动自身大模型研发的同时,也为行业伙伴提供大模型训练、微调、部署和各类生成式AI的能力及服务。
商汤科技董事长兼CEO徐立表示:“商汤在尺度定律的指导下,会持续探索大模型能力的KRE三层架构(知识-推理-执行),不断突破大模型能力边界。”
AI光年|商汤日日新大模型升级,官宣赶超 GPT-4 Turbo 第1张图片


自去年4月首次发布,商汤“日日新SenseNova”大模型体系已正式推出五个大版本迭代。基于超过10TB tokens训练、覆盖大量合成数据,全新的“日日新SenseNova 5.0”(以下简称:日日新5.0)采用混合专家架构,推理时上下文窗口可以有效到 200K 左右。
本次更新主要聚集增强了知识、数学、推理及代码能力,全面对标 GPT-4 Turbo,主流客观评测上达到或超越 GPT-4 Turbo。
本次“日日新5.0”另一大核心指标就是多模态能力,商汤多模态大模型的图文感知能力在多模态大模型权威综合基准测试MMBench中综合得分排名首位,在多个知名多模态榜单MathVista,AI2D,ChartQA,TextVQA,DocVQA,MMMU 取得领先成绩。
“日日新SenseNova5.0”在应用产品层面也实现了更卓越的多模态能力,支持高清长图的解析和理解以及文生图交互式生成,还可以实现复杂的跨文档知识抽取及总结问答展示,还具备丰富的多模态交互能力。
商汤科技首次推出“云、端、边”全栈大模型产品矩阵,其中包括应用于终端设备的“商汤端侧大模型”,以及面向金融、代码、医疗、政务等多个领域的边缘产此次品“商汤企业级大模型一体机”。
对于金融、代码、医疗、政务等重点行业边缘侧日益增长的AI应用需求,商汤正式推出企业级大模型一体机,可同时支持企业级千亿模型加速和知识检索硬件加速,实现本地化部署,即买即用,降低企业应用大模型的门槛。相比行业同类产品,推理成本节约80%,检索大大加速,CPU工作负载50%。
此外,今天商汤还发布了基于昇腾原生的行业大模型,共同打造面向金融、医疗、政务、代码等大模型产业生态。在自身应用方面,商汤“日日新SenseNova5.0”在秒画、如影、格物、琼宇、大医、小浣熊家族等产品均有重要更新。


上一篇:“贵州科比酒业”注册成功,又一场媲美罗纳尔多与金嗓子的商业骗局?
下一篇:金价为何创两年最大跌幅
@



1.西兔生活网 CTLIVES 内容全部来自网络;
2.版权归原网站或原作者所有;
3.内容与本站立场无关;
4.若涉及侵权或有疑义,请点击“举报”按钮,其他联系方式或无法及时处理。
 

精彩评论2

正序浏览
跳转到指定楼层
沙发
举重若轻 发表于 2024-4-23 21:37:28 | 只看该作者
 
GPT4出来之前发布多好,现在说超越晚了了吧。
回复 支持 反对

使用道具 举报

 
板凳
环球电影院 发表于 2024-4-23 22:15:47 | 只看该作者
 
Llama3一开源,商汤就超越了[哈哈]
回复 支持 反对

使用道具 举报

 
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

排行榜
活跃网友
返回顶部快速回复上一主题下一主题返回列表APP下载手机访问
Copyright © 2016-2028 CTLIVES.COM All Rights Reserved.  西兔生活网  小黑屋| GMT+8, 2024-5-24 17:46