首页 > 新车生活 > 新车生活 > 开源又赢闭源!商汤8B模型空间智能碾压GPT-5,AI看懂世界又进了一步

开源又赢闭源!商汤8B模型空间智能碾压GPT-5,AI看懂世界又进了一步

发布时间:2025-11-11 16:32:17

11月11日报道,昨晚,商汤正式发布并开源SenseNova-SI系列空间智能大模型,涵盖2B与8B两个版本

该系列模型在多个空间智能基准测试中均表现突出,其中SenseNova-SI-8B模型在VSI-Bench、MMSI-Bench、MindCube-Tiny与ViewSpatial四个核心任务上获得60.99的平均成绩,不仅大幅领先Qwen3-VL-8B(40.16)、BAGEL-7B(35.01)等同级别开源通用模型,以及SpatialMLLM(35.05)、ViLaSR-7B(36.41)等专注空间理解的模型。

值得注意的是,在保持8B参数规模的前提下,该模型的均成绩已领先GPT-5(49.68)与Gemini-2.5-Pro(48.81)

▲SenseNova-SI系列模型在多个空间智能基准测试(VSI、MMSI、MindCube、ViewSpatial)中的评测成绩

此次性能跃升,得益于商汤在训练机制上的系统性设计,其研究团队构建了“空间能力分类体系”,并扩充空间理解数据规模,首次在该领域验证了“尺度效应”的存在

这一技术突破也回应了当前多模态大模型面临的核心挑战之一空间智能短板仍未补齐。尽管当前大模型在语言、代码、逻辑推理等任务上已展现出较强性能,但在需要空间理解能力的场景中,仍容易“栽跟头”。

例如,GPT-5可以正确解出复杂图形逻辑题,但面对判断立方体俯视图这类空间题时,却出现了明显错误。这类题对人类儿童来说往往是直觉判断,却仍难住了顶级模型。

新车生活更多>>

从计算成本到享受旅程,汉DM-i长续航版凭何全家幸福感? 竞争华为问界m8,极氪8X路试图及配置 中国首家、全球第三家迪奥之家于三里屯太古里正式开业 深圳手机巨头冲刺港交所!年入687亿,销量全球第三 澎湃OS 3正式版覆盖更多机型:适配小米13系列,即日起推送 折叠iPhone取消实体卡槽?苹果若真这么干,中国销量必崩盘! 三星Watch Ultra 2手表已在路上 预计2026年夏季发布 华为Mate 80 RS率先实现BT.2020色域 李小龙:过于先进! 辛顿:即便 AI 重塑编程行业,计算机科学学位仍具重要价值 微信公众号重大功能更新:文章支持修改3次 可拆卸电池!这顶级LCD小屏,我真有点心动 周星驰《鹿鼎记》重映首日票房仅18万!网友真相了!星爷分不到钱 25周年纪念版雅马哈TMAX560 燃情驾驭,品味经典,大众高尔夫 GTI 车型品鉴 广汽传祺如何务实取胜?家用车型获认可,电动转型求稳健 全新丰田威兰亮相,2.5L混动323牛米+L2辅助,CR-V慌了 东风日产NX8公告图亮相,简约造型超充技术智驾辅助成亮点2026年将登场 日产NX8亮相!800V平台与双动力路线,或2026年上市 真・大手机:华为MatePad Mini小平板集中上架常用汽车应用 中国电信董事长柯瑞文:加快推进算力基础设施建设 努比亚Z80 Ultra墨水屏手机壳上线,售价399元 DeepSeekV3.2技术报告还是老外看得细 豆包和OpenAI,都在押注同一个未来 十二万以内入手长续航大增程,第三代蓝电E5 PLUS实力几何 京东健康:启动S100项目,2026年翻倍投入营销资源 荣耀方飞谈“豆包手机”:AI手机赛道有新伙伴加入,让荣耀AI团队振奋 大众安徽与众06“充电噩梦”:一次充电需多次挪车,品控堪忧 三位一体Trinity,12月5日丰田三新车同发 奔驰旗下YASA轮毂电机原型亮相:单轮千马力,2026年将揭开发展新篇 预计售价40万元起/明年一季度亮相 极氪8X路试谍照曝光