11月11日报道,昨晚,商汤正式发布并开源SenseNova-SI系列空间智能大模型,涵盖2B与8B两个版本。
该系列模型在多个空间智能基准测试中均表现突出,其中SenseNova-SI-8B模型在VSI-Bench、MMSI-Bench、MindCube-Tiny与ViewSpatial四个核心任务上获得60.99的平均成绩,不仅大幅领先Qwen3-VL-8B(40.16)、BAGEL-7B(35.01)等同级别开源通用模型,以及SpatialMLLM(35.05)、ViLaSR-7B(36.41)等专注空间理解的模型。
值得注意的是,在保持8B参数规模的前提下,该模型的平均成绩已领先GPT-5(49.68)与Gemini-2.5-Pro(48.81)。

▲SenseNova-SI系列模型在多个空间智能基准测试(VSI、MMSI、MindCube、ViewSpatial)中的评测成绩
此次性能跃升,得益于商汤在训练机制上的系统性设计,其研究团队构建了“空间能力分类体系”,并扩充空间理解数据规模,首次在该领域验证了“尺度效应”的存在。
这一技术突破也回应了当前多模态大模型面临的核心挑战之一:空间智能短板仍未补齐。尽管当前大模型在语言、代码、逻辑推理等任务上已展现出较强性能,但在需要空间理解能力的场景中,仍容易“栽跟头”。
例如,GPT-5可以正确解出复杂图形逻辑题,但面对判断立方体俯视图这类空间题时,却出现了明显错误。这类题对人类儿童来说往往是直觉判断,却仍难住了顶级模型。
