No menu items!

商湯科技開源SenseNova-MARS模態搜索推理模型

商湯科技於2026年1月30日開源了多模態自主推理模型SenseNova-MARS,提供8B和32B版本。該模型在多個多模態搜尋與推理的基準測試中平均得分69.74,超過Gemini-3-Pro的69.06和GPT-5.2的67.64。

SenseNova-MARS是首個同時支持動態影像推理與圖文搜尋的開源Agentic VLM模型,具備自主規劃步驟和調用工具的能力。該模型在MMSearch、HR-MMSearch等多項基準測試中表現優異,並在搜尋推理和視覺理解領域領先。

在MMSearch評測中,SenseNova-MARS以74.27分與Gemini-3-Pro並列第一,超越GPT-5.2的66.08分。在HR-MMSearch評測中,SenseNova-MARS以54.43分領先其他閉源模型。

該模型能解決需要多步驟推理和多工具協作的複雜任務,並可自動調用圖像裁剪、文本和圖像搜索工具,實現無需人工干預的閉環解答。開發者和行業用家可通過Hugging Face下載該模型,並參考技術報告進行測試與體驗。


睇完記得 Like & Share

More