微新创想:2026年4月底,DeepSeek面向测试用户灰度上线“识图模式”,目前已大范围开放。该功能基于多模态模型“Thinking with Visual Primitives”,具备文物识别、空间推理、表情包解读及截图转码等能力。用户上传图片后可触发深度思考,处理800×800图像仅耗约90 tokens,效率显著优于GPT、Claude等模型。
当前该功能仍处于内测阶段,存在知识库滞后的问题,例如在识别2025年底发布的新机型号时可能出现误判。此外,在处理高难度视错觉题目时,模型仍存在幻觉现象,影响识别准确性。因此,用户在使用过程中需注意这些局限性,以获得更可靠的结果。
值得注意的是,目前“识图模式”暂不支持图像生成或视频理解功能。这意味着用户只能通过上传图片进行内容识别与分析,无法直接生成新的图像或处理动态视频内容。未来随着技术的不断优化,这一功能有望进一步拓展,为用户提供更加全面的视觉交互体验。
