DeepSeek OCR2发布实现视觉Token消耗锐减80%超越Gemini3Pro

微新创想:中国 AI 领军企业 DeepSeek 近日发布了全新的视觉编码器 DeepSeek OCR2 在文档处理和图像识别领域实现重大突破。该模型通过模拟人类视觉的灵活扫描模式 彻底颠覆了传统视觉模型平铺直叙的处理逻辑。DeepSeek 研究人员指出 人类眼睛在观察物体时会根据内容进行灵活聚焦。为了实现这一特性 DeepSeek OCR2 引入了全新的架构 弃用了传统的 CLIP 组件 转而采用轻量级语言模型架构。

DeepSeek OCR2发布实现视觉Token消耗锐减80%超越Gemini3Pro插图1

该架构利用“因果流 Token”对视觉信息进行重新排列和上下文整合 使 AI 能够像人类一样 根据内容的意义而非固定的网格顺序来“观察”世界。这种创新的处理方式不仅提升了理解力 更极大地优化了效率。在相同的图像处理任务中 DeepSeek OCR2 仅需 256 到 1120 个 Token 相比同类系统通常消耗的 6000 个以上 Token 其视觉 Token 消耗量锐减了 80% 以上。这种极高的压缩率使得模型在处理长文档时具有巨大的成本和速度优势。

在权威的 OmniDocBench 基准测试中 该模型以 91.09% 的高分刷新纪录 在文档解析性能上全面超越了 Gemini3Pro。目前 DeepSeek 已将该模型的代码和权重向公众开放。研究团队认为 这种架构是迈向统一多模态处理的重要一步 未来有望在同一框架下实现文本、语音和图像的深度融合理解。

DeepSeek OCR2发布实现视觉Token消耗锐减80%超越Gemini3Pro插图2

能效巅峰 DeepSeek OCR2 将单张图像的视觉 Token 需求大幅降低 相比同类系统减少了约 80% 的资源消耗。性能超越 在 OmniDocBench 测试中 该模型在文档解析和识别阅读顺序方面表现卓越 准确率超越了 Gemini3Pro。架构创新 通过引入“因果流 Token”重组视觉信息 模型实现了从机械扫描到理解内容逻辑的跨越。

最新快讯

2026年02月09日

12:36
微新创想:生物计算领域迎来重磅开源力量 字节跳动近日正式发布了名为Protenix-v1的生物分子结构预测模型 该模型不仅完整复现了 AlphaFold3(AF3)的核心能力 更宣布在 Apache2.0协议下全面开源代码及模型参数 打破了顶尖生物大模型的技术围垒 Protenix-v1的强大之处在于其全原子3D 结构预测能力 能够精准处理包括蛋白质、核...
12:36
微新创想:小红书技术团队正在研发一款名为 OpenStoryline(版本号1.0.0)的视频剪辑类AI产品。该产品目前尚处于测试阶段,未来有开源的可能。OpenStoryline 定位为基于AI智能体的创作工具,核心功能支持对话式剪辑。这一创新设计让用户可以通过自然语言与AI互动,完成视频内容的策划与剪辑。产品效果被认为类比字节跳动的即梦小云雀及商汤的 S...
12:31
微新创想:2026年2月,美国互联网彩妆品牌Live Tinted完成B轮融资,金额达到数千万美元。此次融资由Curate Capital领投,欧莱雅集团旗下战略风投基金BOLD首次作为新战略投资者加入。联合利华旗下Unilever Ventures及Monogram Capital等现有股东也选择跟投。Live Tinted由南亚裔美国网红Deepica ...
12:31
微新创想:2026年2月9日,全球最大AI开源社区HuggingFace出现Qwen3.5接入Transformers库的代码合并申请(PR) 该模型由阿里巴巴研发,属于Qwen系列新一代基座大模型 目前尚未正式发布,但已进入开源生态集成阶段 此举意味着Qwen3.5即将面向开发者开放,或为后续商用版本铺路 业内普遍认为其性能、多语言支持及推...
12:31
微新创想:2026年2月9日,万达电影在投资者互动平台披露,其投资出品的《飞驰人生3》《惊蛰无声》《熊出没·年年有熊》及联合出品的《镖人》均已定档春节档。影片将于2月28日(农历腊月二十九)起陆续上映,覆盖喜剧、悬疑、动画及古装动作类型。 此举系公司强化春节档内容布局、提升票房市场份额的重要举措。四部影片均由万达主控宣发或深度参与制作,预计覆盖全年龄观影群体...
12:31
微新创想:2026年2月,西北工业大学常洪龙、吉博文团队研发的三维锥形碳基柔性大脑皮层电极阵列,搭载“迪迩五号·中国科技城号”空间试验器,在轨成功开展国际首次无线植入式脑机接口离体验证 此次试验在近地轨道上进行,电极阵列在模拟体液环境中持续稳定采集脑电信号,成功获取了噪声水平与服役稳定性等关键数据 该技术突破了极端空间环境下神经传感技术的瓶颈,填补了国际在该...
12:31
微新创想:据科技记者马克·古尔曼报道,2026年2月中旬至3月上旬,苹果公司将在全球范围内密集推出多款新产品。此次发布会涵盖多个产品线,包括iPhone 17e、新款iPad以及搭载M5 Pro和M5 Max芯片的MacBook系列。苹果的这次产品发布主要集中在中端机型和性能提升方面,意在进一步完善其春季产品线布局。 消息来源并未公布具体的发布日期和区域安排...
12:31
微新创想:2025年11月凌晨4时许,美国佐治亚州一名车主在前往亚特兰大途中突发STEMI型心肌梗死。该车主驾驶的是一辆2026款Model Y首发版,车辆已更新至最新的FSD v14.1.3软件系统。在突发状况发生时,车辆的自动驾驶功能依然保持正常运行。 其子杰克·布兰特在紧急时刻通过远程授权的方式,成功操控车辆导航系统。他引导FSD将车辆安全驶入卡罗尔顿...
12:31
微新创想:2026年2月9日 昆明呈贡福朋喜来登酒店在昆明市呈贡新区春融街正式开业 酒店由万豪国际集团运营 位于市政中心旁 拥有优越的地理位置 毗邻多个城市公园及热门商圈 距离昆明南站约5公里 交通便利 便于商务出行和城市探索 距离长水国际机场约28公里 为远道而来的旅客提供了便捷的交通选择 酒店设有116间现代化客房及套房 部分房间可欣赏到公园的美丽景观 ...
12:31
微新创想:2月5日,郑州新郑国际机场相继开通“郑州-巴塞尔”和“郑州-塔林”两条跨境电商全货机航线。前者于2月4日首飞瑞士巴塞尔,后者于2月5日晚首飞爱沙尼亚塔林。两航线均由中大门国际物流集团运营,其中郑州-巴塞尔航线每周三班,郑州-塔林航线每周两班。 此次新航线的开通标志着郑州在跨境电商物流领域迈出了重要一步。作为中国内陆的重要物流节点,郑州一直致力于打造...
12:31
微新创想:2月6日,小米汽车科技有限公司申请的“对开门车辆和锁扣组件”专利正式获国家知识产权局授权。该专利适用于对开门车型,通过创新锁扣与铰链组件协同设计,使左右车门可不分先后顺序独立开启或关闭。这一技术突破为用户带来了更便捷的上下车体验,同时也提升了人机交互的智能化水平。 微新创想:技术方案包括车身、两扇对开式车门、可移动锁扣组件及轨迹可控铰链组件,实现开...
12:31
微新创想:2026年2月9日,宁美旗下品牌名龙星球正式推出新款无线游戏鼠标MX301 PRO。这款鼠标专为中小手用户设计,兼顾了便携性与操控性。整体重量仅为57±3克,轻盈的机身让玩家在长时间游戏过程中也能保持舒适的手感。 微新创想:MX301 PRO采用复合碳纤维材质,不仅提升了产品的耐用性,还有效减轻了重量,使鼠标更加灵活。同时,该鼠标准备支持抓握、趴握...