腾讯混元开源1B参数HunyuanOCR模型 多场景赋能OCR应用

11月25日,腾讯混元重磅发布全新开源OCR模型——HunyuanOCR,为OCR技术领域注入强劲动力。该模型参数量仅为10亿(1B),却依托混元原生多模态架构打造,在多项业界权威OCR应用榜单中斩获SOTA(最先进水平)成绩,为OCR技术落地提供轻量化高效解决方案。

腾讯混元开源1B参数HunyuanOCR模型 多场景赋能OCR应用插图1

HunyuanOCR采用全端到端范式设计,由原生分辨率视频编码器、自适应视觉适配器和轻量化混元语言模型三部分构成。其核心优势在于”高效便捷”:体积小巧便于部署,单次前向推理即可实现功能最优输出,效率远超业界级联方案。这一创新设计使得HunyuanOCR在资源受限环境下依然能发挥卓越性能。

性能方面,HunyuanOCR表现亮眼。在复杂文档解析的OmniDocBench测评中,以94.1分超越谷歌Gemini3-Pro等领先模型;在覆盖文档、手写、街景等9大场景的自建基准测试中,文字检测和识别能力大幅领先同类开源及商业模型;OCRBench榜单上,其以1B参数斩获总参数3B以下模型SOTA,总得分860分。这一系列优异表现充分证明HunyuanOCR在OCR领域的领先地位。

腾讯混元开源1B参数HunyuanOCR模型 多场景赋能OCR应用插图2

在多语种翻译领域,HunyuanOCR同样表现出色。该模型支持14种高频小语种与中/英文互译,还拿下ICDAR2025端到端文档翻译比赛小模型赛道冠军。这一能力使得HunyuanOCR能够满足全球化应用需求,为跨语言场景提供高效解决方案。

应用场景上,HunyuanOCR可实现多语种复杂文档解析、票据字段JSON格式提取、视频双语字幕自动抽取等功能,已覆盖卡证处理、视频创作、跨境沟通等领域。无论是企业级应用还是个人需求,HunyuanOCR都能提供专业级解决方案。

腾讯混元开源1B参数HunyuanOCR模型 多场景赋能OCR应用插图3

目前,用户可通过多种渠道下载体验HunyuanOCR。支持web端、移动端链接,以及GitHub、Hugging Face开源地址。直接访问Hugging Face空间即可快速试用,开启OCR应用新篇章。具体下载地址:https://hunyuan.tencent.com/vision/zh?tabIndex=0https://github.com/Tencent-Hunyuan/HunyuanOCR

最新快讯

2025年11月25日

18:18
微新创想11月25日消息,今天华为正式发布了首款鸿蒙二合一平板电脑华为MatePad Edge。作为一款二合一设备,华为MatePad Edge可在巨幕平板和性能电脑之间自由切换,两种模式数据可以互享互通。屏幕为14.2英寸柔性OLED大屏,拥有94%超高屏占比,分辨率为3120*2080、峰值亮度1000nits,对比度100...
18:18
声明:本文来自于微信公众号 深响,作者:何文,授权站长之家转载发布。回望过去一年电商行业的发展,一个再清晰不过的趋势正在加速成形——AI正全面进入电商经营链路。从图文、视频素材的自动生成,到直播脚本和数字人的批量生产,从投放策略的实时优化到客服自动化,AI不再只是附着在电商表层的“创新工具”,而是正在成为驱动整个行业效率提升的新...
18:18
谷歌正式官宣语音助手 Google Assistant 的退役计划,该服务将于 2026 年 3 月 31 日全面停止运营,并启动功能迁移过渡期。新一代智能语音助手 Gemini 将全面接替 Google Assistant,覆盖 Android、Wear OS、Chrome 以及智能音箱等多元平台。用户可通过系统设置手动完成切换,整个过渡阶段预计持续至 2...
18:14
2025年11月25日,美国银行发布最新研报,对网易旗下备受期待的新游戏《无限大(ANANTA)》展现出显著信心。在与网易高层管理人员及投资关系团队进行深入电话会议后,美银分析师大幅上调了该游戏上线后的用户参与度预期,并对其盈利潜力给予高度评价。据该行预测,《无限大》正式上线后有望实现年化流水高达100亿人民币的惊人成绩,这一数字不仅彰显了游戏的市场吸引力,...
18:14
2025年前三季度,三协电机交出亮眼业绩,营业总收入高达4.07亿元,同比增长38.00%,展现出强劲的增长势头;归母净利润达到4615.27万元,同比增长21.15%,盈利能力稳步提升。公司正积极推动产品向技术驱动型转型,通过与下游客户深度协同开发,不断优化产品性能与市场适应性。目前,三协电机的步进电机已成功应用于3D打印领域,市场需求持续扩大;无刷电机则...
18:14
11月21日,优必选科技传来振奋人心的消息,成功中标广西防城港市人形机器人数据采集与测试中心及人工智能科创教育示范项目,合同金额高达2.64亿元。这一重大突破不仅彰显了优必选在机器人领域的领先地位,更预示着其商业化应用的加速推进。 该项目将以优必选最新推出的可自主换电工业人形机器人Walker S2为核心产品,这款机器人凭借其卓越的性能和高度智能化,将成为数...
18:14
2024年11月24日,新疆派特罗尔能源服务股份有限公司正式在新疆证监局完成上市辅导备案,标志着这家深耕油气田领域的专业企业已迈出登陆北京证券交易所的关键一步。本次辅导工作由长江证券担任承销保荐机构,为公司的资本化之路保驾护航。 作为行业内的资深服务商,新派能源自2003年成立以来,始终专注于油气田深井钻井技术服务领域。公司注册资本达5537.5万元,凭借多...
18:14
近日,华润怡宝饮料(中国)投资有限公司完成了一项引人注目的工商变更,其注册资本从约8329万美元大幅提升至约2.53亿美元,增幅高达204%。这一显著增长不仅彰显了公司对发展前景的坚定信心,更揭示了其在华业务扩张的雄心壮志。 该公司自2011年8月成立以来,始终专注于食品饮料领域的外商投资及进出口业务。在张伟通先生的悉心领导下,公司凭借敏锐的市场洞察力和高效...
18:14
招银国际最新研报发布,对百胜中国(09987)维持"买入"评级,并将目标价上调至457.48港元。报告指出,百胜中国近期门店扩张速度超出市场预期,必胜客品牌营运利润表现同样优于预期。这一积极表现主要得益于公司持续强化性价比策略,通过聚焦核心市场、开发空白区域以及吸引新客群等举措,有效提升了市场占有率。 为实现更高效的运营管理,百胜中国正积极执行RGM3....
18:14
2025年11月24日,备受瞩目的生物科技企业明宇制药有限公司正式向香港交易所递交招股书,宣布正式启动主板上市计划。此次联席保荐工作由国际顶尖投行摩根士丹利、美银证券以及国内头部券商中信证券联合承担,彰显了资本市场对该企业的高度认可与信心。 作为一家成立于2018年的生物技术创新企业,明宇制药已迅速成长为肿瘤治疗领域的领先者,目前正处于商业化前夜的关键阶段。...
18:14
2025年11月24日,阿里云正式宣布与新加坡国家人工智能计划(AISG)达成战略合作,为其提供尖端技术支持,助力其推出基于通义千问Qwen3-32B架构的新一代大语言模型——Qwen-Sea-Lion-v4。这一重要合作标志着AISG在人工智能领域的重要战略转向,正式从Meta模型体系转向阿里云的Qwen架构,展现了双方在推动区域人工智能发展方面的坚定决心...
18:14
Geekbench数据库近日出现了一款名为“RTX 6000D”的显卡测试记录,引发了行业广泛关注。这款显卡的核心配置显示其拥有156个计算单元(SM),运行频率高达2430MHz,而显存容量更是达到了惊人的83.0GB(实际可能为84GB)。通过对其核心规模的深入分析,可以推断出该显卡很可能采用了英伟达最新的GB202核心架构,这与传闻中即将推出的RTX ...