Grab自研视觉模型攻克东南亚语言识别难题

Grab,这家在东南亚地区广受欢迎的超级应用程序公司,近日在其官方工程博客上详细分享了其自主研发语言模型的创新实践。文章指出,尽管大型语言模型在处理通用文本方面表现出色,但在理解和识别东南亚地区的语言时却存在明显短板。Grab的超级应用程序集打车、外卖、购物和金融服务于一体,服务网络覆盖新加坡、马来西亚、印尼、菲律宾、越南、泰国、柬埔寨和缅甸等多个国家。这些地区的文档通常采用非拉丁字母的复杂脚本,给Grab的合规工作带来了巨大挑战。

在客户身份验证等关键合规流程中,Grab需要精准提取身份证、驾照和注册证书等文档上的关键信息。尽管团队尝试过多种光学字符识别(OCR)系统,但发现这些技术在面对多样化的文档模板时效果始终不尽如人意。2025年,Grab开始探索利用大型语言模型解决这一难题。经过测试,市面上一些强大的商业模型虽然功能强大,但在东南亚语言处理上频繁出现错误和延迟。而开源的视觉大型语言模型虽然效率较高,准确性却仍无法满足Grab的需求。面对这些困境,Grab最终决定自主研发一个专门针对东南亚语言的视觉大型语言模型。

Grab的工程师们选择了阿里巴巴云的Qwen2-VL2B模型作为技术基础。这一选择主要基于三个关键优势:模型体积适中、全面支持东南亚语言,以及能够动态处理不同分辨率的图像。为了进一步提升模型对东南亚语言的理解能力,团队从Common Crawl中提取了大量东南亚语言内容,并建立了内部合成数据管道,专门用于生成各种字体和背景条件下的文本图像。通过低秩适配技术对Qwen2-VL模型进行微调,Grab在印尼文档处理上取得了令人瞩目的成果。尽管在泰语和越南语的识别上仍面临挑战,团队最终决定采用完整参数微调方案,通过深度训练让模型掌握东南亚语言的独特视觉特征。

Grab自研视觉模型攻克东南亚语言识别难题插图1

经过不懈努力,Grab成功开发出一个轻量级的视觉大型语言模型。该模型在处理身份证和驾照等文档时的表现不仅超越了多种OCR工具,甚至超过了许多通用模型。Grab团队总结道,战略性地运用高质量数据,能够使小型专业模型在高效性和有效性上实现完美平衡。展望未来,Grab计划继续投入资源开发更多自有模型,以应对日益复杂的文档处理需求。

Grab的这一创新实践再次证明,针对特定场景定制开发专用模型,往往能够带来远超通用解决方案的性能优势。特别是在东南亚这样语言文化多元化的市场,拥有自主可控的语言处理技术,对于超级应用程序的合规运营和服务质量至关重要。随着Grab在文档处理领域的持续深耕,我们有理由相信,这家东南亚科技巨头将在人工智能应用创新上创造更多突破。

最新快讯

2025年11月04日

20:03
研究机构Alinea Insight最新发布的权威报告揭示了育碧新作《刺客信条:影》的市场表现。该作自上市以来已满7个月,在PS5平台上的销量表现尤为亮眼,累计售出240万份。若将所有平台合并计算,包括PS5、Xbox及PC,总销量已突破430万份。从平台分布来看,PS5平台贡献了最大份额,占比高达56%,其次是Xbox平台占比26%,PC平台则以18%的份...
20:03
2025年11月4日,视觉中国(股票代码:000681.SZ)正式对外发布重大战略举措,宣布正积极筹备境外发行H股并在香港联合交易所有限公司(HKEX)完成上市。此举标志着这家国内领先的视觉内容服务商正加速全球化布局,通过拓展国际融资渠道,进一步巩固其在全球创意产业中的核心竞争力。根据公告内容,此次境外发行计划旨在优化公司资本结构,增强海外市场融资能力,同时...
20:03
2025年11月4日,存储现货市场迎来新一轮价格飙升,多数成品端产品价格持续上行。这一轮上涨主要得益于服务器领域对NAND和DRAM的强劲需求,推动三星、SK海力士等核心原厂加速产能向高利润产品转移。受此影响,消费类存储产品的供应端出现明显收紧态势,市场供需关系发生显著变化。 根据最新三季度财报数据,各大原厂库存水平呈现快速下降趋势,整体供应增长动力严重不足...
20:02
2025年11月4日,全球领先的光伏企业天合光能正式宣布,其核心子公司天合储能与澳大利亚太平洋绿色能源公司Pacific Green达成战略合作协议。根据协议内容,双方将在2026年至2028年期间建立长期战略合作伙伴关系,共同开发并供应总计5吉瓦时的电网级电池储能系统。这一合作标志着天合储能凭借其技术领先优势,将为其全球战略伙伴提供高安全性、高效率及超长寿...
20:02
2025年11月4日,中国领先的汽车零部件供应商丰茂股份(股票代码301459.SZ)正式发布重要公告,宣布拟通过发行可转债的方式筹集资金总额不超过6.1亿元人民币。这一战略举措旨在进一步强化公司在汽车零部件领域的核心竞争力,推动产业升级与业务拓展。根据公告内容,所募集的资金将重点投向三大核心项目:智能底盘热控系统生产基地(一期)的建设、年产800万套汽车用...
19:32
本次大会由中国信息通信研究院与IMT-2030(6G)推进组强强联合主办,旨在打造一场聚焦6G技术革新的全球性盛会。大会将重点展示6G AI原生设计、智能体通信等前沿成果,通过这些尖端技术的集中呈现,致力于构建一个万物智联的新生态体系。这一宏伟目标不仅代表着技术的飞跃,更象征着未来智能生活的新篇章。 大会将汇聚全球顶尖专家,共同探讨6G应用场景和技术体系的构...
19:32
理想汽车最新运营数据显示,其充电网络建设正迎来高速发展期。2025年第44周,公司新增47座超充站及266根充电桩,使全国超充站总数成功突破3500座这一重要里程碑。这一成绩的取得,不仅彰显了理想汽车在充电设施布局上的坚定步伐,更为广大新能源汽车用户带来了更为便捷高效的补能服务体验。 上周新增的充电站点实现了广泛的地域覆盖,涉及广东、浙江、四川等17个省级行...
19:32
光年探索近日传来振奋人心的消息,成功研制出直径5米的不锈钢共底贮箱,这一里程碑式成果为大直径运载火箭贮箱的设计制造领域带来重大突破。作为国内仅有的两家掌握该尺寸贮箱制造技术的单位之一,光年探索更是首家实现这一技术的民营航天企业。这一成就不仅彰显了公司在航天制造领域的领先地位,更标志着其已建立起覆盖直径2.25米至5.0米全系列不锈钢贮箱的完整设计制造体系,全...
19:32
美国食品和药物管理局(FDA)近日正式批准了一项开创性的基因编辑猪肾人体移植临床试验,标志着生物医学领域迈入器官移植革命性新纪元。这项备受瞩目的研究项目由纽约大学朗格尼健康中心率先实施,成为全球首个将基因编辑猪器官应用于人体移植的临床实践。据悉,该试验将系统性地评估经过基因改造的猪肾脏在终末期肾病患者体内的安全性与实际疗效,初期计划招募六名患者参与,后续有望...
19:02
2025年11月4日,国内钢材市场延续近期下行态势,价格整体承压下滑。其中,唐山迁安松汀钢铁普方坯出厂价再度下调10元/吨,调整后含税报价降至2950元/吨。这一调价动作不仅凸显了当前市场供需失衡的局面,更反映出下游需求持续疲软、供给端压力加大的行业现状。随着钢材价格连续走低,市场参与者观望情绪日益浓厚,多数企业选择按兵不动。预计短期内,在多重利空因素影响下...
19:02
2025年11月4日,斯特兰蒂斯集团首席执行官在重要会议上发表关键讲话,直指欧洲当前供应链体系自主性严重不足的问题。他明确指出,现有供应链架构在面对突发状况时显得力不从心,以安世半导体供应中断事件为例,充分暴露了欧洲在关键零部件供应上的先天脆弱性。这一尖锐的批评不仅揭示了欧洲汽车产业对全球供应链的高度依赖,更凸显了构建本土化、高韧性供应链的迫切需求。该发言引...
19:02
2025年11月3日,美国联合治疗公司在纽约大学兰贡医学中心成功完成了全球首例基因编辑猪肾移植人体的临床试验手术这一历史性突破。作为美国食品药品监督管理局FDA批准的首个规模化临床研究项目,该试验将系统性地评估基因编辑技术在治疗终末期肾病方面的安全性与临床有效性。值得注意的是,在此之前,此类异种器官移植仅限于极少数"同情用药"的个案治疗。此次试验的成功实施,...