微新创想(idea2003.com) 7月31日讯:一项最新研究揭示了大型语言模型在不同语言处理上的成本差异,这一发现对于全球范围内的AI应用具有重要启示。研究指出,以OpenAI为代表的服务在处理英语输入和输出时成本最低,而其他语言则呈现出显著差异。具体而言,简体中文的处理成本约为英语的两倍,西班牙语则需1.5倍,而掸语更是高达15倍。

牛津大学的研究团队通过实验发现,一个大型语言模型处理一句缅甸语句子需要198个tokens,相比之下,同样的英语句子仅需17个tokens。Token作为衡量API访问大型语言模型(如OpenAI的ChatGPT或Anthropic的Claude 2)计算成本的基本单位,这一数据直观地表明,处理缅甸语句子的成本是英语的11倍。这种「标记化」模型的工作方式意味着,非英语语言在访问和训练时往往面临更高的经济门槛。

语言结构差异是造成成本差异的核心原因。以中文为例,其语法结构和字符数量与英语存在本质区别,导致标记化成本显著提高。OpenAI的GPT3 tokenizer数据显示,「your affection」这一词组在英语中仅需两个tokens,而在简体中文中却需要八个tokens。尽管英语文本有14个字符,但简体中文仅用4个字符就能表达相同含义,这种差异直接影响了计算资源的消耗。

微软在其ChatGPT模型API使用页面上提供了实用的标记化工具,帮助用户测试不同提示的成本。该工具显示,英语中1个token约等于4个字符,100个tokens则相当于75个英文单词。值得注意的是,这种线性关系并不适用于其他语言,微软对此有明确说明。

从成本效益角度来看,英语在人工智能领域展现出无与伦比的优势。以中文为例,其使用成本是英语的两倍。这一现象反映了当前AI公司训练模型时可用数据的分布情况。高质量紧急数据(如生活记录产生的数据)的价值在人工智能爆发期得到充分体现,这也直接关系到AI公司实现递归训练的愿景——即用自身输出训练AI模型。

若要实现这一目标,未来模型仍将延续英语的成本优势。其他语言由于复杂性和基础训练数据的局限性,标记化速率将持续偏高。进一步分析表明,除了标记化之外,其他成本衡量方法(如位数或字符计数)同样无法绕开这一困境。英语凭借其较高的「可压缩性」,在标记数量上始终处于领先地位,这并非货币化方式的问题,而是技术和基础模型训练中的真实局限。

值得注意的是,这一成本差异不仅存在于当前的大型语言模型,未来多语言模型也可能面临相同挑战。毕竟,这些模型大多采用相似的技术架构。考虑到ChatGPT等大型语言模型及Midjourney等生成式图像网络主要诞生于美国,成本差异已促使中国和印度等国家启动本土语言模型的研发计划。这些国家声称此举旨在配合以英语为基础的AI网络实现创新速度,而创新速度本身正受限于访问和训练成本。

在人工智能这一复杂而深远的领域,成本效益始终是关键考量因素。每个决策都需要谨慎权衡,因为微小的变化可能产生巨大的影响。语言处理成本问题不仅关乎经济效率,更反映了全球AI发展的不平衡现状。随着技术的不断进步,如何平衡成本与质量,将成为未来AI领域的重要课题。

最新快讯

2025年10月25日

11:54
随着汽车辅助驾驶技术的快速发展和广泛应用,越来越多的驾驶员开始习惯性地依赖这项功能,却逐渐忽视了自身在驾驶过程中的监控责任。这种过度依赖不仅带来了潜在的安全风险,更在交通事故中屡见不鲜。10月16日,沪宜高速就发生了一起典型的因驾驶员过度信任辅助驾驶系统而引发的交通事故。 据无锡交警部门通报,涉事司机在行驶过程中开启了车辆的辅助驾驶功能,但并未将注意力集...
11:54
微软游戏业务CEO菲尔·斯宾塞在《大创意,小游戏:超越爆款的创造力》小组讨论中分享了Xbox在人工智能领域的最新进展。他透露,尽管外界普遍关注AI在游戏开发中的应用,但Xbox当前的重点实际上并非直接用于游戏创作。斯宾塞强调,AI技术在Xbox生态中的核心价值更多体现在提升平台安全性和用户体验方面。 在网络安全与用户保护领域,斯宾塞特别指出AI技术正在发挥关...
11:23
微新创想10月25日重磅消息,备受瞩目的旗舰手机一加15将于10月27日正式揭开神秘面纱。一加中国区总裁李杰今日通过官方渠道发布重要声明,强调这款产品将开创行业先河,成为首款性能Ultra级别手机,不仅拥有超长续航的强悍性能,更将带来全面旗舰级的极致体验。李杰进一步透露,一加15的诞生遵循了影像Ultra的严苛标准,首次定义了性能Ultra的新标杆。 在性能...
11:23
小米集团创始人雷军于10月25日在社交平台惊喜宣布,本周末将针对REDMI K90系列手机推出限时首销优惠活动,为新老用户带来多重惊喜。此次优惠力度空前,不仅覆盖了广泛用户群体,更展现了小米满满的诚意。 首销优惠亮点纷呈,主要包括两大核心福利。第一,凡在本周末购买REDMI K90系列手机的用户,均可享受2年碎屏保、2年电池盖保以及365天只换不修的优质售后...
11:23
微新创想10月25日重磅消息,知名数码博主数码闲聊站通过深入挖掘HarmonyOS官方开发文档,意外发现华为Mate80系列将全面支持3D人脸识别技术。需要强调的是,这一信息目前仅基于文档披露,实际配置仍需官方最终确认,但已引发行业广泛关注。根据多方消息源透露,华为Mate80系列预计将于11月正式发布,该系列将包含四款机型,分别是标准版Mate80、Mat...
11:23
10月25日深度报道,近日一段令人心跳加速的潜水视频在网络上掀起轩然大波。视频中,潜水博主在马尔代夫的碧海蓝天下,遭遇了令人难以置信的惊险一幕——他的水下相机竟被一只鲨鱼突然吞入腹中,吓得他连滚带爬地游回岸边。更令人惊奇的是,这只鲨鱼不仅将相机完好无损地吐出,更神奇的是,相机内竟然完整记录了整个惊心动魄的过程。 从博主发布的震撼视频中可以看到,一只体型硕大的...
11:23
小米商城于10月25日重磅推出全新显示器——REDMI A27Q Type-C版2026,首发售价仅为899元,为用户带来高性价比的视觉体验。这款显示器采用27英寸IPS面板,搭载2K分辨率(2560x1440)显示屏,16:9黄金显示比例,确保画面细节丰富且观看舒适。 在性能表现上,A27Q Type-C版2026拥有静态对比度1300:1、典型亮度300...
11:22
据可靠消息源透露,微软近期对Outlook团队进行了重大重组,任命Gaurav Sareen为新任负责人,旨在将这款广受欢迎的电子邮件客户端彻底升级为AI时代的智能协作平台。Sareen在内部备忘录中明确指出,团队将"以全新视角彻底重构"Outlook,而非仅仅添加AI功能。这位新领导者描绘了Outlook未来的发展蓝图——将其打造成为用户的"数字分身",能...
11:22
2025年10月18日至24日,中国一级市场投融资活动呈现新动态,共发生85起投资事件,较上一周期下降5.56%,但披露总额显著提升至约110.63亿元,环比增长87.03%。这一变化反映出市场在调整中仍保持较高活跃度,多个领域展现出强劲的发展潜力。 其中,新石器科技以超6亿美元的D轮融资成为本周焦点,由阿联酋磊石资本领投,多家知名机构联合参与。此次融资不仅...
11:22
科技媒体borncity最新报道,部分Windows 11 24H2用户在安装9月可选更新KB5066835后遭遇远程桌面协议(RDP)连接异常问题。该故障现象呈现明显的规律性特征:当从Windows 11客户端尝试连接已安装问题更新的同版本设备时,系统会频繁出现连接失败的情况;然而,若从Windows 10或Windows Server 2022设备发起连...
11:22
macOS 26 Tahoe的发布为用户带来了一项重大变化——经典Launchpad启动台的移除,取而代之的是全新设计的“App”页面。这一操作逻辑的调整,虽然旨在提升用户体验,却引发了部分用户对效率下降的担忧。面对这一挑战,夸克为其macOS版客户端精心打造了“夸克启动台”功能,致力于为用户还原原生Launchpad的交互体验。 要启用这一功能,用户只需轻...
11:22
科技媒体Windows Report最新报道,微软游戏业务首席执行官菲尔·斯宾塞在接受日本权威媒体Famitsu的专访中,首次正式确认下一代Xbox游戏主机的研发计划,并特别强调这将是一款纯粹由微软自主研发的"第一方"硬件产品。这一重要表态不仅直接驳斥了近期网络上流传的"Xbox可能放弃硬件制造"的猜测,更在Xbox业务面临裁员重组、重点项目调整以及Game...