编者按:本文由微信公众号 财经十一人(ID:lcaijingEleven)授权转载,作者 刘以秦,编辑 谢丽容。海南设计师阿黄在经历五年设计工作后,因公司倒闭转而从事AI大模型数据标注工作。尽管他熟悉ChatGPT和文心一言等前沿技术,并见证着”大模型前景广阔”的呼声,但他始终认为自己的工作并非”参与未来”。他的日常任务是为AI大模型寻找错误、修正偏差并打分,机械的点鼠标操作让他感叹”大模型挺傻的”。中国上一波AI浪潮始于2017年,如今服务于自动驾驶和人脸识别的数据标注产业已趋于成熟。传统标注工作以”打点”和”画框”为主,教会机器识别”人脸”与”障碍物”;而大模型时代的标注则更像是阅读理解,帮助AIGC学习生成优质内容。阿黄每天面对电脑屏幕,等待系统分配包含问题与五个答案的数据组,需标注问题类型并为答案打分排序,分数区间为0-5分,低分需注明具体原因。新技术催生大模型热潮,数据标注行业迎来新机遇。业内人士透露,近期数据标注公司订单量激增,均来自大模型需求。大模型依赖海量数据与算力,通过”预训练”掌握逻辑思维与通识能力,但原始数据中充斥着诱导性内容、错误信息等,需持续调优。标注师的工作正是”调优”的关键,通过挑错、修改、打分给予机器反馈,低分”惩罚”高分”奖励”,促使模型进化。数据是机器的”养料”,理想状态下需持续获得高质量数据。但当前大模型数据标注仍存在不足,此前中国大模型与GPT4差距较大的原因之一便在于数据质量。1、本科生构成的标注流水线阿黄通过招聘网站加入某标注基地,发现工作环境已从过去的简陋工坊升级为窗明几净的写字楼,同事多为本科生。尽管如此,他仍视自己为流水线工人。数据标注行业有言”有多少智能,就有多少人工”,这句话在大模型时代依然适用。曾有报道指出,OpenAI早期标注员主要来自肯尼亚,月薪200-300美元,而阿黄与同事月薪约5000元,按题目数量计费。工作节奏不快,基本无加班,收入在当地属中上水平。唯一困扰他的是工作的枯燥和对未来方向的迷茫,学历专业对这份工作毫无加成,职业发展路径也并不清晰。他偏爱标注文案撰写类问答,因AI生成答案质量高;较难的是事实核查类问答,需搜索权威资料;而”扭蛋和鸡蛋哪个更好吃”这类刁钻问题则暴露了机器的局限性。大模型标注与过去不同,”画框”有标准答案,但大模型内容往往无标准答案,标注师只需提交争议内容给经验更丰富的”老师”或接受审核抽查。这条流水线目前由标注师与审核员组成,未来或将出现模型评估师、指令工程师等细分岗位。2、需要更多高质量数据阿黄供职的百度智能云是国内通用大模型领域的佼佼者,其文心一言发布后,他于今年4月加入,经一周培训后上岗。初期数据量稀少,后期工作逐渐繁忙。数据标注行业波动性大,AI繁荣时需求上涨,稍有回落则首当其冲。阿黄一天能完成约80道题,所在基地200名标注师每日可标注约16000道题。一位AI大模型人士认为,当前量级与理想状态差距巨大。大模型参数量动辄千亿,缺乏匹配的标注量难以优化。百度智能云主要承担基础通识能力训练,专业领域需与专家合作。全球领先者OpenAI采用多公司协作与博士团队质检的方式,通过RLHF(强化学习与人类反馈)持续调优。科技公司认为数据质量是OpenAI的核心竞争力,谷歌等纷纷效仿。中文大模型表现不佳主因之一是互联网数据质量,专业人士更倾向于使用专业数据库。大模型新趋势是垂直领域,医疗数据标注需重金聘请专家。国内一线大模型产品也在优化阶段,部分上线产品仍存在问题。相比算力,数据投入回报周期长且易被复制,但数据能力是商业化的第一步。3、”人工”会越来越少数据标注市场主要参与者为第三方公司与科技公司自建团队。百度智能云已与多地政府合作共建10余个基地,提供超1.1万个就业岗位。短期内数据标注师需求旺盛,但长期看,随着大模型自学习能力增强,这个职业可能重蹈上一轮AI标注员的覆辙。OpenAI在东欧等地招募远程员工,若编程能力达标,程序员或将失业。AI技术已辅助人工标注,未来大模型本身将更适合数据标注场景。商汤、海康威视等公司已应用大模型自动标注技术,谷歌、微软等也发布相关产品。百度智能云自研标注系统亦含辅助功能,但机器仍无法完全自主训练。人工智能发展依赖数据、算法与算力,数据是燃料。大模型热潮后,投资人和从业者趋于冷静,开源大模型增多,单纯复制产品难获资本青睐。建立数据能力是商业化的关键,但需平衡投入与回报。本文为专栏作者授权微新创想发表,版权归原作者所有。文章系作者个人观点,不代表微新创想立场,转载请联系原作者。如有任何疑问,请联系http://www.idea2003.com/。

最新快讯

2025年10月31日

04:55
2023年10月30日,纽约肯尼迪国际机场遭遇了一起紧急事件,一架进港航班因报告发动机故障被迫实施地面停飞。幸运的是,涉事的边疆航空3546号航班最终安全降落在指定跑道。美国联邦航空管理局迅速介入并确认,此次事件未造成任何人员伤亡,避免了更严重的后果。然而,这一突发状况对机场的正常运行造成了显著影响。受此事件波及,肯尼迪国际机场的航班平均延误时间一度高达3小...
04:22
2025年10月31日,全球知名投资银行瑞银集团正式发布最新研报,宣布对科技巨头Meta和Alphabet的股价目标进行大幅上调。瑞银将Meta的股价目标从900美元提升至915美元,而谷歌母公司Alphabet的目标价也由255美元上调至306美元。这一系列调整背后,是两家公司近期在广告业务复苏和人工智能技术布局方面取得的显著成果。 市场分析人士指出,...
04:22
2025年10月31日,在NASA就SpaceX火箭研发进度提出严厉批评后,这家航天巨头果断提出了一项创新的简化版登月方案。面对外界压力,SpaceX迅速响应,启动了新任务架构的全面评估工作,其核心目标在于加速宇航员重返月球的伟大征程,同时显著提升任务的安全性。这一举措不仅展现了SpaceX的技术实力,更彰显了其勇于担当的企业精神。 根据双方签署的40亿美元...
04:22
2025年10月31日,全球医药巨头丹麦诺和诺德正式宣布达成一项历史性收购交易,将以高达90亿美元的巨额资金收购专注于肥胖症药物研发的创新型生物技术公司Metsera。此次交易的每股现金报价为56.50美元,若Metsera在研发过程中达成特定科学里程碑,诺和诺德还将额外支付21.25美元的里程碑奖金。这一报价不仅超越了辉瑞此前提出的73亿美元收购方案,更被...
03:18
10月31日,Globalstar股价迎来惊人飙升,盘中一度触及52.60美元的历史高点,单日涨幅高达27%,成交额也创下近期新高。这一异常波动背后,市场盛传埃隆·马斯克麾下的航天巨头SpaceX正积极寻求收购这家卫星通信企业。消息一出,投资者纷纷抢购,推动股价持续攀升,显示出市场对该潜在交易的浓厚兴趣。值得注意的是,此次股价大幅波动伴随着成交量的显著放大,...
02:15
2025年10月31日,高盛集团首席执行官大卫·所罗门在公开场合坦诚表态,承认公司在推动女性高管晋升方面遭遇显著瓶颈。这位华尔街顶级投行掌门人指出,尽管近年来集团在性别多样性议题上投入了大量资源,但高层管理团队中的女性比例始终未能达到理想水平。所罗门强调,高盛将着力优化内部晋升机制,同时加强包容性企业文化建设,通过制度创新与人文关怀双管齐下,为更多女性人才提...
02:15
汇丰控股于本周四正式宣布一项重大战略举措,计划斥资140亿美元收购其香港旗舰子公司恒生银行的少数股东权益。这一交易预计将在2025年3月底前完成,相较于原定2026年上半年的计划,时间表大幅提前,彰显了集团加速整合资源的决心。此次调整后的交易时间表不仅体现了进展的加快,更预示着汇丰控股在亚太地区金融布局的进一步深化。具体的交易细节与执行方案将于下月公布,引发...
02:15
2025年10月31日,备受瞩目的商业交易再度升温,长江和记实业有限公司(以下简称长和)与法国电信巨头Iliad正式宣布,已启动双方在意大利电信业务的合并初步磋商。这一潜在合作标志着两大电信运营商在欧洲市场的战略布局迈出重要一步,有望重塑意大利电信行业的竞争格局。 据悉,Iliad在意大利市场的业务估值高达30亿欧元以上,其丰富的用户基础和先进的网络技术将成...
02:15
近日,一项名为Argentum的AI训练项目正式启动,吸引了约150名来自麦肯锡、贝恩、BCG等顶级咨询公司的前顾问加入。这些资深专家将运用其丰富的行业经验,为人工智能系统提供专业指导,帮助AI逐步掌握咨询行业的初级任务。据悉,该项目由一家专注于数据标注领域的初创公司运营,该公司此前曾成功组织前投行员工参与金融建模AI系统的训练工作。由于项目涉及敏感信息,知...
02:15
10月30日,历史性时刻在吉林长春上演。一汽-大众第3000万辆整车正式下线,这辆承载荣耀的车型是一汽奥迪A5L。这一壮丽成就不仅刷新了企业自身的发展记录,更标志着中国汽车制造业迈入了一个崭新的里程碑——一汽-大众成为国内首家产销总量突破3000万辆的乘用车企业。 这一里程碑事件不仅是一汽-大众发展历程中的辉煌篇章,更是中国汽车工业实力与自信的生动体现。它不...
00:36
2025年10月30日,上市公司有棵树(股票代码:300209.SZ)发布重要公告,宣布原定于10月31日发布的2025年第三季度财务报告将延期披露。公告指出,此次延期主要源于公司内部接管工作的复杂性。目前,有棵树正全面接管原有资产、业务运营、财务体系、人力资源及办公场所等关键环节,但部分第六届董事会成员及管理层人员未能按计划完成离任交接程序,直接影响了季度...
00:06
2025年10月30日,我国自主研发的17.4万立方米LNG运输船在上海正式交付,标志着我国在大型LNG船建造领域取得重大突破。次日,同型船将紧随其后交付,进一步彰显我国造船实力的飞跃。据行业统计,今年全年预计将交付大型LNG船11艘,这一数字不仅创下单年交付量新纪录,更凸显我国在全球LNG运输船市场的领先地位。 数据显示,截至2025年6月,我国新接绿色船...