编者按:本文由微信公众号 财经十一人(ID:lcaijingEleven)授权转载,作者 刘以秦,编辑 谢丽容。海南设计师阿黄在经历五年设计工作后,因公司倒闭转而从事AI大模型数据标注工作。尽管他熟悉ChatGPT和文心一言等前沿技术,并见证着”大模型前景广阔”的呼声,但他始终认为自己的工作并非”参与未来”。他的日常任务是为AI大模型寻找错误、修正偏差并打分,机械的点鼠标操作让他感叹”大模型挺傻的”。中国上一波AI浪潮始于2017年,如今服务于自动驾驶和人脸识别的数据标注产业已趋于成熟。传统标注工作以”打点”和”画框”为主,教会机器识别”人脸”与”障碍物”;而大模型时代的标注则更像是阅读理解,帮助AIGC学习生成优质内容。阿黄每天面对电脑屏幕,等待系统分配包含问题与五个答案的数据组,需标注问题类型并为答案打分排序,分数区间为0-5分,低分需注明具体原因。新技术催生大模型热潮,数据标注行业迎来新机遇。业内人士透露,近期数据标注公司订单量激增,均来自大模型需求。大模型依赖海量数据与算力,通过”预训练”掌握逻辑思维与通识能力,但原始数据中充斥着诱导性内容、错误信息等,需持续调优。标注师的工作正是”调优”的关键,通过挑错、修改、打分给予机器反馈,低分”惩罚”高分”奖励”,促使模型进化。数据是机器的”养料”,理想状态下需持续获得高质量数据。但当前大模型数据标注仍存在不足,此前中国大模型与GPT4差距较大的原因之一便在于数据质量。1、本科生构成的标注流水线阿黄通过招聘网站加入某标注基地,发现工作环境已从过去的简陋工坊升级为窗明几净的写字楼,同事多为本科生。尽管如此,他仍视自己为流水线工人。数据标注行业有言”有多少智能,就有多少人工”,这句话在大模型时代依然适用。曾有报道指出,OpenAI早期标注员主要来自肯尼亚,月薪200-300美元,而阿黄与同事月薪约5000元,按题目数量计费。工作节奏不快,基本无加班,收入在当地属中上水平。唯一困扰他的是工作的枯燥和对未来方向的迷茫,学历专业对这份工作毫无加成,职业发展路径也并不清晰。他偏爱标注文案撰写类问答,因AI生成答案质量高;较难的是事实核查类问答,需搜索权威资料;而”扭蛋和鸡蛋哪个更好吃”这类刁钻问题则暴露了机器的局限性。大模型标注与过去不同,”画框”有标准答案,但大模型内容往往无标准答案,标注师只需提交争议内容给经验更丰富的”老师”或接受审核抽查。这条流水线目前由标注师与审核员组成,未来或将出现模型评估师、指令工程师等细分岗位。2、需要更多高质量数据阿黄供职的百度智能云是国内通用大模型领域的佼佼者,其文心一言发布后,他于今年4月加入,经一周培训后上岗。初期数据量稀少,后期工作逐渐繁忙。数据标注行业波动性大,AI繁荣时需求上涨,稍有回落则首当其冲。阿黄一天能完成约80道题,所在基地200名标注师每日可标注约16000道题。一位AI大模型人士认为,当前量级与理想状态差距巨大。大模型参数量动辄千亿,缺乏匹配的标注量难以优化。百度智能云主要承担基础通识能力训练,专业领域需与专家合作。全球领先者OpenAI采用多公司协作与博士团队质检的方式,通过RLHF(强化学习与人类反馈)持续调优。科技公司认为数据质量是OpenAI的核心竞争力,谷歌等纷纷效仿。中文大模型表现不佳主因之一是互联网数据质量,专业人士更倾向于使用专业数据库。大模型新趋势是垂直领域,医疗数据标注需重金聘请专家。国内一线大模型产品也在优化阶段,部分上线产品仍存在问题。相比算力,数据投入回报周期长且易被复制,但数据能力是商业化的第一步。3、”人工”会越来越少数据标注市场主要参与者为第三方公司与科技公司自建团队。百度智能云已与多地政府合作共建10余个基地,提供超1.1万个就业岗位。短期内数据标注师需求旺盛,但长期看,随着大模型自学习能力增强,这个职业可能重蹈上一轮AI标注员的覆辙。OpenAI在东欧等地招募远程员工,若编程能力达标,程序员或将失业。AI技术已辅助人工标注,未来大模型本身将更适合数据标注场景。商汤、海康威视等公司已应用大模型自动标注技术,谷歌、微软等也发布相关产品。百度智能云自研标注系统亦含辅助功能,但机器仍无法完全自主训练。人工智能发展依赖数据、算法与算力,数据是燃料。大模型热潮后,投资人和从业者趋于冷静,开源大模型增多,单纯复制产品难获资本青睐。建立数据能力是商业化的关键,但需平衡投入与回报。本文为专栏作者授权微新创想发表,版权归原作者所有。文章系作者个人观点,不代表微新创想立场,转载请联系原作者。如有任何疑问,请联系http://www.idea2003.com/。
最新快讯
2025年12月20日
2025年12月20日,科技巨头谷歌正式对数据服务公司Serpapi提起诉讼,这起备受瞩目的法律纠纷在美国正式拉开序幕。据悉,此次诉讼的核心争议聚焦于Serpapi通过自动化技术大规模抓取谷歌搜索结果数据的行为。谷歌在诉讼中明确指控Serpapi违反了双方的服务条款,并涉嫌触犯相关法律法规,其自动化抓取行为不仅严重损害了谷歌的系统安全,也对公司的商业利益构成...
2025年12月20日,福特汽车公司宣布在美国范围内启动一项大规模召回行动,涉及超过27万辆电动及混合动力车型。此次召回范围广泛,涵盖2022至2026款F-150 Lightning、2024至2026款Mustang Mach-E以及2025至2026款Maverick等系列车型。福特方面表示,此次召回的核心原因是部分车辆的集成式驻车模块在挂入驻车挡时可...
2025年12月20日,科技巨头苹果公司被曝出对人工智能研究员的薪酬做出重大调整,大幅提高相关岗位的薪资待遇。这一举措被视为苹果为应对日益白热化的人才竞争而采取的关键策略,旨在稳固其核心AI研发团队,防止关键技术人员被竞争对手挖角。据悉,此次薪酬上调主要聚焦于机器学习、自然语言处理等关键AI研发领域的高级职位,通过提供更具吸引力的薪酬方案,增强团队凝聚力和稳...
2025年12月20日,全球飞机制造巨头波音公司正式向美国联邦航空管理局提交了一份关键申请,寻求将波音777F货机的生产许可证延期至2028年之后。这一战略性举措的核心目标,在于帮助该经典货运机型规避国际民航组织即将全面实施的温室气体排放限制新规,从而确保其市场竞争力与持续盈利能力。据悉,波音777F目前的生产许可即将在2028年到期,面对日益严格的环保法规...
2025年12月20日,全球医药行业迎来重大动态,葛兰素史克、赛诺菲等国际知名药企或将联合宣布一项具有里程碑意义的药品价格调整计划。据悉,此次降价行动将涉及多个关键治疗领域的核心药物,包括但不限于慢性病治疗药物和免疫类疾病用药,旨在为广大患者提供更具性价比的用药选择。这一举措不仅是对当前全球医疗成本控制趋势的积极回应,更是提升药物可及性的重要一步,有望让更多...
2025年12月20日,全球航天科技巨头SpaceX正积极与多家国际知名银行展开深度接洽,为备受瞩目的首次公开募股(IPO)进行精心筹备。据行业消息透露,顶级投资银行摩根士丹利已凭借其卓越的金融服务能力和丰富的市场经验,成为此次IPO项目的主承销商热门候选。此次IPO不仅标志着SpaceX向资本市场迈出关键一步,更将为其带来巨额资金支持,从而有力推动星链卫星...
2025年12月20日,派拓网络与谷歌云正式宣布达成一项具有里程碑意义的长期战略合作协议,合作总金额预计将突破数十亿美元。此次合作的核心目标是通过深度融合双方在安全与云计算领域的顶尖技术,为全球企业客户提供更强大的云安全防护体系。根据协议内容,派拓网络将全面将其先进的安全平台与谷歌云的强大基础设施进行深度集成,双方将携手打造新一代云原生安全解决方案,以满足日...
12月19日,科技圈知名博主罗永浩通过个人朋友圈发布了一条关于上海电信千兆宽带使用体验的反馈,引发了广泛关注。他在帖文中透露,自半年前在上海开通电信千兆宽带服务以来,实际网速长期徘徊在百兆以下,远低于预期标准。更令他困扰的是,每次向客服反映问题后,网速虽然会短暂恢复正常,但问题往往很快再次出现,严重影响了日常使用体验。
针对罗永浩的反馈,上海电信官方客服当晚...
2025年,字节跳动交出亮眼的成绩单,前三个季度累计净利润高达约400亿美元,这一数字预示着全年净利润有望突破500亿美元大关。公司不仅成功超越既定业绩目标,其盈利能力更已逼近美国科技巨头Meta,后者预期全年利润为600亿美元。
字节跳动的强势表现,很大程度上得益于其庞大的用户基础。旗下各应用月活跃用户数累计超过40亿,这一规模与Meta不相上下。在营...
2025年1月19日,国家互联网信息办公室正式发布了《数字化绿色化协同转型发展报告(2025)》,全面展示了我国在推动数字经济与绿色发展深度融合方面的最新进展与战略布局。报告指出,截至2024年底,我国已成功建成246家国家级绿色数据中心,并广泛推广了超过300项数字基础设施节能降碳技术,这些技术已有效覆盖数据中心、通信基站等关键领域。这一系列举措的核心目标...
2025年12月20日,Epic平台再掀福利风暴,本周第三款免费游戏震撼上线——《Eternights - 永夜》。这款原价108元的恋爱动作游戏,现正限时一天免费领取,为玩家带来前所未有的沉浸式体验。游戏巧妙融合末日冒险与恋爱养成元素,让玩家在探索危机四伏的地下城、搜集稀缺资源的同时,还能深度参与浪漫约会剧情,双重乐趣无缝衔接。
《Eternights -...
2025年12月19日,海信通信官方视频号正式官宣,将推出备受期待的Hi Reader 2026纪念版阅读器。这款全新的阅读设备预计将于2026年第一季度正式登陆市场,为读者带来更优质的数字阅读体验。与此同时,海信还公布了另一款重要产品——搭载5G模块、采用白色背壳的海信A10阅读手机,该机型计划于2026年中旬与消费者见面。
回顾来看,海信A9阅读手机于2...
