声明:本文源自微信公众号AI新智能(ID:alpAIworks),作者:举大名耳,经微新创想授权转载发布。生成式AI如同茁壮成长的孩子,而海量数据则是其滋养成长的养分,而数据标注正是制作这一”养分”的关键工艺。然而这一过程不仅竞争激烈,而且异常繁琐。从事标注工作的”标注师”需要反复识别图像中的各类元素,有时还需进行数据清洗和预处理。随着AI技术的飞速发展,人工数据标注的局限性日益凸显。不仅耗时费力,标注质量也难以稳定保障。为破解这一难题,谷歌创新性地提出用大模型替代人类进行偏好标注的技术——AI反馈强化学习(RLAIF)。研究显示,RLAIF无需人类标注即可实现与人类反馈强化学习(RLHF)相当的效果,两者胜率均为50%,且均优于监督微调(SFT)的基准策略。这一发现表明,RLAIF有望成为RLHF的可行替代方案。若该技术普及推广,众多依赖人工标注的企业是否将面临生存危机?

1数据标注现状
当前国内标注行业现状可概括为:劳动密集但效率低下,堪称费力不讨好的行业。标注企业被誉为AI领域的数据工厂,多集中在东南亚、非洲或中国河南、山西、山东等人力资源丰富的地区。为控制成本,企业常在县城租赁场地配置电脑,订单来临时招募兼职,无单时则解散休息,工作性质类似街头临时装修工。系统随机分配数据给”标注师”,需先分类问题再对回答打分排序。国产大模型与GPT-4等先进模型的差距,部分源于数据质量问题。中文大模型主要依赖开源数据集和爬取的互联网数据,但专业人士通常不使用百度等普通搜索引擎,导致专业领域数据质量不高。与专业团队合作虽能提升质量,却面临回报周期长、先行者吃亏的困境,如某团队投入大量资源却沦为他人廉价数据源。国内大模型陷入数据量多但质量不高的矛盾局面。

2OpenAI的解决方案
为解决人工标注的主观性和不稳定性问题,OpenAI采用两大核心策略:1)人工反馈与强化学习结合。其人工反馈主要针对智能系统行为而非输出进行排序评分。智能系统行为指复杂环境中的动作决策,如游戏、机器人控制等,较输出更难用对错判断,偏好评价能减少主观影响。国内标注虽也使用排序打分,但缺乏奖励模型优化,本质上仍是修改标注。2)多元化大规模数据来源。OpenAI数据来源多样,除开源数据集和爬虫数据,还与Scale AI、Appen等机构合作获取高质量数据。这些机构采用Snorkel等弱监督学习技术,通过规则、模型等信号自动标注,大幅降低成本。通过聚焦自动驾驶、大语言模型等高价值领域,这些机构建立了技术壁垒,破解了”搭便车”困境。

3标准化与专业化
AI自动标注技术将淘汰纯人工标注企业。数据标注虽属劳动密集型产业,但高质量数据获取绝非易事。以Scale AI为例,其不仅利用非洲廉价人力,更聘有数十名博士处理专业数据。其创新之处在于建立统一数据平台,包括Scale Audit、Scale Analytics等工具,实现质量监控、校验和优化。这种标准化工具与流程成为区分”流水线工厂”与”手工作坊”的关键。国内多数企业仍依赖人工审核,唯有百度等少数巨头引入智能数据服务平台。为提升效率和质量,百度、龙猫数据等企业开始探索人机协作模式。AI标注技术的出现并非行业末日,而是淘汰低效廉价劳动密集型模式的开始。

最新快讯

2026年02月11日

12:00
微新创想:Supermassive Games近日正式公布《黑相集》系列最新作品《8020号指令》的发售日期,该游戏将于2026年5月12日登陆各大平台。作为该系列的延续,《8020号指令》将带领玩家进入一个全新的科幻恐怖世界。游戏由曾成功打造《直到黎明》和《采石场惊魂》的开发团队负责,延续了系列一贯的沉浸式叙事风格与紧张刺激的氛围。 游戏背景设定在距离地球...
12:00
微新创想:2026年2月11日,Digital Intelligence Holdings Limited宣布完成对环球印馆约65.54%股权的收购。此次交易因持股比例达到香港《公司收购及合并守则》所规定的强制要约门槛,要约人将向所有独立股东发出无条件强制性现金要约。要约价格为每股0.35港元,总交易金额为2289.37万港元。 环球印馆是一家专注于印刷服务...
12:00
微新创想:2026年2月,互联网安全企业薮猫科技宣布获得长亭科技战略投资。该公司总部位于北京,专注于漏洞挖掘、渗透测试及终端威胁检测与响应(EDR)产品研发。本轮融资将用于强化攻防技术团队建设与产品迭代。长亭科技作为国内知名网络安全厂商,此次投资旨在深化双方在红蓝对抗、自动化渗透等场景的协同能力。目前薮猫科技已服务金融、能源、政务等领域数十家客户。
12:00
微新创想:2月11日,北京——极智嘉正式发布全球首款面向仓储场景的通用人形机器人Gino 1。该机器人专为电商与物流仓储环境设计,具备搬运、分拣、盘点等多任务执行能力。其结构、感知系统与AI算法均针对高密度货架、窄通道、动态货品等真实仓储条件优化。Gino 1无需改造仓库即可部署,支持与现有AMR系统协同作业。此举旨在提升仓储自动化柔性与泛化能力,降低人形机...
12:00
微新创想:2月11日,秘鲁利马国际机场伙伴公司(LAP)宣布中远海运联合安骏物流成功中标利马国际机场机侧仓项目运营权 该项目位于秘鲁首都利马,是中远海运首次获得海外航空枢纽关键基础设施的运营权 此次中标标志着中远海运在国际航空物流领域的重要突破,特别是在南美地区的战略布局进一步深化 通过此次合作,中远海运将能够提升拉美地区航空物流的整体服务能力,为客户提供更...
12:00
微新创想 2月10日晚间 小米集团创始人 董事长兼CEO雷军开启小年夜直播带网友云参观小米汽车工厂 直播结束后有网友在评论区问雷总叉车说了吗 雷军回复了一个狗头表情包 这个略带调侃的回应也间接暗示他目前尚未完成学会叉车的目标 此前雷军曾立下2026年3个flag 分别是健身打卡100次 学会叉车 交付55万辆小米汽车 而在2025年他已完成健身房打卡10...
12:00
微新创想:在内容业态里,横屏短剧总是一种尴尬式存在。它是最早接下微短剧称呼的载体,却在免费竖短的飞跃式发展之下逐渐模糊了姓名,有的平台将其纳入“短剧场”,与竖短的“微剧场”区别开来,有的平台对外便直接称呼其为“精品微短剧”,不断用分账票房向外“纳贤”,而现在,关于“中剧”的声音也横亘其中,似乎在表明要给横屏短剧正名,成为“中剧”,完成话语权的上升。标志性事件...
12:00
微新创想: 北京的冬日街头,总有一抹沉稳的黑色身影。它不仅是打工人抵御寒风的利器,更是都市生活中的独特存在。无论是挤地铁时的实用,还是午休时的舒适,黑羽绒服早已成为北京人不可或缺的冬日装备。它低调、包容,从不喧宾夺主,却在千篇一律的黑色中,悄然藏着五彩斑斓的个性。 黑羽绒服看似普通,实则暗藏玄机。有的款式设计巧妙,拥有九个口袋,仿佛能装下后羿射下的九个太阳。...
11:59
声明:本文来自于微信公众号 娱乐独角兽,作者:Mia,授权站长之家转载发布。2025年,文娱形势更加复杂多变,平台与公司都在寻找“更确定性的增长”直面挑战,穿越周期。娱乐独角兽将继续推进“年度盘点”和“年度专访”,从短剧、长剧集、综艺、音乐等多维度盘点年度行业事件和标杆公司。本文为“年度专访”专刊第八篇。过去一年,推出新厂牌,拿...
11:59
微新创想:去年以来手机品牌纷纷布局风扇散热技术领域,标志着手机散热技术迈入新阶段。红魔作为先行者,率先在手机中引入风扇设计,随后OPPO K13 Turbo系列、荣耀WIN系列以及iQOO 15 Ultra等机型也相继加入。这一趋势表明,厂商们正积极应对高性能芯片带来的发热问题,以提升用户体验。 随着市场对手机性能需求的不断提升,散热技术成为影响产品竞争力的...
11:59
微新创想:为了重新赢回年轻一代(Gen Z)的青睐 Facebook 本周二发布了一系列由 Meta AI 驱动的个性化功能 这些更新不仅赋予了静态照片生命力 还为传统的文字帖子增添了更多视觉冲击力 此次更新的亮点之一是动态个人头像 该功能利用 AI 技术为用户的静态照片添加动作效果 例如挥手告别 比心或戴上虚拟派对帽 Facebook 建议用户使用清晰的单...
11:59
微新创想:在全球 AI 基础设施需求爆发的背景下 中国云计算市场格局正发生微妙变化 根据国际调研机构 Omdia 的最新数据 阿里云在 2025 年第三季度的表现尤为抢眼 其市场占有率已从上一季度的 34% 攀升至 36% AI 成为核心增长引擎 Omdia 的报告指出 AI 已成为驱动云基础设施服务新增需求的核心动力 阿里云凭借在 AI 领域的深厚积淀 不...