声明:本文源自微信公众号AI新智能(ID:alpAIworks),作者:举大名耳,经微新创想授权转载发布。生成式AI如同茁壮成长的孩子,而海量数据则是其滋养成长的养分,而数据标注正是制作这一”养分”的关键工艺。然而这一过程不仅竞争激烈,而且异常繁琐。从事标注工作的”标注师”需要反复识别图像中的各类元素,有时还需进行数据清洗和预处理。随着AI技术的飞速发展,人工数据标注的局限性日益凸显。不仅耗时费力,标注质量也难以稳定保障。为破解这一难题,谷歌创新性地提出用大模型替代人类进行偏好标注的技术——AI反馈强化学习(RLAIF)。研究显示,RLAIF无需人类标注即可实现与人类反馈强化学习(RLHF)相当的效果,两者胜率均为50%,且均优于监督微调(SFT)的基准策略。这一发现表明,RLAIF有望成为RLHF的可行替代方案。若该技术普及推广,众多依赖人工标注的企业是否将面临生存危机?

1数据标注现状
当前国内标注行业现状可概括为:劳动密集但效率低下,堪称费力不讨好的行业。标注企业被誉为AI领域的数据工厂,多集中在东南亚、非洲或中国河南、山西、山东等人力资源丰富的地区。为控制成本,企业常在县城租赁场地配置电脑,订单来临时招募兼职,无单时则解散休息,工作性质类似街头临时装修工。系统随机分配数据给”标注师”,需先分类问题再对回答打分排序。国产大模型与GPT-4等先进模型的差距,部分源于数据质量问题。中文大模型主要依赖开源数据集和爬取的互联网数据,但专业人士通常不使用百度等普通搜索引擎,导致专业领域数据质量不高。与专业团队合作虽能提升质量,却面临回报周期长、先行者吃亏的困境,如某团队投入大量资源却沦为他人廉价数据源。国内大模型陷入数据量多但质量不高的矛盾局面。

2OpenAI的解决方案
为解决人工标注的主观性和不稳定性问题,OpenAI采用两大核心策略:1)人工反馈与强化学习结合。其人工反馈主要针对智能系统行为而非输出进行排序评分。智能系统行为指复杂环境中的动作决策,如游戏、机器人控制等,较输出更难用对错判断,偏好评价能减少主观影响。国内标注虽也使用排序打分,但缺乏奖励模型优化,本质上仍是修改标注。2)多元化大规模数据来源。OpenAI数据来源多样,除开源数据集和爬虫数据,还与Scale AI、Appen等机构合作获取高质量数据。这些机构采用Snorkel等弱监督学习技术,通过规则、模型等信号自动标注,大幅降低成本。通过聚焦自动驾驶、大语言模型等高价值领域,这些机构建立了技术壁垒,破解了”搭便车”困境。

3标准化与专业化
AI自动标注技术将淘汰纯人工标注企业。数据标注虽属劳动密集型产业,但高质量数据获取绝非易事。以Scale AI为例,其不仅利用非洲廉价人力,更聘有数十名博士处理专业数据。其创新之处在于建立统一数据平台,包括Scale Audit、Scale Analytics等工具,实现质量监控、校验和优化。这种标准化工具与流程成为区分”流水线工厂”与”手工作坊”的关键。国内多数企业仍依赖人工审核,唯有百度等少数巨头引入智能数据服务平台。为提升效率和质量,百度、龙猫数据等企业开始探索人机协作模式。AI标注技术的出现并非行业末日,而是淘汰低效廉价劳动密集型模式的开始。

最新快讯

2026年02月11日

10:19
2026年2月10日,中国城市基础设施(02349.HK)旗下全资附属深圳华峰基建投资公司,拟以330万港元收购智联飞创科技60%股权。交易通过发行等额可换股债券支付,初步换股价为每股0.3港元。智联飞创主营AI技术与SaaS工具融合,为组织提供智能决策支持与商业赋能。此次收购旨在强化集团在智慧基建与数字化服务领域的技术能力与业务协同。
10:19
2026年2月10日,荷兰厂商Trust在荷兰正式发布办公无线鼠标Seron Slim。该鼠标准确尺寸为111×62×32mm,重83g,采用低矮便携设计及可左右倾斜无极滚轮。支持200–3200 DPI调节、三模连接与静音微动,配备PTFE脚垫及续航达3个月的内置可充电电池。产品主体使用再生塑料,提供黑、白、蓝、粉四色可选,售价24.99欧元(约合205...
10:19
2月11日,小米创始人、董事长兼CEO雷军在直播中透露,新一代小米SU7门把手已提前满足即将实施的《汽车车门把手安全技术要求》强制性国家标准。该标准由工信部等批准发布,规定每车门须配备至少一个机械释放内把手,2027年1月1日起正式施行。新款SU7新增机械冗余设计,有效解决低温失灵及高故障率问题。此举系小米在智能电动车安全领域主动升级的关键举措。
10:19
2月11日,安徽中通快递安庆宿松网点赴宿松县特殊教育学校开展“暖冬行动”。活动由该网点员工自发组织,向在校师生捐赠全新棉袄100余件及保暖手套、围巾等冬日物资。此举旨在关爱特殊儿童成长,助力教育帮扶。活动当天,网点人员与校方共同发放物资,并了解教学需求,后续将探索常态化助学机制。
10:19
2026年2月12日,浙江海圣医疗器械股份有限公司在北京证券交易所正式上市。公司股票简称为“海圣医疗”,证券代码为920166,发行价12.64元/股,发行市盈率13.99倍。本次公开发行11,294,118股,采用战略配售与网上发行相结合方式,其中战略配售112.9411万股,网上发行1016.4707万股,网上申购获配比例约0.0187%。募集资金总额...
10:19
2026年2月,中国科学院大连化学物理研究所陈忠伟院士团队在黑龙江漠河完成超低温锂电池实地测试。该电池在零下34℃静置8小时后仍保持超85%容量,并驱动工业级无人机完成长续航飞行与任务模拟。团队通过耐低温电解液、准固态隔膜及AI电源管理系统,攻克传统锂电池低温活性骤降难题。技术可适配零下40℃至50℃宽温域,续航衰减率控制在常温10%以内,显著提升极寒地区...
10:19
截至2026年2月11日,《阿凡达3:火与烬》全球票房约14亿美元(96.86亿元人民币),未达15亿美元盈亏平衡线。该片于2025年上映,制作宣发成本约5亿美元,虽居当年好莱坞票房榜第二,但较前两部大幅下滑。业内分析指出,技术红利递减、剧情创新不足及受众局限致口碑与续航力减弱。迪士尼正重新评估2029年、2031年续集计划。
10:19
2026年春节期间(2月11日起),小米汽车在全国范围内推行“服务不打烊”举措。雷军宣布,全国销售及服务门店按正常时间营业,275家服务中心覆盖158个城市,提供7×24小时线上咨询、上门补胎、机电快修及事故车接收服务。小米汽车App商城同步正常运营。此举旨在保障用户节日期间购车、维保与应急需求,提升全周期服务响应能力。
10:19
2月11日,顺丰饶河智能仓在黑龙江省饶河县正式开仓。该仓由顺丰建设运营,旨在提升县域物流效能,服务当地特色农产品上行。依托自动化分拣、智能仓储等技术,实现订单处理提速与履约精度提升。此举是顺丰深化县域物流网络布局的关键一步,将助力饶河县电商发展和乡村振兴。
10:19
2月10日起,京东上线有奖发票抽奖服务,成为首批响应财政部等三部门联合部署的电商平台。活动覆盖全国50个试点城市,消费者在零售、餐饮、住宿、文旅等场景消费,取得单张100元及以上、实名数字化电子普通发票,即可上传参与抽奖,单次最高奖金800元。太原、宜昌已率先启动,北京、上海、武汉、天津等地将陆续跟进。此举旨在激发线下线上消费活力。
10:19
2026年2月11日,曜越(Thermaltake)官网正式上线新款TGM-V49CDQ显示器。该机采用49英寸曲面LCD面板,分辨率达5120×1440(DQHD),刷新率240Hz,响应时间1ms(典型值),峰值亮度400nits,色域覆盖95% DCI-P3。支持VRR自适应同步、暗色增强、无闪烁及低蓝光技术。接口配备双HDMI 2.1、DP 1.4...
10:16
微新创想2月11日消息 2月10日晚间,小米创办人,董事长兼CEO雷军开启小年夜直播,带网友云参观”了小米汽车科技展厅和定制服务中心。直播中,雷军透露,小米汽车去年推出的高阶驾驶培训,一共培训了超过1万名车主。成本很高,人均2000元左右。他提到,去年第一批全部是免费的,今年可能会收个成本价。小米汽车高阶驾驶培训课程旨在帮助车主...