Meta近日发布了一项名为FACET的全新数据集,旨在深入探究计算机视觉模型在识别特定人群时可能存在的偏见问题。FACET数据集包含32000张高质量图片,涵盖了50000个个体,并详细标注了职业、活动类别以及人口统计特征和身体属性。这一创新数据集为研究人员和从业者提供了宝贵的工具,用以评估模型在分类、检测、分割和定位任务中的公平性表现。

微新创想(idea2003.com)9月1日 消息:Meta通过发布FACET数据集,进一步推动了AI领域的公平性研究。该数据集不仅包含了丰富的图像资源,还通过人类注释者对每张图片进行了细致的标注,涵盖了从职业活动(如篮球运动员、DJ、医生)到人口统计特征(性别表现、年龄组)以及身体属性(肤色、发型、面部特征等)的全方位信息。这一举措使Meta能够对模型在识别不同人群时的偏见进行深度评估。

Meta在与技术媒体TechCrunch分享的博客文章中强调,FACET的发布旨在为研究人员和从业者提供基准测试工具,帮助他们识别模型中存在的偏见,并监控缓解措施的效果。文章中写道:“我们鼓励研究人员使用FACET来评估其他视觉和多模态任务的公平性。”这一数据集的推出,标志着AI领域在推动公平性研究方面迈出了重要一步。

尽管探测计算机视觉算法偏见的基准测试并非新鲜事物,Meta此前也发布过相关工具,但FACET在深度和广度上均有所突破。它能够回答诸如“当被感知的性别表现具有更多传统男性特征时,模型是否在将人们分类为滑板运动员方面做得更好?”以及“当头发卷曲程度与直发相比时,任何偏见都会放大吗?”等复杂问题。

FACET的创建过程同样值得关注。Meta首先让注释团队对32,000张图像中的每张人物图像进行标注,内容涵盖人口统计属性(如性别表现、年龄组)、身体属性(肤色、发型、面部特征等)以及类别标签。这些标注信息随后与来自Segment Anything1Billion的数据集进行整合,后者是Meta设计的用于训练计算机视觉模型从图像中分割或隔离物体和动物的数据集。

然而,FACET的创建过程也引发了一些争议。有报道指出,FACET图像的来源是Segment Anything1Billion,而这些图像则从“照片提供商”处购买,目前尚不清楚图片中所描绘的人是否知情。此外,关于注释者的招募方式和报酬水平也存在疑问。Meta在白皮书中称注释者为“经过培训的专家”,并来自北美、拉丁美洲、中东、非洲、东南亚和东亚等多个地理区域。他们通过第三方供应商的专有注释平台工作,报酬按照每个国家一小时的工资标准支付。

尽管存在一些争议,FACET在评估模型公平性方面仍具有重要意义。Meta将自家的DINOv2计算机视觉算法应用于FACET,发现了几种偏见,包括对某些性别表现的人的偏见以及对典型地将女性照片识别为“护士”的可能性的偏见。Meta在博客文章中写道:“DINOv2预训练数据集的准备过程可能无意中复制了为策展选择的参考数据集中的偏见。我们计划在未来的工作中解决这些潜在的不足之处,并相信基于图像的策展也可以帮助避免因使用搜索引擎或文本监督而产生的潜在偏见。”

没有完美的基准测试,但Meta的FACET无疑为AI领域的公平性研究提供了重要支持。Meta承认FACET可能无法充分捕捉现实世界的概念和人口群体,并指出由于自FACET创建以来,许多职业形象可能已经发生了变化。例如,在COVID-19大流行期间拍摄的FACET中的大多数医生和护士都佩戴了比大流行前更多的个人防护装备。Meta表示,目前不打算更新此数据集,但将允许用户标记任何可能令人反感的内容,并在发现时删除这些内容。

除了数据集本身,Meta还提供了一个基于网络的数据集浏览器工具。要使用该工具和数据集,开发人员必须同意不将其用于训练计算机视觉模型,而仅用于评估、测试和基准测试。这一举措体现了Meta在推动AI公平性研究方面的决心和努力。

最新快讯

2025年08月12日

22:53
微新创想8月12日讯,小米汽车创始人雷军于今日晚间发布重要动态,透露了小米YU7标准版在极端环境下的续航表现。据雷军介绍,该车型在新疆吐鲁番地区40℃高温环境下,经过高速、市郊及山路等复杂路况的综合实测,最终实现了高达600公里的续航里程,这一数据充分展现了小米YU7在炎热气候下的卓越续航能力。 小米YU7的出色续航表现,主要归功于其先进的电池动态热管理策略...
22:53
微新创想8月12日重磅报道,近日浙江大学医学院附属儿童医院紧急接诊了一名因误触管道疏通剂导致严重灼伤的2岁男童。据医护人员介绍,这起意外发生在孩子独自在家玩耍时,他误将角落里用于疏通管道的化学药剂当作玩具,被诱人的泡沫吸引后伸手触碰,瞬间引发剧烈疼痛。 经过专业诊断,医生发现患儿手部皮肤呈现典型的化学灼伤症状,灼伤面积较大且深度较深。幸运的是,孩子的奶奶在意...
22:53
微新创想8月12日重磅消息 动画电影《浪浪山小妖怪》中送袈裟的老和尚角色意外走红,其神秘身份成为全网热议焦点。观众们纷纷化身侦探,猜测这位慈眉善目的老僧人究竟是谁——有人大胆推测是孙悟空的化身,也有人认为可能是弥勒佛的化身。这一悬念直到导演於水亲自揭晓才尘埃落定。 於水导演在访谈中透露,这位老和尚角色最初的设计定位非常纯粹,仅作为第一个认可四位主角的功能性配...
22:52
2025年8月12日,高盛集团股价迎来强劲反弹,盘中表现持续活跃,涨幅一度突破3%大关。这一显著上涨主要得益于市场对高盛近期财务报告的积极解读以及对其未来增长前景的乐观预期。投资者信心显著回升,成为推动股价稳步攀升的关键动力。分析人士指出,高盛在报告期内展现出的稳健经营和盈利能力,为其股价上涨奠定了坚实基础。随着市场情绪的改善,投资者对高盛后续发展潜力充满期...
22:52
持续高温天气正对韩国农业造成显著冲击,大白菜等农产品价格出现明显上涨。最新数据显示,韩国一棵大白菜的平均零售价较一个月前已飙升超过40%,泡菜原料的短缺问题日益凸显。受此影响,韩国对我国泡菜进口需求呈现快速增长态势。 青岛海关最新统计显示,今年1至7月,山东省出口泡菜等蔬菜制品总额达18.2亿元人民币,同比增长5.2%。其中,出口至韩国的泡菜占比高达90%以...
22:52
截至8月12日收盘,深沪北市场呈现活跃态势,共有48只个股连续5日或以上主力资金净流入,显示出市场资金的持续关注与积极布局。在这批备受青睐的个股中,恒尚节能和农业银行表现尤为突出,分别连续11日和10日净流入,稳居前列。其中,农业银行凭借10天累计净流入19.17亿元的强劲表现,位列榜首;紧随其后的是博瑞医药,8天内主力资金净流入高达8.68亿元,展现出不俗...
22:52
2025年8月12日,资本市场聚焦机器人与人工智能领域的创新突破,多家上市公司纷纷披露最新研发成果,展现科技产业蓬勃发展的强劲势头。上声电子在公告中明确表示,目前尚未涉足机器人产品制造,但持续关注行业发展趋势。与此同时,新时达宣布将于今年9月正式推出新一代智能焊接解决方案,该方案融合了视觉识别与自适应控制技术,有望大幅提升制造业自动化水平。 在机器人产业链方...
22:52
今日下午,财通证券与平安集团旗下三大核心金融板块——平安财险、平安养老险及平安资产管理公司正式签署战略合作协议,共同开启金融领域的深度合作新篇章。此次签约不仅标志着双方将在金融业务层面实现全面协同,更将通过资源整合与优势互补,打造全新的金融服务生态体系。 此次战略合作协议的签署,是财通证券与平安集团在金融领域强强联合的重要里程碑。双方将充分发挥各自在资本市场...
22:52
2025年8月12日,北京时间,全球知名投资机构贝雅资本(BAIRD)发布最新研报,正式将星巴克的股票评级从"中性"上调至"跑赢大盘",并同步将目标价从100美元上调至115美元。这一重要调整不仅彰显了贝雅资本对星巴克未来市场表现的强烈信心,更揭示了其深度看好该企业持续增长的潜力。据分析,此次评级上调主要基于星巴克在品牌创新、数字化转型及全球市场拓展等多方面...
22:52
8月12日20时,广东省防汛防旱防风总指挥部果断决策,将防风Ⅳ级应急响应提升至Ⅲ级,以应对可能加剧的台风影响。这一重要举措旨在全面强化防御措施,筑牢安全防线,全力保障人民群众生命财产安全。随着台风路径的进一步明确,广东省正积极做好各项应对准备,确保关键时刻能够迅速响应,最大程度降低灾害风险。此次应急响应升级,充分体现了政府对防灾减灾工作的高度重视,彰显了守护...
22:52
2025年8月12日,北京时间,美股市场迎来强劲开盘,多只绩优股表现亮眼,股价大幅上涨。其中,AST SpaceMobile股价涨幅惊人,一度飙升超过18%,昂跑也紧随其后,涨幅超过11%,Circle更是劲增9%以上。本轮上涨的背后,市场分析主要归因于两家公司的亮眼财报以及近期乐观的经济数据所释放的积极信号。企业财报的强劲表现不仅提振了投资者信心,更反映了...
22:52
2025年8月12日,印度石油公司正式发布了其2025年第一季度财务报告,数据显示公司营收仅为501亿卢比,较市场普遍预期的527.6亿卢比存在明显差距。与此同时,公司净利润也未能达到预期水平,实际数值为81.3亿卢比,远低于分析师预估的132.1亿卢比。这一系列财务数据充分反映出印度石油公司本季度业绩表现未达市场预期,但公司方面尚未就具体原因进行详细说明。...