近日,备受瞩目的蚂蚁数科AI数据产业基地在太仓智汇谷·科技创新园正式投产。作为苏州市首个AI数据产业基地,该基地肩负着推动长三角区域制造业、金融、医疗等领域大模型落地的重任。通过汇聚跨行业人才与前沿技术,基地致力于为这些领域提供场景化、高质量的训练数据支撑,为AI技术的实际应用奠定坚实基础。
数据是AI学习的核心教材,然而在工业等复杂场景中,AI落地常常遭遇行业知识匮乏、高质量数据稀缺等瓶颈。此时,专业AI数据标注师的作用便凸显出来。他们被誉为“AI教官”,通过精确标注和修正,确保训练数据的准确性与无偏见,从而提升模型输出的安全性与可靠性。这些标注师不仅持续“教导”AI理解语义,更使其逐渐通人情,更好地适应人类社会的复杂需求。
在蚂蚁数科AI数据产业基地,汇聚了一批来自不同领域的专业人才。赵秋燕毕业于某财经大学金融学专业,曾从事会计工作,擅长纠正AI回答的金融问题。严冯娜则拥有法学背景,主要负责标注大模型输出文字中涉及的“红线”问题,教会AI“什么能说,什么不能说”。此外,还有曾是一名美术老师的李宁,他需要面对大量图片数据,标注其中的“内容风险”。医学、外语、旅游等领域的专业人才也正纷纷加入各垂类模型的数据标注工作,共同推动AI技术的进步。
“蚂蚁数科AI标注师队伍的平均学历在本科以上,这得益于太仓政府在园区建设、人才招募、生态企业入驻等方面提供的强力支持。”蚂蚁数科AI科技事业部总经理张凯介绍道。蚂蚁数科已与江苏多所高校开展产教融合,孵化AI实战人才。按照计划,基地未来将扩展至300人规模,为更多领域的AI应用提供人才保障。
在技术层面,蚂蚁数科自研的AI数据标注平台展现出强大的智能化水平。该平台能够智能推荐标注内容、自动补全标签,并结合自动化质检与人工抽检的双重保障,确保数据质量。目前,其标注服务已覆盖金融风控、内容审核、自动驾驶、智能客服等数十个场景,为多领域大模型产业化提供可靠的数据基石,助力AI技术在不同领域的深度应用与落地。