
微新创想:英国政府正致力于通过国家数据图书馆(NDL)推动人工智能的发展。然而近日发布的研究表明如果不能改善公共数据集的可用性这一计划可能会面临严峻挑战
开放数据研究所(ODI)的一项研究指出目前可用的数据在实际分析中存在误导性标题和缺乏元数据等问题导致其难以有效使用。在2024年秋季预算案中政府确认了NDL的计划并承诺将为研究人员和企业提供重要的数据洞察促进经济增长和改善生活质量
政府还宣布该项目将获得1亿英镑的投资这笔资金是政府计划在2028/29财年之前向科学、创新和技术部(DSIT)提供的19亿英镑预算的一部分。ODI最近推出了一个名为“NDL-Lite”的原型系统能够访问超过10万个公共数据集
研究发现部分数据集存在标签不一致、数据过时以及人工智能工具无法有效获取等问题。ODI警告称缺乏权威数据时人工智能系统会转向其他来源比如新闻报道或商业数据而这些信息的准确性并不总是有保障
尽管ODI的研究表明构建NDL的成本相对较低但也强调了将数据调整至适合人工智能处理的必要工作量。研究发现即使是“犯罪”等广泛的术语也难以进行有效分析。一些数据集由于缺乏共享标准无法整合导致分析困难
开放数据研究所的教授Elena Simperl表示公共数据的数量与其实际可用性之间存在日益扩大的差距。她指出如果政府不能及时更新数据和改善元数据质量人工智能系统可能会寻求其他更易获取的信息来源
政府发言人表示政府希望“最大化公共部门数据的收益”以提高服务效率并促进经济增长。为此政府正在通过数字公共基础设施的现代化计划来改善数据共享和使用的便利性
国家数据图书馆是帮助研究人员和数据科学家获取公共数据的最新项目然而ODI的研究提醒人们这一计划必须避免成为错失良机
