谷歌被指控窃取用户数据训练AI产品面临集体诉讼

2023-07-13 08:18:49 互联网 186 次阅读

微新创想（Idea2003.com）7月12日消息：谷歌近日陷入一场大规模的侵权诉讼风波，被指控未经用户授权，系统性地窃取数百万用户的个人数据，并涉嫌违反版权法，将这些数据用于训练和开发其人工智能产品。这起涵盖谷歌、其母公司Alphabet以及人工智能子公司DeepMind的集体诉讼，于本周二正式在美国加利福尼亚州联邦法院提起，由知名律所克拉克森律师事务所代理。值得注意的是，该律所上月曾对ChatGPT开发方OpenAI提出过类似的诉讼请求。

诉讼文件直指谷歌“长期秘密窃取数百万美国人在互联网上创作和分享的所有内容”，并以此作为其人工智能产品，特别是聊天机器人Bard的核心训练数据。投诉书中更是强调，谷歌获取了“我们数字足迹的绝大部分”，其中包括大量具有创意价值且受版权保护的作品，以此构建其AI产品体系。截至目前，谷歌、Alphabet和DeepMind方面尚未对此诉讼做出任何回应。

值得关注的是，谷歌近期更新的隐私政策中，明确提及公司可能利用公开可获取的信息来训练其人工智能模型及工具，例如新推出的Bard聊天机器人。该公司解释称，此次政策更新并非新规，而是对现有条款的进一步明确，即谷歌一直采用来自开放网络的信息来训练语言模型，如Google翻译等，此次将Bard也纳入该范畴。

这起诉讼的提起，正值近年来人工智能工具因其强大的文本和图像生成能力引发社会广泛关注之际。支撑这些新技术的大型语言模型，其核心在于通过海量在线数据进行深度训练。然而，谷歌的诉讼指控指出，在这一过程中，公司不仅面临因数据集中包含版权争议作品而引发的版权问题，还因涉嫌使用包含普通用户（含儿童）个人信息及敏感内容的数据而遭受日益严峻的法律审视。

克拉克森律师事务所的律师蒂姆·乔达诺（Tim Giordano）明确表示：“谷歌必须认识到‘公开可获得’绝不等于可以随意用于任何目的。我们的个人信息和数据属于个人财产，具有明确价值，任何组织无权将其剥夺并用于未经授权的用途。”

诉讼请求中，原告方要求法院采取措施，暂时冻结谷歌生成式人工智能工具（如Bard）的商业访问和进一步开发，以获得初步救济。同时，原告还寻求针对谷歌据称不当使用数据的受害者，获得未指定的损害赔偿及经济补偿。据悉，目前已有八名原告参与此案，其中包括一名未成年人。

乔达诺律师进一步对比了谷歌通常索引在线数据以支持其核心搜索引擎业务的做法与其被指控窃取数据训练AI的行为。他指出，谷歌通过搜索引擎为用户提供作品属性链接，实际上能够有效引导用户购买或与作品互动。然而，用于训练AI的数据爬取行为，却是在创造作品的替代版本，从根本上削弱了用户购买原作的意愿。

律所合伙人瑞安·克拉克森（Ryan Clarkson）强调，谷歌有责任为用户提供选择权，即允许用户拒绝其数据被用于训练人工智能，同时确保用户仍能正常使用互联网服务。