
微新创想:近日谷歌官方披露其旗舰AI模型Gemini正遭遇商业化驱动的大规模蒸馏攻击。攻击者通过重复提问诱导聊天机器人泄露内部机制,试图逆向工程Gemini的内部推理逻辑与决策机制。
谷歌称这些攻击主要由商业动机行为者发起。公司判断其幕后人员多为希望获得竞争优势的AI私企或研究机构。公司发言人表示此次攻击源来自全球多个地区,但并未透露更多信息。
据悉蒸馏攻击原本是一种模型压缩技术。通过将大型教师模型的知识迁移到小型学生模型中,实现模型轻量化。攻击者利用这一技术原理,通过系统化、结构化的海量提问,收集模型在不同场景下的响应。
分析响应的内容、延迟、置信度等细微差异,攻击者能够构建Gemini的决策边界与推理路径图谱。最终用收集到的响应数据训练自己的学生模型,复制Gemini的核心能力。
谷歌指出此类蒸馏攻击属于知识产权盗窃。尽管各大厂商已部署能够识别与阻断蒸馏攻击的机制,但由于主流大模型服务面向所有人开放,所以其本质上仍易受攻击。
