
Anthropic 公司近日推出了一项创新性的评估方法,旨在精准衡量其旗舰聊天机器人 Claude 在处理政治议题时的公正性与中立性。这一举措的核心目标在于确保 Claude 在回应政治相关问题时,能够严格遵循事实依据,坚决避免提出缺乏实证支持的政治观点,从而有效规避被贴上任何特定政治倾向的标签,无论是保守派还是自由派。Anthropic 强调,Claude 的表现与其系统提示和奖励机制紧密相连,其中特别注重奖励那些展现出高度中立性的回答。值得注意的是,这些被判定为中立的回答中,常常包含对”传统价值观和制度重要性”的尊重与强调,这反映出 Anthropic 正在积极引导 Claude 更好地契合美国当前的政治语境与需求。
根据最新发布的研究报告,Gemini2.5Pro 在中立性评估中表现最为突出,以高达97%的得分荣登榜首,而 Claude Opus4.1 则以95%的优异表现紧随其后,展现出强大的政治中立能力。其他知名模型如 Sonnet4.5、GPT-5、Grok4和 Llama4 的得分同样表现不俗,但与 Claude 相比仍存在一定差距。尽管 Anthropic 在官方博客中并未明确提及此次测试方法的推出背景,但外界普遍认为,这一举措很可能与特朗普政府近期推行的相关政策密切相关,该政策明确要求聊天机器人不得展现任何”觉醒”(woke)倾向。与此同时,OpenAI 也在积极调整其 GPT-5 模型的算法方向,以顺应政府监管要求,展现出与 Anthropic 类似的政策响应姿态。

值得一提的是,Anthropic 以高度开放的态度,将这一创新测试方法完整开源,并发布在 GitHub 平台之上,此举不仅为全球 AI 开发者与研究机构提供了宝贵的评估工具,更极大地促进了人工智能领域内的知识共享与技术交流。这一慷慨的开放姿态,无疑将加速整个 AI 社群在政治中立性评估方面的进步,为构建更加公正透明的 AI 生态贡献力量。Anthropic 的这一系列举措,不仅彰显了其在 AI 伦理治理方面的领先思考,也为整个行业树立了值得效仿的标杆。
