科技媒体NeoWin最新报道,OpenAI正式发布了备受期待的gpt-oss-safeguard-120b和gpt-oss-safeguard-20b两款开源模型,这标志着继今年gpt-oss系列成功推出后的又一重大开源里程碑。这两款新模型均采用行业通用的Apache 2.0许可证,为全球开发者提供了完全免费的使用和修改权限,极大地降低了AI应用的技术门槛。
与传统安全系统采用硬编码规则不同,这两款开源模型创新性地将安全边界定义权完全交还给开发者。其核心突破在于能够在推理阶段实时解读开发者提供的安全策略,无需在训练过程中预先植入固定规则。这种设计不仅提高了模型的灵活性和适应性,更为开发者提供了前所未有的自主控制权。
值得注意的是,新模型支持完整的”思维链”输出功能,能够将整个推理过程以可视化方式呈现,让开发者可以清晰追踪每一步决策逻辑。这种透明化的设计极大地便利了开发者对策略的调试和优化,确保最终分类结果能够精准匹配特定场景的业务需求。
OpenAI在官方声明中特别强调,该方法在处理新兴风险识别、复杂领域分析、多模态内容审核以及高敏感度场景管理等四种典型场景中展现出卓越效果。通过动态调整安全策略,开发者可以构建出更符合实际业务需求的智能系统。
目前,这两款开源模型已全面登陆Hugging Face平台供开发者免费下载。这一举措不仅将进一步推动AI技术的普及应用,更为全球开发者社区贡献了宝贵的创新资源,有望催生出更多具有突破性的AI应用解决方案。
