2025年11月24日,微软正式发布了一款专为计算机操作场景设计的高性能开源小型语言模型——Fara-7B。这款拥有70亿参数的先进模型具备在设备端本地高效运行的强大能力,彻底摆脱了对云端服务的依赖。其创新之处在于能够通过智能视觉解析技术处理网页截图,并精准执行点击、输入等复杂交互操作,为用户带来前所未有的便捷体验。与市面上其他解决方案不同,Fara-7B无需借助可访问性树或多模型协作机制,简化了操作流程的同时降低了系统资源消耗。
该模型基于业界领先的Qwen2.5-VL-7B架构构建,拥有高达128k的上下文长度支持,能够处理更复杂的任务序列。在训练方法上,研发团队采用了先进的监督微调技术,确保模型在保持通用性的同时,能够精准响应特定操作指令。特别值得一提的是,Fara-7B内置了多重安全防护机制,能够有效识别并阻止潜在的危险操作,为用户数据安全提供坚实保障。
目前,Fara-7B已全面开源,用户可以通过Microsoft Foundry和Hugging Face平台免费获取。微软表示,未来将推出针对神经形态处理器(NPU)的优化版本,进一步提升模型在移动设备上的运行效率。这一创新举措不仅拓展了小型语言模型的应用边界,也为无障碍计算领域带来了革命性突破,预示着人机交互将进入更加智能、高效的新时代。
