日本NTT于20日正式发布了备受期待的新一代轻量级AI模型tsuzumi2,这款模型在保持高效性能的同时大幅优化了资源占用,成为AI应用领域的一大突破。tsuzumi2拥有30B参数规模,在推理运行时仅需约30GB内存即可流畅运行,单张A100 40GB显卡即可完成部署,极大地降低了硬件门槛。这一特性使得该模型特别适合本地部署或私有云应用场景,为用户提供了更高的数据自主性和安全性保障。
相较于2023年发布的初代tsuzumi模型,tsuzumi2在多项关键技术指标上实现了显著跨越。新模型在复杂文档理解能力上大幅提升,能够更精准地解析专业领域文本,显著增强了在专业场景中的应用价值。NTT通过持续优化算法架构,使tsuzumi2在日语处理方面表现突出,性能达到同规模模型的领先水平。
NTT特别强调,tsuzumi2结合了最新的RAG检索增强生成与微调技术,使其在金融、医疗及公共管理等关键领域展现出卓越性能。在实际业务测试中,经过专业场景的深度适配,tsuzumi2的表现甚至超越了GPT-5,这一成果充分证明了其在专业应用中的强大竞争力。未来,随着更多行业应用的落地,tsuzumi2有望成为推动AI技术本地化部署的重要力量,为各行业数字化转型提供强大支持