2025年12月20日,摩尔线程公司创始人、董事长兼CEO张建中在行业峰会上发表重要观点,系统分析了当前大模型推理技术所面临的三大核心挑战。张建中强调,随着人工智能技术的迅猛发展,大模型推理正经历着前所未有的变革,主要体现在三个方面:迭代速度的持续加速、服务质量的极致追求以及模型复杂度的指数级增长。
他指出,当前AI推理任务对计算效率和响应速度提出了严苛要求,这迫使行业必须在硬件架构和软件优化层面进行深度协同创新。具体而言,摩尔线程通过自研的智能计算架构,实现了在相同算力下推理速度提升300%的突破性进展。这种软硬件协同优化的策略,为解决推理性能瓶颈提供了全新思路。
张建中进一步指出,上述三大挑战直接制约着大模型在实际场景中的部署效果与成本控制。以金融风控领域为例,摩尔线程的某项解决方案通过优化推理架构,将原本需要5秒的决策时间缩短至0.3秒,同时将硬件成本降低了40%。这些数据充分说明,高效算力解决方案已成为行业发展的关键突破口。
面对持续增长的市场需求,张建中呼吁行业加快构建更高效的算力基础设施。摩尔线程近期推出的新一代推理芯片,通过创新的内存管理技术,实现了在复杂模型推理中能耗比提升50%的纪录。这一成果表明,只有通过技术创新才能有效应对大模型推理带来的系统性挑战,为AI应用落地提供坚实支撑。
