
微新创想
3月19日消息
3月16日晚间 特斯拉CEO马斯克在社交平台公开发声
点赞中国人工智能企业月之暗面(Kimi)团队的最新技术成果
直言这项工作令人印象深刻
将这款国产大模型的前沿研究推向公众视野
伴随技术论文同步公开
作者名单中位列首位的Guangyu Chen(陈广宇)引发全网关注
这位核心作者竟是一名年仅17岁的在读高中生
来自广东深圳
据论文附录标注信息显示
陈广宇与张宇 苏剑林三人同为同等贡献共同第一作者
其余34位参与作者均未标注该资格
其中 张宇是Kimi高效模型架构的核心研发人员
苏剑林则是旋转位置编码(RoPE)的提出者

值得一提的是
陈广宇真正深耕AI领域仅一年时间
起步阶段 他凭借自主研读前沿论文
追踪GitHub开源项目等方式
快速补齐AI基础知识与实践能力
去年暑假 他远赴旧金山完成7周实习历练
回国后于去年11月加入Kimi团队参与实习
论文发布后
陈广宇在朋友圈发文复盘成果
特意提及三位同等贡献作者
以及负责模型扩展 基础设施搭建的团队同事
他低调回应称是团队成果
不要造神
据报道
Kimi团队发布的这项技术报告
提出全新Attention Residuals(注意力残差)机制
对深度学习领域沿用近十年的传统残差连接实现颠覆性重构
Kimi的创新相当于给AI装了智能筛选器
将Transformer注意力机制迁移到模型深度维度
让每一层动态筛选此前有用信息
压低冗余 提升传递效率
