微软人工智能研究团队于6月26日发布了一项重大突破——全新的轻量级代码生成模型phi-1,其性能竟超越了支撑ChatGPT的GPT-3.5大型语言模型。这一创新成果标志着微软在人工智能领域又迈出了坚实一步。phi-1基于Transformer架构,仅包含13亿个参数,而Codex模型的参数量高达120亿,两者形成鲜明对比。

在训练方面,微软团队展现了惊人的效率。他们仅用四天时间,便借助Nvidia的8块A100芯片成功训练出phi-1。该模型的训练数据来源广泛,涵盖了网络中的60亿个token,以及通过GPT-3.5生成的10亿个token,这种多元化的数据策略为模型性能提供了有力支撑。

从性能表现来看,phi-1在HumanEval基准测试中取得了50.6%的pass@1准确率,这一成绩足以令人瞩目。更令人惊叹的是,尽管phi-1的参数量远小于其他竞争模型,它却成功击败了包括Hugging Face的StarCoder(33.6%)、OpenAI的GPT-3.5(47%)以及谷歌的PaLM2-S(37.6%)在内的多个知名模型。在MBPP pass@1测试中,phi-1更是以55.5%的优异成绩遥遥领先。值得注意的是,许多同类模型尚未公布在MBPP基准测试中的表现数据,而此前WizardLM的WizardCoder在同类测试中得分为51.5%,该模型参数量高达150亿。

微软研究人员将phi-1的卓越表现归功于”高质量数据的力量”。他们以”教科书就是你所需要的”为论文命名,生动阐述了这一理念。正如一本精心编写的教科书能够为学生提供系统化的知识体系,高质量数据同样能够帮助语言模型在代码生成任务中达到专业水准。通过构建”教科书质量”的数据集,微软团队成功训练出phi-1这一轻量级却高效的模型,即便在模型大小缩小10倍、数据集规模缩小100倍的情况下,phi-1依然在编码基准测试中超越了绝大多数开源模型。

目前,phi-1专注于Python编码,这一局限性源于其设计初衷。与大型模型相比,phi-1缺乏特定领域的专业知识,例如使用特定API进行编程的能力。为了进一步提升模型性能,微软团队提出了改进方案:建议使用GPT-4替代GPT-3.5生成训练数据,同时致力于提高数据集的多样性和非重复性。尽管面临挑战,研究团队表示将探索在数据生成过程中注入随机性和创造力的方法,同时确保示例的质量和连贯性。这一创新举措有望为人工智能领域带来更多突破。

最新快讯

2025年12月15日

14:02
2025年12月15日,贝耐特光学科技正式宣布成功完成数千万元人民币规模的A++轮独家融资,由知名投资机构安芯投资独家领投。此次融资不仅彰显了资本市场对贝耐特光学科技创新实力的高度认可,更将为其未来的技术突破与产业升级注入强劲动力。据悉,所获资金将全面投向三大核心领域:一是持续深耕LCoS(硅基液晶)空间光调制器及光谱分析模块的核心技术研发,力求在显示技术领...
14:02
2025年12月13日,中国汽车品牌奇瑞与法国西部汽车俱乐部(ACO)在马来西亚正式签署战略合作协议,标志着奇瑞成为首个正式进军勒芒24小时耐力赛的中国车企。此次合作中,奇瑞旗下高端品牌星途将肩负重任,代表中国汽车品牌开启参与世界顶级耐力赛的新篇章。勒芒赛事由ACO主办,每年6月在法国举行,是全球最著名、最具挑战性的三大汽车赛事之一,以其严苛的赛道环境和卓越...
14:02
2025年12月15日,广西数据集团有限公司正式宣告成立,标志着广西在数字经济领域迈出关键性步伐。该公司法定代表人为周飞,注册资本高达10亿元人民币,彰显了其雄厚的资本实力和发展潜力。作为一家具有地方战略意义的企业实体,广西数据集团有限公司的注册地位于广西壮族自治区,这一地理位置优势为其未来的业务拓展奠定了坚实基础。 在股权结构方面,该公司由多家实力雄厚的机...
14:02
2025年12月15日,贵州茅台股价迎来第四个交易日连续上涨,盘中涨幅一度突破1%。这一积极表现背后,市场传闻公司即将推出"控量"政策成为焦点。针对外界关注,茅台集团相关工作人员明确表示,该政策举措目前仍处于研究阶段,具体的实施方案预计将在12月28日举办的渠道商联谊会上正式公布。 据悉,茅台产品投放始终坚持以终端动销情况为依据,实施精准投放策略。工作人...
14:02
2025年12月15日,中国新能源汽车领域迎来重大合作里程碑。首驱科技与广西柳州市政府正式签署战略协议,宣布将在柳东新区核心区域投资15.21亿元人民币,建设华南地区规模领先的总部基地及智能电动车生产制造中心。这一项目承载着打造区域新能源汽车产业新引擎的宏伟目标,规划年产能高达150万台,将全面聚焦车规级智能两轮电动车的研发与量产,涵盖从核心技术突破到智能化...
14:01
2025年12月,中共西藏自治区委员会正式发布了《“十五五”时期国民经济和社会发展规划建议》,为西藏未来的发展擘画了宏伟蓝图。这份重要文件明确提出,将着力优化开放格局,构建具有西藏特色的对外开放新体系。该体系以拉萨为核心中心,以东部和西部为两翼支撑,同时联动多个口岸,形成全方位、多层次、立体化的开放格局。 作为“一带一路”倡议的重要参与者,西藏将深度融入西部...
14:01
在人工智能浪潮席卷创意产业的当下,一款名为《Codex Mortis》的类《吸血鬼幸存者》游戏横空出世,以惊人的方式宣告自己的存在——从代码到美术,再到音乐,全部由人工智能驱动完成。开发者 Grolaf(又名 Crunchfest)自豪地宣称,这款仅用三个月时间就诞生的独立游戏,是"真正意义上100% AI 生成的游戏"之一。据开发者自述,整个开发过程几乎完...
14:00
谷歌研究院、谷歌 DeepMind 与麻省理工学院近日联合发布的一项突破性研究,颠覆了传统观点中“更多智能体意味着更好结果”的认知。研究团队通过精心设计的180项控制实验,深入探究了多智能体系统在不同任务场景下的实际表现,结果令人惊讶:系统性能波动极大,有的任务效率提升高达81%,而另一些任务却出现了高达70%的性能下降。 研究表明,任务的类型对多智能体系统...
14:00
12月13日,在第二届CCF中国数据大会上,蚂蚁数科重磅宣布将全面开源其核心数据智能体技术Agentar SQL的全套资源,包括学术论文、源代码、预训练模型以及详细的使用指南。这一创新举措旨在推动企业数字化转型,使非专业人员也能通过自然语言轻松进行商业数据查询与分析,构建更精准高效的智能数据分析基座。 作为开源计划的首步,蚂蚁数科率先发布了实时文本转化结构化...
13:38
近日,美国佐治亚州引发社会广泛关注的一则新闻,主角是体重高达276斤的死刑犯斯泰西•汉弗莱斯。这位52岁的囚犯因在2003年犯下持枪抢劫并残忍杀害两名女性的重罪,被依法判处死刑。在行刑前,汉弗莱斯提出了一份令人瞠目结舌的“最后餐食”请求,这份被批准的菜单堪称一场“奢华盛宴”,迅速在网络和社交媒体上掀起轩然大波。 据悉,按照美国仍保留死刑执行州中的惯例,囚犯在...
13:31
2025年12月15日,一项由中国科学院青藏高原研究所牵头、联合全球数十家顶尖科研机构共同完成的突破性研究,成功揭示了大麦种子休眠的核心遗传机制。这项发表在《科学》期刊上的重要成果,通过深入分析大麦基因组,精准定位了调控种子休眠的关键基因位点,为培育适应极端气候的耐逆作物品种提供了全新的科学依据。 该研究团队利用先进的基因组测序和生物信息学技术,系统解析了大...
13:31
2025年12月15日,派杰投资机构正式宣布将可口可乐公司股票的目标价从81美元上调至87美元,这一调整幅度显著,充分体现了市场分析师对可口可乐未来业绩的乐观预期。据派杰投资发布的最新研究报告显示,此次目标价上调主要基于对可口可乐公司稳健经营策略和持续增长潜力的深度评估。 可口可乐在全球饮料市场的长期竞争优势和稳定的市场份额是支撑此次目标价上调的核心逻辑...