微软人工智能研究团队于6月26日发布了一项重大突破——全新的轻量级代码生成模型phi-1,其性能竟超越了支撑ChatGPT的GPT-3.5大型语言模型。这一创新成果标志着微软在人工智能领域又迈出了坚实一步。phi-1基于Transformer架构,仅包含13亿个参数,而Codex模型的参数量高达120亿,两者形成鲜明对比。

在训练方面,微软团队展现了惊人的效率。他们仅用四天时间,便借助Nvidia的8块A100芯片成功训练出phi-1。该模型的训练数据来源广泛,涵盖了网络中的60亿个token,以及通过GPT-3.5生成的10亿个token,这种多元化的数据策略为模型性能提供了有力支撑。

从性能表现来看,phi-1在HumanEval基准测试中取得了50.6%的pass@1准确率,这一成绩足以令人瞩目。更令人惊叹的是,尽管phi-1的参数量远小于其他竞争模型,它却成功击败了包括Hugging Face的StarCoder(33.6%)、OpenAI的GPT-3.5(47%)以及谷歌的PaLM2-S(37.6%)在内的多个知名模型。在MBPP pass@1测试中,phi-1更是以55.5%的优异成绩遥遥领先。值得注意的是,许多同类模型尚未公布在MBPP基准测试中的表现数据,而此前WizardLM的WizardCoder在同类测试中得分为51.5%,该模型参数量高达150亿。

微软研究人员将phi-1的卓越表现归功于”高质量数据的力量”。他们以”教科书就是你所需要的”为论文命名,生动阐述了这一理念。正如一本精心编写的教科书能够为学生提供系统化的知识体系,高质量数据同样能够帮助语言模型在代码生成任务中达到专业水准。通过构建”教科书质量”的数据集,微软团队成功训练出phi-1这一轻量级却高效的模型,即便在模型大小缩小10倍、数据集规模缩小100倍的情况下,phi-1依然在编码基准测试中超越了绝大多数开源模型。

目前,phi-1专注于Python编码,这一局限性源于其设计初衷。与大型模型相比,phi-1缺乏特定领域的专业知识,例如使用特定API进行编程的能力。为了进一步提升模型性能,微软团队提出了改进方案:建议使用GPT-4替代GPT-3.5生成训练数据,同时致力于提高数据集的多样性和非重复性。尽管面临挑战,研究团队表示将探索在数据生成过程中注入随机性和创造力的方法,同时确保示例的质量和连贯性。这一创新举措有望为人工智能领域带来更多突破。

最新快讯

2025年10月25日

19:09
2025年10月25日,松延动力在万众瞩目中正式发布了旗下首款人形机器人——Bumi“小布米”,这款备受期待的产品一经亮相便引爆市场热潮。当晚20点至23点的首发销售活动中,小布米以惊人的速度创造了销售奇迹,短短3小时内便成功售出超过200台,充分展现了其强大的市场吸引力。官方宣称,这款机器人定价9998元,是"全球首款万元内高性能人形机器人",这一极具竞争...
19:09
2025年,全球知名食品饮料公司亿滋国际正式宣布启动一项雄心勃勃的计划,将斥资超过4000万美元,携手阳狮等顶尖营销合作伙伴,共同研发新一代生成式人工智能工具。这一战略举措旨在通过技术创新,全面优化营销流程,显著降低运营成本,为企业在数字化时代的竞争注入强劲动力。 据悉,该生成式AI工具已率先在亿滋旗下“趣多多”等核心品牌的社交媒体内容制作中投入应用。初步数...
19:09
2025年10月25日,阿斯利康在北京隆重宣布正式启用全球战略研发中心,标志着这家国际制药巨头在华创新布局再添重要里程碑。作为阿斯利康全球第六个、中国第二个战略研发中心,该机构总投资高达25亿美元(折合约180亿人民币),将成为推动中国及全球医药创新的重要引擎。 该研发中心坐落于北京核心区域,配备了业界领先的AI与数据科学平台,致力于通过智能化手段加速药...
19:09
《初音未来:缤纷舞台》重磅衍生剧场版《世界计划:无法歌唱的初音未来》今日震撼登陆全国院线!这部由知名导演畑博之执导,实力动画制作公司P.A.Works精心打造的105分钟奇幻音乐巨制,将带领观众踏上一场跨越现实与虚拟的视听冒险之旅。 影片以东京涩谷为舞台背景,讲述了20位充满活力的青少年意外闯入由纯粹情感构筑的异世界"SEKAI"。在这个充满奇幻色彩的世界里...
19:09
2024年10月24日,一个具有划时代意义的时刻在横琴粤澳深度合作区悄然上演。全球首款类脑智算体“智者一号”正式揭开神秘面纱,为人工智能与高性能计算领域的发展注入了前所未有的活力。这款被誉为科技界新宠的设备,其体积小巧如迷你冰箱,却蕴含着惊人的计算能力。它集成了1152个CPU核心,4.8T DDR5内存和204T存储空间,能够轻松应对各种复杂计算任务。更令...
18:31
2025年10月25日,拼多多直播正式揭晓双11活动全新玩法,并推出一系列针对性扶持政策,旨在助力新主播、潜力商家及优质主播实现跨越式成长。针对新主播群体,平台特别设计了"闪降活动"参与机制,通过完成指定任务即可获得丰厚的广告红包奖励。具体而言,新主播只需提报5件闪降商品,即可轻松获得200元现金红包;若每日坚持讲解闪降商品并保持开播时长超过1小时,更可累计...
18:31
2025年10月19日至24日,备受瞩目的联合国全球卫星导航系统国际委员会第19届大会在韩国釜山盛大召开。中国高度重视此次国际盛会,精心组建了由40余名顶尖代表和专家组成的代表团,全面深入地参与到大会的每一个议题讨论中,充分展现了中国在全球卫星导航领域的责任担当。 大会上,中国代表团系统性地向与会各国介绍了北斗卫星导航系统的最新建设成就与发展规划,详细阐...
18:31
近日,北京市朝阳区人民法院就一起备受关注的无人机违规飞行案件作出权威判决,依法驳回了原告龚某的全部诉讼请求。这起案件不仅涉及无人机飞行的法律边界,更对公共安全与航空秩序的维护提出了深刻启示。 龚某在机场净空保护区内进行非法无人机作业,具体行为是在该区域喷洒农药,且未按规定提前申报飞行计划。尽管其操作未直接导致任何航班延误,但法院经过严谨审理认定,其行为已对3...
18:00
深中通道西人工岛即将开启一段全新的文旅探索之旅。这座作为连接桥隧体系关键枢纽的人工岛,不仅承载着交通管理、应急救援等多重功能,更将成为科普教育的重要窗口。据官方消息,该岛将于10月25日正式启动文旅试运营,并于12月实现全面对外开放,为粤港澳大湾区居民带来独特的跨海体验。 试运营期间,深圳巴士集团与中山公交集团将联合提供定点接驳服务,确保游客能够便捷往返。游...
18:00
2025年10月25日,一个值得铭记的里程碑时刻——拱北口岸年度客流量历史性突破1亿人次,正式成为中国内地首个迈入“亿级”客流大关的口岸。这一振奋人心的数据由拱北出入境边防检查站权威发布,具体统计显示,截至当日16时08分,全年累计通关旅客数量终于突破1亿大关。更令人瞩目的是,这一纪录的达成比2024年整整提前了27天,彰显了口岸运营效率与服务能力的持续提升...
17:26
哈弗品牌今日正式发布了旗下H6L车型的详细配置信息,这款备受市场期待的车型凭借其出色的空间表现和豪华配置,再次引发广泛关注。新车整体尺寸长宽高分别为4800/1895/1730mm,轴距达到了2810mm,这样的车身比例不仅赋予了车辆稳健的姿态,更确保了内部空间的宽敞舒适,为用户带来媲美中大型SUV的乘坐体验。 在内饰设计方面,H6L提供了秋褐米、探秘黑、峡...
17:26
2025年10月25日,蚂蚁国际正式宣布与泰国国家支付系统PromptPay达成战略合作,携手NITMX和盘谷银行共同推进支付便利化升级。此次合作将显著提升中国游客在泰国的消费体验,通过Alipay+服务实现跨境支付的无缝衔接。 中国游客现可通过支付宝扫描遍布全泰国的超百万PromptPay二维码,轻松完成购物、餐饮、交通等多样化消费场景的支付。这一举措...