美团正式进军AI领域,公开开源了560B参数的MoE模型LongCat-Flash-Chat,标志着其在人工智能领域的重大突破。这一举措不仅彰显了美团在AI领域的雄心壮志,更展现了其技术创新的实力。开源地址:https://github.com/meituan-longcat/LongCat-Flash-Chat,线上体验地址:https://longcat.ai。
在个人体验中,LongCat-Flash-Chat的模型能力表现中规中矩,但速度惊人。将560B的模型在推理时实现如此高的效率,确实令人赞叹。我录制了一段视频,直观展示LongCat与DeepSeek V3的输出速度对比。两者均采用MoE架构,参数量相近,在相同问题下关闭联网搜索以避免干扰,进行公平竞争。
DeepSeek的输出过程依然需要反复思考,逐字吐出,耗时33秒。而LongCat则像机关枪般迅速,五六秒内完成输出。这一对比直观展现了LongCat的卓越性能。此外,我还测试了LongCat在写作和代码生成方面的能力。通过一个弹射线小游戏,LongCat展现了其UI设计和物理碰撞效果的艺术感,碰撞时还会产生火花,增强游戏体验。在小说创作方面,LongCat的表现令人惊喜,尤其喜欢那句”在宇宙的尺度下,孤独是一种常态”。在美食地图生成方面,作为美食世家出身的大模型,LongCat的描述细致入微。
最值得关注的是LongCat的技术报告中提到的Agent能力。其速度极快,Agent能力也登顶。长期以来,AI似乎与普通大众存在距离,多聚焦于生产力工具。而美团打造的LongCat,其目标直指C端用户的生活场景,解决日常痛点。美团搜索框的AI模式已能理解复杂需求,直接推荐符合条件的店铺。AI订座功能更是解决了社恐人士的痛点,自动与餐厅沟通预订。AI开发票功能也极大提升了用户体验。
这些功能共同指向一个目标:通用生活Agent。美团凭借其海量商户数据、用户交易数据和动态物理世界数据,构建了一个正向循环的AI生态系统。用户使用AI越多,AI越懂用户需求,服务越贴心,用户越依赖美团。LongCat的快速响应和强大Agent能力,正是为生活场景设计,避免用户等待,解决复杂任务组合的需求。
LongCat的输出成本仅为5元/百万token,体现了美团对C端市场的重视。美团做大模型的目标明确:瞄准ToC的通用生活Agent,而非单纯的知识问答。美团从本地生活起家,比任何人都更懂人类真实需求。它并非追求AGI,而是致力于让地球上的生活更加便捷舒适,像被无微不至地照顾一样。