声明:本文源自微信公众号「机器之心」(ID:almosthuman2014),经作者「机器之心」授权,由微新创想转载发布。近年来,科技领域的新产品纷纷以「大模型加持」为标签,技术竞争日趋激烈。谷歌、微软、Meta等巨头仿佛重拾初心,积极拥抱大模型技术。随着技术浪潮的推进,大模型应用成为热议焦点。在落地场景中,首当其冲的便是长期占据主导地位的谷歌搜索。ChatGPT问世后,微软迅速抢占先机,率先将大模型技术应用于搜索引擎领域。北京时间2月8日凌晨,微软正式宣布将大模型技术引入自家搜索引擎,这一举措让数十年如一日稳坐霸主地位的谷歌搜索感受到了前所未有的冲击,也印证了AI搜索引擎已成为大模型技术落地的战略高地。近日,国内企业昆仑万维加入AI搜索引擎的角逐,推出国内首款融合大语言模型的搜索引擎——天工AI搜索,并开启内测申请,正式上线App。内测链接:tiangong.cn本文将深入探讨天工AI搜索如何挑战传统搜索模式,以及实际使用体验究竟如何。
为何选择搜索作为起点?为何早早发布「天工」大语言模型的昆仑万维,将大模型技术的首款C端产品落地搜索引擎场景?归根结底,还是因为搜索的重要性与大模型技术带来的革新潜力。在技术快速迭代的时代,许多科技公司提出了「基础模型」概念,开发者可根据自身需求在其上构建商业应用。然而,基于这些基础模型实现的大规模工业转型效果尚未显现。但在消费级领域,生成式AI展现出更明显的应用前景。从今年2月起,微软、OpenAI、谷歌、百度等先行者不约而同地将大模型能力引入自家搜索引擎,并广受好评。大模型时代已经到来,我们的生活将发生哪些改变?在体验过ChatGPT的震撼效果后,我们或严肃或夸张地想象过它的未来:大模型将无处不在,尤其对于那些需要与计算机互动的工作,颠覆将更为剧烈。在人与计算机的互动过程中,搜索引擎是最基础且「无感」的应用。长期以来,搜索形态鲜有显著变化,人们也越来越倾向于选择头部几家服务。大模型问世后,传统搜索或将迎来颠覆性变革,这一格局有望被打破。通过结合质变后的AI技术,过去以关键词为起点的搜索动作,已转变为发出指令「让人工智能干活」。我们不再需要思考检索方式,或是在搜索结果中繁琐筛选有用内容,AI将一站式解决问题。借助大模型特有的思维链(CoT)能力,新一代搜索系统能充分理解用户提出的问题和找到的内容,分析意图,进行持续有效的互动,生成有意义的内容。简而言之,AI如今已具备一定「逻辑」,真正成为个人助理,因满足大量复杂需求而成为流量入口,也可作为初步生产力工具解决工作问题。基于大模型的搜索能力,我们期待在不远的未来,信息需求将得到极大满足,AI整合资料能大幅提升知识获取效率,AI生成则能用前所未有的速度完成任务。另一方面,一个能充分理解人类意图的AI也能连接各种服务,让行程制定、会议纪要不再耗时,随着不断使用,它还会变得越来越聪明。若存在这样的大模型应用,它难道不就是我们梦寐以求的,可帮我们与世界打交道的「超级APP」吗?
全量AI搜索体验,更添便捷既然已有产品上线,其具体效果如何?作为首批内测用户,机器之心第一时间体验了天工AI搜索。一番体验下来,我们切实感受到了与传统搜索引擎的不同之处。这款APP名为「天工AI助手」,新用户下载即可体验,老用户只需更新APP即可使用。其用户界面设计简洁明了:在搜索框中输入问题,即可获取答案。此外,利用「AI对话」功能,还可体验天工AI助手聊天互动、创作文本等常规大模型能力。传统搜索引擎以关键词为导向,输入文字后得到与关键词匹配的海量结果,按关联程度排序(不考虑广告)。但这种方式未必能满足需求,标题党屡见不鲜,搜索长段话时,搜索引擎很少考虑输入内容的逻辑。天工AI搜索主打自然语言搜索,用大白话提问即可,无需遣词造句或使用信息检索课中的「操作符」。天工AI搜索能轻松分析并把握用户真实意图,捕捉问题中的上下文关系,使搜索结果更精确、更相关。它还大幅改变了搜索引擎输出结果的逻辑:简单提问后,界面从上到下分为三个部分呈现——参考、回答和追问。这正是天工AI搜索与传统搜索的不同之处:它首先展示最具参考价值的参考信息源;然后基于AI大模型能力对参考内容概括总结,去除冗余信息,高效准确生成简明扼要的回答。作为搜索结果(回答)中引用信息源的参考,是天工AI搜索的一大亮点。这些列出的参考保证了回答的可追溯性和可信度,通过索引直接链接到原始信息。参考信息源丰富多样,包括新闻网站、知识问答平台、机构官网、视频等。来到最底部,则是天工AI搜索的「追问」功能,体现了搜索引擎大模型的一面,可围绕一个问题展开20+轮次的深度交互。搜索引擎的特点在于能针对需求输出即时准确的信息,而大模型的强项是打破人机壁垒,进行有效对话,充分理解上下文内容并给出准确回应。接下来想了解谷歌2017年发表的那篇影响NLP发展方向的大作。天工AI搜索给出了这篇论文的题目、架构原理及影响,简直是对论文的摘要总结。继续追问,在NLP领域曝光率极高的Transformer早已扩展到计算机视觉领域。谷歌在视觉Transformer领域的工作Vision Transformer有哪些厉害之处?天工AI搜索让我们了解到ViT相较于传统卷积和循环神经网络的优势、更出色的建模能力、更强的可解释性,以及为计算机视觉领域带来的积极影响。当初写Transformer论文的几位作者,如今已是大神级人物,他们现状如何?那就继续往下问。由此可见,天工AI搜索的无限追问赋予了我们「打破砂锅问到底」的能力,一件事情的来龙去脉都能在它那里找到答案。除了通过追问让我们化身「万事通」之外,天工AI搜索在大模型加持下具备强大的信息整合、提炼和串联能力,从而在应对开放式问题时更加游刃有余、答之有物。这次来问一个目前大模型领域没有定论的热点话题:开源还是闭源?看看天工AI搜索会给出什么答案。它的回答首先点明不能一概而论,然后详细罗列了开源和闭源的优势,最后建议企业和研究机构根据自身情况选择开源或闭源,可谓非常全面。大模型搜索引擎不仅能接得住追问,还能拿捏很多细节。天工AI搜索在知识类、创意类搜索方面更胜传统搜索一筹。比如给出一个编程题目,它会先进行解释,再输出代码实现。当然解法的来源链接也都列好了。另外,你也可以基于这个结果进行追问,一步步了解代码原理。再来一个创意类的问题,比如想利用生成式工具Stable Diffusion和Runway创作一部科幻大片,但不知如何下手。天工AI搜索给出了非常详细的准备步骤,可见要比自己总结快得多。接着追问,想写一个以海洋遭到核污染导致人类灭亡为主题的故事,但不知如何创作剧本。同样交给天工AI搜索,回答依然条理清晰、逻辑性强。实时性是搜索引擎的重要要求,天工AI搜索在这方面尤为出色,它用整个网络作为资料库保证了输出的实时性。比如想了解Meta上周五发布的代码大模型Code Llama,以及在它基础上超越GPT-4的大模型。从天工AI搜索那里,我们知道这个超越GPT-4的大模型是WizardCoder34B以及它的一次生成通过率。最后,天工AI搜索非常友好的一点是每轮次搜索结果都不会丢失,保存在「我的历史」中,以便随时回看搜索内容。并且,所有客户端都是统一的。天工大模型和AI增强技术看起来非常实用天工AI搜索背后应用了哪些技术?其最重要依托是昆仑万维此前推出的千亿级大语言模型「天工」。作为国内首个对标ChatGPT的双千亿级大语言模型,「天工」部署在国内领先的GPU集群上,整合了千亿级预训练基座模型与千亿RLHF模型。因此,模型拥有强大的自然语言处理和智能交互能力,在丰富的知识储备加持下,可满足知识问答、文案创作、逻辑推理、数理推算、代码编程等多样化生成式AI需求。昆仑万维表示,利用大模型能力,新一代搜索引擎正在变得更加聪明。另一方面,基于搜索的实时内容,大模型在内容生成时幻觉等现象出现的概率也被降低。在天工AI搜索背后,昆仑万维从多个角度进行着重改进,革新了传统搜索引擎的体验。具体而言,提升主要体现在五个方面:意图识别和理解、智能摘要、向量语义检索、智能追问技术、跨语言检索(Cross-LanguageInformationRetrieval,CLIR)。传统搜索引擎中,用户常需多次尝试搜索语句。天工AI搜索在检索前会使用大模型对用户问题做Query改写,不仅深入挖掘用户真实意图,还能准确捕捉查询中的上下文关系,带来更精确、更相关的搜索结果。智能摘要:在开放式问题上,通过「DensePassageRetrieval」(DPR)技术,利用双编码器模型对问题和潜在相关文档(例如维基页面或论坛文章)进行编码、计算相似度,确保准确检索到高相关性文档及关键段落。向量语义检索:昆仑万维为搜索引擎构建了一套大规模实时向量检索系统,并在搜索的多个环节发挥作用,包括精准内容定位、增强内容多样性、提升上下文连贯性等。通过召回用户之前查询的搜索结果,提高搜索结果与用户交互的连贯性,打造更自然、流畅的搜索对话体验。智能追问技术:它为天工AI搜索的无限追问提供了支持。昆仑万维表示,该技术的核心是充分理解用户查询,并在需要更多信息时提出追问。追问的实现不仅离不开「意图识别、信息完备性检测、问题生成、用户反馈接收、动态调整与学习、上下文感知」等步骤,还需要对话、用户查询日志、追问反馈等大量数据持续训练。当然也需要不断迭代和优化,通过准确把握用户多遍需求,使回答始终不偏题。此外,天工AI搜索也实现了跨语言检索(Cross-LanguageInformationRetrieval,CLIR),即使提问时使用中文,AI生成内容时寻找的信息也并不仅是中文,但呈现结果时全部都已翻译并整合好了。这种方式不仅大大扩展了搜索的知识边界,也确保用户能够接触到最新、最全面的全球资讯和研究成果。更重要的一点是,天工AI搜索会自动过滤收费网页和无效信息,也没有广告,排在前面的都是有效参考链接。在这些能力的加持下,AI搜索既能看懂你的长难句,也能从全球网络中搜罗信息,整理出逻辑清晰的答案,如果获得反馈还能不断改进。一个能够解决所有问题的万能AI已经初具雏形。或许,超级应用的开始就是这个样子。