微新创想(Idea2003.com) 7月10日讯 Google Cloud 近期宣布了一项重要更新,在其 Cloud SQL for PostgreSQL 和 AlloyDB for PostgreSQL 服务中正式集成了对 pgvector 的支持。这一创新扩展将向量搜索功能引入到托管数据库平台,为开发人员提供了前所未有的能力,能够存储由大型语言模型(LLM)生成的向量嵌入,并执行高效的相似性搜索操作。
通过这一技术突破,Cloud SQL 和 AlloyDB 现在能够与 Vertex AI 上的生成式 AI 服务无缝协作,助力开发人员构建具备智能分析能力的应用程序。这些应用程序能够深度理解应用上下文和用户状态,从而提供更加个性化和精准的服务体验。Google 高级产品经理 Sandhya Ghai 和产品经理 Bala Narasimhan 指出,向量嵌入技术能够将复杂的用户生成内容,包括文本、音频和视频等,转化为易于存储、处理和索引的数值表示形式。
这些嵌入向量由先进的嵌入模型生成,其核心原理在于语义相似的 内容在向量空间中会呈现出相邻分布。通过建立高效的向量索引机制,系统可以根据相似度对数据进行快速筛选和过滤。例如,开发人员可以利用 Vertex AI 上的预训练模型生成文本和图像的嵌入向量,并将其存储在数据库中进行索引,从而极大简化相似记录的检索过程。
这一新功能还为开发人员打开了利用预训练 LLMs 的大门。Ghai 和 Narasimhan 特别强调,LLM 目前仍缺乏状态感知能力,而嵌入技术恰好能够弥补这一缺陷。通过将大型上下文数据,如文档集合或长期聊天记录存储在数据库中,并建立相关性过滤机制,系统可以精准定位最相关的信息。这种模式使得 LLM 能够”记忆”重要的聊天历史或文档内容,从而模拟出长期记忆和特定业务领域的专业知识。
为了帮助开发者快速上手,Google Cloud 特别推出了一个 Colab 笔记本和配套教学视频,详细演示了如何结合 pgvector、开源框架 LangChain 和 LLMs 构建具备生成式 AI 功能的应用程序。高级软件工程师 Saket Saurabh 在视频中展示了将生成式 AI 功能集成到 Python 应用程序的具体步骤和最佳实践。
值得注意的是,Google Cloud 在向量数据库领域的布局并非孤军奋战。近几个月来,其他云服务提供商也在积极跟进这一趋势。亚马逊 RDS for PostgreSQL 已宣布支持 pgvector 扩展,微软则展示了如何利用 Azure Data Explorer(ADX)作为向量数据库,并发布了多个与向量数据库连接器的技术文档,共同推动向量数据库技术的广泛应用和发展。