Google Cloud 将矢量搜索集成到托管数据库中:增强人工智能能力

站长之家(ChinaZ.com) 7月10日消息:Google Cloud 最近在 Cloud SQL for PostgreSQL 和 AlloyDB for PostgreSQL 上添加了对 pgvector 的支持。该扩展将向量搜索操作引入托管数据库,允许开发人员存储由大型语言模型 (LLM) 生成的向量嵌入并执行相似性搜索。

Cloud SQL 和 AlloyDB 现在可以与 Vertex AI 上的生成式 AI 服务配合使用,帮助创建支持 AI 的应用程序,这些应用程序能够了解应用程序和用户状态。Google 高级产品经理 Sandhya Ghai 和 Google 产品经理 Bala Narasimhan 解释道:

向量嵌入是通常用于将复杂的用户生成内容(如文本、音频和视频)转化为可以轻松存储、操作和索引的形式的数值表示。这些表示由嵌入模型生成,以使得如果两个内容在语义上相似,它们的嵌入向量就会在向量空间中相邻。然后将向量嵌入进行索引,并根据相似性高效过滤数据。

例如,开发人员可以使用 Vertex AI 在文本和图像上的预训练模型生成嵌入,并将其存储和索引在数据库中,从而简化查找相似记录的过程。

这一新功能还可以帮助开发人员利用预训练的 LLMs,正如 Ghai 和 Narasimhan 所解释的:

LLMs 没有状态的概念。(…) 嵌入允许您将大型上下文(如文档或长期聊天历史记录)存储在数据库中,并对其进行过滤以找到最相关的信息。然后,您可以将最相关的聊天历史记录或文档提供给模型,以模拟长期记忆和业务特定知识。

Google Cloud 发布了一个 Colab 笔记本和一个视频,展示如何使用 pgvector、开源框架 LangChain 和 LLMs 构建具有生成式 AI 功能的应用程序。Google 高级软件工程师 Saket Saurabh 展示了如何将生成式 AI 功能添加到示例 Python 应用程序中。

最近几个月,Google Cloud 并不是唯一一个针对向量数据库的云服务提供商,亚马逊的 RDS for PostgreSQL 支持 pgvector 扩展,微软展示了如何将 Azure Data Explorer(ADX)用作向量数据库,并讨论了与向量数据库的几个连接器。

您可能还喜欢...

发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注