订阅我们的每日和每周通讯,获取有关行业领先的 AI 报道的最新更新和独家内容。了解更多
随着生成式 AI 的不断发展,对于许多企业来说,仅仅拥有一个简单的聊天机器人可能不再足够。
云计算巨头们正在争先恐后地构建自己的数据库和工具,以帮助企业快速高效地部署运营数据,从而让他们构建既智能又具有上下文感知能力的应用程序。
一个典型的例子是:谷歌云最近为多个数据库产品发布了一系列更新,首先是 AlloyDB。
根据该公司的一篇博文,这个完全托管的 PostgreSQL 兼容数据库现在支持 ScaNN(可扩展最近邻)向量索引的通用可用性。这项技术为其搜索和 YouTube 服务提供支持,并为更快的索引创建和向量查询铺平了道路,同时消耗的内存要少得多。
此外,该公司还宣布与 Aiven 建立合作伙伴关系,以实现 AlloyDB 的托管部署,以及对 Memorystore for Valkey 和 Firebase 的更新。
向量数据库对于为高级 AI 工作负载提供支持至关重要,从 RAG 聊天机器人到推荐系统,无所不包。
这些系统的核心是关键功能,例如存储和管理向量嵌入(数据的数值表示)以及为目标应用程序所需的相似性搜索。
由于世界上大多数开发人员都将 PostgreSQL 作为首选的运营数据库,因此其用于向量搜索的扩展 pgvector 变得非常流行。谷歌云已经在 AlloyDB for PostgreSQL 上支持它,并使用一种名为分层可导航小世界 (HNSW) 的最先进的基于图的算法来处理向量作业。
但是,在向量工作负载过大的情况下,算法的性能可能会下降,导致应用程序延迟和高内存使用率。
为了解决这个问题,谷歌云正在 AlloyDB 中提供 ScaNN 向量索引的通用可用性。这个新的索引使用与为 Google 搜索和 YouTube 提供支持的相同技术,可以将向量查询速度提高四倍,将索引构建时间提高八倍,并且内存占用量比标准 PostgreSQL 中的 HNSW 索引小 3-4 倍。
“ScaNN 索引是第一个 PostgreSQL 兼容索引,它可以扩展到支持超过十亿个向量,同时保持最先进的查询性能,从而为每个企业提供高性能工作负载,”谷歌云数据库工程总经理兼副总裁 Andi Gutmans 在一篇博文中写道。
Gutmans 还宣布与 Aiven 建立合作伙伴关系,使 AlloyDB Omni(AlloyDB 的可下载版本)作为一种托管服务可用,可以在任何地方运行,包括本地或云端。
“您现在可以在单个平台上跨云运行事务性、分析性和向量工作负载,并轻松开始构建 gen AI 应用程序,同样也可以在任何云上运行。这是第一个为 AlloyDB Omni 添加管理和管理层的合作伙伴关系,”他补充道。
除了 AlloyDB 之外,谷歌云还宣布了对 Memorystore for Valkey(Valkey 内存数据库的完全托管集群)和 Firebase 应用程序开发平台的增强功能。
对于 Valkey 产品,该公司表示正在添加向量搜索功能。Gutmans 指出,单个 Memorystore for Valkey 实例现在可以在超过十亿个向量上以毫秒级延迟执行相似性搜索,召回率超过 99%。
他还补充说,Memorystore for Valkey 的下一个版本 8.0 现在处于公开预览阶段,与 Memorystore for Redist Cluster 相比,查询速度提高了 2 倍,新的复制方案、网络增强功能以及对性能和资源使用情况的详细可见性。
至于 Firebase,谷歌云正在添加 Data Connect,这是一种新的后端即服务,它将与由 Cloud SQL 提供支持的完全托管的 PostgreSQL 数据库集成。它将在今年晚些时候进入公开预览阶段。
通过这些发展,谷歌云希望开发人员能够拥有更广泛的基础设施和数据库功能选择,以及强大的语言模型,为他们的组织构建智能应用程序。这些新进展如何部署到实际用例中还有待观察,但总体趋势表明,gen AI 应用程序的数量预计将大幅飙升。
Omdia 估计,生成式 AI 应用程序市场将从 2023 年的 62 亿美元增长到 2028 年的 585 亿美元,复合年增长率为 56%。