新闻稿

如有任何疑问,请联系 [email protected].

2024 年 6 月 10 日

PostgreSQL 现已比 Pinecone 更快,价格便宜 75%,并拥有新的开源扩展

纽约 - 2024 年 6 月 11 日 - Timescale,PostgreSQL 云数据库公司,发布了两个突破性的开源扩展 pgvectorscale 和 pgai,它们显著增强了 PostgreSQL 的可扩展性和易用性,适用于 AI 应用。这些扩展在开源 PostgreSQL 许可下授权,使开发者能够使用 PostgreSQL 构建检索增强生成、搜索和 AI 代理应用程序,其性能与 Pinecone 等专用向量数据库相当,而成本却低得多。完整的基准信息,包括有关性能和成本的详细信息,请访问 此处

推动 AI 应用程序性能和开发人员生产力的创新

pgvectorscale 使开发者能够构建更具可扩展性的 AI 应用程序,具有更高的性能嵌入式搜索和经济高效的存储。pgvectorscale 对 pgvector(PostgreSQL 中流行的用于向量数据的开源扩展)进行了补充,并引入了两个关键创新:StreamingDiskANN 索引(改编自微软的研究)和统计二进制量化(由 Timescale 研究人员开发,并在标准二进制量化技术的基础上进行了改进)。Timescale 的基准测试表明,使用 pgvectorscale,PostgreSQL 在 99% 的召回率下,近似最近邻查询的 p95 延迟降低了 28 倍,查询吞吐量提高了 16 倍,与 Pinecone 相比。与用 C 语言编写的 pgvector 相比,pgvectorscale 是用 Rust 编程语言开发的,为 PostgreSQL 社区提供了一个新的途径,可以为向量支持做出贡献。

pgai 将更多 AI 工作流引入 PostgreSQL,使开发者更容易构建搜索和检索增强生成 (RAG) 应用程序。初始版本支持直接在 PostgreSQL 中创建 OpenAI 嵌入并从 GPT4o 等模型中获取 OpenAI 对话完成。这种集成允许对现有关系数据进行分类、摘要和数据丰富任务,简化了从概念验证到生产的开发过程。

“pgvectorscale 和 pgai 在使用 PostgreSQL 构建 AI 应用程序方面令人难以置信地令人兴奋。将嵌入函数直接放在数据库中是一个巨大的优势,”Market Reader 的首席技术官 Web Begole 表示,该公司正在使用 Timescale 的云 PostgreSQL 产品构建一个支持 AI 的金融信息平台。“以前,更新我们保存的嵌入是一项繁琐的任务,但现在,一切都集成在一起,它有望变得更加简单和高效。这将为我们节省大量的时间和精力。”

“pgvectorscale 和 pgai 是 PostgreSQL AI 生态系统中很棒的补充。统计二进制量化的引入有望为向量搜索带来闪电般的性能,并且在我们扩展向量工作负载时将非常有价值,”OpenSauced 的基础设施主管 John McBride 表示,该公司正在使用 Timescale 的云 PostgreSQL 产品为开源项目构建一个支持 AI 的分析平台。“Pgai 消除了开发者重新实现常见功能的必要性,我期待它带来的用例。”

挑战对独立专用向量数据库的需求

Pinecone 和许多其他专用向量数据库的主要优势在于它们的性能,这些性能来自针对存储和搜索大量向量数据而专门构建的架构和算法。然而,Timescale 的 pgvectorscale 挑战了这一概念,它将这些专用架构和算法以扩展的形式带入 PostgreSQL,帮助这个流行的通用数据库提供与专用向量数据库相当,甚至常常优于专用向量数据库的性能。根据 Timescale 的基准测试,该测试涉及查询 5000 万个 Cohere 嵌入(768 维)的数据集,PostgreSQL 的性能优于 Pinecone 的存储优化索引 (s1),在 99% 的召回率下,近似最近邻查询的 p95 延迟降低了 28 倍,查询吞吐量提高了 16 倍。此外,与 Pinecone 在同一数据集上 90% 的召回率下性能优化索引 (p2) 的性能相比,具有 pgvectorscale 的 PostgreSQL 的 p95 延迟降低了 1.4 倍,查询吞吐量提高了 1.5 倍。

成本效益同样令人信服。使用 pgvector 和 pgvectorscale 自托管 PostgreSQL 比使用 Pinecone 便宜 4-5 倍,PostgreSQL 在 AWS EC2 上每月大约花费 835 美元,而 Pinecone 的存储优化索引每月花费 3,241 美元,性能优化索引每月花费 3,889 美元。

PostgreSQL:AI 应用程序的一体化数据库解决方案

Timescale 的新扩展加强了“PostgreSQL for Everything”运动,开发人员希望通过利用 PostgreSQL 强大的、多功能的和可靠的生态系统来简化复杂的数据架构。

凭借丰富的扩展和经过验证的可靠性,PostgreSQL 成为未来数据和人工智能驱动应用程序的理想基础。

“Timescale 的目标是降低开发人员采用和扩展 PostgreSQL 用于 AI 应用程序的门槛,”Timescale 首席执行官 Ajay Kulkarni 表示。“通过开源 pgvectorscale 和 pgai,Timescale 旨在将 PostgreSQL 确立为 AI 应用程序的默认数据库。这消除了对单独的向量数据库的需求,并简化了开发人员在扩展时的数据架构。”

Timescale pgvectorscale 和 pgai 扩展产品现已推出。访问 这篇博文 以了解更多信息,或访问 www.timescale.com/contact 联系我们以安排演示。

关于 Timescale Timescale 是一个成熟的 PostgreSQL 云,专门为时间序列、事件、分析、向量和 AI 等要求苛刻的工作负载而设计。Timescale 致力于为全球的软件开发人员和企业提供服务,使他们能够构建下一波计算浪潮。Timescale 拥有全球员工队伍,并得到 Benchmark、New Enterprise Associates、Redpoint、Icon、Tiger Global、Two Sigma Ventures 和其他领先投资者的支持。有关更多信息,请访问 www.timescale.com 或关注.

@TimescaleDB

媒体联系

[email protected]