cckuailong
读完需要
速读仅需 2 分钟
1
向量数据库是处理向量嵌入的特殊数据库,对扩展大语言模型如 GPT-4 至关重要。
它简化 AI 开发者对向量数据的管理,能将非结构化数据转换成向量并存储,为大模型提供“长期记忆”,并减少“幻觉”生成。
下面是一个向量数据库知识合集
https://three-recorder-52a.notion.site/Vector-DB-5-4-9eeba4eee3b44ec5adca20a119e60b1e
2
非结构化数据占企业新数据的 90%,且增速是结构化数据的 3 倍。
资本正在大量涌入早期的向量数据库领域。
其中,估值 1 亿美元以下的有 Chroma 和 Qdrant,总融资在千万美元;
估值 5 亿美元内的有 Weaviate,总融资 5000 万美元;
估值超过 5 亿美元的有 Pinecone 和 Zilliz,总融资超过 1 亿美元。
3
3.1
Pinecone
累计融资:1.38 亿创始人是耶鲁 PHD,之前是亚马逊 AI 实验室的领导者,论文引用数高达 4326。2022 年 12 月起,Pinecone 先后上架 Google Cloud 和 AWS。目前非常火的 AutoGPT 就集成了它的产品,抢占了用户心智。
推荐阅读:https://36kr.com/p/2233027665457281
海外独角兽:AI Agent 的海马体
官网:https://www.pinecone.io/
3.2
Zilliz(Milvus)
Zilliz 是一家源自中国的公司,总部设立在美国硅谷。在五年前就推出了全球首个开源向量数据库产品 Milvus。创始人 Charles 星爵是甲骨文的工程师。与 Nvidia、IBM、微软、AWS 等公司建立合作。有~18000 个 GitHub Star。
推荐阅读:Zilliz 星爵访谈 https://sohu.com/a/674672178_323203
官网:https://zilliz.com/
3.3
典型企业:Weaviate
融资总额超过 6700 万美元。前身为 SeMI Technology,成立于 2019 年,是一家全球性初创企业。目前 Weaviate 在荷兰、美国、加拿大等地设有分支机构,拥有超过 30 名团队成员。Weaviate 创始人 Bob van Luijt 与 Etienne Dilocker 拥有 10 年以上的自由工程师经历。
官网:https://weaviate.io/
3.4
Chroma
获得 1800 万美元种子轮融资,除了机构投资者外,他们还获得了 MongoDB、Scale、Hugging Face、Jasper 等公司创始人或高管的投资由 Jeff Huber 和 Anton Troynikov 共同创建,J 他的上一家企业获得了 YC 投资,做的是低成本的假肢制造。Anton Troynikov 也是连续创业者。视觉工程师。
开源地址:https://github.com/chroma-core/chroma
官网:https://www.trychroma.com/
3.5
Qdrant
获 750 万美元种子融资 Qdrant 成立于 2021 年,是一款针对人工智能软件开发人员,提供用于非结构化数据的开源向量搜索引擎和数据库。两位创始人 Andre Zayarni(CEO)和 Andrey Vasnetsov(CTO)是老同事,他们在共同创立 Qdrant 之前,都在智能招聘公司 moberries 工作。
开源地址:https://github.com/qdrant/qdrant
官网:https://cloud.qdrant.io/
3.6
Vespa
Vespa 由 Oath 开发,发布之初被定义为一款开源的“大数据处理和服务引擎”。
2003 年 2 月 2 日,Yahoo 以 1 亿美元收购 Vespa 前身——挪威搜索引擎公司 AlltheWeb;
2017 年 9 月 28 日,由 Yahoo 和 AOL 业务合并后诞生的公司 Oath 宣布开源 Vespa,并将代码托管于 GitHub。
开源地址:https://github.com/vespa-engine/vespa
官网:https://vespa.ai
4
https://twitter.com/FinanceYF5/status/1656899032470687744