開源向量數據庫 Milvus 簡介

Milvus 是一個開源的、高性能、高擴展性的向量數據庫,專門用於處理和檢索高維向量數據。它適用於相似性搜索(Approximate Nearest Neighbor Search,ANN),特別適合 AI、推薦系統、計算機視覺、自然語言處理(NLP) 等領域。Milvus 由 Zilliz 開發,並已捐贈給 LF AI & Data 基金會。

向量是神經網絡模型的輸出數據格式,可以有效地對信息進行編碼,在知識庫、語義搜索、檢索增強生成(RAG)等人工智能應用中發揮着舉足輕重的作用。

1. 非結構化數據、Embeddings 和 Milvus

文本、圖像和音頻等非結構化數據格式各異,並帶有豐富的底層語義,因此分析起來極具挑戰性。爲了處理這種複雜性,Embeddings 被用來將非結構化數據轉換成能夠捕捉其基本特徵的數字向量。然後將這些向量存儲在向量數據庫中,從而實現快速、可擴展的搜索和分析。

Milvus 提供強大的數據建模功能,使您能夠將非結構化或多模式數據組織成結構化的 Collections。它支持多種數據類型,適用於不同的屬性模型,包括常見的數字和字符類型、各種向量類型、數組、集合和 JSON。

Milvus 提供三種部署模式,涵蓋各種數據規模:

2. Milvus 架構

Milvus 主要由以下組件組成:

Milvus 的雲原生和高度解耦的系統架構確保了系統可以隨着數據的增長而不斷擴展:

Milvus 本身是完全無狀態的,因此可以藉助 Kubernetes 或公共雲輕鬆擴展。此外,Milvus 的各個組件都有很好的解耦,其中最關鍵的三項任務 -- 搜索、數據插入和索引 / 壓實 -- 被設計爲易於並行化的流程,複雜的邏輯被分離出來。這確保了相應的查詢節點、數據節點和索引節點可以獨立地向上和向下擴展,從而優化了性能和成本效率。

3. Milvus 支持的搜索類型

Milvus 支持各種類型的搜索功能,以滿足不同用例的需求:

4. 相關資料

  1. Milvus 是什麼?: https://milvus.io/docs/zh/overview.md
本文由 Readfog 進行 AMP 轉碼,版權歸原作者所有。
來源https://mp.weixin.qq.com/s/X9v3dqR9zZt9QBhmb4x3pQ