Chroma + Ollama RAG工作流代码案例

status

type

date

slug

summary

category

icon

password

最近在考虑本地部署vector database 来做rag(这个领域感觉做的人很多我也就是稍微了解一下看看能不能用特定领域数据做出能显著看出差异的搜索质量提升)

暂且先不谈 graph rag 如果比较一般 vector database 的话

现阶段的总结是作为查找来说 faiss 性能最好但是也最消费资源作为一种搜索方式

vector store 必须要用 langchain/llamaindex 的？

体验来讲 chroma 感觉语法简单完全开源 local host 很容易用

但是因为很新应该非常不适合production

怎么定义? 是db大小? 如果需求只是100本书左右 —> 可以测试一下

Milvus 应该也好用同时应该是最快的如果local的话只能用lite ?

下面是别人总结的

来源:

下面是两套使用 Chroma + Ollama 的 sample code(本地这里都用的是llama3.1:8b 可以自行更换):

首先是从pdf书(扫描版应该不支持)里提取

共两个步骤

1. 收集数据创建本地client → collection → store (注意这套代码没有做embedding)

因为有paywall 有钱可以支持一下像我一样穷的一可以搜索freedium

Ok 下面应该是第二套也就是ollama 官方的chromadb implementation了代码很简单用的也只是几句话来当文本

用的emb model是mxbai-embed-large(mix bread) 也是ollama上现在下载量最大的

因为文本被改的太奇怪了所以模型也是很快反应过来了回答也很是幽默…

这边贴几个

但是最后不知道为什么调用多了模型话就变少了也逐渐顺从我了不知道为啥