简单review based RAG recommendation system

status

type

date

slug

summary

category

icon

password

延续一下之前的UI 增加了用reviews 来做rag

rag 部分可以看一下做了下总结:

UI 部分可以参考:

github:

Tech stack:

RAG → llamaindex, chromadb

Scraping → selenium IMDB

主要麻烦的是网上现有的IMDB review 爬虫测试一下都不能用了只能重新分析一下html找内容

这里是selenium 打开网页 → 找到All → 点击后等待reviews加载 (一共用时40s) 大概每个电影可以爬到600+条评论

然后每个电影创建chromadb collection (还有很多别的方法应该会更好以后慢慢试)

以后可以用更复杂的工具(graph rag, meta data filter, query pipeline) 在更复杂的数据类型上

下面放几个现在效果: