type
status
date
slug
summary
tags
category
icon
password
延续一下之前的UI 增加了用reviews 来做rag
rag 部分可以看一下 做了下总结:
 
UI 部分可以参考:
 
github:
 
Tech stack:
RAG → llamaindex, chromadb
Scraping → selenium IMDB
 
主要麻烦的是网上现有的IMDB review 爬虫测试一下都不能用了 只能重新分析一下html找内容
这里是selenium 打开网页 → 找到All → 点击后等待reviews加载 (一共用时40s) 大概每个电影可以爬到600+条评论
 
然后每个电影创建chromadb collection (还有很多别的方法 应该会更好 以后慢慢试)
以后可以用更复杂的工具(graph rag, meta data filter, query pipeline) 在更复杂的数据类型上
 
下面放几个现在效果:
 
notion image
 
notion image
 
notion image
 
notion image
 
notion image
 
近期分享Leetcode - line sweep 相关
Loading...
ran2323
ran2323
我们再来一次, 这一次, 好好来!
Latest posts
Leetcode记录「2」
2024-12-27
Flutter 基础 记录
2024-12-25
Flutter tutorial 记录
2024-12-25
Privicy policy for GitHub To Text (Chrome Extension)
2024-12-22
一些 Kubernetes 笔记
2024-12-21
一些 docker 笔记
2024-12-20
Announcement
 
 
 
 
暂时没有新的内容