status
type
date
slug
summary
tags
category
icon
password
延续一下之前的UI 增加了用reviews 来做rag
rag 部分可以看一下 做了下总结:
 
UI 部分可以参考:
 
github:
 
Tech stack:
RAG → llamaindex, chromadb
Scraping → selenium IMDB
 
主要麻烦的是网上现有的IMDB review 爬虫测试一下都不能用了 只能重新分析一下html找内容
这里是selenium 打开网页 → 找到All → 点击后等待reviews加载 (一共用时40s) 大概每个电影可以爬到600+条评论
 
然后每个电影创建chromadb collection (还有很多别的方法 应该会更好 以后慢慢试)
以后可以用更复杂的工具(graph rag, meta data filter, query pipeline) 在更复杂的数据类型上
 
下面放几个现在效果:
 
notion image
 
notion image
 
notion image
 
notion image
 
notion image
 
近期分享Leetcode - line sweep 相关
Loading...
ran2323
ran2323
忘掉名字吧
Latest posts
SFT + DPO 塔罗解读
2025-4-14
Backtracking
2025-4-14
Leetcode 0001-1000 分组
2025-4-14
mcp 记录(1)
2025-4-14
DPO 相关
2025-3-29
今日paper(3/25) - MAGPIE
2025-3-27
Announcement
 
 
 
 
暂时没有新的内容