status
type
date
slug
summary
tags
category
icon
password
 
 
重点:
  1. 因为auto regressive, 模型可以根据 Pre_query 补全后面的User一般问的问题 也就是我们需要的instruction 建立起 Pre_query template → instruction → response
 
  1. 生成domain specific instruction… 通过扮演领域chatbot
 
 
优势:
  1. diversity → t-SNE full coverage
  1. 高效 需要样本量少
  1. 可控 → 可以control task category做专业领域数据集 和 instruction language
  1. 全流程自动
  1. 成本低 自己租服务器(paper里用的lambda ai) 高精度少样本量即可涵盖
 
mcp 记录(1)SFT + DPO 塔罗解读
Loading...
ran2323
ran2323
忘掉名字吧
Latest posts
SFT + DPO 塔罗解读
2025-4-14
Backtracking
2025-4-14
Leetcode 0001-1000 分组
2025-4-14
mcp 记录(1)
2025-4-14
DPO 相关
2025-3-29
今日paper(3/25) - MAGPIE
2025-3-27
Announcement
 
 
 
 
暂时没有新的内容